180 101 19MB
French Pages 641 [640] Year 2013
Physique de la Matie`re Condense´e Des atomes froids aux supraconducteurs a` haute tempe´rature critique
Michel He´ritier
Cet ouvrage a e´te´ e´dite´ avec le concours du Triangle de la Physique. Imprime´ en France ISBN : 978-2-7598-0810-6 Tous droits de traduction, d’adaptation et de reproduction par tous proce´de´s, re´serve´s pour tous pays. La loi du 11 mars 1957 n’autorisant, aux termes des aline´as 2 et 3 de l’article 41, d’une part, que les « copies ou reproductions strictement re´serve´es a` l’usage prive´ du copiste et non destine´es a` une utilisation collective », et d’autre part, que les analyses et les courtes citations dans un but d’exemple et d’illustration, « toute repre´sentation inte´grale, ou partielle, faite sans le consentement de l’auteur ou de ses ayants droit ou ayants cause est illicite » (aline´a 1er de l’article 40). Cette repre´sentation ou reproduction, par quelque proce´de´ que ce soit, constituerait donc une contrefac¸on sanctionne´e par les articles 425 et suivants du code pe´nal. Ó EDP Sciences 2013
Table des matie`res
Pre´face ....................................................................................................... Pre´ambule ................................................................................................ Syste`me d’unite´s de Gauss.................................................................
xxiii
Chapitre 1 d Mode`le d’Ising a` une et deux dimensions.........................
1
1.1 Introduction.................................................................................. 1.1.1 Syste`mes magne´tiques anisotropes........................................... 1.1.2 « Gaz sur re´seau »................................................................. 1.1.3 Mode`le d’alliages binaires ...................................................... 1.2 Le mode`le d’Ising a` une dimension, cas des forces a` courte porte´e ...... 1.2.1 Fonction de partition ............................................................ 1.2.2 Matrice de transfert............................................................... 1.2.3 Fonctions de corre´lations ....................................................... 1.2.4 Absence de transition de phase a` une dimension ...................... 1.2.5 Interactions a` longue porte´e ...................................................
1 2 3 4 4 5 7 9 13 16
ix xv
i
Physique de la matie`re condense´e
1.3 Le mode`le d’Ising a` deux dimensions............................................... 1.3.1 Matrice de transfert............................................................... 1.3.2 Existence d’une transition de phase - me´thode de Peierls .......... 1.3.3 Dualite´ ................................................................................ 1.3.4 Quelques re´sultats sur Ising 2D.............................................. 1.3.5 Quelques caracte´ristiques de la transition.................................
18 18 19 23 32 33
Chapitre 2 d Transitions de phases - Ge´ne´ralite´s...................................
37
2.1 Ge´ne´ralite´s .................................................................................... 2.1.1 Introduction......................................................................... 2.1.2 Classification des transitions de phase ..................................... 2.1.3 Le mode`le de Landau............................................................ 2.2 Notion de syme´trie brise´e ............................................................... 2.2.1 Qu’est-ce que la syme´trie brise´e ? ........................................... 2.2.2 Origine des brisures de syme´trie ............................................. 2.2.3 Proprie´te´s lie´es aux brisures de syme´trie .................................. 2.3 Mode`le de Landau – Recherche des parame`tres d’ordre ..................... 2.3.1 Introduction......................................................................... 2.3.2 Exemple simple .................................................................... 2.3.3 Cas ge´ne´ral .......................................................................... 2.4 Mode`le de Landau – Ordre des transitions .......................................
37 37 40 48 51 51 52 61 68 68 70 73 75
Chapitre 3 d Approximations de champ moyen.....................................
81
3.1 Me´thodes variationnelles................................................................. 3.1.1 Les the´ore`mes variationnels.................................................... 3.1.2 Me´thode de Bragg et Williams – Champ mole´culaire ............... 3.2 The´orie thermodynamique de Landau.............................................. 3.2.1 Principes ge´ne´raux ................................................................ 3.2.2 Approximation du col ........................................................... 3.3 The´orie d’Ornstein-Zernike – Approximation gaussienne ................... 3.3.1 Mode`le gaussien ................................................................... 3.3.2 Fonction de corre´lation ......................................................... 3.3.3 Longueur de corre´lation ........................................................ 3.3.4 Susceptibilite´ relative au parame`tre d’ordre .............................. 3.3.5 Validite´ de l’approche – Crite`re de Ginzburg........................... 3.3.6 Dimensionalite´s critiques .......................................................
81 82 85 94 94 94 102 103 104 106 107 108 111
Chapitre 4 d Phe´nome`nes critiques ........................................................ 113 4.1 Ge´ne´ralite´s .................................................................................... 4.1.1 Comportement critique ......................................................... 4.1.2 Exposants critiques................................................................ 4.1.3 Universalite´ .......................................................................... 4.2 Lois d’e´chelles – Hypothe`se d’homoge´ne´ite´ ...................................... 4.3 Introduction au groupe de renormalisation ....................................... 4.3.1 Le groupe de renormalisation.................................................
ii
113 113 115 116 124 131 133
Table des matie`res
4.3.2 Point fixe – Champs pertinents .............................................. 4.3.3 Surface critique – Bassin d’attraction ...................................... 4.3.4 Exposants critiques................................................................ 4.4 Exemple du mode`le gaussien........................................................... 4.4.1 Le mode`le............................................................................ 4.4.2 La transformation du groupe de renormalisation ...................... 4.4.3 Les points fixes ..................................................................... 4.4.4 Les exposants critiques .......................................................... 4.5 Au-dela` du mode`le gaussien............................................................ 4.5.1 Introduction......................................................................... 4.5.2 Le mode`le............................................................................ 4.5.3 Point fixe gaussien ................................................................ 4.5.4 Point fixe non gaussien..........................................................
136 138 139 141 141 142 143 144 145 145 146 147 152
Chapitre 5 d Les transitions de Kosterlitz-Thouless............................... 159 5.1 Introduction.................................................................................. 5.1.1 Un type original de transition de phase................................... 5.1.2 La notion d’ordre a` grande distance........................................ 5.1.3 Le roˆle des modes de Goldstone............................................. 5.1.4 Le roˆle des de´fauts topologiques ............................................. 5.2 Le mode`le X-Y .............................................................................. 5.2.1 L’e´nergie libre e´lastique ......................................................... 5.2.2 Les fluctuations .................................................................... 5.2.3 Le quasi ordre a` longue distance............................................. 5.3 Les de´fauts topologiques ................................................................. 5.3.1 Introduction......................................................................... 5.3.2 De´finitions........................................................................... 5.3.3 Configurations de vortex ....................................................... 5.3.4 E´nergies de vortex................................................................. 5.3.5 Interaction entre vortex ......................................................... 5.4 Transition de Kosterlitz-Thouless..................................................... 5.4.1 Mode`le de Villain – Gaz de Coulomb .................................... 5.4.2 Effet d’e´cran......................................................................... 5.4.3 Renormalisation.................................................................... 5.4.4 Proprie´te´s de la transition ...................................................... 5.5 Exemples ...................................................................................... 5.5.1 Films superfluides ................................................................. 5.5.2 Fusion bidimensionnelle ........................................................
159 160 160 161 162 162 163 165 168 171 171 171 176 179 182 185 185 188 190 196 197 198 200
Chapitre 6 d Le gaz d’e´lectrons............................................................... 209 6.1 Introduction.................................................................................. 6.2 Gaz quantique – Premie`res approches et difficulte´s............................ 6.2.1 Particule sans interaction – Trou d’e´change.............................. 6.2.2 Me´thodes de Hartree et Hartree Fock ..................................... 6.2.3 E´nergie totale – Calcul en perturbations..................................
209 210 210 213 221
iii
Physique de la matie`re condense´e
6.3 Me´thode de la RPA ....................................................................... 6.3.1 Me´thode RPA – Plasmons ..................................................... 6.3.2 Constante die´lectrique ........................................................... 6.3.3 Application : Cas statique – E´cran.......................................... 6.3.4 E´nergie de l’e´tat fondamental................................................. 6.4 Mode`le du jellium ......................................................................... 6.4.1 Ge´ne´ralite´s – Constante die´lectrique ....................................... 6.4.2 Modes propres d’oscillations .................................................. 6.5 Instabilite´s de Peierls ...................................................................... 6.5.1 E´tat fondamental a` tempe´rature nulle ..................................... 6.5.2 Tempe´rature finie.................................................................. 6.5.3 Observations expe´rimentales...................................................
227 228 241 246 250 253 256 258 265 265 270 274
Chapitre 7 d The´orie de Landau des liquides de Fermi......................... 281 7.1 Introduction.................................................................................. 7.2 Principe d’exclusion et diffusion e´lectron-e´lectron pre`s du niveau de Fermi ........................................................................................... 7.3 Les quasiparticules ......................................................................... 7.3.1 Gaz parfait et Liquide de Fermi de´ge´ne´re´ ................................ 7.3.2 La notion de quasiparticule.................................................... 7.3.3 Surface de Fermi des quasiparticules ....................................... 7.3.4 E´nergie des quasiparticules..................................................... 7.4 Interation entre quasiparticules ........................................................ 7.4.1 Fonctionnelle de l’e´nergie libre............................................... 7.4.2 E´nergie locale d’une quasiparticule ......................................... 7.4.3 Distribution d’e´quilibre de quasiparticules a` tempe´rature finie ... 7.5 Proprie´te´s d’e´quilibre ..................................................................... 7.5.1 Chaleur spe´cifique ................................................................ 7.5.2 Susceptibilite´ de spin............................................................. 7.5.3 Compressibilite´ et vitesse du son ............................................ 7.6 Proprie´te´s hors d’e´quilibre .............................................................. 7.7 Application a` 3He liquide ................................................................ 7.8 Conclusion ...................................................................................
281 282 284 284 287 293 295 297 297 299 301 302 303 304 305 306 308 313
Chapitre 8 d Au-dela´ du liquide de Fermi.............................................. 317 8.1 Localisation par les corre´lations e´lectroniques.................................... 8.1.1 Transition de Wigner-Mott : ge´ne´ralite´s .................................. 8.1.2 Le traitement de Hubbard ..................................................... 8.1.3 L’approximation variationnelle de Gutzwiller ........................... 8.1.4 La the´orie de champ moyen dynamique.................................. 8.2 Conducteurs unidimensionnels........................................................ 8.2.1 Introduction......................................................................... 8.2.2 Mode`le de conducteur unidimensionnel ..................................
iv
317 318 321 324 334 338 338 341
Table des matie`res
8.2.3 Le traitement de champ moyen.............................................. 8.2.4 Renormalisation a` une dimension........................................... 8.3 Fermions corre´le´s a` une dimension .................................................. 8.3.1 Introduction......................................................................... 8.3.2 Bosonisation et liquide de Luttinger ....................................... 8.3.3 Conclusions .........................................................................
346 351 362 362 362 366
Chapitre 9 d Introduction au magne´tisme localise´ ................................. 369 9.1 Introduction – E´nergie d’e´change .................................................... 9.1.1 Atomes et ions magne´tiques................................................... 9.1.2 Me´canismes d’e´change........................................................... 9.2 E´tat d’e´quilibre stable – E´tat fondamental ........................................ 9.2.1 E´tat d’e´quilibre stable de spins classiques – Structures magne´tiques ......................................................................... 9.2.2 E´tat fondamental pour des spins quantiques ............................ 9.3 Champ mole´culaire a` tempe´rature finie............................................ 9.3.1 Me´thode du champ mole´culaire statique – Cas uniforme.......... 9.3.2 Champ mole´culaire non uniforme .......................................... 9.3.3 Structures magne´tiques .......................................................... 9.3.4 Couplages moments magne´tiques – Re´seau ............................. 9.3.5 Parois et domaines ................................................................ 9.4 Ondes de spin et magnons ............................................................. 9.4.1 Ondes de spin dans un cristal ferromagne´tique ....................... 9.4.2 Magnons..............................................................................
Chapitre 10
d
d
373 375 377 377 380 382 387 391 394 394 396
Le magne´tisme itine´rant ................................................. 401
10.1 Introdution au magne´tisme itine´rant................................................ 10.2 La the´orie de Stoner....................................................................... 10.3 Ondes de Densite´ de Spin .............................................................. 10.3.1 Crite`re d’instabilite´ ............................................................. 10.3.2 The´orie de la phase ordonne´e .............................................. 10.3.3 Onde de Densite´ de Charge................................................. 10.3.4 Conduction de Fro¨hlich ...................................................... 10.3.5 Ondes de Densite´ de Spin induites par un champ magne´tique 10.4 Magnons....................................................................................... 10.4.1 Excitations collectives .......................................................... 10.4.2 Mode de Goldstone ............................................................
Chapitre 11
369 370 371 372
401 408 415 415 420 429 432 436 448 449 452
Supraconductivite´ conventionnelle ................................. 457
11.1 Principaux faits expe´rimentaux ........................................................ 11.1.1 Conductivite´ infinie ............................................................ 11.1.2 Effet Meissner .................................................................... 11.1.3 Courants persistants et quantification du flux ........................ 11.1.4 Chaleur spe´cifique .............................................................. 11.1.5 Gap d’e´nergie.....................................................................
457 461 461 464 464 465
v
Physique de la matie`re condense´e
11.1.6 Effets Josephson.................................................................. 11.1.7 Effet isotopique .................................................................. 11.2 The´orie phe´nome´nologique de Ginzburg-Landau .............................. 11.2.1 Les e´quations de Ginzburg-Landau ....................................... 11.2.2 Solutions dans des cas simples – Longueurs caracte´ristiques..... 11.2.3 Quantification du fluxoı¨de................................................... 11.2.4 Les deux types de supraconducteurs ...................................... 11.3 La the´orie de Bardeen-Cooper-Schrieffer .......................................... 11.3.1 Introduction....................................................................... 11.3.2 L’appariement des e´lectrons – Les paires de Cooper ............... 11.3.3 Fondamental supraconducteur : me´thode variationnelle .......... 11.3.4 Fondamental supraconducteur : transformation de Bogoliubov 11.3.5 Supraconducteur a` tempe´rature finie ..................................... 11.3.6 Quelques effets quantiques importants dans les supraconducteurs ................................................................
Chapitre 12
d
d
d
545 547 548 561 570 574
583 585 586 592 594
Physique des atomes froids et physique de la matie`re condense´e ........................................................................ 597
14.1 Introduction.................................................................................. 14.2 La physique de Fermi-Hubbard de´crivant des atomes dans un re´seau optique ......................................................................................... 14.3 Gaz quantiques atomiques ..............................................................
vi
543 544 544
Exemples d’analogies e´labore´es par de Gennes .............. 583
13.1 Le parcours scientifique de Pierre-Gilles de Gennes ........................... 13.2 Trois exemples d’analogies de´veloppe´es par P.-G. de Gennes............... 13.2.1 Les analogies entre transitions de phase des supraconducteurs et celles des cristaux liquides .................................................... 13.2.2 Physique et physico-chimie des polyme`res – La de´couverte n = 0 ................................................................................... 13.2.3 La percolation : un concept unificateur .................................
Chapitre 14
536
Les supraconducteurs non conventionnels ..................... 543
12.1 Introduction.................................................................................. 12.2 Le « paradigme » de la supraconductivite´ « conventionnelle » ............. 12.2.1 L’ordre supraconducteur ...................................................... 12.2.2 Les points essentiels de la the´orie BCS de la supraconductivite´ conventionnelle .................................................................. 12.3 Les supraconducteurs « non conventionnels ».................................... 12.3.1 Les cuprates ....................................................................... 12.3.2 Les conducteurs et supraconducteurs organiques .................... 12.3.3 Les fermions lourds............................................................. 12.3.4 Les pnictures ......................................................................
Chapitre 13
468 469 469 469 473 478 479 491 491 497 502 513 520
597 598 600
Table des matie`res
14.4 14.5 14.6 14.7 14.8 14.9
Atomes dans les re´seaux optiques..................................................... Le mode`le de Fermi-Hubbard dans un pie`ge atomique ...................... Physique a` N corps avec des interaction attractives ou re´pulsives .... Limitations de la description de Fermi-Hubbard ............................... Re´sonances de Feshbach ................................................................. Perspectives ...................................................................................
601 602 604 606 607 608
vii
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Préface La matière condensée, solide ou liquide, se caractérise par la multiplicité de ses constituants – atomes et électrons – en contact proche les uns des autres sur des distances macroscopiques, où la mécanique quantique joue un rôle primordial. Des approches très simplifiées permettent d’aborder leur étude en termes d’un gaz d’électrons circulant dans une structure ionique qui écrante leur charges dans les métaux, complétant ainsi une description en termes d’atomes à liaisons ioniques ou covalentes dans les isolants et les semi-conducteurs. Mais il est clair que l’analyse détaillée des nombreux changements de phase observés, outre la fusion, met en jeu une description plus fine des structures de leurs excitations, notamment celles mettant en jeu le magnétisme et la conductibilité électrique et pas seulement la structure atomique des phases. C’est l’objet de ce livre de présenter les bases théoriques de tels phénomènes. Michel Héritier me semble particulièrement qualifié pour présenter une description assez complète des progrès obtenus depuis un demi-siècle dans ce domaine, sans cacher les divergences encore non résolues dans certains domaines, mais présentée d’une façon graduelle, et assez élémentaire au départ pour être comprise par des étudiants en fin d’études universitaires. Avec toute sa carrière au Laboratoire de Physique des Solides d’Orsay, Michel Héritier a travaillé au contact d’un groupe de théoriciens inventifs comme lui, qui ont su collaborer avec de multiples groupes expérimentaux, à Orsay comme dans d’autres laboratoires français et étrangers, dans l’analyse des changements de phase en matière
ix
Physique de la matière condensée
condensée. Il a, par exemple, développé avec Pascal Lederer et Gilles Montambaux une analyse originale de la structure de l’Hélium ; il a aussi largement collaboré, avec ses chercheurs, aux développements des conducteurs organiques, dont la supraconductivité a été découverte et étudiée par Denis Jérome et son groupe et dont la structure atomique a été étudiée en parallèle par Robert Comès et Jean Paul Pouget. Avec P. Lederer et G. Montambaux, puis D. Poilblanc, il a notamment étudié la création d’ondes de densité de spin successives sous champ magnétique croissant dans les conducteurs quasibidimensionnels. Ainsi, dans les composés de Bechgaard (TMTSF)2X, comme dans les (BEDT TTF)2X, les surfaces de Fermi des porteurs sont assez proches des limites de zone de Brillouin pour permettre une analyse complète et très originale de ce phénomène, qui peut être aussi interprété qualitativement par la déviation des porteurs sous champ magnétique. Ces travaux sont présentés en détail aux chapitres 8 et 10. Ils ont stimulé l’intérêt général de Michel Héritier pour les fluctuations antiferromagnétiques qui se rencontrent dans les supraconducteurs organiques, mais aussi dans les cuprates et d’autres supraconducteurs à hautes températures critiques développés plus récemment. Il a notamment participé à l’analyse du rôle possible de ces fluctuations antiferromagnétiques dans le couplage des porteurs de charge, initialement proposé par C. Bourbonnais pour les conducteurs organiques. Par ailleurs, après avoir suivi lui-même le DEA de Physique des Solides créé en 1956 par André Guinier (cristallographe qui allait veiller au développement du Campus d’Orsay comme son vice Doyen à partir de sa venue en 1959), Pierre Aigrain (spécialiste des semi-conducteurs à l’ENS d’Ulm) et moi-même (pour les structures électroniques), Michel Héritier a finalement dirigé le Laboratoire de Physique des Solides, et aussi le DEA de Physique des Solides, à une période, après les années 80, de fortes évolutions tant dans les recherches du laboratoire, plus ouvert à la matière molle, que dans l’enseignement universitaire qui cherchait alors l’Européanisation dans les structures LMD, copie assez artificielle du modèle américain. Ayant perdu leur responsabilité vis à vis de leurs anciens étudiants durant leur thèse et notamment les bourses distribuées aux meilleurs et la responsabilité de leur trouver un emploi après thèse, les DEA des années 50 ont été remplacés par des enseignements de Master 2 de cinquième année pour les étudiants futurs doctorants, sans assez souci de leur formation préalable comme de leurs besoins futurs. Ce livre a, de ce fait, un esprit remarquable : conçu pour des étudiants de bon niveau, il aborde un grand nombre de sujets d’intérêt général, par une approche la plus simple possible pour être comprise par ces étudiants. Assez rapidement, cet enseignement se complique dans certains chapitres, et Michel Héritier en est alors contraint à une description qualitative des points plus complexes, qui lui permet sans doute de transmettre au lecteur certains concepts difficiles et l’envie de les approfondir. Certes, une bonne partie de ce livre se lit sans réelle difficulté ; mais surtout dans les derniers chapitres, il joue un rôle d’analyse plus que de démonstration. Pour être plus précis, et en suivant les termes du Préambule de ce livre, le problème essentiel est l’étude des corrélations entre les particules – électrons et atomes – mises en jeu. Le rôle des symétries est bien analysé, avec leurs modifications associées aux
x
Préface
changements de phase. Les approximations du modèle de Landau sont clairement exposées, ainsi que les lois d’échelle qu’on peut en tirer, avec, dans ce cadre l’utilisation des perturbations, tant pour l’analyse des corrélations électroniques que pour l’analyse des phénomènes critiques. Ces points sont illustrés par de nombreux exemples et un sort particulier est fait à la supraconductivité-suprafluidité mais aussi aux contributions majeures apportées par Pierre-Gilles de Gennes dans ces domaines et aux questions posées par l’étude optique des atomes froids en liaison avec la matière condensée. Mon intérêt spécifique pour certaines questions m’a amené à quelques réflexions. En ce qui concerne par exemple les transitions de Kosterlitz-Thouless des fluides à basses dimensions, mon attention vient de ma longue fréquentation à Orsay avec Bernard Jancovici, l’un des inventeurs du changement de phase à température finie des fluides à deux dimensions. Si les explications du livre sont assez claires et font intervenir, pour les supraconducteurs les tourbillons des mécaniciens (que Michel Héritier habille en vortex anglo-saxons), il me semble dommage de ne pas faire un lien plus étroit avec ce que l’on sait depuis les années 50 sur les dislocations de rotation du vecteur vitesse et la réduction de leur énergie en s’appariant en paires de tourbillons de sens opposés, dont l’énergie se réduit, à grande distance, à celle d’une dislocation de translation ; cette remarque s’étend à la fusion bidimensionnelle de Jancovici, où ce sont des dislocations de translation de sens opposés qui compensent à grandes distances leur énergies de distorsion. De la même façon, les larges développements qui traitent de la selfconsistence des corrélations électroniques utilisent pour les métaux, une constante diélectrique tirée de l’approximation de Thomas Fermi, qui n’est strictement valable que dans les semi-conducteurs à températures finies : elle conduit en effet à un écrantage exponentiellement décroissant autour d’une charge ionique fixe, alors que les oscillations spatiales à grandes distances jouent un rôle important dans les métaux. Elle vient sans doute de ce que, tant « BCS » dans leurs études de la supraconductivité que Walter Kohn dans son étude des corrélations, étaient fortement imprégnés des approches « Thomas Fermi » valables pour les semi-conducteurs. L’idée même que les interactions des électrons « presque libres » des métaux sp avec les ions du réseau peuvent être traitées en perturbation n’est justifiée que par l’analyse de leurs fonctions d’onde en « ondes planes orthogonalisées » aux états électroniques liés aux ions. Cette approche, due à Conniers Herring en 1940, a été largement utilisée pour décrire l’ordre local des métaux liquides par John Ziman, mais peut conduire à des effets d’écrantage positifs ou négatifs pour les électrons autour d’ions positifs suivant leur place dans les séries sp. Enfin, tout ce qui concerne les instabilités ferromagnétiques et antiferromagnétiques, la supraconduction au sens de BCS et aussi l’apparition d’ondes de densité de charge et de spin avec leurs analyses par Rudolf Peierls et Herbert Frœhlich sont détaillées avec soin. Il est seulement dommage que leur liaison directe avec l’explication par Nevill Mott et Harvey Jones de la stabilité générale des métaux et des alliages de Hume Rothery ne soit pas mentionnée, ni l’extension qui a suivi aux quasicristaux
xi
Physique de la matière condensée
ou encore l’extension générale par André Blandin et ses élèves à l’analyse de la stabilité générale des métaux et des alliages sp dans leurs diverses phases et défauts de structure cristalline, par l’addition numérique, à volume constant, d’interactions de paires entre ions atomiques. Les deux derniers chapitres concluent sur des études plus ponctuelles mais qui ouvrent des voies nouvelles pour le futur et où Michel Héritier nous fait profiter de sa curiosité vis à vis de nouvelles approches. Je suis moins enthousiaste en ce qui concerne les « nouveaux » supraconducteurs qui se sont développés dans les organiques, puis les cuprates, les fermions lourds, les fullerides, les composés de Fer... D’une part il est évident que tous ne justifient pas de la même approche théorique. Mais, par contre, les organiques, les cuprates, certains au moins des fermions lourds et des nouvelles espèces développées ont des caractéristiques en commun, comme une résistivité en T2 et un ordre local antiferromagnétique lié à une gamme de température intermédiaire où la résistivité est linéaire en T ; et un « pseudogap » s’observe souvent dans cette gamme de température par un abaissement de la densité d’états au niveau de Fermi mesurée par résonance magnétique. Dès les premières observations d’ordre local antiferromagnétique aux USA dans les premiers composés de Müller et leur variation systématique de longueur d’onde moyenne avec le dopage, il était clair pour Bob Schrieffer comme pour moi, qui partageais alors son bureau, que ces « nouveaux » supraconducteurs avaient des électrons délocalisés et un niveau de Fermi, confirmés plus tard par des mesures ARPES de structure électronique. A mon retour à Orsay, il était alors naturel que Henri Alloul interprète ses mesures de déplacement de Knight en résonance magnétique dans la large gamme de température de fluctuations antiferromagnétiques comme dues à ce que Nevill Mott appelait alors un « pseudogap » en présence d’un ordre atomique local dans les alliages métalliques. C’est ensuite dans les organiques que Claude Bourbonnais a proposé que le couplage supraconducteur soit dû à un couplage des électrons de conduction, responsables d’une résistivité r en T2, par l’intermédiaire de ces fluctuations antiferromagnétiques, responsables du comportement linéaire de r en T à plus hautes températures. L’extension des organiques aux cuprates et à certains au moins des autres « nouveaux » supraconducteurs, accompagnée d’une asymétrie assez générale de la bande interdite supraconductrice, incline je pense la majorité des chercheurs vers le rôle éminent des fluctuations antiferromagnétiques, très souvent observées, dans le mécanisme de la supraconductivité. Michel Héritier, qui a participé à la recherche avec Denis Jérome, en mentionne la possibilité. Je pense que la revue proposée ne devrait pas mentionner sur le même pied d’autres suggestions, bâties sur des expériences souvent trop diverses ou trop hâtives. Michel Héritier n’insiste pas assez, notamment sur ce point, noté d’abord par David Pines, qu’un couplage par excitation électronique tel que celui introduit par Claude Bourbonnais, pouvait conduire à une bande interdite supraconductrice anisotrope.
x ii
Préface
Ces quelques remarques personnelles n’enlèvent rien à la qualité d’une présentation générale qui met en avant les idées théoriques fondamentales, aussi bien que les détails expérimentaux ou les noms de nombreux participants à cette tâche collective. Jacques Friedel Le 12 décembre 2012
x iii
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Préambule À l’origine, cet ouvrage a été conçu, initialement, pour l’enseignement du DEA de Physique des Solides de la Région Parisienne, devenu depuis le M2 de Physique de la Matière Condensée. Le public auquel il était donc destiné, depuis de longues années, était celui d’étudiants ayant acquis une formation universitaire de Physique Fondamentale de type M1, des élèves des ENS, des principales Écoles d’Ingénieurs. Mais aussi, plus généralement, il s’est aussi adressé à tous ceux qui recherchaient une formation de base en Physique de la Matière Condensée et à tous ceux qui voulaient poursuivre des travaux de recherche dans ce domaine de la Physique. Les prérequis ont donc été, avant tout, une bonne formation en Physique Générale de niveau Maîtrise, notamment en Mécanique Quantique et en Physique Statistique. Depuis ces premiers temps, une évolution du manuscrit a été effectuée. Il s’agissait de passer d’un ouvrage d’enseignement de niveau M2, à une monographie essentiellement destinée à la recherche, recherche qui, il faut toutefois le souligner, n’a jamais été absente du manuscrit. Cependant, le contenu du manuscrit s’en est trouvé, d’une certaine façon, modifié. Une des originalités essentielles de ce manuscrit, sous sa forme actuelle, tient précisément à la double motivation que l’auteur a voulu lui conserver : – une motivation liée à la formation, pas seulement des étudiants de Master, mais aussi de tous ceux qui découvrent cette discipline qui couvre un champ important de la Physique ;
xv
Physique de la matière condensée
– mais aussi une motivation liée de façon importante à la recherche. Le présent manuscrit expose d’abord, de façon simple et accessible, les concepts de base qui tiennent en rôle important dans la discipline. Nous verrons également, ci-après, les principales thématiques de recherche qui seront abordées, qui se développent et se renouvellent de façon importante, et les principales méthodes exposées dans cet ouvrage.
Le problème à N corps Pour un physicien, la Matière Condensée se définit par la propriété qu’un très grand nombre de degrés de liberté interagissent entre eux fortement. Il n’est pas possible d’ignorer ces interactions ou de les considérer comme une petite perturbation, comme on pourrait le faire dans les milieux dilués. Pour définir des quantités macroscopiques, comme, par exemple, l’énergie libre, l’entropie ou la chaleur spécifique, il faut, bien sûr, faire appel aux méthodes de la mécanique statistique, mais ceci n’est pas spécifique de la Physique de la Matière Condensée. Ce qui est spécifique, c’est qu’un nombre macroscopique de degrés de liberté sont fortement couplés entre eux. C’est ce qu’on appelle le « problème à N corps ». C’est dans ce problème à N corps que réside la difficulté principale de la Physique de la Matière Condensée, mais aussi sa principale richesse. C’est cette grande richesse qui est à l’origine de la diversité presque infinie et sans cesse renouvelée, des phénomènes étudiés en Physique de la Matière Condensée, notamment grâce aux phénomènes coopératifs produits par les effets des interactions.
Lois de conservation et brisures spontanées de symétrie Les propriétés de symétrie jouent un rôle essentiel dans toute la Physique. Ceci est sans doute particulièrement vrai en Physique de la Matière Condensée. Il est donc toujours important d’analyser les propriétés de symétrie d’un système. Plus précisément, on doit rechercher s’il existe des opérations de symétrie qui laissent le système invariant. En effet, les propriétés macroscopiques de la Matière Condensée sont gouvernées par des lois de conservation et par des phénomènes de brisures de symétrie. Il s’agit là d’un des concepts les plus importants qui émergent de cette discipline. On sait que les lois de la physique vérifient de très hautes propriétés de symétrie. La matière, à suffisamment haute température se trouve dans un état gazeux et, même à plus haute température, les molécules sont dissociées et les atomes ionisés. Un tel état est clairement compatible avec les symétries de base des équations qui gouvernent cette matière. Cependant, à basse température, il arrive souvent que ce ne soit plus le cas. Fréquemment, l’état de la matière perd spontanément certaines propriétés de symétrie qu’il possédait à plus haute température. Un exemple simple est celui des liquides, qui cristallisent tous, y compris l’Hélium, dans des conditions
xvi
Préambule
expérimentales adéquates de température et de pression. Ils perdent alors la propriété d’invariance par le groupe des translations continues de l’espace, qu’ils vérifiaient dans la phase liquide, alors qu’un solide n’est invariant que dans les opérations de translations discrètes du réseau cristallin. Cette différence dans les propriétés de symétrie du liquide et celle du solide est importante, car elle induit des différences qualitatives spectaculaires du comportement physique : notamment, en même temps que se produit la transition de phase de cristallisation, apparaît le phénomène de rigidité cristalline, spécifique de la phase solide. C’est L.D. Landau qui a souligné l’importance et le caractère très général de ce phénomène, qu’il a dénommé « brisure spontanée de symétrie ». Toute la théorie de Landau des transitions de phase repose sur ce concept.
Théorie de Landau des transitions de phase – Paramètre d’ordre L.D. Landau a ainsi introduit la notion, très féconde et très importante pour l’étude des transitions de phase, de « paramètre d’ordre ». Si on suppose que la transition se traduit par la perte d’un ou de plusieurs éléments de symétrie, il devient nécessaire, pour caractériser complètement la phase la moins symétrique et pour distinguer les deux phases, de définir un nouveau paramètre physique, nul par raison de symétrie dans la phase désordonnée, non nul dans la phase ordonnée. L’apparition d’une valeur non nulle pour le paramètre d’ordre correspond à une brisure spontanée de symétrie. Dans le cas d’une transition de phase avec brisure de symétrie, nous introduisons donc le paramètre d’ordre indiquant le degré de la brisure de symétrie, qui est aussi, habituellement, le degré d’ordre acquis par le système.
Approximation de champ moyen Bien entendu, il est en général impossible de résoudre de façon exacte le problème à N corps, si on excepte quelques modèles très simples et très spécifiques, dont les solutions sont désormais bien connues. Il est donc nécessaire, en général, d’introduire des méthodes d’approximation, en ayant soin de bien préciser leur limite de validité, dans les conditions imposées par l’expérience. Nous verrons, tout au long du présent ouvrage, que l’approximation la plus simple, pour traiter ce problème à N corps, consiste à négliger les corrélations entre particules et à les traiter comme indépendantes. Nous verrons que ces méthodes de champ moyen ne sont pas toujours aussi brutales et grossières qu’on pourrait le supposer a priori, mais qu’elles s’avèrent souvent un outil simple et efficace, y compris en Matière Condensée, là où, précisément on s’attend à l’importance des effets des interactions et des corrélations entre les degrés de liberté couplés. La théorie de champ moyen décrit en général de façon correcte les faits qualitatifs de la plupart des transitions de phase.
x v ii
Physique de la matière condensée
Cette approximation consiste à remplacer les configurations exactes par les valeurs moyennes des variables locales. Elle néglige donc les effets des fluctuations autour de la moyenne. Ces fluctuations peuvent, selon les cas, être importantes ou faibles. Le critère de Ginzburg permet de discuter leur importance
Phénomènes critiques Quand la dimension d’espace augmente, les fluctuations deviennent de moins en moins importantes. Au dessus d’une dimension critique dc , les fluctuations deviennent si peu importantes qu’une théorie de champ moyen fournit une description analytique correcte des transitions de phase continues. Au contraire, quand la dimension d’espace est réduite, les fluctuations deviennent de plus en plus importantes. En dessous de trois dimensions, les fluctuations deviennent si violentes qu’elles peuvent détruire l’état ordonné et les transitions de phase à température non nulle. À une dimension les fluctuations détruisent tout ordre à longue portée à symétrie brisée continue, à température non nulle. En dessous de la dimension critique supérieure dc , les fluctuations sont toujours importantes et invalident les théories de champ moyen quand la température devient trop proche d’une température critique Tc . Il faut décrire la fonction de partition comme une intégrale fonctionnelle sur toutes les valeurs possibles du paramètre d’ordre en tout point de l’espace. Ainsi apparaissent de nouvelles approximations, dont les résultats diffèrent des valeurs des exposants critiques prévus par le champ moyen. On définit, pour ces fluctuations critiques, une longueur de corrélation ξ , donnant leur taille moyenne et un temps de corrélation τ donnant leur durée de vie moyenne. Cette longueur ξ et ce temps τ deviennent de plus en plus grands au fur et à mesure que l’on s’approche du point de transition, et ceci entraîne l’importance de plus en plus marquée des phénomènes critiques associés à ces fluctuations. Si ξ tend vers l’infini quand T tend Tc , le régime de fluctuations se développe complètement près de Tc ; sinon le régime avorte, la transition de phase se produisant prématurément. On observe au voisinage d’un point critique des comportements en lois de puissance avec des exposants non nécessairement entiers. Il s’agit d’un comportement singulier parce qu’il implique que les grandeurs thermodynamiques, les fonctions de corrélations sont des fonctions non analytiques, non régulières, de leurs variables.
Lois d’échelle On peut regrouper les différents systèmes physiques, présentant les transitions de phase les plus variées, en un petit nombre de groupes, qu’on appellera classes d’universalité, caractérisés par un certain ensemble de valeurs des exposants critiques. Si un système appartient à une classe d’universalité donnée, tous les exposants critiques de ce système sont ceux de la classe d’universalité. On observe, de plus, entre les
x v iii
Préambule
exposants critiques, des relations très simples appelées lois d’échelle, qui présentent un caractère d’universalité encore plus grand. En fait le comportement critique dépend de n, nombre de composantes du paramètre d’ordre, et de d , dimension d’espace : ceci définit une classe d’universalité. La propriété d’homogénéité vérifiée par la densité d’énergie libre, au voisinage d’un point critique, peut s’interpréter comme une propriété d’invariance dans une transformation d’échelle de la longueur de corrélation. On établit une correspondance entre un problème de longueur de corrélation donnée et un problème de longueur de corrélation plus petite. Le cas où la longueur de corrélation est strictement infinie au départ, et en conséquence, le reste au cours de la réduction, c’est-à-dire le cas d’un point critique, correspond au cas du point fixe. La partie singulière de l’énergie libre est donc le point fixe de cette transformation. Les singularités du comportement critique sont tout entières associées à la divergence de la longueur de corrélation. Les lois d’échelle permettent de calculer tous les exposants critiques que nous avons définis dès qu’on en connaît trois. Grâce à la théorie de Landau, nous connaissons les exposants critiques exacts pour d = 4. Nous pouvons les calculer pour d < 4 par une série de perturbation en puissances de = 4 − d . Au cours des années 70, l’accent a été mis sur le développement du comportement critique en . Ce développement a effectivement joué un très grand rôle historique, en permettant pour la première fois d’aller au-delà de la théorie de Landau, avec des résultats qualitativement corrects. Aujourd’hui, il semble très important de pouvoir prouver l’existence de points fixes par des méthodes non perturbatives, ce qui permettrait un calcul totalement fiable des exposants critiques. L’hypothèse d’homogénéité nous permet de dériver les relations entre exposants critiques. Toutefois, elle ne permet pas de donner la valeur numérique de chaque exposant. Pour cela, il faut faire appel à la méthode du groupe de renormalisation.
Introduction au groupe de renormalisation Le groupe de renormalisation établit des correspondances entre systèmes de longueurs de corrélation différentes. Si la chaîne de correspondance aboutit à un système soluble, par quelque méthode, on peut obtenir, en remontant la chaîne, la solution du système de départ. Dans le cas des transitions de phase, la solution du comportement critique est obtenue en étudiant les petites déviations autour du cas particulier du point critique, où la longueur de corrélation reste infinie dans les opérations de réduction. Au point critique, on peut supposer qu’un hamiltonien invariant H ∗ existe. C’est la façon dont on s’approche de H ∗ qui révélera toutes les propriétés universelles inhérentes à l’existence du point critique.
x ix
Physique de la matière condensée
Un florilège d’exemples de transitions de phase Il est, bien sûr, impossible dans cet ouvrage d’explorer toute la richesse et toute la diversité des transitions de phase de la Physique de la Matière Condensée. Nous nous contenterons ici d’exposer quelques exemples particulièrement importants et significatifs. Nous aborderons d’abord le cas des transitions de phases électroniques, où l’énergie cinétique des électrons entre en compétition avec les interactions coulombiennes et, notamment, des phénomènes quantiques macroscopiques (ordre magnétique, ordre supraconducteur). Nous commencerons par discuter le cas des systèmes électroniques très denses, où les méthodes de champ moyen (Hartree, Hartree-Fock, RPA) se trouvent justifiées de façon perturbative. Puis nous discuterons la Théorie de Landau des Liquides de Fermi, véritable justification de la théorie quantique initiale de la matière condensée, appliquée aux systèmes de Matière Condensée expérimentaux. Vers la fin des années 80, les expériences ont révélé des exemples de plus en plus nombreux où la théorie de Landau des liquides de Fermi ne pouvait plus s’appliquer. Le cas le plus spectaculaire est celui de la supraconductivité à haute température critique. Mais depuis, de nombreux exemples de systèmes physiques ont montré qu’ils nécessitaient une analyse allant au delà de la théorie de Landau des liquides de Fermi et, par conséquent de nouveaux développements, aussi bien conceptuels qu’expérimentaux.
La richesse des analogies en Physique de la Matière Condensée Ce qui frappe, peut-être d’abord, en Physique de la Matière Condensée, c’est cette grande diversité des phénomènes étudiés, ce foisonnement presque infini de systèmes physiques, d’expériences menées à bien et de concepts nouveaux élaborés pour les comprendre. Mais ce sont aussi de profondes analogies qui ont été établies sur des phénomènes apparemment si différents : différents par les interactions mises en jeu, différents par les ordres de grandeur et même par les concepts établis. Les exemples de ces analogies sont eux mêmes extrêmement divers. Nous ne donnerons ici que quelques uns de ceux élaborés par Pierre-Gilles de Gennes, grand maître de ces analogies, autour des quelles il a construit son œuvre scientifique. Nous consacrerons un chapitre de cet ouvrage consacré à trois exemples significatifs d’analogies développées par P. G. de Gennes : (i) la percolation, un concept unificateur, (ii) l’analogie entre supraconducteurs et cristaux liquides nématiques et smectiques, (iii) la découverte n=0 sur la physique expérimentale et théorique des polymères. Il ne s’agit là, évidemment, que d’un choix arbitraire et nécessairement réducteur.
xx
Préambule
La richesse et la créativité du dialogue incessant entre théorie et expérience Chacun connaît l’importance qu’il convient d’attribuer aux aspects expérimentaux dans le développement de la Physique. Ceci est notamment vrai pour la Physique de la Matière Condensée, qui constitue le sujet de cet ouvrage. C’est pourquoi nous pensons nécessaire d’insister sur l’importance des expériences dans le développement de la Physique de la Matière Condensée. Sur chacune des thématiques abordées ici, il sera nécessaire de ne pas se limiter aux aspects théoriques, mais de montrer tout ce qu’apportent les études expérimentales : la position du problème, la nécessité d’élaborer des concepts nouveaux, la discussion sur tout ce que la réalité expérimentale exige d’inclure dans une modélisation correcte, sur toutes les limitations des connaissances expérimentales, etc. Enfin et surtout, tout le monde sait bien que théories et expériences ne s’élaborent jamais de façon indépendante. Les connaissances scientifiques résultent toujours d’un dialogue incessant entre théorie et expérience, dans un sens et dans l’autre. C’est ce dialogue permanent qui apporte la créativité des équipes de recherche qui y participent. Il nous paraît important que cet ouvrage puisse tirer parti de ce dialogue. Ainsi, à simple titre d’exemple, nous ne nous limiterons pas ici à l’exposé théorique de théorie des champs sur les transitions de Kosterlitz – Thouless. Cette théorie est conceptuellement très belle, mais la couper artificiellement des observations expérimentales serait très réducteur et pour tous frustrant. C’est pourquoi nous souhaitons montrer aussi comment les concepts théoriques développés par la théorie permettent de rendre compte de tout la richesse de phénomènes observés expérimentalement, aussi divers que la cristallisation des électrons à la surface de l’Hélium liquide, les transitions de phase des films suprafluides, les transitions de phase des couches minces de cristaux liquides, le diagramme de phase des gaz rares adsorbés sur le graphite. Seul ce dialogue entre théorie et expérience peut rendre compte de façon correcte de la réalité de la connaissance scientifique.
Remerciements Ce manuscrit est le modeste fruit d’une culture scientifique acquise, d’une part lors de la direction du Master 2 de Physique de la Matière Condensée de la Région Parisienne, d’autre part lors la direction du Laboratoire de Physique des Solides d’Orsay. – Au sujet de l’enseignement de Master 2, Il faut souligner l’importance, pour cet enseignement, d’avoir regroupé l’ensemble de la Région Parisienne. Ceci a fortement contribué à sa richesse, à sa cohésion et à sa diversité culturelle, intellectuelle et thématique. – Au sujet du Laboratoire de Physique des Solides d’Orsay, on peut dire qu’il constitue certainement l’un des laboratoires les plus importants dédiés à la recherche sur la Matière Condensée. Il a su mettre en symbiose les études sur les propriétés
xxi
Physique de la matière condensée
électroniques, magnétiques, optiques et mécaniques avec les problèmes d’organisation de la matière, c’est à dire l’étude des structures et de leurs imperfections, et développer une instrumentation scientifique originale pour répondre à ces objectifs. La politique scientifique de ce laboratoire a toujours accordé une importance toute particulière au développement de concert des recherches expérimentales et théoriques. Un dialogue permanent entre théorie et expérience a toujours été recherché. L’auteur de ce manuscrit tient particulièrement à adresser toute la reconnaissance due à trois géants de la Physique de la Matière Condensée, Jacques Friedel, André Blandin et Pierre-Gilles de Gennes pour l’importance exceptionnelle de ce qu’ils ont apporté et qui transparait dans ce manuscrit.
Jacques Friedel
x x ii
André Blandin
Pierre-Gilles de Gennes
Système d’unités de Gauss Le système d’unités de Gauss a été adopté dans ce manuscrit. Le lecteur désireux de traduire les équations faisant intervenir des grandeurs électromagnétiques dans les unités du système international (SI) doit utiliser les équivalences suivantes : qSI qG = √ 4π0 Potentiel scalaire : VG = VSI 4π0 4π Potentiel vecteur : A G = ASI μ0 Charges électriques :
(1.1) (1.2) (1.3)
Dans ces équations, l’indice G indique une grandeur mesurée dans le système d’unités de Gauss et SI la valeur de cette même grandeur dans en unités SI. Les champs électriques et magnétiques sont modifiés de la même manière que les potentiels scalaire et vecteur les engendrant respectivement. Aussi, les courants sont modifiés de la même manière que les charges, car la définition d’un courant fait intervenir une charge électrique.
x x iii
Physique de la matière condensée
Explicitement, on a donc : jSI 4π0 Champ électrique : EG = ESI 4π0 4π Champ magnétique : BG = BSI μ0 Densité de courant :
jG = √
(1.4) (1.5) (1.6)
Le système d’unités international introduit la permittivité diélectrique du vide et la perméabilité magnétique du vide, absentes du système d’unités de Gauss. La perméabilité magnétique du vide est définie par : μ0 = 4π × 10−7 N/A2
(1.7)
et sa valeur fixe la définition de l’Ampère A. La permittivité diélectrique du vide est définie via la relation : 1 0 = 2 , (1.8) c μ0 où c est la célérité de la lumière dans le vide, fixée à 299 792 458 m/s. Voici quelques exemples de changement de système d’unités, à commencer par l’expression de la force de Lorentz, 1 (1.9) FL = qG EG + v ∧ BG = qSI (ESI + v ∧ BSI ) c De même la force de Coulomb agissant entre deux charges q et q distantes de r s’écrit : qG qG qSI qSI FC = = (1.10) r 4π0 r On peut aussi exprimer les équations de Maxwell dans ces deux systèmes d’unités. Équation
Gauss
SI
Maxwell-Gauss
∇ · E = 4πρ
Maxwell-Thompson
∇ ·B =0
∇ · E = ρ0 ∇ ·B =0
Maxwell-Faraday
∇ ∧ E = − 1c ∂t B
Maxwell-Ampère
x x iv
∇ ∧ E = −∂t B 4π 1 ∇ ∧ B = c j + c ∂t E ∇ ∧ B = μ0 j + c12 ∂t E
Modèle d’Ising à une et deux dimensions 1.1 Introduction Nous commençons, dans ce chapitre, l’étude d’un problème de mécanique statistique de la matière condensée où l’effet des interactions est important. Le modèle que nous avons d’abord choisi de discuter ici est connu sous le nom de Modèle d’Ising [1]. Ce modèle très simple est défini de la façon suivante : on considère un réseau régulier dont les sites sont numérotés d’une certaine façon, et sur chaque site i , on définit une variable scalaire σi qui peut prendre deux valeurs ±1. Ces variables sont couplées à un « champ » extérieur hi , et entre elles par une interaction de paires. L’hamiltonien s’écrit : H =− Jij σi · σj − hi σi , (1.1) i>j
i
où les Jij sont les constantes de couplage. Ce choix, qui peut, a priori, paraître arbitraire, présente les avantages suivants : – Il s’agit d’un modèle extrêmement simple, mais non trivial. Contrairement au cas du gaz parfait, il peut donner lieu à des effets coopératifs que nous allons discuter. Or ces effets peuvent être étudiés dans le cadre d’une solution exacte. En effet, alors qu’il existe très peu d’exemples de problèmes exactement solubles en mécanique statistique, le modèle d’Ising est l’un de ceux-là, à une dimension
1
Physique de la matière condensée
(calcul élémentaire) et à deux dimensions (solution de Lars Onsager, 1944 [2]). À trois dimensions, il n’existe que des solutions approchées. – Le fait qu’il existe une solution exacte nous permettra d’introduire, souvent de façon élémentaire, des concepts de mécanique statistique importants et très généraux, tels que les fonctions de corrélation, la notion d’ordre à courte et grande distance, de longueur de corrélation, de point critique, de symétrie spontanément brisée, etc. Nous en profiterons également pour introduire de façon très simple des méthodes utiles de mécanique statistique, telles que les développements de haute et basse température, la matrice de transfert, la dualité, etc. – L’existence d’une solution exacte nous permettra, évidemment, de comparer les propriétés de cette solution exacte avec celles de solutions approchées, qui seront exposées plus loin, notamment celle obtenue dans l’approximation de champ moyen (chapitre 3), mais aussi une autre, obtenue en utilisant la méthode du groupe de renormalisation et discutée plus loin dans cet ouvrage (chapitre 5). Il est toutefois bon de préciser que l’intérêt de ce problème ne réside pas seulement dans le fait qu’il existe une solution exacte à une et deux dimensions. Le modèle d’Ising permet de décrire, de façon plus ou moins approchée, toute une large classe de systèmes physiques. Il présente donc, en lui-même, un intérêt considérable. Nous nous contenterons ici, de donner quelques exemples, évidemment non limitatifs, de systèmes physiques susceptibles d’être valablement décrits par un modèle d’Ising.
1.1.1 Systèmes magnétiques anisotropes La motivation initiale qui a conduit à étudier le modèle d’Ising, était, au départ, de décrire des problèmes de magnétisme. Le magnétisme de certains solides isolants peut être décrit par des opérateurs de spins Si à trois composantes couplés par une interaction d’échange, dans le cadre du modèle d’Heisenberg [3], comme nous le discuterons plus loin dans l’étude du magnétisme localisé (chapitre 9) : −Jij Si · Sj (1.2) En présence d’un champ magnétique extérieur h, l’hamiltonien de spin sera de la forme : Jij Si · Sj − g μB h · Si , (1.3) H =− i>j
i
L’une des difficultés de ce modèle d’Heisenberg tient à la nature quantique du problème, c’est-à-dire à la non-commutation des composantes des opérateurs de spin Si . Une approximation simplifie considérablement le problème : on ne retient dans l’interaction d’échange que les composantes des spins le long du champ extérieur appliqué au système : Jij Siz · Sjz − g μB h z Siz (1.4) H =− i>j
2
i
1. Modèle d’Ising à une et deux dimensions
Tous les opérateurs, dans cet hamiltonien, commutent entre eux, de sorte que les valeurs propres de H sont obtenues en donnant aux différents Siz leurs valeurs propres respectives égales à ± 12 . Ce modèle, bien que très simplifié, permet de décrire un certain nombre de systèmes magnétiques. Il se peut, en effet, que l’anisotropie soit telle que les composantes du spin dans les deux directions perpendiculaires soient gelées et ne participent pas à la transition magnétique. Par exemple, il peut exister une anisotropie magnétique axiale, qui impose un axe de facile aimantation dans la direction z, qui peut être décrite par le terme : 2 2 Ha = Ea Six + Six (1.5) i
Dans la limite d’une très forte anisotropie, c’est-à-dire Ea |Jij |, seuls les états propres où les spins sont orientés parallèlement à z ont une énergie accessible, de sorte que l’hamiltonien se réduit effectivement à un hamiltonien d’Ising.
1.1.2 «Gaz sur réseau » Dans ce modèle, on imagine que l’espace a été divisé en cellules de volume unité, centrées sur les sites d’un réseau régulier. On définit la quantité ni = 0 ou 1, selon que la i -ème cellule est vide ou occupée par une particule de gaz : chaque cellule peut être occupée au plus par une particule de gaz. Les occupations multiples de cellule ne sont pas autorisées. Les configurations sont spécifiées par la donnée des ni pour chaque cellule i . L’énergie potentielle U ne dépend que des ni . Le système est susceptible d’échanger des particules avec un réservoir. On se place donc dans l’ensemble grand-canonique. La grande fonction de partition classique (ensemble grand-canonique) est donnée par : exp −βH (1.6) ZG = {ni }
où
H =U −μ
ni
(1.7)
i
μ étant le potentiel chimique dans la cellule i . En supposant que les cellules n’interagissent que par des interactions de paires, on écrit : ϕij ni nj (1.8) U = i>j
où ϕij est le potentiel de paire. Le gaz sur réseau et le système de spins sont reliés de façon évidente par l’identification : σi = 1 − 2ni
(1.9)
3
Physique de la matière condensée
ce qui signifie que σi = +1 correspond à une cellule vide et σi = −1 à une cellule remplie par une particule. Les deux systèmes sont donc équivalents. Le modèle de « gaz sur réseau » permet de décrire des problèmes d’adsorption sur une surface pouvant échanger des atomes ou des molécules avec un gaz, d’épitaxie, etc.
1.1.3 Modèle d’alliages binaires Considérons un modèle sur réseau pour des solutions ou des alliages binaires, où les sites du réseau peuvent être occupés soit par des atomes A, soit par des atomes B. On constate une différence d’énergie selon qu’une paire d’atomes AA, AB, ou BB occupent les sites i et j . Soient εij (AA), εij (AB) = εij (BA), εij (BB) ces énergies d’interaction de paires. Posons pi (A) = 1, si le site i est occupé par un atome A et 0 si le site i n’est pas occupé par un atome A et pi (B) = 1 si le site i est occupé par un atome B et 0 si le site i n’est pas occupé par un atome B. Puisque nous imposons que chaque site du réseau soit occupé par un atome et un seul (ce qui exclut la présence de lacunes et d’intersticiels, dont l’énergie est supposée très grande et donc très peu probable), ceci impose la condition : pi (A) + pi (B) = 1
(1.10)
L’énergie d’interaction s’écrit : H =
ϕij ni nj
(1.11)
i>j
Nous nous sommes contentés de ne donner ici que quelques exemples. Il existe, en fait, un grand nombre de systèmes physiques très variés décrits par des variables locales résultant d’un choix entre deux solutions (spin + ou spin −, site vide ou site occupé, atome A ou atome B, etc...) susceptibles d’être décrits par un modèle d’Ising. Ceci confère à ce modèle un intérêt très général en Physique de la Matière Condensée.
1.2 Le modèle d’Ising à une dimension, cas des forces à courte portée Nous commençons par l’étude du modèle unidimensionnel. Un calcul élémentaire permet dans ce cas, où le réseau est une chaîne linéaire, de déterminer la fonction de partition sans approximation.
4
1. Modèle d’Ising à une et deux dimensions
1.2.1 Fonction de partition Les forces sont à courte portée. Ce point a une importance particulière, notamment pour déterminer s’il existe une phase ordonnée et une transition de phase à température finie. De plus, par souci de simplicité, nous spécifions que les interactions sont non nulles entre premiers voisins seulement. Cette limitation aux premiers voisins simplifie les calculs, mais ne modifie pas qualitativement les propriétés physiques essentielles du modèle par rapport à un cas moins simplifié, mais où la portée des interactions reste finie. Par exemple, un modèle où l’on étendrait les interactions au delà des premiers voisins, en incluant les interactions entre deuxième voisins ou entre troisièmes voisins, garderait essentiellement les mêmes propriétés, à des modifications quantitatives près, qui ne changeraient pas de façon essentielle la physique. L’hamiltonien du système en champ nul se réduit à : J σi σj (1.12) H =−
où la paire < i, j > est prise entre sites premiers voisins. Dans ce qui suit, nous supposerons J > 0, de sorte que les spins tendent à être parallèles entre eux (plus précisément à avoir le même signe). La fonction de partition dans l’ensemble canonique s’écrit : Zc =
···
σ1 =±1
exp K σi σj
(1.13)
σN =±1
où β = kBl T et K = βJ , ce qui se réécrit, en mettant en évidence la partie paire et la partie impaire de l’exponentielle : Zc = ··· (1.14) cosh K + σi σj sinh K σ1 =±1
σN =±1
Numérotons les spins 1, 2...N , de gauche à droite. Nous considérons que les deux extrémités sont ouvertes : nous posons σN +1 = 0. La chaîne comporte donc N spins et N − 1 liaisons de spins premiers voisins. N −1 Zc = cosh K ··· 1 + σi σj tanh K σ1 =±1
σN =±1
En effectuant le produit sur toutes les paires < i, j >, on obtient une somme de termes comprenant chacun un produit de N − 1 facteurs, chacun de ces facteurs pouvant être soit 1 + tanh K , soit 1 − tanh K. Puis on doit effectuer la trace sur les spins σi de ces produits de termes. Dans le calcul de cette trace sur σi , tous les termes qui
5
Physique de la matière condensée
sont proportionnels à σi (ou plus généralement à toutes puissance impaire de σi ) donneront 0 : · · · σk σi σj · · · = 0 σi =±1
Le seul terme de trace non nulle, obtenu quand le produit sur les paires < i, j > est effectué, est celui où l’on prend, dans chacun des N facteurs i = 1, ..., N , le terme 1. Alors, Zc = 2N ( cosh K )N −1
(1.15)
Si, au lieu de prendre des extrémités ouvertes, on impose des conditions aux limites périodiques σN +1 = σ1 , nous obtiendrons un autre terme de trace non nulle. En effet, si au lieu de prendre dans les N facteurs le terme 1, on prend, à chaque fois, au contraire, le terme σi σj tanh K, ceci rajoute le terme supplémentaire : (σ1 σ2 ).(σ2 σ3 ).(σ3 σ4 )...(σN σ1 )( tanh K )N qui, sommé sur les σi , ne donne pas 0 mais la contribution non nulle (2 sinh K )N car chaque spin σi se trouve alors élevé au carré. Or, 2 σi = 2
(1.16)
(1.17)
σi =±1
ce qui conduit à : Zc = (2 cosh K )N + (2 sinh K )N
(1.18)
Notons que, dans le cas de la chaîne fermée, les termes en (2 cosh K ) et en (2 sinh K ) se trouvent à la puissance N, car il y a maintenant N liaisons de spins premiers voisins et non plus N − 1, comme dans le cas de la chaîne ouverte. Puisque cosh K > sinh K , les deux fonctions de partition Zc et Zc tendent vers la même limite quand N tend vers l’infini. Quand la taille du système tend vers l’infini, l’influence des effets de bord tend vers zéro. La fonction de partition est une fonction analytique de K ou de la température. On s’attend donc à ce que toutes les fonctions thermodynamiques qui en découlent le soient aussi. Il n’y a pas de « transition de phase ». Ceci est un résultat général des systèmes à une dimension quand les interactions sont à courte portée, liée à la topologie particulière des systèmes à une dimension et des défauts détruisant l’ordre à longue portée dans ces systèmes.
6
1. Modèle d’Ising à une et deux dimensions
1.2.2 Matrice de transfert Le calcul élémentaire du paragraphe précédent reste possible en raison de la simplicité du modèle, mais difficilement généralisable à des systèmes plus complexes. C’est pourquoi nous étudierons dans ce paragraphe une méthode de calcul en général puissante à une ou deux dimensions, même si elle est difficile à utiliser pour des dimensionalités plus élevées. On considère une chaîne linéaire de spins d’Ising, refermée sur un cercle et on impose des conditions aux limites périodiques : σi+N = σi L’hamiltonien du système, en présence d’un champ magnétique extérieur s’écrit : H =−
N
J σi · σi+1 −
i=1
N
hσi
(1.19)
i=1
Décomposons exp −βH par la méthode suivante : (1.20) exp −βH = e K σ1 σ2 +βhσ1 e K σ2 σ3 +βhσ2 · · · e K σN σ1 +βhσN = Tσ1 σ2 Tσ2 σ3 · · · TσN σ1
(1.21)
Les coefficients à deux indices Tσi σj , où chaque indice σi peut prendre 2 valeurs, peuvent être considérés comme les éléments d’une matrice 2 × 2. Cette matrice T est définie de la façon suivante : ⎛ ⎞ ⎛ +K +βh −K +βh ⎞ T++ T+− e e ⎠=⎝ ⎠ T =⎝ (1.22) T−+ T−− e −K −βh e +K −βh Notons que :
σ2
Tσ1 σ2 Tσ2 σ3 = T2 σ
(1.23)
1 σ3
où T2 est la matrice carrée de T, par définition même du produit de deux matrices. On peut ainsi sommer de proche en proche sur σ2 ....σN . On obtient, par cette méthode, la fonction de partition canonique pour N spins : TN ZN = Tσ1 σ2 Tσ2 σ3 · · · TσN σ1 = , (1.24) σ1 ,σ2 ,···σN
σ1
σ1 σ1
7
Physique de la matière condensée
c’est-à-dire : ZN = Tr (TN )
(1.25)
Les valeurs propres de la matrice T sont les racines de l’équation : λ2 − 2λe K cosh βh + 2 sinh 2K = 0
(1.26)
dont les racines sont : 1
λ± = e K cosh βh ± [e 2K sinh2 βh + e −2K ] 2
(1.27)
et par conséquent, ZN = (λ+ )N + (λ− )N
(1.28)
On s’intéresse à la limite thermodynamique, c’est-à-dire qu’on veut calculer l’énergie libre par spin, dans la limite où le nombre de spins tend vers l’infini. Dans cette limite, l’énergie libre par site s’obtient par : F 1 = lim − LnZN N →∞ N βN 1) Puisque l’on considère la limite où N est grand, il est commode de faire apparaître le rapport λ− λ+ < 1 : 1 1 λ− N LnZN = Lnλ+ + Ln 1 + N N λ+
(1.29)
2) Nous considérons ici des situations où le champ est normal à la boucle. Le deuxième terme décroît exponentiellement avec N car λ− reste strictement inférieur à λ+ , quels que soient la température et le champ appliqué, à l’exception du point singulier T = 0, h = 0 , de sorte que : 1 1 F 2 K 2K −2K 2 lim = − Ln e cosh βh + e sinh βh + e N →∞ N β On en déduit aisément la susceptibilité magnétique en champ nul : 2 ∂ F ∂M =− = N β exp 2K χ= ∂h h=0 ∂h 2 h=0
8
(1.30)
(1.31)
1. Modèle d’Ising à une et deux dimensions
qui reste finie à toute température non nulle. Comme nous l’avions vu au paragraphe précédent, toutes les fonctions thermodynamiques sont régulières. Il ne peut apparaître de singularité à température finie.
1.2.3 Fonctions de corrélations À partir de l’énergie libre par site F /N , obtenue au paragraphe précédent, on peut calculer l’aimantation moyenne par site : M =−
1 ∂F = N ∂h
sinh βh sinh2 βh + exp −4K
12
(1.32)
L’aimantation spontanée, c’est-à-dire dans la limite du champ tendant vers zéro (h → 0+ ), est nulle à toute température non strictement nulle. L’interaction J entre spins tend à rendre ces spins parallèles entre eux, mais les fluctuations thermiques sont suffisantes pour détruire toute aimantation moyenne, tout « ordre à grande distance ». La moyenne < σi > est nulle, mais il est intéressant de calculer comment les spins sur des sites différents σk et σl sont corrélés : c’est-à-dire de calculer les valeurs moyennes du type < σk σl >. La quantité : kl =< σk σl > − < σk >< σl >
(1.33)
appelée fonction de corrélation à deux spins, nous renseigne sur ces corrélations. Cette fonction de corrélation de paire mesure essentiellement le degré d’ordre dans le réseau, en champ nul. Mais il est nécessaire de considérer la limite des grandes distances. Ainsi, si (1.34) lim lim < σk σl >= 0 rkl →∞ N →∞
où rkl dénote la distance entre spin k et spin l , il est évident que les spins à grande distance ne sont pas corrélés, ou, plus précisément, la corrélation entre spins tend vers 0 quand la distance entre ces spins tend vers l’infini et nous disons qu’il n’y a pas d’ordre à longue distance. Même dans ce cas, la fonction de corrélation à distance finie est en général non nulle. Ceci est une mesure de l’ordre à courte distance qui subsiste dans le réseau. Dans notre modèle très simple, ces fonctions de corrélation peuvent se calculer aisément. Pour calculer ces corrélations à distance finie, commençons par considérer un cas un peu plus compliqué où βJi,i+1 = Ki dépend du site i . Dans ce calcul précis, nous considérons à nouveau le cas d’une chaîne ouverte, ce qui, à la limite thermodynamique, ne joue aucun rôle. La fonction de partition s’écrit alors : N −1 exp Ki σi σi+1 Z K1 , K2 , · · · KN −1 = (1.35) σ1 =±1,···σN =±1
i=1
9
Physique de la matière condensée
La somme sur σN = ±1 peut être effectuée de façon exacte : Z K1 , K2 , · · · KN −1 = 2 cosh KN −1 Z K1 , K2 , · · · KN −2
(1.36)
et par itération : N −1 Z K1 , K2 , · · · KN −1 = 2 2 cosh Ki
(1.37)
i=1
Calculons maintenant la fonction de corrélation : kl =< σk σl > − < σk >< σl >=< σk σl >
(1.38)
puisque les valeurs moyennes des spins sont nulles. Pour r > 0 et k + r < N : N −1 1 < σk σl >= (1.39) σk σl exp K σi σi+1 ZN {σi }
i=1
c’est-à-dire, en utilisant σi2 = 1 : 1 σk σk+1 σk+1 σk+2 · · · σk+r −2 σk+r −1 σk+r −1σk+r ZN {σi } N −1 × exp K σi σi+1 (1.40)
< σk σk+r >=
i=1
K1 =K2 =···KN −1 =K
d’où < σk σk+r >= 1 ∂ (r ) Z K1 , K2 , · · · KN −1 ZN ∂Kk+r −1 · · · ∂Kk+1 ∂Kk
(1.41)
K1 =K2 =···KN −1 =K
Avec l’expression précédente de ZN , on obtient : ⎡ ⎤ k+r −1 1 ⎣Z K1 , K2 , · · · KN −1 tanh Ki ⎦ < σk σk+r >= ZN i=k K1 =K2 =···KN −1 =K r = tanh K Si a est la distance entre spins premiers voisins, la fonction de corrélation entre spins distants de x = ra décroît exponentiellement avec x : < σk σk+r >= (x ) = exp −
10
x ξ
(1.42)
1. Modèle d’Ising à une et deux dimensions
avec ξ=
a
(1.43)
Ln tanh1 K
ξ est la longueur de corrélation, qui décrit comment décroît exponentiellement l’ordre à courte distance, en l’absence d’ordre à longue distance. L’apparition de l’ordre à longue distance se traduirait par la divergence de la longueur de corrélation, ce qui, dans ce modèle, ne se produit jamais à température non strictement nulle. Voyons ceci dans le langage de la matrice de transfert, pour une chaîne fermée, en présence d’un champ extérieur. On peut écrire, pour k < l : N N 1 (1.44) σk σl exp K σi σi+1 + βh σi < σk σl >= ZN {σ }
i=1
i=1
En introduisant la matrice de transfert T : 1 < σk σl >= Tσ1 σ2 · · · Tσk−1 σk σk Tσk σk+1 · · · Tσl −1 σl σl Tσl σl +1 · · · TσN σ1 ZN {σ }
(1.45) Après sommation sur tous les σj = ±1 excepté j = k et j = l , on obtient < σk σl >=
1 l −k σk T σl TN −l +k σk σl σl σk ZN
(1.46)
{σ }
où Ts σ σ dénote l’élément σ σ de la matrice T portée à la puissance s. On peut écrire 2 s s T σσ = λj φj (σ ) φj σ
(1.47)
j =1
où λj et φj sont les valeurs propres et les vecteurs propres de la matrice T. Par exemple, en champ nul, λ1 = 2 cosh K et
1 φ1 = √ 2
En général, en utilisant
1 1
λ2 = 2 sinh K 1 φ2 = √ 2
1 −1
(1.48) (1.49)
N N ZN = λ1 + λ2
11
Physique de la matière condensée
nous avons : < σk σl >=
N −1 N λ1 + λ2
2
σk =±1,σl =±1 i,j =1
−l +k λN σk φi σk φi σl i
× λlj −k σl φj σl φj σk N −1 2 2 λ2 λi N −l +k λj l −k = 1+ φi , σ φj λ1 λ1 λ1
(1.50) (1.51)
i,j =1
φi , σ φj = φi (σ )σ φj (σ )
où
(1.52)
σ =±1
Pour k et l fixés, puisque
λ2 λ1
< 1 pour tout K fini :
lim
N →∞
λi λ1
N −l +k
De même, puisque :
lim
N →∞
λ2 λ1
ckl = lim < σk σl >= N →∞
En champ nul :
=
⎧ ⎨ 1 si i = 1 ⎩ 0 si i = 2
(1.53)
N =0
2 2 λj l −k φ1 , σ φj λ1
(1.54)
j =1
⎧ ⎨ 0 si j = 1 φ1 , σ φj = ⎩ 1 si j = 2
Donc,
ckl =
λ2 λ1
l −k
l −k = tanh K
(1.55)
Sous cette forme, nous voyons que, si a est la distance entre deux spins premiers voisins : a x où ξ= (x ) = exp − (1.56) ξ Ln λλ12 c’est-à-dire que la longueur de corrélation diverge si et seulement si la plus grande valeur propre λ1 devient asymptotiquement dégénérée. Ceci signale l’apparition d’un
12
1. Modèle d’Ising à une et deux dimensions
point critique. Dans ce cas, il y a apparition d’ordre à grande distance : 2 lim ckl = φ1 , σ φ2 = 0 lim l −k→∞ N →∞
(1.57)
En général, à chaque fois qu’on peut écrire une expression telle que l’équation (1.57) pour la fonction de corrélation, nous pouvons déduire qu’un ordre à longue distance existe si et seulement si la plus grande valeur propre (λ1 ) est asymptotiquement dégénérée (pourvu, évidemment, que l’élément de matrice (1.55) soit non nul). Ce mécanisme pour l’apparition d’une transition de phase a été étudié en détail par Kac [8].
1.2.4 Absence de transition de phase à une dimension La symétrie de l’hamiltonien d’Ising, qui reste invariant dans un changement de signe global de tous les spins, montre bien que deux états possèdent une énergie minimale E0 : ils correspondent aux deux configurations où tous les spins sont de même signe, tous positifs (ce qu’on décrit parfois en disant abusivement que tous les spins sont « alignés vers le haut ») ou tous négatifs (« tous alignés vers le bas »). Ce sont les deux phases pures possibles du système. À cause de cette dégénérescence, liée à la symétrie de l’hamiltonien, la valeur moyenne de l’aimantation est nécessairement nulle. Pour qu’il existe une aimantation spontanée non nulle, il est nécessaire que cette symétrie soit brisée d’une façon ou d’une autre. Supposons que les conditions aux limites soient telles que l’un de ces deux états seulement soit possible, en imposant que sur les bords du système (deux points à une dimension) les spins soient orientés vers le haut. Cette condition va évidemment briser cette symétrie, puisque un des états purs devient impossible car il ne remplit pas les conditions aux limites. À température finie, toutes les configurations contribuent à la fonction de partition : exp −βE (c) (1.58) Z = {c}
qu’il est commode de réécrire sous la forme : Z =
W (c) exp −βE (c)
(1.59)
{c}
ne porte que sur les configurations d’énergie distincte. Si où la nouvelle somme on introduit l’entropie des configurations d’énergie E (c) S (c) = kB LnW (c)
(1.60)
L’entropie calculée ici est l’entropie dans l’ensemble microcanonique, puisqu’on considère l’ensemble des configurations dont l’énergie est fixée égale à E (c).
13
Physique de la matière condensée
D’où : Z =
exp −β [E (c) − TS (c)]
(1.61)
{c}
À températurefixée, cette somme est dominée par les configurations qui minimisent l’énergie libre E (c) − TS (c) . Il y a donc compétition entre énergie et entropie. Si, à température nulle, la minimisation de l’énergie libre se réduit à celle de l’énergie, à température finie, des configurations d’énergie supérieure peuvent être favorisées si leur entropie est suffisamment grande pour compenser la différence d’énergie. Dans notre système de spins unidimensionnels, les configurations peuvent être classées selon leur énergie. État Fondamental : + + + · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · + ++ Énergie : E0
1ers états excités : + + ········· + + − −············ − − + +········· + + Énergie E = E0 + 2(2J ) Entropie S = kB LnCN2 2kB LnN
2èmes états excités : ++······++− −···− −+ +···+ +−−···−− ++···++ Énergie E = E0 + 4(2J ) Entropie S 4kLnN Énergie libre : F E0 + 4(2J ) − 4kTLnN On voit donc qu’à toute température non nulle, aussi petite soit elle, les configurations où les spins sont retournés sont plus probables que l’état fondamental ordonné pour N très grand. On peut poursuivre un peu plus loin le raisonnement et calculer l’énergie libre Fp d’une séquence de p blocs de spins parallèles à l’intérieur d’un même bloc, chaque bloc étant alternativement + et − (p est nécessairement impair à cause des conditions aux limites : dans les états schématisés ci-dessus, p = 1, 3 ou 5) . p−1 Fp = E0 + 2 p − 1 J − kB TLnCN −1 (1.62)
14
1. Modèle d’Ising à une et deux dimensions
Pour p 1 et N 1 : Fp E0 + 4pJ − kB T {NLnN − pLnp − (N − p)Ln(N − p)}
(1.63)
Le terme le plus probable de la fonction de partition est obtenu en minimisant Fp par rapport à p. On obtient : 1 p = N 1 + exp 4βJ
(1.64)
c’est à dire une fraction très petite à basse température et croissante jusqu’à la valeur 1/2 à température infinie. Chaque bloc a une longueur l dont la moyenne est : N = 1 + exp 4βJ p
(1.65)
et par conséquent, l’aimantation moyenne par site vaut : =
1 1 < σi >= < l1 > − < l2 > + < l3 > − · · · + < lp > N N i
=
N 1 + exp 4βJ 1 × = N p N
(1.66)
À toute température non nulle, l’aimantation moyenne par site, non nulle à cause des conditions aux limites que nous avons imposées, se réduit à ces effets de bord. Elle est proportionnelle à 1/N et tend vers 0 quand N → ∞. Il ne subsiste aucune phase ordonnée. Le rôle de la dimension 1 apparaît nettement dans ces considérations qualitatives. En effet, à une dimension, il suffit de créer deux défauts localisés à une paire de spins premier voisins, chacun, pour retourner un nombre quelconque de spins : l’augmentation d’énergie est la même qu’on retourne un seul spin ou k spins consécutifs. À plus d’une dimension, partant d’un état ordonné à température nulle, les premiers états excités sont obtenus en renversant un seul spin et ils ne changent qu’infinitésimalement l’aimantation par site. Si on veut retourner une fraction x des N spins, la façon de dépenser une énergie minimale consiste à prendre ces spins dans un cube d’arête (Nx )1/d où d est la dimension d’espace. En comptant le nombre de spins à la surface du cube, on obtient l’augmentation d’énergie par rapport à l’état ordonné, égale à l’énergie d’un défaut localisé à une paire 2J, multipliée par le nombre de paires de spins à la surface (Nx )(d −1)/d E = 2J (Nx )(d −1)/d
15
Physique de la matière condensée
L’entropie de ces configurations excitées est d’ordre kB LnN (en effet, la position du centre du cube peut être choisie arbitrairement sur le réseau parmi N sites), de sorte que, pour créer une configuration d’aimantation moyenne par site : 1 N 1 − x − Nx = 1 − 2x N l’énergie libre nécessaire est : F = 2J (Nx )(d −1)/d − kB TLnN
(1.67)
Cette énergie libre est donc très grande pour tout x non nul à basse température, puisqu’elle augmente comme une puissance positive de N avec la taille du système. Contrairement au cas très spécifique des systèmes unidimensionnels, l’état ordonné reste donc favorisé à température non nulle pour d > 1. La spécificité est de nature topologique. À une dimension, il suffit pour casser les corrélations dans une chaîne parfaitement ordonnée, de casser deux liaisons de spins premiers voisins. Ces défauts localisés sont en fait de dimension 0 et ne concerne qu’un nombre fini de spins (2 dans le modèle précis discuté ici), même quand la taille du système devient infini. Il est clair que cet aspect est qualitativement différent dès le cas de la dimension 2, car la topologie de l’espace est différente, et la dimension des défauts n’est plus 0.
1.2.5 Interactions à longue portée Les calculs de ce chapitre et particulièrement l’argument du paragraphe précédent supposent que les interactions s’exercent seulement entre premiers voisins. Toutefois, cet argument ne serait à modifier que très légèrement si les forces entre spins s’étendaient quelque peu au-delà des premiers voisins, en incluant des interactions par exemple Ji,i+2 σi σi+2 . L’essentiel de l’argument reposait sur le fait qu’avec une dépense finie d’énergie on peut retourner une fraction macroscopique des spins, mais ce résultat resterait inchangé pourvu que les forces soient à courte portée. Ceci n’est plus le cas pour des forces de portée infinie. Dans ce dernier cas, l’interaction peut donner lieu à une transition de phase. Pour voir ceci, considérons un système où l’interaction entre deux spins distants de na est J (n), où a est l’unité de distance interatomique. Quand J (n) est indépendant de n dans un réseau, l’énergie totale s’écrit : σi σj = −JN N − 1 ∼ (1.68) E = −2J = JN 2 i,j
Ceci montre que l’énergie totale est proportionnelle à N 2 et ne satisfait pas la condition d’extensivité de l’énergie. Si l’on veut que l’énergie totale demeure une quantité extensive, donc proportionnelle à la taille du système, on peut remédier à cette difficulté à condition de considérer que l’interaction entre deux spins n’est pas J , mais J /N . (Ce modèle est en fait équivalent à une approximation qui sera discutée au
16
1. Modèle d’Ising à une et deux dimensions
chapitre 3 et connue sous le nom d’approximation de Bragg-Williams [4]). L’hypothèse d’une distribution uniforme de particules sur le volume permet d’obtenir une transition de phase quelle que soit la dimension d’espace. Ce modèle suppose que l’interaction ait une portée infinie et une amplitude infinitésimale. Considérons maintenant la condition pour l’existence d’une transition de phase, selon la dépendance en fonction de n de J (n) pour n grand. Supposons J > 0 et posons : M0 =
∞
J (r )
(1.69)
r =1
Si M0 devient infini, la différence entre l’énergie de l’état fondamental (c’est-à dire l’état où tous les σi sont égaux à +1) et celle des premiers états excités (les états où seulement un σi est égal à −1) est infiniment grande. Le système est alors toujours dans son état fondamental et ne peut pas subir de transition de phase, (cette fois ci parce que la phase désordonnée n’est jamais stable). M0 doit rester fini pour qu’une transition de phase puisse exister. De plus R. Ruelle [5] a montré que si : ∞ M1 = rJ (r ) (1.70) r =1
était fini, le système était toujours dans un état désordonné et ne pouvait, par conséquent, subir une transition de phase. On peut comprendre intuitivement cette propriété de la façon suivante : la frontière entre deux domaines ordonnés de longueur infinie + + + · · · · · · + + + + et − − − − · · · · · · − −− a une énergie de création finie M1 . Par conséquent, les frontières de deux états ordonnés de longueur finie + + + · · · · · · + et − − − − · · · · · · − ont une énergie inférieure à M1 . Alors, selon l’argument développé pour le cas des forces à courte portée, le système ne peut rester dans la phase ordonnée à toute température finie, puisque l’entropie stabilisera toujours la création de défauts. Dyson [6] a montré que, si J (n) (≥ 0) était monotone décroissant en fonction de n, et que M0 et K défini par ∞ Ln Ln r + 4 K = (1.71) r 3 J (r ) r =1
restaient finis, alors une transition de phase se produisait à température finie. De plus, même dans le cas où M1 est infini, aucune transition ne se produit si −1 N Ln LnN r =1 nJ (n) → 0 quand N → ∞. Par exemple, Baker [7] a considéré un modèle où l’interaction est définie par : J (n) = α exp ( − γ n)
(1.72)
17
Physique de la matière condensée
où M0 et M1 sont finis pour γ positif. Si on pose α = α0 γ et qu’on fait tendre γ vers zéro, alors M0 = α, mais M1 devient infini. Par conséquent, une transition de phase peut se produire.
1.3 Le modèle d’Ising à deux dimensions Les arguments qui précèdent montrent bien le caractère particulier du cas unidimensionnel. On s’attend à des résultats qualitativement différents à des dimensionalités plus élevées et à la possibilité d’existence d’une phase ordonnée et d’une transition à température finie. Nous allons donc étudier le cas bidimensionnel où existe une solution exacte [2], en l’absence de champ magnétique. Nous considèrerons, dans ce paragraphe, un modèle d’Ising bidimensionnel avec interactions à courte portée.
1.3.1 Matrice de transfert Cette méthode s’applique encore à deux dimensions. On considère un réseau bidimensionnel sur un tore construit en empilant des anneaux de n spins et ceci de façon périodique, de sorte que le (m + 1) ème anneau soit identique au premier. L’énergie totale est de la forme : φ(σ1 , σ2 ) + φ(σ2 , σ3 ) + .. + φ(σm , σ1 )
(1.73)
où σi , (qui est un vecteur à n composantes) dénote l’état de spin du i ème anneau et φ(σi , σj ) est l’énergie d’interaction entre le ième et le jème anneau dans l’état de spin σi et σj respectivement. Nous supposerons que φ(σi , σj ) n’est non nul que si les anneaux i et j sont premiers voisins. Définissons la matrice de transfert U : U(σ , σ ) = exp −βφ(σ , σ )
(1.74)
La matrice U est donc une matrice 2n × 2n , puisque chaque σ est un vecteur à n composantes, chacune de ces composantes pouvant prendre 2 valeurs. La fonction de partition s’exprime en fonction de la matrice de transfert : Z = Tr {Um } Soient λ1 et λ2 les deux plus grandes valeurs propres (éventuellement dégénérées) de la matrice de transfert : λ1 ≥ λ2 > .... On peut alors écrire un développement de la fonction de partition pour m grand.
18
1. Modèle d’Ising à une et deux dimensions
m m λ2 1+ Z = λ1 +··· λ1
(1.75)
À la limite thermodynamique, LnZ = mLnλ1
(1.76)
Il s’agit encore de calculer la plus grande valeur propre d’une matrice, mais la dimension de celle-ci est 2m × 2m et tend vers l’infini à la limite thermodynamique. Ce problème a cependant été résolu exactement [2]. Cette solution n’est, toutefois, pas assez simple pour être reproduite ici. On peut également montrer, comme à une dimension, que si λ1 et λ2 sont non dégénérées la corrélation entre σi et σi+r → 0 quand r → ∞ et que l’apparition de l’ordre à grande distance suppose que λ2 → λ1 quand m → ∞. Onsager a effectivement montré que c’était le cas en dessous d’une certaine température Tc .
1.3.2 Existence d’une transition de phase - méthode de Peierls Nous allons montrer qu’à température suffisamment basse, l’aimantation spontanée Ms = lim h→0+ M h est non nulle. À cause de la symétrie par retournement global des spins, il est bien sûr nécessaire de briser cette symétrie pour qu’une aimantation non nulle puisse exister. Cette symétrie peut être brisée en introduisant un champ extérieur, ce qui va privilégier un des deux états fondamentaux dégénérés, puis on fait tendre l’amplitude de ce champ extérieur vers 0, de façon que l’énergie apportée par ce champ tende elle aussi vers 0. En fait, il est plus simple, sur le plan théorique, au lieu d’imposer un champ extérieur infinitésimal, de supposer que sur la frontière du réseau tous les spins sont orientés vers le haut (par exemple) : c’est également une façon de briser la symétrie en introduisant un terme d’énergie dont la valeur relative tende vers 0 quand le nombre de spins tend vers l’infini. En fait, ces deux façons de briser la symétrie de l’hamiltonien sont équivalentes, à la limite thermodynamique. Nous admettrons cette équivalence, sans toutefois la démontrer. L’argument qui suit est dû à Rudolph Peierls [9], amélioré par Griffiths [10]. Son but est de prouver que dans le modèle d’Ising en dimension 2, et pour des interactions à courte portée, à suffisamment basse température, l’aimantation spontanée Ms est strictement supérieure à 0 et que, donc, un état ordonné existe. Ceci suffit à prouver l’existence d’une transition de phase dans le cas d’interactions à courte portée. En effet, dans une phase totalement désordonnée, on perdra, par rapport à la phase ordonnée, une énergie par spin de l’ordre de zJ, où z est le nombre de premiers voisins d’un site donné, alors qu’on gagnera un terme d’entropie par spin de l’ordre de kB TLn2. À suffisamment haute température, l’entropie stabilisera toujours la phase désordonnée. Si on peut pouver l’existence d’une phase ordonnée à suffisamment
19
Physique de la matière condensée
basse température, on aura établi l’existence d’une transition de phase. C’est l’objet de ce paragraphe. Considérons une configuration C donnée de spins d’Ising (figure 1.1) localisés sur les sites d’un réseau carré. Nous adoptons la condition aux bords qui contraint les spins à être positifs sur les frontières extérieures de l’échantillon, de façon à briser la symétrie de renversement global des spins par un terme d’énergie infinitésimale. La configuration C contient des îlots de spins − immergés dans la mer des spins + et on trace les frontières séparant ces îlots. Ces frontières ne sont d’ailleurs pas nécessairement connexes, car un îlot de spin − peut contenir un « lac » de spins +. La donnée de l’ensemble des frontières que contient la configuration de spins C suffit à déterminer complètement cette configuration.
Fig. 1.1 Configuration de spins dans le modèle d’Ising sur un réseau bidimensionnel carre. Les spins positifs sont représentés par des disques blancs et les spins négatifs par des disques noirs. La symétrie de renversement global des spins est brisée par les conditions aux bords, qui imposent que sur la surface extérieure de l’échantillon, tous les spins soient positifs. La configuration de spin est spécifiée en indiquant quels spins sont négatifs, ou, ce qui revient au même, quelles sont les frontières qui séparent les « ilôts » de spins négatifs dans la « mer » de spins positifs. Ces frontières peuvent ne pas être connexes : des « lacs » positifs peuvent être inclus dans les « ilôts » négatifs.
2 Une frontière de longueur b contient au plus b4 points, puisque le polygone de longueur donnée b qui possède la plus grande aire est le carré de côté b4 . (j )
On note Fb les frontières de longueur b : l’indice j varie de 1 à ν(b), où ν(b) est le nombre de figures qu’il est possible de tracer sur le réseau, dont le périmètre total est b et qui sont exclusivement formées de polygones fermés. Rappelons que ces
20
1. Modèle d’Ising à une et deux dimensions
figures, de périmètre total b, ne sont pas nécessairement connexes. Un dénombrement élémentaire montre que : ν(b) ≤ N 3b−1 (1.77) Pour démontrer cette limite supérieure pour ν b , il est possible de procéder de la façon suivante : on choisit le point inférieur gauche de polygone, ce qui correspond à N choix possibles, où N est le nombre total de sites du réseau carré, et, à partir de ce sommet, on décrit le polygone en effectuant b pas sur le réseau carré. À chacun des b − 1 premiers pas, 3 choix sont possibles, le quatrième étant impossible, car on s’interdit de revenir en arrière pour éviter des doubles comptages. Le b-ième et dernier pas n’introduit pas de chemins supplémentaires, car il n’y a qu’une façon de revenir au point de départ. Bien entendu, ce dénombrement ne fait que donner une limite supérieure pour ν b , car un grand nombre de chemins ainsi engendrés ne seront pas formés exclusivement de polygones fermés. (j )
(jk )
Une configuration de spin C contient des frontières Fb11 , · · · Fb
k
.
(j )
de la façon suivante : ⎧ (j ) ⎪ ⎨ 1 si C contient la frontière Fb (j ) Xb C = ⎪ ⎩ 0 si C ne contient pas F (j ) b
On définit la variable Xb
Une configuration C contient N− (C ) spins − et on a : ν(b) j j N− (C ) ≤ Xb C × nb de points intérieurs à Fb b
(1.78)
(1.79)
j =1
Il s’agit d’une inégalité (et non pas d’une égalité), car si un « lac » contient des « ilôts », tous les spins intérieurs ne sont pas négatifs. Par conséquent : ν(b) b 2 j N− (C ) ≤ Xb C (1.80) 4 j =1
b
(j )
La valeur moyenne de Xb
s’écrit : (j )
< Xb
>=
(j )
c⊃Fb
C
exp −βH
exp −βH
(1.81)
où la somme qui apparaît au numérateur ne comporte que les configurations qui (j ) contiennent la frontière Fb , alors que la somme qui apparaît au dénominateur comprend toutes les configurations de spin.
21
Physique de la matière condensée
À chaque configuration Ci apparaissant dans la somme du numérateur (et donc com(j ) prenant la frontière Fb ), on peut associer la configuration Ci∗ déduite de celle-ci en (j )
renversant tous les spins intérieurs à Fb . L’ensemble des configurations {C ∗ } n’est qu’un sous-ensemble de toutes celles qui apparaissent dans la somme au dénominateur. Donc, nous pouvons écrire : ! " (j ) exp −βH c ⊃Fb (j ) < Xb >≤ (1.82) {C ∗ } exp −βH (j )
Soit E (Ci ⊃ Fb ) l’énergie d’une configuration Ci incluse dans la somme du numérateur et E (Ci∗ ) l’énergie de la configuration Ci∗ du dénominateur obtenue à partir de Ci : (j ) E (Ci∗ ) = E (Ci ⊃ Fb ) − 2Jb (1.83) Cette égalité étant exacte pour toutes les configurations Ci de la somme du numérateur, on en déduit : (j ) (1.84) < Xb >≤ exp −2βbJ Par conséquent, le nombre moyen de spins − peut être majoré par l’expression : < N− >≤
b 2 N 3b−1 e −2βbJ 4
(1.85)
b=4,6,···
La somme sur b converge pourvu que 3 exp −2βJ < 1. En prenant une température suffisamment basse, on peut rendre le rapport < N− > /N arbitrairement petit. On peut obtenir en particulier : < N− > 1 < (1.86) N 2 ce qui entraîne pour l’aimantation spontanée par spin Ms , définie par : Ms =
1 < N− > < N+ > − < N− > = 1 − 2 N N
(1.87)
que Ms est strictement positif à toute température T inférieure à T0 définie par la relation : ∞ 2 p p=2
22
2
32p−1 exp −
4pJ 1 = kB T0 2
(1.88)
1. Modèle d’Ising à une et deux dimensions
Cette équation n’est en aucune façon une expression approchée d’une température de transition (car les majorations successives utilisées pour l’établir sont trop grossières), mais elle établit l’existence, à suffisamment basse température, d’une phase où l’aimantation spontanée est non nulle. Comme expliqué plus haut, il est physiquement évident qu’à haute température et, notamment dans la limite kB T J , l’entropie l’emportera toujours sur l’énergie pour favoriser un état désordonné. La conclusion de ce paragraphe sera donc qu’une phase ordonnée existe toujours à suffisamment basse température, alors qu’à suffisamment haute température, la phase désordonnée est toujours la plus stable. Ceci implique donc l’existence d’une transition de phase à température non nulle, contrairement au cas unidimensionnel.
1.3.3 Dualité Les hamiltoniens d’un grand nombre de modèles sur réseau peuvent être exprimés comme la somme, sur toutes les paires de sites, d’énergies de liaison, ne dépendant que des différences entre les valeurs que prennent des variables dynamiques sur les paires de sites définissant les liaisons. Dans ces cas là, il est possible d’effectuer une transformation de Fourier du potentiel de liaison. Les fonctions de partition peuvent alors être exprimées, soit comme des sommes sur les variables dynamiques originelles définies sur les sites du réseau, soit comme des sommes sur les variables transformées de Fourier définies sur les liaisons, mais sujettes à certaines contraintes. La transformation définissant les variables transformées de Fourier est appelée une « transformation de dualité ». La dualité, ainsi que les transformations associées jouent un rôle important dans l’étude des transitions de phase à deux dimensions. C’est notamment le cas du modèle d’Ising à deux dimensions, comme nous allons le montrer. Le modèle d’Ising à deux dimensions est un exemple où la transformation de dualité est une méthode importante, qui apporte de façon très simple des informations physiques précieuses.
Réseau dual Soit un réseau bidimensionnel, défini par des sites dont la position est définie par les vecteurs x, ce qui définit également des liaisons de sites premiers voisins x, x . À chaque liaison x, x du réseau initial, on définit une liaison R, R du réseau dual, de façon que le vecteur R, R soit médiateur du vecteur x, x et vice versa. À chaque liaison x, x , c’est à dire à chaque paire de sites du réseau initial, on associe une paire de sites premiers voisins R, R d’un nouveau réseau appelé réseau dual du réseau initial. Par construction, le réseau dual du dual est le réseau initial.
23
Physique de la matière condensée
Il est ainsi possible, pour tout réseau bidimensionnel, de construire le réseau dual associé, en utilisant la construction que nous venons de définir. Donnons quelques exemples de réseaux bidimensionnels et de leurs résaux « duaux ». Dans un réseau bi-dimensionnel carré (figure 1.2), on définit de nouveaux sites, repérés par les signes ×, placés au centre de chaque maille du réseau. Ces nouveaux sites × constituent un nouveau réseau qui est le réseau dual du réseau carré initial.
Fig. 1.2 Le réseau carré (en traits pleins) et son dual (en tiretés), obtenu en plaçant un nouveau site au centre de chaque maille du réseau originel, sont identiques. Les liaisons entre sites premiers voisins du réseau dual sont les médiatrices des liaisons entre sites premiers voisins du reseau initial, et vice versa.
On voit facilement que le réseau dual d’un réseau carré est lui-même un réseau carré de la même forme et de même paramètre de maille, et que le réseau dual d’un réseau hexagonal (en « nid d’abeille »)1 est un réseau triangulaire (figure 1.3) et vice-versa. Le réseau original et le réseau dual sont réciproques l’un de l’autre. Nous allons maintenant appliquer des arguments de dualité au modèle d’Ising bidimensionnel. Considérons le cas d’un réseau carré. La fonction de partition s’écrit : s 1 + σi σj tanh K Z = cosh K
(1.89)
σ1 ···σN 1
Notons que l’arrangement périodique en « nid d’abeille » (encore dénommé hexagonal) ne constitue pas un réseau de Bravais, car il contient deux atomes non équivalents par maille. L’arrangement périodique triangulaire n’est pas non plus un réseau de Bravais.
24
1. Modèle d’Ising à une et deux dimensions
Fig. 1.3 Le réseau dual du réseau « nid d’abeille » est le réseau triangulaire et réciproquement. Comme dans la figure 1.2, chaque liaison entre sites premiers voisins du resau dual est mediatrice d’une liaison entre sites premiers voisins du réseau initial, et vice versa.
où s est le nombre total de paires de premiers voisins < i, j > et est égal à zN /2 si on ignore les effets de bords (z étant le nombre de sites premiers voisins d’un site donné et N le nombre total de sites).
Développement de haute température Dans cette expression (1.93), les produits de facteurs σi σj donnent une contribution nulle quand on prend la trace sur {σi }, si tous les spins σi n’interviennent pas au carré. Pour que la contribution soit non nulle, il faut donc que la suite des sites i, j... qui se retrouvent quand on effectue ces produits de facteurs soit telle que chaque site i s’y retrouve deux fois, car σi2 = 1 . Ceci peut s’interprèter en disant que la chaîne formée par les maillons < i, j > de sites premiers voisins participant à ces produits de facteurs doit dessiner une figure exclusivement formée de polygones fermés sur le réseau pour donner une contribution non nulle. Ces polygones peuvent être non connexes (voir figures 1.4 et 1.5). s n N n tanh K Z = 2 cosh K 1+ (1.90) n>0
où n est le nombre de figures de n liaisons constituées exclusivement de polygones. À une dimension n = 0 pour tout n > 0, à l’exception de n = N , pour lequel N = 1 pour une chaîne fermée de N maillons. Cette expression est jusqu’à présent exacte formellement. Toutefois, pour être utilisée en pratique, elle exige des calculs de dénombrement des quantités n , de complexité rapidement croissante avec n. C’est pourquoi, bien souvent, l’expression précédente doit être considérée comme un développement limité aux premiers termes. Dans ce cas, il constitue un développement de haute température, c’est à dire valable pour tanh K 1.
25
Physique de la matière condensée
Fig. 1.4 Exemple de chemin de trace nulle, qui ne contribue pas à l’expression de la fonction de partition. Ce chemin correspond à un facteur faisant intervenir 17 paires de spins premiers voisins. Il est proportionnel à ( tanh K )17 , mais la trace sur le spin 9 est nulle.
Fig. 1.5 Exemple de chemin permis qui contribue à l’expression de la fonction de partition. En effet, dans ce terme tous les spins interviennent à une puissance 2, sauf les spins 4 et 6, qui interviennent à la puissance 4. La trace est donc non nulle.
Développement de basse température Pour obtenir un développement de basse température, on réécrit Z différemment : Soit r le nombre de paires de spins antiparallèles [+, −] et s − r le nombre de paires de spins parallèles ([+, +] ou [−, −] ) : σi σj = (s − r ) − r = s − 2r (1.91)
Z =
σ1 ···σN
26
exp K σi σj
(1.92)
1. Modèle d’Ising à une et deux dimensions
d’où
∞ ωr exp −2Kr Z = 2 exp sK 1 +
(1.93)
r =1
où ωr est le nombre de configurations avec r paires de spins antiparallèles. Ceci est un développement de basse température.
Correspondance auto-duale À chaque polygone de n côtés tracé sur le réseau réel, on peut faire correspondre une configuration de spins sur le réseau dual comprenant n paires de spins antiparallèles : nous plaçons des spins − aux sites du réseau dual intérieurs aux polygones correspondant aux figures de n liaisons considérées en (1.92) et des spins + sur les sites du réseau dual extérieurs aux polygones (figures 1.6 et 1.7)
Fig. 1.6 À chaque chemin de n pas sur le réseau, exclusivement formé de polygones, est associée une configuration de spin du réseau dual comportant n paires de spins antiparallèles et vice-versa. Pour cela, on place des spins positifs sur les sites du réseau dual extérieur au chemin et des spins négatifs sur les sites intérieurs.
n = ωn∗
(1.94)
où l’astérisque repère les grandeurs du réseau dual. De même :
ωn = ∗n
(1.95)
à cause de la réciprocité des deux réseaux. On a évidemment s ∗ = s.
27
Physique de la matière condensée
Fig. 1.7
La définition des sites intérieurs demande quelques précautions pour des chemins qui se recoupent. L’exemple montré ici, ou n=20, correspond au chemin de la figure (1.5).
La fonction de partition du réseau original est donnée par : s n N 1+ n tanh K Z T = 2 cosh K
(1.96)
n
et la fonction de partition du réseau dual par : ∗ Z T = 2 exp sK 1 + n exp −2nK
(1.97)
n
On se restreint au cas J > 0 (K > 0) et on définit la nouvelle variable K ∗ et la température correspondante T ∗ par : exp −2K ∗ = tanh K J kB T ∗ = ∗ K
(1.98) (1.99)
qui est déterminée de façon unique pour K > 0. On a alors les relations suivantes : ⎧ exp −2K = tanh K ∗ ⎪ ⎨ sinh 2K sinh 2K ∗ = 1 ⎪ ⎩ tanh 2K ∗ cosh 2K = tanh 2K cosh 2K ∗
28
(1.100)
1. Modèle d’Ising à une et deux dimensions
En fonction de T ∗ , on obtient : Z (T ) = 2N −1 ( cosh K )s exp ( − sK ∗ )Z ∗ (T ∗ ) ce qui se réécrit de façon symétrique pour N 1 : Z∗ T∗ Z T s = N ∗ +1 s N −1 2 2 cosh 2K 2 2 2 cosh 2K ∗ 2
(1.101)
(1.102)
où on a utilisé le théorème d’Euler N +N∗ = s
(1.103)
Abaisser T correspond à augmenter T ∗ . Si en élevant la température, on obtient une singularité de Z (T ) à T = Tc , alors Z ∗ (T ∗ ) présentera une singularité à T ∗ = Tc∗ , Tc∗ étant la température correspondant à Tc selon la relation (1.98). Puisque le réseau dual du réseau carré est le même réseau carré, Z est égal à Z ∗ et si on admet qu’il n’existe qu’un seul point singulier (on sait qu’il en existe au moins 1), alors l’équation Tc = Tc∗ donne la température critique, dite Température de Curie (figure 1.8) : exp −2Kc = tanh Kc
(1.104)
sinh2 2Kc = 1
(1.105)
d’où
La température critique Tc est donnée par : kB Tc =
2J ∼ √ = 2, 269J Ln 1 + 2
L’auto-dualité nous a permis de calculer de façon exacte la température critique. Mais, de façon plus générale, cette méthode se revèle extrêmement précieuse, car elle nous permet d’établir une correspondance biunivoque entre les propriétés du système aux températures T et T ∗ reliées par : tanh
J kB T
= exp −
2J kB T ∗
(1.106)
Il suffit donc d’étudier, par exemple, la phase haute température, c’est-à-dire T ∈ [Tc , ∞[ , pour déterminer les propriétés de la phase basse température, T ∈ [0, Tc [, la phase haute température est toujours beaucoup plus simple à étudier. C’est, en effet, la phase la plus symétrique, celle ou la valeur moyenne de l’aimantation est nulle par raison de symétrie. La phase basse température ne peut être décrite qu’en
29
Physique de la matière condensée
Fig. 1.8 Relation de dualité entre les températures T, définie sur le réseau direct, et T ∗ , définie sur le réseau direct, fonction monotone décroissante de T pour J > 0. La température critique est définie par la relation T = T ∗ . La propriété de dualité définit une correspondance entre la phase haute température et la phase ordonnée.
introduisant une variable thermodynamique supplémentaire, qui complique en général la description physique de cette phase. Grâce à la méthode de la dualité, cette difficulté est contournée. Le cas d’un réseau carré est particulièrement simple, car il s’agit d’un réseau auto-dual. Cependant, il est possible d’étendre la méthode au cas de réseaux qui ne possèdent pas cette propriété d’autodualité, comme par exemple, les réseaux « nid d’abeille » et triangulaire. L’un est le dual de l’autre. Pour le réseau « nid d’abeille », il est possible de montrer que la température critique exacte est donnée par cosh 2Kc = 2 (1.107) soit,
kB Tc ∼ = 1, 5186J
(1.108)
Pour le réseau triangulaire : kB Tc =
4J ∼ = 3, 6403J Ln3
(1.109)
On remarquera que la température d’ordre croît avec le nombre de spins premiers voisins d’un spin donné : 3 pour le réseau nid d’abeille, 4 pour le réseau carré et 6 pour le réseau triangulaire.
Ordre antiferromagnétique sur un réseau alterné Nous avons supposé, dans ce qui précède que l’ordre était « ferromagnétique » (J > 0), c’est-à-dire que l’interaction entre spins favorisait un « alignement » entre spins ou, plus précisément, que les signes des spins en interaction soient les mêmes.
30
1. Modèle d’Ising à une et deux dimensions
Dans ce cas, les deux fondamentaux possibles, qui sont dégénérés, correspondent aux configurations où tous les spins sont positifs ou tous négatifs. Le cas « antiferromagnétique » (J < 0) favorise des valeurs opposées des spins en interaction. Le cas où J < 0 et où les interactions ne sont non nulles qu’entre spins premiers voisins se ramène très simplement au cas ferromagnétique si le réseau sur lequel les spins sont localisés est « alterné ». On dit qu’un réseau est « alterné », ou encore « bi-partite », s’il peut être décomposé en deux sous-réseaux A et B, de façon que tous les sites premiers voisins de tout site du sous-réseau A appartiennent au sous-réseau B, et que, de même, tous les sites premiers voisins de tout site du sous-réseau B appartiennent au sous-réseau A. Ainsi, à deux dimensions, le réseau carré de paramètre de maille a est alterné : les deux √ sous-réseaux A et B sont également des réseaux carrés de paramètre de maille a 2, et dont les axes se déduisent de ceux du réseau initial par une rotation de π/4. Mais les réseaux triangulaire et nid d’abeille ne le sont manifestement pas. A` trois dimensions, les réseaux cubiques simples et cubiques centrés sont alternés, mais le réseau cubique faces centrées ne l’est pas. C’est un argument de symétrie du modèle d’Ising sur un réseau alterné qui permet de déduire la solution du cas antiferromagnétique de celle du cas feromagnétique. En effet, si on effectue la transformation suivante : ⎧ σi → σi si i ∈ A ⎪ ⎪ ⎪ ⎨ σj → −σj si j ∈ B (1.110) ⎪ ⎪ ⎪ ⎩ J → −J on obtient un système rigoureusement identique au système initial, mais qui représente une phase « antiferromagnétique ». Si le système initial est dans une phase « ferromagnétique », avec une aimantation moyenne par spin m, le système transformé sera dans une phase où l’aimantation moyenne par site sur le sous-réseau A est mA = +m et où l’aimantation moyenne par spin sur le sous-réseau B est mB = −m. L’aimantation totale est nulle, contrairement au cas ferromagnétique, mais le système est bien dans une phase ordonnée, caractérisée par une aimantation alternée non nulle, mAF = mA − mB = 0 La température critique exacte du modèle d’Ising « antiferromagnétique » (J < 0), avec interaction entre spins premiers voisins seulement, sur un réseau carré, est évidemment donnée par kB Tc =
−2J ∼ √ = −2, 269J Ln 1 + 2
(1.111)
31
Physique de la matière condensée
Contrairement au cas ferromagnétique, il n’est pas possible d’étendre simplement le résultat du réseau carré à celui du réseau triangulaire. En effet, le modèle d’Ising antiferromagnétique sur ce réseau triangulaire présente le phénomène de « frustration ». Considérons une maille triangulaire de ce réseau. Il n’est pas possible de placer 3 spins aux sommets de ce triangle de façon à satisfaire en même temps les trois interactions antiferromagnétiques entre spins premiers voisins. Ceci complique sérieusement la détermination de l’état fondamental et des excitations de ce système magnétique « frustré ».
1.3.4 Quelques résultats sur Ising 2D On peut calculer la fonction de partition en champ nul et l’aimantation spontanée, obtenue en introduisant un champ magnétique infinitésimal. Contentons nous ici de rapporter quelques résultats : $ ⎡ ⎤ 2 # π 1 + 1 − 4x sin2 ϕ 1 1 ⎦ d ϕ (1.112) Ln ⎣ LnZ = Ln2 cosh 2K + N 2π 0 2 où on a posé : x=
1 tanh 2K 2 cosh 2K
(1.113)
∂LnZ ∂β
(1.114)
On en déduit l’énergie : E =− et la chaleur spécifique :
C = kB K 2
∂ 2 LnZ ∂K 2
La chaleur spécifique devient singulière pour x = 1/4, mais l’énergie interne reste finie (figure 1.9). La chaleur spécifique diverge de façon logarithmique des deux côtés de la transition C ∼ ALn|T − Tc |
(1.115)
et le coefficient A est le même au-dessus et en dessous de Tc . L’aimantation spontanée est donnée par le premier terme du développement de l’énergie libre par rapport au champ magnétique (figure 1.10).
32
1. Modèle d’Ising à une et deux dimensions
C/NkB
1
2
3
4
kB T/J
Fig. 1.9 Chaleur spécifique du modèle d’Ising bidimensionnel.
Fig. 1.10 Aimantation du modèle d’Ising bidimensionnel.
M =0
M =N 1−
pour T > Tc 1 8 1 sinh4 2K
pour T < Tc
(1.116)
Près de la température de Curie M ∼ (Tc − T )1/8 On définit un exposant critique pour l’aimantation β = 1/8.
1.3.5 Quelques caractéristiques de la transition Importance de la limite thermodynamique Il a été nécessaire de considérer la limite thermodynamique pour deux raisons. La première est de garantir l’homogénéité du système, c’est-à-dire rendre négligeables les effets de bords. La seconde est de fournir des singularités de la fonction de partition
33
Physique de la matière condensée
ou des quantités thermodynamiques qui donnent lieu à une vraie transition de phase. En effet la fonction de partition Z =
exp
σ1 ,σ2 ,···σN
J
kB T
σi σj
est une fonction de T qui est toujours analytique, excepté en T = 0, parce qu’ une somme comportant un nombre fini de termes, chacun de ces termes étant une fonction exponentielle (donc analytique), est analytique. Tant que N reste fini, aucune singularité, donc aucune transition de phase ne peut exister. Dans les systèmes réels, qui sont toujours de taille finie, il n’y a jamais de vrai point singulier au sens mathématique. Par singularité, il faut comprendre singularité du système à la limite thermodynamique.
Singularités thermodynamiques La signature de la transition de phase est précisément l’existence de singularités de certaines dérivées de l’énergie libre. Ces grandeurs thermodynamiques qui deviennent c α ) (ou singulières quand T → Tc ont un comportement en loi de puissance ( T T−T c logarithmique), ce qui définit des exposants critiques.
Ordre à grande distance – Ordre à courte distance Dans la phase haute température la fonction de corrélation (r ) tend vers 0 exponentiellement quand | r | → ∞. Il n’y a qu’un ordre à courte distance, caractérisé par une longueur de corrélation. Cette longueur diverge quand on tend vers le point critique. Dans la phase basse température, la fonction de corrélation tend vers une constante quand | r | → ∞ : il y a ordre à grande distance.
Phase ordonnée – Symétrie brisée L’apparition de l’ordre à grande distance est caractérisée par l’aimantation spontanée, quantité physique qui mesure le degré d’ordre des spins, qui joue donc le rôle de ce qu’on appellera, au chapitre suivant, le paramètre d’ordre. Dans la phase haute température, le système est invariant dans un renversement global des spins. Cette propriété de symétrie n’est pas conservée dans la phase basse température. En effet quand le système acquiert une aimantation spontanée, il choisit arbitrairement une des deux orientations possibles + + + · · · ou − − − · · · . Il y a brisure spontanée de symétrie. Dans ce cas, il s’agit d’une symétrie discrète.
34
1. Modèle d’Ising à une et deux dimensions
Bibliographie 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
E. Ising, Z. Physik, 31, 253 (1925) L. Onsager, Phys. Rev., 65, 117 (1944) W. Heisenberg, Z. Physik, 49, 619 (1928) W.L. Bragg et E.J. Williams, Proc. Roy. Soc. London A 145, 699 (1934) ; 151, 540 (1935) : 152, 231 (1935) R. Ruelle, Commun. Math. Phys. 9, 267 (1968) F.J. Dyson, Commun. Math. Phys. 12, 91 (1969) G.A. Baker, Phys. Rev., 126, 2071 (1962) M. Kac, “Brandeis Lectures 1966” (M. Chrétien, E.P. Gross and S. Deser, editors), Gordon and Breach, New York, 1966 R. Peierls, Proc. Cambridge Phil. Soc. 32, 477 (1936) R.B. Griffiths, Phys. Rev. 136, A437 (1964)
35
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Transitions de phases – Généralités 2.1 Généralités 2.1.1 Introduction Le phénomène de transition de phase occupe une place importante en Physique de la Matière Condensée, pour diverses raisons : sa fréquence et sa diversité, son caractère spectaculaire et l’intérêt des problèmes conceptuels qui s’y rattachent. Commençons par prendre un exemple bien connu, l’eau et ses diverses phases : solide (glace), liquide, gaz (vapeur), qu’on peut distinguer dans l’expérience quotidienne. Les transitions d’une phase à l’autre, qu’un changement de température permet d’observer, sont très familières : – gel (dégel) ; transition solide-liquide, – ébullition (condensation) ; transition liquide-gaz, – sublimation ; transition solide-gaz. Ce qui caractérise ces transitions, c’est le changement qualitatif, la discontinuité des propriétés ; une petite variation d’un paramètre (température, pression, ...) déclenche une modification qualitative spectaculaire.
37
Physique de la matière condensée
P solide
liquide
(ρC, TC)
Tt gaz
T
Fig. 2.1 Le diagramme de phase de l’eau, avec ses trois phases stables ; solide, liquide, gaz, dans le plan (pression-température). La ligne de transition liquide-gaz présente un point d’arrêt. La pente de la ligne de transition liquide-solide est négative car le volume molaire du solide est supérieur à celui du liquide, contrairement au cas usuel.
La physique de la matière condensée est très riche d’exemples de telles transitions ; citons les transitions magnétiques, ferroélectriques, suprafluides, supraconductrices, démixion de mélange, ordre-désordre dans les alliages, les transitions structurales solide-liquide ou entre différentes phases cristallines ou encore entre mésophases des cristaux liquides, etc. Ce qui frappe tout d’abord, c’est la très grande diversité de ce domaine des transitions de phase ; diversité des systèmes, des interactions mises en jeu, des paramètres physiques pertinents pour induire la transition et des grandeurs thermodynamiques affectées, des ordres de grandeur, etc. Il faut, bien sûr, souligner qu’en dépit de cette richesse, ce champ d’étude présente également une très grande unité ; unité des concepts mis en jeu, des méthodes d’études utilisées et surtout universalité d’un grand nombre de propriétés, notamment des propriétés critiques. Dans ce domaine d’une si grande diversité et d’une si grande complexité, il est tout à fait remarquable que certains résultats physiques aient une portée absolument générale. Comprendre ce caractère universel représente un défi particulièrement intéressant et important à relever. Pour un système donné, on fait varier un certain nombre de paramètres (température, pression, champs extérieurs, etc...) pour mettre en évidence les diverses phases du système et en explorer les domaines d’existence, et on consigne les résultats sur une carte ; on détermine un diagramme de phase. Pour fixer quelques idées, considérons trois diagrammes de phases particuliers : (i) Diagramme (pression, température) montrant les domaines d’existence de trois phases (solide, liquide, gaz) (figure 2.1). On note deux points particuliers ; le point triple Tt , à la jonction des trois domaines ; le point critique (pc , Tc ), point d’arrêt à la frontière entre domaines liquide et gaz. En tournant autour du point critique, on peut passer continûment de la phase liquide à la phase gazeuse sans transition discontinue.
38
2. Transitions de phases – Généralités
Fig. 2.2 Diagramme de phase d’un ferromagnetique dans le plan (champ magnétique-température). Il existe une ligne de discontinuité, sur l’axe H=0, pour une température inférieure à la température critique Tc .
Fig. 2.3 Courbes d’aimantation M(H) pour un ferromagnétique a différentes températures. Pour T < Tc , l’aimantation présente une discontinuité quand le champ magnétique change de signe. Cette discontinuité n’existe plus pour T > Tc .
(ii) Diagramme (champ magnétique, température) pour un corps qui présente une transition ferromagnétique (figure 2.2) ; Ce diagramme présente une frontière sur l’axe H = 0 avec un point d’arrêt, qu’on appelle aussi point critique. En champ nul, quand T diminue, on observe, à haute température une phase désordonnée, dite paramagnétique, sans aimantation. Lorsque T = Tc , au point critique, une transition se produit, et pour T < Tc , on observe une phase ordonnée, dite ferromagnétique, où l’on observe une aimantation spontanée. Il y a une analogie avec la transition liquide-gaz, H et p jouant des rôles similaires. Dans le 2ème diagramme (figure 2.3), si on traverse la frontière (H = 0 ; 0 < T < Tc ), on observe un saut de l’aimantation. Ce saut diminue quand le point de franchissement de la frontière se rapproche du point critique. Au point critique, il n’y a plus de saut de l’aimantation. (iii) Le 3ème diagramme est un diagramme (champ magnétique, température) mais pour un corps qui présente une transition antiferromagnétique avec une aimantation alternée dans la phase ordonnée (figure 2.4) ;
39
Physique de la matière condensée
Fig. 2.4 Exemple de diagramme de phase montrant un point tricritique. Dans le cas présenté ici, il s’agit d’un matériau antiferromagnétique. On suppose, dans le cas présent, que l’ordre de la transition change sous l’effet d’un champ magnétique uniforme. Ce champ n’est pas le champ couplé à l’aimantation uniforme.
On observe sur ce diagramme deux domaines séparés par une ligne (une partie en trait épais, l’autre en trait fin) ; quand on franchit la partie épaisse, on observe un saut de l’aimantation alternée ; quand on franchit la ligne fine, il n’y a pas de saut. Cette dernière ligne est une ligne de points critiques (puisqu’il n’y a pas de saut). La ligne de points critiques a un point d’arrêt, sur la ligne de transition, qu’on appelle un point tricritique.
2.1.2 Classification des transitions de phase Comme nous l’avons déjà souligné, le domaine des transitions de phase connaît, tout à la fois, une diversité foisonnante extrêmement riche, mais aussi de nombreuses propriétés communes, voire universelles. C’est pourquoi est apparue, très tôt, la nécessité d’apporter une certaine classification dans cette diversité. Tout naturellement, les transitions de phase étant caractérisées par leurs singularités thermodynamiques, c’est par la nature de ces singularités qu’on a, tout d’abord, tenté d’effectuer cette classification. Mais, avec l’évolution historique de la thermodynamique et de la physique statistique, diverses façons de discuter ces singularités ont été, en leur temps, proposées. Ces différentes classifications traduisent l’évolution conceptuelle des méthodes d’études des transitions de phase. La classification la plus ancienne, de nature thermodynamique, est due à Ehrenfest. Elle repose sur l’analyse des singularités du potentiel thermodynamique. Puis est apparue, avec L.D. Landau, la notion très importante de brisure spontanée de symétrie, qui correspond à une classification différente. Enfin, les méthodes du groupe de renormalisation appliquées aux phénomènes critiques des transitions de phase, a permis de distinguer les transitions où la longueur de corrélation diverge de celles où celle-ci reste finie (voir chapitre 4). Il faut souligner que ces différentes classifications ne se recouvrent pas exactement. Mais toutes, évidemment, présentent leur intérêt propre.
40
2. Transitions de phases – Généralités
Classification d’Ehrenfest Considérant le potentiel thermodynamique G = U − TS + pV , Ehrenfest proposa d’appeler transition du premier ordre les transitions s’accompagnant de discontinuités dans les grandeurs physiques, comme l’entropie, qui sont reliées à des dérivées premières du potentiel thermodynamique, et transitions du second ordre les transitions s’accompagnant de discontinuités dans les grandeurs physiques, comme la chaleur spécifique, qui sont reliées à des dérivées secondes du potentiel thermodynamique, les dérivées premières restant continues. Plus généralement, si toutes les dérivées d’ordre n − 1 de G sont continues et qu’une dérivée d’ordre n est discontinue, la transition sera d’ordre n. Dans le plan des variables intensives (p, T ), soit une ligne de transition séparant deux phases I et II (figure 2.5). En tout point de la courbe, la condition pour que l’équilibre soit assuré s’écrit : GI (p, T ) = GII (p, T )
(2.1)
où GI et GII sont les potentiels thermodynamiques des deux phases. Dans toute évolution le long de la ligne de transition de phase, du point M vers le point M’ voisin, on peut écrire : dGI = −SI dT + VI dp dGII = −SII dT + VII dp
(2.2) (2.3)
où les quantités Vj et Sj (j = I, II ) sont les volumes molaires et les entropies des deux phases. Comme, évidemment, on doit avoir dGI = dGII : 1 SII − SI L dp × = = dT courbe VII − VI T V
(2.4)
On a introduit la chaleur latente de la transition L, reliée au saut d’entropie S par la relation L = T S , et la discontinuité du volume molaire à la transition V.
Fig. 2.5 Diagramme de Clapeyron.
41
Physique de la matière condensée
Si, au contraire elles sont continues, on aura dSI = dSII : 1 ∂S dp dSI = CpI dT + T ∂p TI 1 ∂S dp dSII = CpII dT + T ∂p TII
(2.5) (2.6)
où C désigne la chaleur spécifique, d’où une autre relation similaire, mais pour une transition du second ordre : Cp 1 1 Cp dp = (2.7) = dT courbe T ∂S TV α ∂p où α =
1 V
∂V
∂T p
=
1 V
T
∂S ∂p T
est le coefficient de dilatation isotherme.
De même, en écrivant, pour une transition du second ordre, dVI = dVII , on obtient : α dp = (2.8) dT courbe χT où χT = − V1 ∂V est la compressibilité isotherme. ∂p T
Ces deux équations entraînent l’égalité : TV (α)2 = Cp χT
(2.9)
Cette relation a bien été observée pour la transition Hélium normal-Hélium superfluide dans une certaine gamme de température. En fait, Ehrenfest pensait à des discontinuités des dérivées du potentiel thermodynamique du type saut, par analogie avec la chaleur latente de la transition liquide-gaz S = L/T ; mais, en fait, dans bien des cas, la chaleur spécifique diverge à la transition, quand celle-ci est du second ordre. Notons que, selon cette définition de l’ordre de la transition, une transition peut être d’ordre n, sans limitation sur la valeur de n. La condensation de Bose-Einstein d’un gaz parfait de bosons est une transition de phase du troisième ordre au sens d’Ehrenfest ; la chaleur spécifique, dérivée seconde de l’énergie libre est continue, mais présente un point anguleux à la transition (voir figure 2.6). L’ordre de la transition, ainsi défini, peut même être infini, comme c’est le cas pour la transition de Kosterlitz-Thouless, qui sera étudiée au chapitre 5. Il s’agit d’un type très particulier de transition de phase, qui se produit en dimension 2 (d = 2), quand le paramètre caractérisant la transition (ce que nous appellerons plus loin le paramètre d’ordre) a deux composantes (n = 2). C’est le cas du modèle X − Y, où les spins couplés par
42
2. Transitions de phases – Généralités
CV
3R/2
valeur classique
o
TC
T
Fig. 2.6 Variations de la chaleur spécifique d’un gaz parfait de bosons en fonction de la température. À la température critique de condensation de Bose-Einstein, la chaleur spécifique reste continue, mais présente un point anguleux. La transition est du troisième ordre au sens d’Ehrenfest.
l’échange sont des vecteurs à deux composantes, ou encore de la suprafluidité à deux dimensions. Nous montrerons, au chapitre 5, que la différence d’énergie libre entre les deux phases obéit à une loi de la forme F ∼ exp − √TA−T . Cette fonction n’est c évidemment pas analytique à Tc , mais toutes les dérivées de l’énergie libre sont nulles et continues à la transition. La transition est donc d’ordre infini, au sens d’Ehrenfest. Même si cette définition de l’ordre d’une transition est ancienne, elle conserve un intérêt tout à fait évident, puisqu’elle repose sur les propriétés thermodynamiques du système.
Groupes de symétrie Les propriétés de symétrie jouent un rôle essentiel dans toute la Physique. Ceci est sans doute particulièrement vrai en Physique de la Matière Condensée. Il est donc toujours important d’analyser les propriétés de symétrie d’un système. Plus précisément, on recherche s’il existe des opérations de symétrie qui laissent le système invariant. Par exemple, on sait qu’un liquide reste invariant par toutes les translations continues de l’espace, alors qu’un solide n’est invariant que dans les opérations de translations discrètes du réseau cristallin. Cette différence dans les propriétés de symétrie du liquide et du solide est importante, car elle induit des différences qualitatives spectaculaires du comportement physique. De façon plus générale, on cherchera à définir l’ensemble des opérations de symétrie qui laissent un système invariant. On peut évidemment définir une loi de composition interne pour cet ensemble d’opérations. En effet, si on applique, successivement, deux opérations qui, chacune séparément, laisse le système invariant, le produit des
43
Physique de la matière condensée
deux opérations laissera le système invariant. Il existe un élément neutre, qui est l’opération identité. Chaque élément de l’ensemble possède son inverse. L’ensemble des opérations de symétrie d’un système donné possède donc une structure de groupe. Il existe une très grande diversité de groupes de symétrie. Par exemple, l’hamiltonien d’un gaz parfait est invariant par toutes les translations dans le temps, renversement du sens du temps, ainsi que par le Groupe Euclidien, groupe constitué par toutes les translations, rotations et réflexions (par rapport à un point, un axe ou un plan) arbitraires. Mais, il existe de très nombreux sytèmes physiques qui ne restent pas invariants par toutes les opérations de symétries du Groupe Euclidien. Le nombre de symétries effectivement observées est très important. Ainsi, il existe 230 groupes d’espace non magnétiques. On ne cherchera pas ici à détailler toute la diversité de ces différents groupes, mais seulement à caractériser quelques uns d’entre eux, choisis pour leur simplicité et leur importance. Il convient d’abord de distinguer les groupes discrets et les groupes continus. Un groupe discret contient un nombre dénombrable et habituellement fini d’éléments. Un groupe continu, tel que le groupe des translations quelconques ou celui des rotations, contient une infinité non dénombrable d’éléments. Cette notion sera importante dans l’étude des transitions de phase. De même, on peut distinguer les symétries globales et les symétries locales. Dans une symétrie globale, l’opération de symétrie s’applique de façon uniforme en tout point du système. Par exemple, tous les spins subissent ensemble la même rotation. Une symétrie est locale si le système reste invariant dans une transformation qui n’affecte pas le système de la même façon en tout point de l’espace. Ainsi, l’invariance de jauge des lois de l’électromagnétisme est une symétrie locale, car le potentiel vecteur A(r), qui définit le changement de jauge, peut dépendre du point r. Le groupe de symétrie discret le plus simple est le groupe Z2 , qui ne contient que deux éléments. Il doit nécessairement contenir l’identité e . L’autre élément a , si le groupe ne contient que deux éléments, doit être tel que (a)2 = e. Cet élément doit être son propre inverse. Par exemple, le groupe de symétrie par rapport à un plan donné, la symétrie par renversement du sens du temps sont des réalisations physique de Z2 . On dit qu’un hamiltonien qui est invariant par Z2 possède la symétrie d’Ising. Il existe, bien sûr, un grand nombre d’autres groupes de symétrie discrets, notamment l’ensemble des groupes ZN , où N est un entier, constitués des entiers soumis à l’addition modulo N. Ce groupe de symétrie est aussi celui d’un film d’adsorbat où l’atome adsorbé a le choix entre N sites d’adsorption différents. Il y a donc le choix entre N états fondamentaux équivalents. L’adsorption de Krypton sur√le graphite √ correspond à N = 3. Dans la phase commensurable ainsi formée, dite 3 × 3, la maille élémentaire du Krypton possède une aire trois fois plus grande que l’aire de la maille élémentaire du graphite. Une classe de modèles présentant la symétrie ZN est constituée par les « modéles d’horloge » (clock models) ; á chaque site, on associe une variable de spin Si de longueur unité, soumise à la contrainte de pointer dans une des N directions de l’espace sur le cercle unité.
44
2. Transitions de phases – Généralités
⎧ 2π n ⎨ Six = cos N i ⎩
Siy = sin
2π ni N
où ni = 0, 1, · · · , N − 1. L’hamiltonien est de la forme ; Hclock = −J Si · S j
= −J
2π ni − nj cos N
(2.10)
(2.11)
(2.12)
Le modèle d’Ising correspond au « modèle d’horloge » pour n = 2. Nous verrons plus loin que le cas n = ∞ est exactement soluble. Le groupe de symétrie continu le plus simple est le groupe orthogonal bidimensionnel des rotations dans unplan à deux dimensions, dénommé O2 . Ce groupe est isomorphe au groupe U 1 , des transformations de la phase d’un nombre complexe (donc défini par son module et sa phase). La symétrie associée à ces groupes est souvent appelée symétrie X − Y , parce que les rotations sont effectuées dans un plan X − Y. Un exemple de réalisation physique du groupe de symétrie O2 est un ferromagnétique présentant un plan de facile aimantation, où les spins sont confinés par l’anisotropie dans un plan X − Y. Le groupe de symétrie O3 correspond au groupe des rotations à trois dimensions, dont une réalisation physique est le ferromagnétisme d’Heisenberg, dont les spins sont des vecteurs à trois composantes. On peut évidemment définir, de façon générale, le groupe On , groupe orthogonal n-dimensionnel des rotations dans un espace de dimension n.
Classification de Landau Les propriétés de symétrie, rapidement esquissées dans le paragraphe ci-dessus, sont à l’origine de la classification des transitions de phase introduite par L.D. Landau (1937) [1]. Cette dernière constitue la base conceptuelle de toute la théorie de Landau des transitions de phase. Landau remarqua que le passage d’une phase à l’autre, lors d’une transition sans chaleur latente, s’accompagnait d’un changement de symétrie. La phase basse température, c’est-à-dire, sauf exception, la phase de plus basse entropie, donc la phase ordonnée, est en général moins symétrique que la phase haute température. On peut dire que le système a perdu un ou plusieurs éléments de symétrie lors de la transition. La phase ordonnée, étant moins symétrique que la phase haute température, ne peut plus être décrite par les mêmes variables. Il faut introduire une variable supplémentaire pour décrire complètement la phase la moins symétrique. Cette variable supplémentaire devra, à la fois, décrire la perte de symétrie du système, mais aussi, en même temps, le degré d’ordre acquis par le système, puisque c’est l’apparition de l’ordre qui abaisse la symétrie. De façon évidente, cette variable doit être nulle, par raison de symétrie, dans la phase symétrique, c’est-à-dire
45
Physique de la matière condensée
la phase haute température, et non nulle dans la phase ordonnée. De plus, on doit choisir une variable extensive. Cette variable, associée au changement de symétrie induit par la transition, a été dénommée par Landau le paramètre d’ordre de la phase ordonnée. Prenons l’exemple du laiton β, alliage binaire d’atomes de cuivre et d’atomes de zinc. Chaque site atomique est occupé par un atome et un seul. L’alliage comprend autant d’atomes de Cu que d’atomes de Zn. Dans la phase désordonnée, sur chaque site, les deux types d’atomes sont équi-probables. L’occupation se fait de façon totalement aléatoire. Dans cette phase désordonnée, le cristal a une structure cubique centrée. À la transition, il apparaît un ordre dans l’occupation des sites atomiques. Le réseau cubique centré doit alors être décomposé en deux sous-réseaux cubiques simples, translatés l’un de l’autre du vecteur (a/2, a/2, a/2). Les sites de l’un des sous-réseaux sont préférentiellement occupés par des atomes de Cu, alors que les sites de l’autre sous-réseau sont préférentiellement occupés par des atomes de Zn. La structure cristalline est maintenant cubique simple. La phase ordonnée est moins symétrique que la phase désordonnée ; en effet, les deux sous-réseaux cubiques simples, équivalents dans la phase désordonnée ne le sont plus dans la phase ordonnée. On dit que la symétrie a été brisée ou encore qu’il y a eu violation de l’invariance par permutation des deux sous-réseaux. Le paramètre d’ordre est le paramètre physique nécessaire pour décrire l’ordre caractérisant la phase la moins symétrique, c’est-àdire caractérisant la brisure de symétrie. Dans cet exemple, on peut prendre pour paramètre d’ordre la quantité (2.13) < φ >=< nCuA − nCuB > où nCuA est l’opérateur nombre d’atomes de Cu sur le sous-réseau A. On peut définir un champ couplé au paramètre d’ordre ; (2.14) h = μCuA − μCuB différence entre les potentiels chimiques des atomes de Cu sur les deux sous-réseaux. Dans l’état parfaitement ordonné, tous les atomes de Cu sont sur les sites du sousréseau A et tous les atomes de Zn sont sur les sites du sous-réseau B. Initialement, la notion de paramètre d’ordre a été introduite par Landau pour discuter les transitions de phase sans chaleur latente (figure 2.7). Toutefois, cela ne veut pas dire qu’il est impossible de définir un paramètre d’ordre pour des transitions avec chaleur latente. Pour ces transitions avec chaleur latente, deux cas peuvent se présenter.
m (T)
m (T)
TC
T
Transition du 1er ordre
TC T Transition du 2e ordre
Fig. 2.7 Variations schématiques avec la température du paramètre d’ordre, dans le cas d’une transition de phase du premier ordre ou du second ordre, au sens de Landau.
46
2. Transitions de phases – Généralités
1- Dans le premier cas, il est possible de définir un paramètre d’ordre, bien que la chaleur latente soit non nulle. Ce cas peut être représenté par l’exemple du titanate de baryum. Le titanate de baryum présente une transition de phase para-électrique - ferroélectrique en dessous d’une certaine température de transition, il apparaît une polarisation diélectrique spontanée. Une chaleur latente non nulle est associée à cette transition. On peut, néanmoins, définir un paramètre d’ordre, qui, dans ce cas, est la polarisation diélectrique spontanée. En effet, l’apparition d’une polarisation diélectrique dans la phase basse température brise la symétrie d’invariance par rotation globale des moments dipolaires, qui laisse invariante la phase haute température, mais pas la phase basse température, à cause de l’apparition de cette polarisation spontanée... 2- Dans le second cas de transition avec chaleur latente, il est impossible de définir un paramètre d’ordre. Cette situation se rencontre, par contre, dans certaines transitions avec chaleur latente non nulle où les symétries mises en jeu ne permettent pas cette définition, et ceci, pour deux types de raisons différentes. a) C’est le cas, pour le premier type d’exemple, des transitions entre variétés polymorphes du soufre. Dans cette transition, les symétries des deux phases sont différentes, car les groupes cristallins sont différents pour les deux variétés polymorphes, mais on ne passe pas d’une phase à l’autre en perdant certains éléments de symétrie, ce qui est la condition nécessaire à la définition d’un paramètre d’ordre. Les deux groupes de symétries sont différents, mais l’un n’est pas inclus dans l’autre. b) C’est aussi le cas, mais pour des raisons différentes, de la transition liquidegaz. Dans ce deuxième type d’exemple, les symétries des deux phases sont identiques ; la phase liquide et la phase gazeuse sont toutes deux invariantes dans toutes les translations continues et toutes les rotations continues de l’espace. Les deux phases, bien que montrant de fortes différences quantitatives dans leurs propriétés physiques, ont les mêmes propriétés de symétrie. Là encore, il n’y a pas perte de certains éléments de symétrie quand on passe d’une phase à l’autre. Ainsi, dans le cas d’une transition solide-liquide, il est possible de définir un paramètre d’ordre (les composantes de Fourier ρq de la densité où les vecteurs q sont les vecteurs du réseau réciproque du solide), parce que la symétrie de translation continue a été brisée par l’apparition d’un réseau, mais dans le cas d’une transition liquide-gaz, il n’est pas possible, à proprement parler, de définir un paramètre d’ordre, puisque ces deux phases ont les mêmes éléments de symétrie1 . 1 Certains auteurs choisissent de décrire la transition liquide-gaz par la différence de densité des deux phases, qui peut décrire les différences quantitatives entre les deux phases. Mais c’est abusivement qu’ils donnent le nom de paramètre d’ordre à cette quantité. Ce terme est, en effet, impropre, puisque la transition liquide-gaz ne modifie pas les propriétés de symétrie, ni le degré d’ordre du système.
47
Physique de la matière condensée
La notion de paramètre d’ordre permet de classer les transitions de la manière suivante. On distingue deux types de transitions : 1- Les transitions sans paramètre d’ordre ; les groupes de symétrie des deux phases sont tels qu’aucun n’est strictement inclus dans l’autre. Il est alors, en effet, impossible de définir un paramètre d’ordre. Ces transitions sont toujours du premier ordre au sens d’Ehrenfest, c’est-à dire qu’il existe une chaleur latente, mais il est impossible de définir un ordre de la transition, au sens de Landau. 2- Les transitions avec paramètre d’ordre ; le groupe de symétrie de la phase la moins symétrique (phase ordonnée) est strictement inclus dans celui de la phase de haute température ; c’est un sous-groupe du groupe de symétrie de la phase la plus symétrique (phase désordonnée). Si le paramètre d’ordre est discontinu au point de transition, on dit que la transition est du premier ordre ; si au contraire le paramètre d’ordre est continu, on dit que la transition est du second ordre.
2.1.3 Le modèle de Landau La succession des phases, lorsque la température augmente, se comprend par une compétition entre l’énergie U , qui favorise l’ordre, et l’entropie S , qui favorise le désordre, dans l’énergie libre F = U − TS , dont le minimum définit l’équilibre thermodynamique. L’élévation de température donne l’avantage à l’entropie et au désordre. Comme nous l’avons vu au paragraphe précédent, Landau a introduit la notion très féconde et très importante pour l’étude des transitions de phase, de paramètre d’ordre. Si on suppose que la transition se traduit par la perte d’un ou de plusieurs éléments de symétrie, il devient nécessaire, pour caractériser complètement la phase la moins symétrique et pour distinguer les deux phases, de définir un nouveau paramètre physique, nul par raison de symétrie dans la phase désordonnée, non nul dans la phase ordonnée. La nature mathématique de cette quantité physique peut être diverse. Dans le modèle d’Ising, étudié au chapitre précédent, l’aimantation spontanée est un scalaire. Dans le cas d’une transition ferromagnétique, mettant en jeu des spins à deux composantes, correspondant à la symétrie O2 du modèle X − Y, ou des spins à 3 composantes, correspondant à la symétrie O3 du modèle d’Heisenberg, par exemple, le paramètre d’ordre est l’aimantation uniforme, c’est-à-dire un vecteur. Dans le cas d’une transition antiferromagnétique, le paramètre d’ordre est l’aimantation alternée, c’est-à-dire la différence entre les aimantations moyennes des deux sous-réseaux, qui est encore une quantité vectorielle. Dans le cas d’une transition suprafluide, où une symétrie de jauge est brisée, le paramètre d’ordre est un nombre complexe, avec un module
48
2. Transitions de phases – Généralités
et une phase, qui possède donc deux composantes. Mais le paramètre d’ordre peut aussi être de nature matricielle ou tensorielle. L’apparition d’une valeur non nulle pour le paramètre d’ordre correspond à une brisure spontanée de symétrie. C’est le cas pour les exemples magnétiques précédents, où la symétrie spontanément brisée est une symétrie globale de rotation ; dans la phase haute température, le système est invariant par rotation globale de l’aimantation autour de trois axes ; dans la phase de basse température, il n’est plus invariant que par rotation autour d’un seul axe, celui de l’aimantation spontanée. L’adjectif « spontanée » a ici toute son importance. Dans un système magnétique, il suffit, pour briser la symétrie par rotation globale des spins d’appliquer un champ magnétique couplé au paramètre d’ordre. Le champ sera couplé au paramètre d’ordre m, s’il induit un terme supplémentaire dans l’énergie du système, de la forme −hm. Dans le cas ferromagnétique, ce champ est tout simplement le champ magnétique uniforme. Dans le cas antiferromagnétique, où apparaît une composante de Fourier de l’aimantation spontanée msq , le champ couplé au paramètre d’ordre est un champ hq , modulé spatialement avec le vecteur d’onde q. Ce champ oscille donc sur de très courtes distances, de l’ordre de la distance interatomique. Il est donc, en fait, impossible à produire en laboratoire. Mais cette quantité, cependant, revêt une grande importance conceptuelle. Ce champ couplé au paramètre d’ordre va induire une réponse du système, en raison du terme supplémentaire d’énergie qu’il introduit. Ainsi, un champ magnétique uniforme induit une aimantation, dont l’axe sera parallèle au champ appliqué. Clairement, cette aimantation induite brise, elle aussi, la symétrie par rotation globale des spins. Mais cette brisure de symétrie, triviale, n’est pas spontanée. Elle ne résulte pas d’un effet coopératif. Dans le cas d’une transition sans brisure de symétrie, par exemple la transition de Mott, que nous discuterons en détail au chapitre 8, n’importe quelle variable thermodynamique pertinente pourra servir à distinguer le degré de différence des deux phases, telle que la longueur de localisation, dans le cas de la transition de Mott, mais il ne s’agira pas, à strictement parler, d’un paramètre d’ordre au sens de Landau. En effet, la phase localisée et la phase délocalisée ont les mêmes propriétés de symétrie. Ces transitions de phase sans brisure de symétrie ne peuvent pas être décrites dans le cadre de la théorie de Landau des transitions de phase. Dans le cas d’une transition de phase avec brisure de symétrie, nous introduisons donc le paramètre d’ordre m indiquant le degré de la brisure de symétrie, qui est aussi, habituellement, le degré d’ordre acquis par le système. Nous nous réservons de discuter, un peu plus loin, comment il est possible de déterminer, de façon systématique, l’ensemble de tous les paramètres d’ordre possibles, compatibles avec les propriétés de symétrie. Landau suppose alors que la densité d’énergie libre du système peut s’écrire comme une fonctionnelle du paramètre d’ordre [2]. La signification physique de cette fonctionnelle est la suivante ; le paramètre d’ordre est une variable thermodynamique qui décrit le degré d’ordre du système et dont la valeur doit donc être nulle à l’équilibre dans la phase désordonnée. Cela ne nous empêche pas d’envisager l’existence de
49
Physique de la matière condensée
configurations hors d’équilibre, où m serait non nul. C’est même indispensable si on veut prendre en compte le rôle des fluctuations dans la fonction de partition et donc dans l’énergie libre. On peut même imaginer que m prend une valeur non nulle et non nécessairement uniforme en chaque point de l’espace m(r). Chaque fonction m(r) définit une configuration du système, qui peut être plus ou moins proche de la configuration d’équilibre du système. La fonctionnelle de Landau établit la correspondance entre cette configuration m(r) et le coût d’énergie libre pour le système. Si F [m(r)] est la fonctionnelle de Landau de la densité d’énergie libre, cela signifie que l’énergie libre qu’aurait une configuration définie par m(r) serait F= F [m(r)] d d r (2.15)
Il ne faut pas confondre F avec l’énergie libre à l’équilibre thermodynamique F
F = −kB TLnZ
(2.16)
où Z est la fonction de partition dans l’ensemble canonique. Pour calculer Z, il est nécessaire de prendre la trace de exp −β F sur toutes les configurations. Prendre la trace, c’est intégrer exp −β F sur toutes les fonctions m(r). Cela s’appelle calculer une intégrale fonctionnelle ; d F [m(r)] d r (2.17) Z = Dm(r) exp − β
L’énergie libre à l’équilibre thermodynamique s’écrit donc, en réalité ; 1 d F = − Ln Dm(r) exp − β F [m(r)] d r β
(2.18)
Le calcul de cette intégrale fonctionnelle est en général difficile et ne peut, en pratique, être effectué, sauf exceptions, qu’à l’aide d’approximations plus ou moins sophistiquées. Nous souhaitons, toutefois, dans un premier temps, dissocier l’exposé du modèle de Landau des transitions de phase de celui des approximations utilisées pour évaluer cette intégrale fonctionnelle (voir chapitres 3 et 4). Le choix de cette fonctionnelle de Landau ne peut pas être arbitraire. Il est soumis à certaines contraintes. Tout d’abord, Landau a supposé que F [m(r)] était analytique au voisinage du point critique et développable en puissances de m au voisinage de m = 0. Comme Landau s’intéressait à l’étude des transitions de phase du second ordre et au voisinage du point critique, il était légitime, effectivement, de se limiter à de très petites valeurs du paramètre d’ordre, même si le modèle de Landau est souvent étendu au cas des transitions du premier ordre, où cette limitation n’est plus quantitativement correcte. Même au voisinage de m = 0, la justification d’un développement analytique en puissances de m n’a absolument rien d’évident et paraît très difficile à justifier rigoureusement
50
2. Transitions de phases – Généralités
à partir des premiers principes. Il faut, en effet, avoir présent à l’esprit que le point critique est justement le point où les propriétés thermodynamiques sont singulières. Il faut donc supposer que F est singulière, mais que F [m(r)] est analytique. Cela n’est, évidemment, nullement impossible, mais la justification a posteriori repose, en fait, sur les succès nombreux et importants de la théorie de Landau des transitions de phase pour décrire et interpréter les résultats expérimentaux. L’autre contrainte imposée par Landau à la fonctionnelle F [m(r)] est une contrainte de symétrie. La fonctionnelle doit être invariante par toutes les opérations de symétrie de la phase la plus symétrique. Donc, chacun des termes du développement analytique de F [m(r)] doit être invariant dans ce groupe de symétrie G0 . Si un terme est interdit par la symétrie de la phase haute température, il ne peut pas figurer dans le développement de la fonctionnelle. Par contre, si un terme est permis par la symétrie G0 , il doit nécessairement être inclus dans le développement. Pour écrire le développement de la fonctionnelle, il est donc nécessaire de recenser tous les termes invariants par le groupe de symétrie G0 et de les inclure dans la fonctionnelle. La façon systématique d’effectuer ce travail est de rechercher une représentation irréductible de G0 et tous les invariants irréductibles associés. La fonctionnelle doit contenir tous ces invariants. Cependant les arguments de symétrie sont évidemment incapables de nous renseigner sur les coefficients numériques de cette fonctionnelle. Ceux-ci doivent être considérés comme des coefficients phénoménologiques ; on les ajuste à partir de certaines données expérimentales, et ces valeurs ajustées permettent alors de prédire les valeurs expérimentales de nouvelles grandeurs. Le modèle de Landau, fondé sur une discussion des propriétés de symétrie des phases, se révèle puissant pour déduire, de façon très simple, des propriétés qualitatives importantes des transitions et même, dans certains cas, quantitatives.
2.2 Notion de symétrie brisée 2.2.1 Qu’est-ce que la symétrie brisée ? En pratique, l’espace peut presque toujours être considéré comme homogène et isotrope. Les lois qui gouvernent le comportement des électrons et des noyaux ont un très haut degré de symétrie ; elles possèdent la symétrie d’invariance par rotation et par translation correspondant à l’homogénéité et l’isotropie de l’espace. En pratique, elle obéissent également à la symétrie d’inversion spatiale et de renversement du sens du temps ou de translation dans le temps. À toutes ces propriétés d’invariance sont associées des lois de conservation. La matière, à température suffisamment élevée, se trouve à l’état gazeux, et même, à plus haute température, les molécules se dissocient, les atomes s’ionisent. On obtient un mélange gazeux des divers composants élémentaires qui est homogène et isotrope. Un tel état est compatible avec les symétries de base des équations gouvernant le système. Par contre, la matière froide représente une toute autre situation. Très
51
Physique de la matière condensée
souvent, en se refroidissant, la matière se place spontanément dans un état moins symétrique, qui ne conserve pas toutes les propriétés de symétrie des équations qui gouvernent cette matière. On dit qu’il s’est produit une brisure spontanée de symétrie. Par exemple, tous les matériaux se solidifient à suffisamment basse température, y compris l’Hélium quand une pression suffisante est appliquée. La phase solide a clairement perdue l’invariance par translation. Un objet solide présente une propriété qu’on peut appeler la rigidité ; non seulement il occupe une position fixe dans l’espace, ce qui constitue une brisure de la symétrie de translation, mais la symétrie de translation est brisée partout à l’intérieur du solide puisque tous les atomes individuels occupent des positions fixées dans l’espace. On peut distinguer deux types de brisure de symétrie. Le premier type, décrit par la théorie mathématique des « Catastrophes » de Thom (1975) [3] est induit par les non-linéarités des équations du mouvement ou de l’équation d’état. C’est un passage plus ou moins soudain à un nouveau régime, caractérisé par le déclenchement d’une instabilité, dont la réalisation précise est contrôlée par des fluctuations infinitésimales déjà présentes dans le milieu. À ce type de brisure de symétrie on peut rattacher l’instabilité qui a conduit à la formation des amas de galaxies, puis des galaxies, puis des étoiles individuelles. Un autre exemple est l’instabilité de turbulence dans un fluide homogène en mouvement. Dans ces instabilités induites par des effets non linéaires, les équations d’état locales et les propriétés locales restent pour ainsi dire symétriques et homogènes. Ce n’est pas le cas dans le deuxième type de brisure de symétrie ; la transition de phase vers une phase solide met en jeu un changement total des propriétés microscopiques de la matière considérée. Microscopiquement, le solide ne peut plus être décrit dans les mêmes termes. Une description entièrement nouvelle, non seulement localement, mais aussi globalement, est nécessaire (la matière froide peut aussi changer de comportement qualitatif sans brisure de symétrie, mais les cas sont relativement rares). L’expérience montre donc qu’habituellement, la matière, en se refroidissant, ne conserve pas totalement la symétrie des lois de base de la Mécanique Quantique auxquelles elle obéit sans aucun doute. Les questions qui se posent alors sont : 1) Pourquoi la symétrie est-elle spontanément brisée ? 2) De quelle manière ? 3) Quelles sont les conséquences ?
2.2.2 Origine des brisures de symétrie Brisure spontanée de symétrie liée aux interactions L’immense majorité des systèmes physiques réels présentant des interactions entre particules, même quand ces dernières sont répulsives, présente le phénomène de présenter un état de plus basse énergie qui ne possède pas la symétrie complète de l’espace ou de l’hamiltonien décrivant leurs interactions. Du point de vue
52
2. Transitions de phases – Généralités
strictement mathématique, il n’y a pas à s’en étonner. Il est bien connu, en effet, que des équations invariantes par un certain groupe de symétrie peuvent présenter des solutions qui n’ont pas toutes les propriétés de symétrie des équations. Ceci, toutefois, ne nous renseigne pas sur l’origine physique du phénomène. Très souvent, ce sont les interactions qui favorisent un fondamental moins symétrique que l’hamiltonien. Prenons l’exemple d’un gaz d’électrons, soumis aux interactions répulsives coulombiennes entre électrons. Si, dans un premier temps, on néglige les interactions entre particules, le système est alors un gaz parfait de N fermions dans un volume , dont l’hamiltonien s’écrit : εk,σ nk,σ (2.19) H = k,σ
Les nk,σ sont les opérateurs nombres de particules dans l’état d’onde plane, de vecteur d’onde k et de spin σ ϕk,σ = exp i k · r |σ (2.20) et d’énergie à une particule donnée par ε(k)σ =
h¯ 2 k 2 2m
(2.21)
L’état de plus basse énergie, occupé à T = 0, est celui où tous les états en dessous de l’énergie de Fermi ε(kF ) = μ sont occupés : + |0 |ψ0 = (2.22) ckσ εk = n0 = N, où nk est l’opérateur nombre de particules dans l’état d’impulsion hk. ¯ On peut montrer très simplement que, même à des températures légèrement audessus de 0, une fraction macroscopique des atomes restent dans le fondamental 0 ; le système est alors dans l’état condensé de Bose-Einstein. En effet, il est facile de montrer que l’inégalité (2.26) ci-dessous (où la dernière intégrale est convergente) est satisfaite : k =0
nk =
k =0
1 ≤ exp β εk − μ − 1
k 2 dk 2
k exp β 2m −1
(2.26)
En effet, le potentiel chimique μ ne peut pas prendre n’importe quelle valeur ; si μ était égal à E0 , énergie de l’état 0 , l’occupation de l’état 0 tendrait vers l’infini, ce qui, évidemment n’a pas de sens. La situation μ > E0 n’a pas de sens non plus,
55
Physique de la matière condensée
car le dénominateur de la distribution de Bose deviendrait négatif pour certains états d’énergie du système. Il faut donc que μ soit strictement inférieur à E0 , ce qui est suffisant pour établir l’inégalité ci-dessus. L’intégrale qui apparaît dans l’inégalité (2.26) est une fonction de la température f (T /TB ), où TB est la température de condensation de Bose : 2 1 N 3 kB TB ∼ 2πm
et qui tend vers 0 quand T → 0 comme (T /TB )3/2 . Puisque l’occupation de la totalité des autres états de k = 0, décroît quand T décroît, finalement, l’état fondamental doit devenir macroscopiquement occupé. On pourrait penser, à première vue, que l’état ainsi obtenu corresponde à une situation hautement symétrique. En fait, nous allons voir que cet état n’est pas réellement symétrique. Nous allons montrer qu’il brise une symétrie de jauge. Quand un ordre ferromagnétique apparaît et brise la symétrie de rotation globale des spins, il est possible de caractériser le phénomène par la moyenne de l’opérateur aimantation < M >, qui s’annule dans la phase paramagnétique, en raison de l’invariance par rotation, mais acquiert une valeur non nulle dans la phase ferromagnétique, dans laquelle la symétrie de rotation est brisée. Peut-on décrire le condensat de Bose-Einstein de la même façon ? La réponse est oui. Le paramètre d’ordre peut être défini comme la valeur moyenne de (r), opérateur champ d’annihilation de particules, ou de son hermitique conjugué, + (r). La phase condensée de Bose-Einstein, ou encore la phase suprafluide de l’Hélium liquide, peuvent être caractérisés par le fait que (r) = n0 (r) exp +i ϕ(r) = 0 (2.27) ou bien
+ (r) = n0 (r) exp −i ϕ(r) = 0
(2.28)
ce qu’on peut considérer comme la propriété qui définit le condensat de Bose-Einstein ou la phase suprafluide, de la même façon que le ferromagnétisme est défini par la propriété que < M(r) > = 0. Si on avait défini le condensat de Bose par la propriété que < nk=0 >= n0 , on aurait perdu l’information sur la phase ϕ(r). Or la propriété de cohérence de phase du condensat de Bose est tout à fait essentielle, notamment pour discuter nombre de propriétés importantes de la phase suprafluide [8, 9, 10]. En effet, l’état condensé de Bose-Einstein brise une symétrie de jauge. Pour le comprendre, divisons notre système en m boîtes de N /m particules et supposons qu’on puisse décrire chaque boîte comme un gaz de Bose condensé de N /m atomes. Introduisons a0i et a0i+ les amplitudes de Bose de l’état uniforme dans chaque boîte, et supposons évidemment, que : a0i+ a0i = n0i , avec < n0i >= N /m.
56
2. Transitions de phases – Généralités
Mais,
1 i a0 = √ a0 m i
si bien que 1 i+ j 1 i+ i a0 a0 a0 a0 + = N = m m i i =j 1 i+ j N a0 a0 + = m m
a0+ a0
i =j
Il faut évidemment que le deuxième terme soit beaucoup plus grand que le premier, ce qui implique de fortes corrélations de phase entre les différents a0i . On voit clairement que l’état condensé de Bose exige, non seulement que les cellules individuelles soient condensées, mais aussi qu’il existe de fortes corrélations de phase entre elles. C’est pourquoi on définit la condensation de Bose, non par l’occupation de l’état fondamental, mais par le fait que l’amplitude de Bose a une valeur moyenne finie. On définit l’amplitude du champ de Boson local (r) et l’amplitude du fondamental 1 d 3r +r a0+ = √
a0i+
1
=
/m
d 3r +r
cellule i
√ On définit l’état fondamental condensé par le fait que < + (r) >= n0 exp +i ϕ √ et le complexe conjugué < (r) >= n0 exp −i ϕ aient une valeur finie. La phase arbitraire de ce nombre complexe montre que c’est une symétrie de jauge qui est brisée dans cet état condensé, de la même façon qu’un réseau brise une symétrie de translation. et + sont les opérateurs champ en seconde quantification. Ces opérateurs obéissent aux propriétés de commutation caractéristique d’un système de bosons. (2.29) (r), + r = δ r − r (r), r = + (r), + r = 0 (2.30) Ces opérateurs champ permettent de décrire toutes les observables et, notamment, la densité de particules ρ(r) = + (r)(r)
(2.31)
57
Physique de la matière condensée
ou la densité de courant : j(r) =
h¯ + (r)∇(r) − ∇ + (r) (r) 2mi
L’opérateur nombre total de particules est donné par N = + (r)(r)d d r
(2.32)
(2.33)
Le fait que les valeurs moyennes de et + soient non nulles définit la condensation de Bose-Einstein. La phase suprafluide est définie par l’existence d’une « fonction d’onde macrosopique » (r) . Le carré de l’amplitude de ce nombre complexe est la densité n0 (r) de particules dans le condensat. Sa phase ϕ(r) est la phase macroscopique. Son gradient est la vitesse suprafluide : vs =
h¯ ∇ϕ m
(2.34)
Comment la valeur moyenne (r) peut-elle être différente de zéro ? Supposons que les atomes d’hélium soient enfermés dans une boîte de volume . On peut alors écrire, par transformation de Fourier ⎧ 1 " ⎪ ⎨ (r) = √ k ak exp i k · r (2.35) ⎪ ⎩ + (r) = √1 " a + exp −i k · r k k
Les opérateurs nombre total de particules N et impulsion P s’écrivent N = ak+ ak
(2.36)
k
P =
+ hka ¯ k ak
(2.37)
k
L’opérateur ak+ crée une particule d’impulsion hk. ¯ Considérons, maintenant, l’état 1 + N0 |N0 = √ |0 a N0 ! 0
(2.38)
Cet état est un état propre du nombre de particules et contient donc exactement N0 particules, toutes d’impulsion nulle. Il est immédiat de vérifier explicitement que N0 | (r) |N0 = 0
58
(2.39)
2. Transitions de phases – Généralités
En effet, l’opérateur (r), qui ne conserve pas le nombre de particules, ne peut pas avoir d’élément de matrice diagonal dans la base des états propres du nombre total de particules. Un état propre du nombre de particules ne peut pas décrire un état suprafluide, car il ne peut pas posséder de propriété de cohérence de phase. La phase et le nombre de particules sont des quantités conjuguées. Considérons maintenant l’état +m 1 N #0 = √ |N0 + ν 2m + 1 ν=−m
(2.40)
où 1 m N0 . Il s’agit d’une superposition cohérente d’états qui ont un nombre de particules voisin de N0 , mais qui ne sont pas fonctions propres du nombre de particules avec les même valeurs propres. Comme ces différents états sont superposés avec des phases relatives cohérentes #0 (r) # N0 = N
N0
1 2
=
√
n0
(2.41)
Pour un gaz parfait de bosons, |N0 est l’état fondamental, puisque toutes les particules se placeraient dans l’état d’impulsion nulle. N0 est le nombre total de particules. Dans l’Hélium liquide, où les interactions entre atomes sont fortes, à température nulle, l’état fondamental contient une fraction macroscopique de particules d’impulsion nulle. Cependant, toutes les particules ne sont pas condensées dans |N0 . Pour l’hélium, N0 est seulement une petite fraction, de l’ordre de 8 %. À partir des relations de commutation des opérateurs de bosons, on démontre facilement que : (2.42) [N, (r)] = −(r) + + (2.43) N, (r) = + (r) La transformation
(r) → (r) exp i αN
qui ajoute une phase au opérateurs champ est appelée une transformation de jauge. Elle est en fait très reliée à la transformation de jauge de l’électrodynamique. Évidemment, l’hamiltonien présente la propriété [N, H ] = 0
(2.44)
L’hamiltonien est invariant dans la transformation de jauge, comme le sont tous les opérateurs d’observables physiques, puisqu’ils sont construits à partir d’un nombre égal d’opérateurs et + . Que peut-on dire, à ce sujet, de l’état du système ? Il est clair, d’après (2.42) et (2.43), que
59
Physique de la matière condensée
(r) ≡ Tr ρ = −Tr ρ [N, (r)] = −Tr [ρ, N ] (r)
(2.45) (2.46)
où l’on a utilisé, dans la dernière égalité, l’invariance cyclique de la trace. De cette dernière égalité, on déduit que (r) ne peut être différent de zéro que si [ρ, N ] = 0
(2.47)
Si la densité de condensat n0 est finie, l’état du système ne peut pas être invariant de jauge. Dans un système condensé de Bose-Einstein, la symétrie de jauge est brisée. Ceci signifie que l’opérateur densité grand-canonique usuel : ρ ∼ exp −β H − μN
(2.48)
ne peut pas être utilisé. Cet opérateur effectue les moyennes d’ensemble sur toutes les phases du paramètre d’ordre , alors que nous devons en sélectionner une seule, bien qu’arbitraire, celle qui correspond à la symétrie brisée. Cette situation est tout à fait analogue à ce que nous avons vu dans le cas du ferromagnétisme. Pour briser la symétrie dans le calcul des valeurs moyennes, nous avons introduit un champ auxiliaire qui tend vers zéro à la fin du calcul. Nous adoptons ici la même méthode. Nous introduisons un champ de « source extérieure » η(r), qui donne légèrement plus de poids statistique à une phase particulière de (r). Nous appellerons « ensemble-η » l’ensemble statistique correspondant [11] : ∗ + d η (r)(r) + η(r) (r) d r (2.49) ρη ∼ exp − βH − μN − où η(r) est une fonction complexe. Puisque N ne commute pas avec , il ne commutera pas non plus avec ρη . Ce que nous recherchons en introduisant ρη , c’est d’obtenir la propriété : √ (2.50) lim Tr ρη (r) = n0 exp i ϕ = 0 η→0
alors que Tr ρη=0 (r) = 0
(2.51)
La notion de symétrie de jauge et de brisure spontanée de la symétrie de jauge est évidemment beaucoup plus générale que le simple exemple de la condensation de Bose-Einstein et se rencontre dans des situations très diverses. À chaque fois que l’hamiltonien est tel que le nombre total de particules est conservé, ou que le nombre total d’une sorte particulière de particules est conservé, ou, plus généralement qu’il existe une « charge généralisée » qui est conservée (telle que le nombre de leptons ou de baryons, ou la charge électrique elle-même), l’hamiltonien
60
2. Transitions de phases – Généralités
présentera une propriété d’invariance de jauge. En effet, le champ approprié (r) rentrera, dans toute interaction, sous la forme + (r)(r) = ρ(r), si bien que multiplier (r) partout par un facteur de phase exp i ϕ et + (r) par exp −i ϕ laisse H invariant. Cette propriété est une propriété d’invariance de jauge globale. L’invariance de jauge locale, dans laquelle le facteur de phase ϕ n’est pas nécessairement constant, mais peut être une fonction de r est une propriété différente ; elle ne se produit que dans le cas de la charge électrique, car pour maintenir l’invariance de jauge, il est nécessaire d’introduire un champ de jauge couplé à la charge conservée, dans ce cas le champ électromagnétique. Les tentatives pour introduire des champs de jauge pour d’autres quantités conservées semblent prometteuses, mais il ne semble pas encore possible de conclure à leur sujet.
Autres brisures de symétrie À ces deux types de symétrie brisée, formation de réseau et brisure de la symétrie de jauge, il faut ajouter la brisure de l’invariance par renversement du temps, c’està-dire l’ordre magnétique, qu’il soit ferromagnétique ou antiferromagnétique. La ferroélectricité est simplement un abaissement de la symétrie cristalline qui aboutit à la formation d’une polarité, c’est-à-dire à la brisure de la symétrie d’inversion. Les cristaux liquides dans la phase nématique montrent un quatrième type ; la brisure de la symétrie locale de rotation. Il en est de même de la transition suprafluide de 3 He liquide, mais celle-ci est reliée, comme dans le cas de la condensation de BoseEinstein, à la brisure de la symétrie de jauge. La supraconductivité est aussi une brisure de la symétrie de jauge. Nous voyons que, de manière très générale, l’état de plus basse énergie d’un système ne possède pas le groupe de symétrie total de son hamiltonien, si bien qu’en l’absence de fluctuations thermiques, le système sera dans un état non symétrique.
2.2.3 Propriétés liées aux brisures de symétrie Singularités thermodynamiques Une propriété centrale dans l’étude des transitions de phase est que, comme l’a souligné Landau, la symétrie ne peut pas changer graduellement. Un élément de symétrie est ou bien présent ou bien absent. Il ne peut pas croître de façon imperceptible. Ceci signifie par exemple qu’on ne peut pas passer de façon continue d’une phase solide à une phase liquide, comme on le fait du liquide vers le gaz en contournant le point critique (figure 2.8). La transition liquide-gaz est en fait un exemple typique de transition qui ne brise pas de symétrie. Un autre exemple est la transition métal-isolant, dite de Mott [12, 13], qui est une transition de localisation des états électroniques induite par des effets de corrélation (voir chapitre 8). Dans ces deux cas, un paramètre physique, la densité
61
Physique de la matière condensée
P
chemin évitant C
liquide
la discontinuité
gaz T
Fig. 2.8 Dans une transition de phase liquide-gaz, la ligne de transition est du premier ordre. Le franchissement de cette ligne, dans une variation de pression ou de température, est marqué par des discontinuités des propriétés thermodynamiques. Mais cette ligne du premier ordre présente un point d’arrêt, le point critique. Il est donc possible de suivre un chemin qui contourne le point critique, afin de passer de la phase liquide à la phase gazeuse sans franchir la ligne du premier ordre, donc sans discontinuités.
pour la transition liquide-gaz, le nombre de porteurs libres pour la transition de Mott, présente deux régimes très différents, quantitativement différents, mais la symétrie des deux phases reste la même. Dans le cas où la transition de phase brise réellement la symétrie, l’état le moins symétrique est caractérisé par un paramètre d’ordre, par exemple < > pour le gaz de Bose, l’aimantation < M > dans le cas du magnétisme. Il s’agit d’une variable additionnelle nécessaire pour spécifier l’état microscopique de la phase de plus basse symétrie. Par exemple, dans un système non magnétique en champ nul, < M > est nul à cause de la symétrie par renversement du temps. Au contraire, dans l’état magnétique, il faut spécifier la valeur de l’aimantation pour caractériser complètement le système. La brisure de symétrie a introduit une nouvelle variable. Ceci suffit pour affirmer que l’énergie libre F = −kB TLn < exp −βH > dans le nouveau système est une fonction mathématique différente, (même après avoir éliminé cette nouvelle variable par la condition de minimisation ∂F /∂M = 0), de ce qu’elle était dans l’ancien. On calcule LnZ pour une valeur spécifiée de M, et on en déduit F (V, T, M ). Puis on calcule F (V, T ) par la condition ∂F /∂M = 0. Au-dessus de Tc , cette condition est automatiquement satisfaite par raison de symétrie. En dessous de Tc , cette condition est non triviale et, quand elle est substituée dans F (V, T, M ), on obtient une nouvelle fonction F (V, T ), qui n’est pas analytique à Tc . Pour fixer les idées supposons, par exemple, que l’énergie libre soit une fonction de M et de T de la forme : F (M, T ) = a(T − Tc )M 2 + bM 4
62
2. Transitions de phases – Généralités
Après minimisation par rapport à M, l’énergie libre s’écrit : ⎧ F T =0 pour T > Tc ⎨ ⎩
2 a2 F T = − 4b T − Tc
(2.52) pour T < Tc
On voit bien que l’énergie libre n’est pas analytique à Tc . Il est clair que, lors d’une transition entre deux phases de symétrie différente, l’énergie libre présente une frontière de singularités entre les deux régimes de symétrie et que, par conséquent, la continuation analytique entre les deux n’est pas possible. La transition du second ordre est un point singulier de F. Dans toute tentative de passer de façon continue de l’état symétrique à l’état non symétrique, en passant par des configurations instables, on rencontrera un point de non-analyticité (même dans les cas où nous ne l’observons pas parce qu’une transition du premier ordre se produit et fait avorter le régime critique). Il est clair que ce type de discontinuité résulte de la taille macroscopique du système à N corps. L’énergie libre d’un système de taille finie est toujours analytique. Par conséquent, cette singularité analytique ne se produit que dans la limite des grands systèmes, plus précisément dans la limite où N → ∞. C’est seulement quand on va vers des systèmes macroscopiques, dans lesquels de grands nombres de degrés de liberté coopèrent, que nous trouvons une transition thermique soudaine plutôt que graduelle. Dans un système ferro-électrique, chaque moment dipolaire agit pour maintenir les autres dans la même direction, à travers un « champ moléculaire ». Le renversement d’un seul moment ne renversera pas la totalité des autres, mais se traduira seulement par une fluctuation √ locale. La proba bilité pour que tous fluctuent en même temps sera ∼ exp − N ∼ exp −1012 , c’est-à-dire complètement négligeable. Si, par contre, un nombre suffisant de dipôles sont retournés, le système peut se transformer, tout à fait soudainement, avec une probabilité extrêmement élevée en une région entièrement différente de l’espace des phase. Il existe donc une ligne de passage, qui sépare le système microscopique symétrique et le système présentant une symétrie brisée macroscopique. Ce qui caractérise cette distinction, c’est que le fait de prendre la moyenne thermique sur la totalité des configurations possibles du système cesse d’être correct. De façon générale, une transition de phase où une symétrie est spontanément brisée est toujours, d’une certaine façon, une transition ergodique-non ergodique. Une fois qu’une polarisation P s’est développée, il n’est plus possible de calculer la fonction de partition Z en prenant la trace sur toutes les configurations de polarisation P et −P. Ces dernières doivent être considérées comme « impossibles à atteindre ». On utilise F T, V, P avec la condition ∂F ∂P = 0, où F T, V, P est calculée pour une valeur spécifiée du paramètre d’ordre. La frontière se produit quand les fluctuations quantiques ou thermiques sont tout juste capables de franchir la barrière entre deux configurations équivalentes.
63
Physique de la matière condensée
Excitations collectives L’hamiltonien décrivant les interactions internes de notre système macroscopique obéit encore au groupe de symétrie initial. C’est l’état de la matière qui ne conserve pas toutes les propriétés de symétrie. Il en résulte deux types de conséquences importantes pour les propriétés de cette matière. D’une part, la brisure de symétrie détermine, dans une large mesure, la dynamique du système, en affectant le spectre des excitations élémentaires et des fluctuations. D’autre part, elle est la cause de nouvelles propriétés statiques, appelées rigidités généralisées. Discutons d’abord les propriétés dynamiques de basse fréquence. Deux cas possibles se présentent. Le nouvel état non symétrique peut être un état propre de l’hamiltonien ou non. L’hamiltonien, en général possède un groupe de symétrie G. Il n’y aura d’effets dynamiques à basse température que si le groupe G est continu. Par exemple, le modèle d’Ising ne présente pas d’excitations de basse énergie de type ondes de spin (voir chapitre 9), dont l’énergie tende vers zéro quand le vecteur d’onde tend vers zéro. Il en résulte que la dynamique de basse température ne présente pas de caractéristiques particulières. Par contre, si G est continu, il peut être décrit par un ensemble de générateurs Li . Cela signifie que les éléments A appartenant au groupe G et vérifiant donc AHA −1 = H
(2.53)
A = exp i θLi
(2.54)
peuvent s’écrire sous la forme
où Li est relié aux transformations infinitésimales (par exemple les rotations infinitésimales d’angle d θ). Pour une transformation infinitésimale ε A = 1 + i εLi
(2.55)
Les groupes continus peuvent, en général, être construits en effectuant des produits d’opérateurs infinitésimaux, (mais aussi, dans certains cas, de groupes d’opérateurs discrets, tels que la parité ou le renversement du sens du temps). Le groupe des rotations de spin, par exemple, a pour générateurs les opérateurs Sx , Sy , Sz et une rotation d’angle quelconque peut être exprimée comme exp i θ · S , où θ est un vecteur parallèle à l’axe de rotation. Les différents générateurs du groupe Li commutent avec H. Ce sont par conséquent des quantités conservées. Si le paramètre d’ordre peut être choisi comme l’un d’entre eux, c’est une quantité conservée. C’est le cas, par exemple, des ferromagnétiques, où le paramètre d’ordre peut être défini comme le spin total dans une direction fixée z. Les autres générateurs du groupe peuvent commuter ou ne pas commuter entre eux. C’est-à-dire que le groupe peut être Abélien, auquel cas toutes les représentations sont de dimension 1 et l’état fondamental est non dégénéré, ou non Abélien, comme
64
2. Transitions de phases – Généralités
le groupe des rotations, comme dans l’exemple du ferromagnétique isotrope ; Sx , Sy , Sz ne commutent pas entre eux. Dans ce dernier cas, le paramètre d’ordre peut être défini comme Sz , par exemple. Alors, Sx et Sy commutent avec H mais pas avec Sz . Si Sz n’est pas nul, il y a une infinité d’autres états fondamentaux dégénérés g , formés en appliquant ces générateurs au fondamental originel g : n n g = Sx ± iSy g = S ± g (2.56) où n = 1, 2, · · · , 2Stotal . Ce sont les 2Stotal + 1 états fondamentaux dégénérés ferromagnétiques de l’hamiltonien H =− Jij S i · S j (2.57) i,j
obtenus par abaissement du spin total, à partir de l’état d’aimantation maximale selon z . Dans le cas où nous avons un générateur de groupe qui engendre un ensemble dégénéré d’états propres, nous pouvons déduire l’existence d’une branche d’excitation associée. Dans l’exemple considéré du ferromagnétisme, ce sont les ondes de spin. Nous obtenons un ensemble d’excitations qui sont états propres, dont les fréquences tendent vers zéro quand le vecteur d’onde de l’excitation tend vers zéro. Soulignons l’importance, dans ce résultat, du caractère continu de la symétrie. Quand la symétrie brisée est une symétrie discrète, comme dans le cas du modèle d’Ising, il n’existe pas de mode collectif, parce qu’il n’y a pas de degrés de liberté continus pour les définir. Dans une transition de phase du second ordre, près du point critique, il y aura l’équivalent à température finie des modes de fréquence nulle, à savoir les fluctuations critiques d’amplitude divergente quand T tend vers Tc . Les fluctuations critiques sont un phénomène purement classique, car elles se produisent toujours à température finie et font intervenir des fréquences très petites devant la température. Dans le cas d’un groupe de symétrie continu, les excitations collectives de basse fréquence, qui existent nécessairement au zéro absolu, sont aussi présentes, évidemment dans tout l’intervalle de température jusqu’à Tc et fusionnent, plus ou moins, avec le spectre des fluctuations critiques près de Tc [14]. La nature des excitations sans collisions de basse température est particulièrement intéressante dans le cas, beaucoup plus fréquent où le paramètre d’ordre n’est pas une constante du mouvement et où l’état de basse température n’appartient pas à la représentation du groupe de symétrie de l’hamiltonien. L’état cristallin nous apporte un exemple familier. Considérons la transformée de Fourier de la densité du cristal : ρG exp i G · r (2.58) ρ(r) = G
65
Physique de la matière condensée
où G dénote les vecteurs du réseau réciproque. Les ρG définissent le paramètre d’ordre du cristal. Comme dans le cas de < M >, < P > ou < >, les ρG ont une amplitude, (qui n’est reliée en aucune façon aux propriétés d’invariance, mais indique simplement le degré d’ordre acquis par le système), mais aussi des directions et des phases, qui sont arbitraires et représentent les vrais paramètres de la brisure de symétrie. Dans l’état cristallin, il existe deux quantités qui brisent la symétrie ; la direction du vecteur G, qui définit l’orientation du cristal, et la phase de ρG , qui est reliée à la variable de position u.
et comme ρ−G
ρG = |ρG | exp i φG
(2.59)
φG = G · u
(2.60)
∗ = ρG ρ(r) =
|ρG | cos [G · (r + u)]
(2.61)
G
Ici, u est un vecteur ; nous obtenons donc trois modes acoustiques. Dans ce cas de brisure de symétrie, où la partie du paramètre d’ordre violant la symétrie n’est pas une constante du mouvement, les équations du mouvement sont plus complexes. Cependant, il est possible de traiter de façon classique les coordonnées collectives de grande longueur d’onde, c’est-à-dire les phonons. Définissons la transformée de Fourier du vecteur déplacement un exp i q · r (2.62) uq = n
Les équations du mouvement, dites équations d’Ehrenfest, s’écrivent ⎧• ⎪ ⎨ u q = i H, uq =
∂H ∂pq
=
⎪ ⎩ p• = i H, p = − ∂V q q ∂uq
pq M
(2.63)
si bien que nous obtenons un spectre linéaire ω2 =
c 2 q M
(2.64)
Le comportement linéaire de ce spectre est caractéristique d’un grand nombre de systèmes. Il est clair que les aspects essentiels de la démonstration ne dépendent pas du système particulier. En fait, ces idées ont été généralisées dans un contexte de théorie des champs par Goldstone, Salam et Weinberg [15, 16]. On appelle ce type de modes, depuis, des « bosons de Goldstone ». Il y a, cependant, un cas particulier où les arguments ci-dessus ne s’appliquent plus, c’est celui des forces à longue portée, et notamment de l’interaction coulombienne.
66
2. Transitions de phases – Généralités
Dans ce cas, bien qu’il soit encore correct de dire que l’énergie ne dépende pas du déplacement uniforme uq=0 , une onde de densité longitudinale provoquera une accumulation de charge à la surface de l’échantillon ρ=
1 · E = ne · u 4π
(2.65)
si bien que les forces de rappel coulombiennes conduisent à un potentiel proportionnel à 1 4π 2 ρ (2.66) VCoul = 2 q2 q C’est pourquoi, dans ce cas, le mode collectif longitudinal a une fréquence finie quand q → 0, en fait égale à la fréquence de plasma, comme on peut le voir à partir des équations du mouvement ⎧ • pq ⎪ ⎨ uq = M (2.67) ⎪ ⎩ p• = − ∂VCoul q ∂uq d’où
4π ne 2 (2.68) M Ce mode de plasma est universel dans les systèmes condensés chargés. C’est le cas, notamment du cristal de Wigner, où il n’existe que deux modes de phonons transverses avec ω ∼ q, et du supraconducteur, où il n’existe pas de mode où ω → 0. ωp2 =
L’équivalent, en théorie des champs, du plasmon, qui n’est pas un boson de Goldstone, est un « boson de Higgs » [17, 18].
Rigidité généralisée Un autre concept lié à celui de brisure de symétrie est celui de rigidité généralisée. Par exemple, quand on translate un solide, on translate de la même distance tous les points du solide. C’est une conséquence du fait que l’énergie est minimisée quand la symétrie est brisée de la même façon dans tout l’échantillon. Pour briser la rigidité complètement (et pas seulement par une petite déformation élastique sous l’effet d’une force extérieure) il est nécessaire de fournir une énergie de condensation d’une partie macroscopique de l’échantillon. Cette énergie est nécessaire pour engendrer la singularité du paramètre d’ordre, qui découle obligatoirement du fait que la symétrie n’est plus brisée partout de la même façon ; ainsi, il faut créer une dislocation si on veut déplacer une partie du cristal par rapport à l’autre. En effet, à cause de la brisure de symétrie, il existe plusieurs états (et même une infinité si la symétrie brisée est continue) de même énergie.
67
Physique de la matière condensée
On peut donc imaginer que l’état arbitrairement choisi ne soit pas le même dans tout le volume de l’échantillon. Mais pour passer d’un état à un autre état dégénéré, d’une région à l’autre de l’échantillon, il faut engendrer une forte variation spatiale du paramètre d’ordre, qui devient singulier dans la région de transition entre les deux solutions dégénérées. On peut généraliser ce concept de rigidité à tous les exemples de symétrie brisée ; dans le cas du ferromagnétisme, les aimants sont permanents parce qu’on ne peut changer graduellement l’aimantation. Il faut retourner un domaine macroscopique d’un seul coup. La singularité du paramètre d’ordre est la paroi qui sépare deux domaines magnétiques. Dans le cas de la supraconductivité, la phase ϕ du paramètre d’ordre est fixée de façon uniforme par une énergie de rigidité 2 (∇ϕ)2 . La singularité qui brise la rigidité de phase est la ligne de vortex (ligne de flux dans les supraconducteurs, ligne de tourbillon dans les suprafluides) qui présente de fortes analogies avec la ligne de dislocation du cristal. Ce sont deux défauts topologiques de même nature. Dans le tableau 2.2.3, nous donnons quelques exemples importants de brisures de symétrie et des propriétés associées.
2.3 Modèle de Landau – Recherche des paramètres d’ordre 2.3.1 Introduction Nous avons jusqu’ici, en pratique, éludé une question importante, celle de la définition précise du paramètre d’ordre. Nous sommes, bien sûr, largement guidé par l’intuition physique dans la définition de ce paramètre physique ; il doit être extensif, nul dans la phase désordonné, non nul dans la phase ordonné ; il doit caractériser la brisure de symétrie associée à la transition de phase et mesurer le degré d’ordre de la phase basse température. Par exemple, dans le cas d’une transition ferromagnétique, où il apparaît une aimantation spontanée dans la phase ordonnée, il est clair que cette aimantation, dont l’axe a une orientation arbitraire, brise l’invariance par rotation globale des spins de la phase haute température. Il ne subsiste plus, dans la phase ordonnée qu’une invariance par rotation dans le plan perpendiculaire à l’axe de l’aimantation. On voit clairement que l’aimantation spontanée est un choix de paramètre d’ordre pertinent. De même dans une transition ferroélectrique, il apparaît une polarisation diélectrique spontanée, et c’est, dans ce cas là, cette polarisation qui jouera le rôle de paramètre d’ordre. Dans une transition liquide-solide, l’apparition d’un réseau cristallin brise l’invariance par le groupe continu des translations. Les composantes de Fourier de la
68
Tab 2.1
Exemples de symétrie brisée.
Phénomène
Phase haute T
Phase basse T
ferroélectricité
cristal non polaire
polarisation
polarisation
2d ou 1er
ferromagnétisme
paramagnétique
ferromagnétique
aimantation
1 ou 3
aimantation alternée
1 ou 3
2d renversement du temps
ondes de spin
anti-ferromagnétisme paramagnétique Anti-ferromagnétique
Paramètre d’ordre
Dimensionnalité Ordre habituel du paramètre de la transition d’ordre
Bosons de Goldstone
Rigidité généralisée
–
hysteresis
parois de domanies
2d renversement du temps
ondes de spin
magnétique paramagnétique hysteresis
Singularités
parois de domanies
parois de domanies
métal normal
supraconducteur
∗ σ∗ −σ
2
2d invariance de jauge
–
supraconductivité
lignes flux
Hélium II
liquide normal
suprafluide
2
2d invariance de jauge
phonons
suprafluidité
lignes de vortex
cristal liquide nématique
liquide normal
liquide orienté
directeur
3
2d
instable à T = 0
élasticité
diclinaisons
cristal liquide smectique
nématique
onde de densité
ρ(0)
>3
2d ou 1er
instable àT =0
élasticité
disclinaisons dislocations
cristallisation
liquide
solide
ρG pour tout G sur le réseau réciproque
3
1er
phonons
rigidité
dislocations joints de grains lacunes
Hélium 3
liquide normal suprafluide anisotrope
onde de densité
gaz d’électrons
de charge
normal
onde de densité
dij = ML MS ρG
pour tout G sur le réseau réciproque
suprafluidité lignes de vortex complexe 2d 1er
phasons
phason d’onde de densité
glissement d’onde discommensurations, de densité
dislocations
2. Transitions de phases – Généralités
supraconductivité
69
Physique de la matière condensée
densité non nulles dans la phase liquide sont réduites au vecteur d’onde q = 0, alors que dans la phase solide, toutes les composantes de Fourier de la densité ρq , de vecteurs d’onde q appartenant au réseau réciproque, apparaissent. Les ρq peuvent jouer le rôle de paramètre d’ordre. On pourrait ainsi multiplier les exemples simples, où le choix d’un paramètre d’ordre, fondé sur les considérations de brisure spontanée de symétrie est parfaitement clair et intuitif. Il existe, toutefois, des situations où ce choix est moins évident. D’autre part, il est clairement souhaitable de répondre à la question suivante : étant donné le groupe de symétrie de la phase de haute température, quelles sont toutes les brisures de symétrie qui sont susceptibles d’apparaître ? Il est clair que toutes ces transitions de phase possibles ne vont pas nécessairement se produire effectivement, mais il est intéressant de connaître toutes celles qui sont possibles, étant donné ce groupe de symétrie, c’est-à-dire compatibles avec ce groupe. Une question importante, étroitement liée évidemment à la précédente, se pose ; toujours pour ce même groupe de symétrie, comment définir et recenser tous les paramètres d’ordre possibles, compatibles avec les symétries de la phase de haute température.
2.3.2 Exemple simple C’est cette question que nous allons discuter dans ce paragraphe. Nous allons d’abord commencer par l’étude d’un exemple simple et pédagogique, proposé par N. Boccara [7], pour lequel nous allons montrer comment on peut choisir les paramètres d’ordre possibles pour décrire le système considéré et comment on peut construire une fonctionnelle de Landau de l’énergie libre. Imaginons un cristal magnétique dans lequel on puisse distinguer deux sous-réseaux identiques. On désigne par m1 et m2 l’aimantation moyenne par maille cristalline de chacun des deux sous-réseaux. Supposons que les deux aimantations soient parallèles, c’est-à-dire qu’il s’agisse de spins d’Ising. L’état du système peut être représenté par le vecteur ; |m >= |m1 , m2 >
(2.69)
Nous postulons les propriétés de symétrie suivantes : 1- en tant que fonction de m1 et m2 , l’énergie libre du système F (T ; m1 , m2 ) n’est pas modifiée si on permute m1 et m2 , 2- elle n’est pas modifiée, non plus, si on change m1 et m2 respectivement en −m1 et −m2 . Le groupe de symétrie engendré par ces deux opérations comporte 4 éléments, à savoir : – l’identité, qu’on dénotera e,
70
2. Transitions de phases – Généralités
– la permutation des deux sous-réseaux, qu’on dénotera a, – le renversement global de tous les moments, qu’on dénotera b, – le produit de ces deux derniers éléments, ab, qui appartient aussi, nécessairement au groupe de symétrie. Dans cette dernière opération, m1 est changé en −m2 et m2 est changé en −m1 . L’espace vectoriel des états du système E est de dimension 2. Les quatre opérations du groupe de symétrie définissent des applications de E dans E, qui peuvent être représentées par des matrices 2 × 2 ; ⎛ e =⎝
1 0
⎞ ⎠
(2.70)
0 1 ⎛ a=⎝
0 1
⎞ ⎠
(2.71)
1 0 ⎛ b=⎝
−1
⎛ ab = ⎝
0
⎞ ⎠
0 −1 0 −1 −1
(2.72)
⎞ ⎠
(2.73)
0
La température étant fixée, développons l’énergie libre en série de la forme ; F (T ; m1 , m2 ) = F (T ; 0, 0) + F1 (T ; m1 , m2 ) + F2 (T ; m1 , m2 ) + .... (2.74) +Fn T ; m1 , m2 + · · · où Fn T ; m1 , m2 est un polynôme homogène de degré n en m1 et m2 . La fonctionnelle F (T ; m1 , m2 ) devant être, par hypothèse, invariante par le groupe de symétrie de laphase de haute température, il en est de même de tous les polynômes Fn T ; m1 , m2 . Comme il est impossible de construire une forme linéaire invariante par rapport à toutes les opérations du groupe de symétrie, le terme F1 T ; m1 , m2 est nécessairement identiquement nul.
71
Physique de la matière condensée
En revanche, il est facile de constater qu’il existe deux formes quadratiques invariantes indépendantes, ce qui implique pour F2 T ; m1 , m2 une expression de la forme générale ; F2 (T ; m1 , m2 ) = A(m12 + m22 ) + 2Bm1 m2 où A et B ne dépendent que de la température. Dans la phase paramagnétique, m1 et m2 étant nuls, les conditions de stabilité imposent à la forme quadratique F2 T ; m1 , m2 d’être définie positive. À la température de transition vers un état magnétique ordonné, on atteint la limite de stabilité de la phase paramagnétique. La forme quadratique cesse d’être définie positive, une des valeurs propres de la matrice : ⎛ ⎞ A B ⎝ ⎠ (2.75) B A s’annule.
Pour poursuivre la discussion, il convient de mettre F2 T ; m1 , m2 sous forme diagonale. On obtient ; 1 1 F (T; m1 , m2 ) = F0 + (A + B)(m1 + m2 )2 + (A − B)(m1 − m2 )2 (2.76) 2 2 Si à une certaine température T0 la valeur propre A + B s’annule, puis devient négative au-dessous de T0 , tandis que la valeur propre A − B reste positive, il apparaît un ordre magnétique caractérisé par m1 +m2 = 0, tandis que m1 −m2 reste nul, c’est-à-dire un ordre ferromagnétique. Dans le cas contraire, si c’est (A − B) qui devient négatif tandis que A + B reste positif, il apparaît un ordre antiferromagnétique caractérisé par m1 − m2 = 0 , tandis que m1 + m2 reste nul. Les paramètres mf = m1 + m2 et maf = m1 − m2 sont appelés des paramètres d’ordre. Celui qui devient différent de zéro au-dessous du point de transition caractérise le type d’ordre magnétique qui s’établit dans le cristal. mf et maf sont les seuls paramètres d’ordre possibles compatibles avec les hypothèses relatives aux propriétés de symétrie de l’énergie libre. Ils sont déterminés par la diagonalisation de la forme quadratique F2 (T ; m1 , m2 ). La diagonalisation de F2 (T ; m1 , m2 ) est liée à la décomposition en représentations irréductibles (unidimensionnelles, dans le cas présent) de la représentation du groupe de symétrie dans l’espace vectoriel à deux dimensions engendré par les vecteurs |m1 , m2 >. Dans l’exemple considéré ici, le groupe de symétrie possède 4 représentations irréductibles unidimensionnelles distinctes rassemblées dans le tableau suivant :
72
2. Transitions de phases – Généralités
e
a
b ab
τ0 1
1
1
1
τ1 1 −1 −1
1
τ2 1 −1 τ3 1
(2.77)
1 −1
1 −1 −1
À la représentation τ1 , on associe le paramètre d’ordre maf = m1 − m2 . Elle laisse invariante toute fonction de m1 et m2 qui n’est pas modifiée si on change m1 en −m2 et m2 en −m1 . De la même manière, le paramètre d’ordre mf = m1 + m2 est associé à la représentation τ3 . On a décomposé l’espace vectoriel engendré par les vecteurs |1, 0 > et |0, 1 > |m1 , m2 >= m1 |1, 0 > +m2 |0, 1 > (2.78) en deux sous-espaces vectoriels irréductibles engendrés respectivement par :
et
m1 + m2 1 1 |√ , √ > √ 2 2 2
(2.79)
m1 − m2 1 1 |√ , −√ > √ 2 2 2
(2.80)
2.3.3 Cas général Après l’exposé de cet exemple simple, on peut présenter la méthode générale. De façon plus générale, considérons un système thermodynamique dont l’énergie libre F est une fonction de la température T et de paramètres extensifs xi , qui sont définis de façon à être nuls dans la phase de plus haute symétrie. En tant que fonction des xi , l’énergie libre F est invariante par les opérations de symétrie du groupe G0 de la phase la plus symétrique. Un état du système peut être représenté par le vecteur : |x >= |x1 , x2 .... >
(2.81)
Si à chaque élément g du groupe G0 , on associe une application de l’espace des états E dans lui-même, on définit une représentation linéaire de G0 . Si E admet une base finie comportant n vecteurs, chaque élément g de G0 peut être représenté par une matrice de rang n, M (g ), et quels que soient g1 et g2 appartenant à G0 , on a :
73
Physique de la matière condensée
M (g1 )M (g2 ) = M (g1 g2 )
(2.82)
La représentation linéaire ainsi définie est dite de degré n. La représentation M (g ) est en général réductible, c’est-à-dire qu’il existe un changement de base tel que la matrice M puisse se mettre sous la forme :
Si chaque bloc M1 , M2 , M3 , · · · ne peut pas à nouveau se décomposer de la même façon, on a défini une représentation irréductible. On a décomposé l’espace vectoriel E en sous-espaces invariants irréductibles E1 , E2 , E3 · · · Dans la nouvelle base, on définit de nouvelles variables mjα qui s’expriment linéairement en fonction des anciennes variables xi . Pour j fixé, les divers mjα appartiennent à l’espace invariant irréductible Ej de dimension nj (α = 1, 2, ...nj ). La représentation τj (g ) induite par M (g ) dans Ej est irréductible et on a : M (g ) = τ1 (g ) ⊕ τ2 (g ) ⊕ ...
(2.83)
Si τj (g ) n’est pas la représentation identique, on ne peut pas construire d’invariants linéaires à partir des mjα (α = 1, 2, ...nj ). En conséquence, tant que le système a la symétrie G0 , tous les paramètres mjα sont nuls. Inversement si un des paramètres mjα devient différent de zéro, ceci implique que le système n’a plus la symétrie G0 . Il y a eu violation de symétrie. La symétrie du système se trouve réduite. On dit encore que la symétrie a été brisée et qu’il y a eu transition. On appelle paramètre d’ordre une grandeur telle que mjα . S’il existe une température T0 , telle que mjα soit nul pour T > T0 et qu’il soit différent de zéro pour T < mjα , on dit que T0 est la température de transition. Si la fonction mjα (T ) est continue en T0 , la transition est dite du deuxième ordre. Si, au contraire mjα (T ) est discontinue en T0 , la transition est dite du premier ordre. La recherche des divers paramètres d’ordre possibles se ramène donc à la décomposition de l’espace vectoriel E en sous-espaces invariants irréductibles. Les seuls paramètres d’ordre possibles sont liés aux représentations irréductibles du groupe de symétrie de la phase la plus symétrique de l’énergie libre, en tant que fonction d’un certain nombre de
74
2. Transitions de phases – Généralités
paramètres variationnels. Ce résultat suppose, d’une part, l’existence d’une énergie libre variationnelle fonction de divers paramètres extensifs et, d’autre part, l’existence d’un développement analytique en puissances de ces paramètres. Il faut avoir présent à l’esprit qu’un paramètre d’ordre n’est pas simplement une quantité qui est nulle dans une phase et non nulle dans une autre. À la rupture de symétrie est toujours associée une amplification des fluctuations. Dans le cas d’une assemblée de N spins {Si ; i = 1...N } localisés aux noeuds d’un réseau, décrite par un hamiltonien invariant par rotation, le ferromagnétisme est caractérisé par le paramètre d’ordre : Siz > (2.84) M =< i
car la fluctuation :
i
ainsi que la fonction de réponse linéaire associée divergent au point de Curie.
2.4 Modèle de Landau – Ordre des transitions L’ordre des transitions est lié au changement de symétrie qui l’accompagne. Cependant l’ordre n’est pas toujours entièrement déterminé par ce changement de symétrie. Lors d’une transition entre deux phases caractérisées par leurs groupes de symétrie, nous savons dans quels cas il est possible de définir un paramètre d’ordre m nul dans la phase la plus symétrique et non nul dans la phase la moins symétrique. La fonction m(T ) est solution de l’équation de minimisation de l’énergie libre F (T ; m) . ∂F =0 ∂m On suppose ici que tous les paramètres autres que m ont été éliminés lors de minimisations préliminaires et que F n’est fonction que de T et m. Si on représente graphiquement les variations de l’énergie libre en fonction du paramètre d’ordre pour diverses valeurs de la température, on est amené à distinguer deux familles de courbes. La famille du premier type, représentée sur la figure (2.9) est caractéristique des transitions du deuxième ordre. La fonction m(T ) est continue au point de transition Tc . Les conditions de stabilité de l’équilibre thermodynamique imposent au voisinage de Tc :
75
Physique de la matière condensée
Fig. 2.9 Représentation schématique de la fonctionnelle de l’énergie libre dans le cas d’une transition de phase du deuxième ordre pour T > Tc , T = Tc et T < Tc .
Pour T > Tc Pour T < Tc
∂ 2F ∂m 2 ∂ 2F ∂m 2
>0
(2.85)
Tc , le minimum de plus basse énergie est à m = 0. Pour T = Tc , les deux minimums sont à la même énergie et il y a cœxistence des deux phases. Cette propriété est caractéristique des transitions du premier ordre. Pour T < Tc , le minimum de plus basse énergie est pour une valeur finie de m. À T = Tc , m passe donc de la valeur zéro à une valeur finie. Il est possible d’établir une condition suffisante pour que la famille de courbes représentant les variations de l’énergie libre F (T ; m) soit du premier ordre. En effet, si le développement en puissances de m de F (T ; m) contient un terme en ∂ 2F m 3 , à la température T1 pour laquelle ( ∂m 2 )m=0 = 0, la courbe a l’allure indiquée sur la figure 2.10. À cette température T1 , l’état stable correspond à une valeur finie de
76
2. Transitions de phases – Généralités
Fig. 2.10 Représentation schématique de la fonctionnelle de l’énergie libre dans le cas d’une transition de phase du premier ordre pour T > Tc , T = Tc et T < Tc .
m et on observera nécessairement une transition du premier ordre à une température Tc supérieure à T1 . Pour qu’une transition puisse être du deuxième ordre, il est donc nécessaire que le développement en puissances de m de l’énergie libre ne contienne pas de termes en m 3 . L’existence ou la non-existence d’un terme en m 3 peut se prévoir par des considération de symétrie (figure 2.11). En effet, la fonctionnelle de Landau de l’énergie libre doit contenir tous les termes autorisés par la symétrie et seulement ceux-là. Si la symétrie n’interdit pas la présence d’un terme en m 3 , ce terme doit nécessairement exister et la transition, d’après l’argument ci-dessus, doit nécessairement être du premier ordre. Par contre, si le terme en m 3 est interdit par la symétrie, ce terme n’existe pas et la transition peut être du second ordre.
Fig. 2.11 Dans le cas où la fonctionnelle de l’énergie libre contient un terme cubique, il y a déjà eu transition vers une valeur non nulle du paramètre d’ordre, avant que la courbure à l’origine ne change de signe.
Prenons l’exemple d’une transition magnétique. La phase ordonnée est caractérisée par l’apparition d’une aimantation spontanée, de vecteur d’onde q = 0 dans le cas ferromagnétique, de vecteur d’onde non nul dans le cas antiferromagnétique. Dans tous les cas, l’ordre magnétique correspond à une brisure de l’invariance
77
Physique de la matière condensée
par renversement du sens du temps. En effet, le renversement t → −t se traduit par le changement de sens de toutes les vitesses des charges électriques et donc le changement de signe de toutes les sources d’aimantation. Donc m est changée en −m. Une valeur finie de l’aimantation spontanée brise nécessairement l’invariance par renversement du sens du temps. La fonctionnelle de Landau décrivant une transition de phase magnétique doit donc être invariante par le groupe de symétrie de la phase haute température, c’est-à-dire, dans le cas présent, de la phase non magnétique. Cette propriété d’invariance par renversement du sens du temps de la fonctionnelle de Landau implique qu’il n’y a pas de puissances impaires de m dans le développement de l’énergie libre. Les transitions magnétiques pourront donc être du second ordre. Mais cette condition nécessaire n’est pas suffisante. Par exemple, si la fonctionnelle de Landau ne contient pas de terme impair (ce qui en général n’est vrai que si ces termes impairs sont interdits par la symétrie), mais si cette fonctionnelle comporte un terme en m 4 négatif, on obtient les familles de courbes données ci-dessous (figure 2.12). Dans ce cas encore, la transition est du 1er ordre.
Fig. 2.12 Représentation schématique de la fonctionnelle de l’énergie libre dans le cas où le terme d’ordre 4 est négatif. La transition est nécessairement du premier ordre.
Contrairement au cas précédent (où l’existence ou la non existence d’un terme en m 3 découle de considérations de symétrie) ce sont des considérations quantitatives qui permettent alors de prévoir le signe du terme en m 4 et donc l’ordre de la transition. En effet, dans les cas où le signe du terme en m 4 peut être négatif, ce signe résulte, en général, d’une compétition entre terme d’entropie et terme d’interaction. Or, le résultat de cette compétition dépend de paramètres quantitatifs, mais pas d’arguments de symétrie. Citons le cas de la transition magnétique de He 3 solide. Cette transition de phase brise l’invariance par renversement du sens du temps, de sorte que la fonctionnelle de Landau ne peut pas contenir de puissances impaires de m. La transition peut être du second ordre. L’expérience montre que les moments magnétiques nucléaires de He 3 , correspondant à un spin 1/2, s’ordonnent à une température de l’ordre de 1 mK, dans une transition fortement du premier ordre [3]. Cette transition du
78
2. Transitions de phases – Généralités
premier ordre est effectivement due à une compétition entre les termes d’entropie, qui contribuent à la fonctionnelle de Landau par des termes en + kB T m 2 et en + kB T m 4 et les termes d’échange qui contribuent à cette fonctionnelle par des termes en −zJm 2 et en −Km 4 F = a kB T − zJ m 2 + b kB T − K m 4 + cm 6 (2.87) où les coefficients a et b sont des constantes qui ne dépendent que de la température. Le terme en −zJm 2 est le terme habituel d’échange à deux spins, qui résulte de l’antisymétrie dans une permutation de deux spins nucléaires. Ce terme, qui décrit bien, habituellement, les interactions entre spins électroniques, ne permet pas de comprendre la transition du premier ordre. L’origine de cette dernière peut être expliquée par le terme supplémentaire en −Km 4 . Ce terme provient d’un échange à 4 spins, résultant d’une permutation de 4 spins nucléaires [20]. Dans le magnétisme électronique, ce terme est habituellement complètement négligeable. Dans le cas du magnétisme de noyaux de He 3 , ce terme n’est, au contraire, pas du tout négligeable et négatif [21], ce qui, à suffisamment basse température, détermine une transition du premier ordre, car il domine alors le terme d’entropie [22]. On voit bien que dans ce cas, ce sont des critères de nature quantitative qui ont déterminé l’ordre de la transition. La valeur extrêmement élevée de la constante d’échange à 4 spins, par rapport aux cas habituels, vient du fait que He 3 solide est un cristal quantique, où les vibrations de point zéro des atomes d’Hélium autour de leurs positions d’équilibre sont exceptionnellement fortes, ce qui augmente de façon considérable la probabilité de processus où 4 atomes d’Hélium effectuent une permutation circulaire sur un cycle de 4 sites atomiques [23].
Bibliographie 1. L.D. Landau, Phys. Z. Sowejetunion 11, 26 (1937) ; reprinted in Collected Papers of L.D. Landau, ed. D. Ter Haar (Pergamon Press, New York, 1965) 2. V.L. Ginzburg et L. D. Landau, Zh. Eksp. Teor. Fiz. 20, 1064 (1950) 3. R. Thom, Structural Stability and Morphogenesis (Benjamin, New York, 1975) 4. E.P. Wigner, Phys. Rev. 46, 1002 (1934) 5. R.A. Coldwell-Horsfall et A.A. Maradudin, J. Math. Phys. 1, 395 (1960) 6. R.G. Palmer et P.W. Anderson, Phys. Rev. D 9, 3281 (1974) 7. N. Boccara, Symétries brisées (Hermann, 1976) 8. P.W. Anderson, Lectures on the many body problem, edited by E.R. Caianiello (Academic Press, New York, 1964) 9. P.W. Anderson, Rev. Mod. Phys. 38, 29 (1966) 10. B.D. Josephson, Nobel Lecture, Rev. Mod. Phys. 46, 250 (1974) 11. P.C. Hohenberg et P.C. Martin, Ann. Phys. 4, 291 (1965) 12. N.F. Mott, Metal-Insulator Transitions (Taylor and Francis, London, 1974)
79
Physique de la matière condensée
13. D.B. McWhan, P.M. Remeika, T.M. Rice, W.F. Brinkmann, J.P. Maita et A. Menth, Phys. Rev. Letters 27, 941 (1971) 14. P.C. Hohenberg et B.I. Halperin, Rev. Mod. Phys. 49, 435 (1977) 15. J. Goldstone, Nuovo Cimento 19, 1 (1961) 16. J. Goldstone, A. Salam et S. Weinberg, Phys. Rev. D127, 965 (1962) 17. P.W. Higgs, Phys. Rev. Lett. 12, 132 (1964) 18. P.W. Anderson, Phys. Rev. 130, 439 (1963) 19. D.D. Osheroff, M.C. Cross et D.S. Fisher, Phys. Rev. Letters 44, 792 (1980) 20. M. Roger, J.M. Delrieu et J.H. Hetherington, Phys. Rev. Letters 45, 137 (1980) 21. M. Bernier, E. Suaudeau et M. Roger, Phys. Rev. B38, 737 (1988) 22. M. Roger, J.M. Delrieu et J.H. Hetherington Journal de Physique C41, 241 (1980) 23. J.M. Delrieu, M. Roger et J.H.Hetherington, Journal de Physique C 41, 231 (1980)
80
Approximations de champ moyen 3.1 Méthodes variationnelles La plupart des transitions ne peuvent se décrire que dans le cadre de théories approchées. Très souvent, il s’agit d’une variante de la méthode du champ moléculaire. On peut développer une formulation de cette méthode qui met en lumière son caractère variationnel. La méthode variationnelle est une méthode d’approximation bien connue en mécanique quantique ; elle est fondée sur la propriété suivante : pour toute fonction d’onde d’essai |ψα , la valeur moyenne de l’hamiltonien Eα =< ψα |H |ψα >
(3.1)
est toujours supérieure ou égale à l’énergie du fondamental exacte E0 . La meilleure estimation variationnelle de E0 sera donc obtenue à partir de la fonction d’onde |ψα > qui minimise Eα . Il existe un équivalent de cette méthode variationnelle en mécanique statistique.
81
Physique de la matière condensée
3.1.1 Les théorèmes variationnels Si un système est en équilibre thermodynamique, la valeur moyenne d’une grandeur physique, représentée par un opérateur A est donnée par : < A >= Tr ρA
(3.2)
où ρ est l’opérateur densité tel que Tr ρ = 1. On s’intéresse aux systèmes en équilibre avec un thermostat. L’expression de ρ s’obtient en minimisant l’énergie libre
On en déduit :
βF = βTr ρH + Tr ρLnρ
(3.3)
1 F = − LnTr exp −βH β
(3.4)
Première méthode variationnelle Comme on ne sait pas calculer exactement la fonction de partition Z = Tr exp −βH
(3.5)
où Tr signifie qu’il faut prendre la trace de l’opérateur. On se contente d’une expression approchée Fv de l’énergie libre obtenue à partir d’un opérateur densité approximatif ρ0 : βFv = βTr ρ0 H + Tr ρ0 Lnρ0
(3.6)
ρ est l’opérateur densité exact et ρ0 un opérateur densité approché, dans l’ensemble canonique, décrivant un système en contact avec un thermostat à la température T, de façon que l’énergie soit fixée en moyenne : < H >= E
(3.7)
ρ et ρ0 doivent tous les deux vérifier deux contraintes. La première est une contrainte de normalisation Tr ρ = Tr ρ0 = 1 (3.8) L’autre contrainte exprime que la valeur moyenne de l’énergie est E Tr ρH = Tr ρ0 H = E
(3.9)
Écrivons maintenant le principe d’entropie maximum ou second principe de la thermodynamique : quel que soit ρ0 ,
82
3. Approximations de champ moyen
−Tr ρ0 Lnρ0 ≤ −Tr ρLnρ
(3.10)
Comme ρ est l’opérateur densité exact, dans l’ensemble canonique : ρ=
1 exp −βH Z
(3.11)
L’équation (3.10) s’écrit : −Tr ρ0 Lnρ0 ≤ Tr ρ LnZ + βH
(3.12)
En utilisant les équations (3.8) et (3.9), on peut écrire Tr ρ LnZ + βH = Tr ρ0 LnZ + βH d’où :
−Tr ρ0 Lnρ0 ≤ Tr ρ0 LnZ + βH = LnZ + Tr ρ0 βH
(3.13)
L’inégalité peut se réécrire : βF = −LnZ ≤ Tr ρ0 Lnρ0 + βTr ρ0 H soit :
βF ≤ βFv
(3.14)
où F est l’énergie libre exacte et Fv est l’énergie libre variationnelle, définie par βFv = Tr ρ0 Lnρ0 + βTr ρ0 H
(3.15)
L’énergie libre approximative est toujours plus grande que l’énergie libre exacte. La meilleure énergie libre approximative sera celle qui minimise βFv (ρ0 ) par rapport aux variations des paramètres de ρ0 .
Deuxième méthode variationnelle Au lieu de raisonner sur un opérateur densité approché ρ0 , il est parfois plus commode de raisonner sur un hamiltonien approché Ha qui permet de définir un opérateur densité. Ce cas est, bien sûr, différent du cas précédent. En effet, ici on connaît de façon exacte l’hamiltonien H (alors qu’on ne connaissait pas exactement ρ). Par contre, évidemment, on ne sait pas le résoudre. C’est pourquoi nous allons utiliser un hamiltonien approché, qui lui sera exactement soluble. À cet hamiltonien approché, correspond un opérateur densité ρa , définit par : ρa =
exp −βHa Tr exp −βHa
(3.16)
83
Physique de la matière condensée
On définit Fa , l’énergie libre correspondant à cet hamiltonien approché : Fa = −kB TLnZa βFa = −LnTr exp −βHa
(3.17) (3.18)
−Tr ρa Lnρa = LnZa + βTr ρa Ha
(3.19)
Dans ce cas, on peut écrire :
Notre énergie libre variationnelle ne sera pas Fa , mais Fv définie par : βFv = βFa + βTr ρa (H − Ha )
(3.20)
Fv = Fa + < H − Ha >a
(3.21)
ou de façon équivalente :
où < A >a = Tr ρa A est défini comme la valeur moyenne de l’opérateur A calculée à partir de l’hamiltonien approché Ha et, donc, de l’opérateur densité correspondant ρa . En effet ce choix de Fv permet de conserver la propriété variationnelle Fv ≥ F . Ceci peut se démontrer en utilisant la propriété vérifiée par tout opérateur hermitique X : < exp X >≥ exp < X >
(3.22)
Pour la démontrer, on peut partir de la définition de l’exponentielle d’un opérateur : exp [X − < X >] = 1 + [X − < X >] +
[X − < X >]2 +··· 2
(3.23)
On en déduit, en prenant la valeur moyenne des deux membres, définie à partir de tout opérateur densité : < exp [X − < X >] >
≥
< 1 + [X − < X >] >
(3.24)
Cette inégalité est vraie quelle que soit l’opérateur densité utilisé pour calculer les valeurs moyennes. L’inégalité est vérifiée pour tout scalaire réel X , mais aussi, à condition de prendre la valeur moyenne des deux membres, pour tout opérateur hermitique X . Donc, en écrivant cette inégalité pour l’opérateur X = −β H − Ha et en définissant les valeurs moyennes à l’aide de l’opérateur densité ρa , on obtient Tr [ρa exp −β(H − Ha )] ≥ exp[−Tr ρa β(H − Ha )]
84
(3.25)
3. Approximations de champ moyen
et en supposant, pour simplifier, que H et Ha commutent : Ln
Tr exp −βH ≥ −Tr ρa β(H − Ha ) Tr exp −βHa
(3.26)
d’où la propriété variationnelle annoncée : F ≤ Fv = Fa + Tr ρa β(H − Ha )
(3.27)
3.1.2 Méthode de Bragg et Williams – Champ moléculaire Ce sont ces considérations générales qui forment la base des méthodes du champ moléculaire et de Bragg et Williams [3], que nous allons discuter maintenant. Historiquement, ce sont les premières méthodes qui ont permis de rendre compte des transitions du deuxième ordre. Nous allons montrer que ce sont deux aspects de la théorie générale précédente. Langevin avait donné une théorie élémentaire du paramagnétisme et avait découvert qu’en présence d’un champ magnétique H suffisamment petit, l’aimantation M de moments magnétiques indépendants était donnée par une expression de la forme M (T ) = CH /T où C est la constante de Curie et T la température. Pour rendre compte du ferromagnétisme, il fallait introduire l’effet des interactions entre « aimants atomiques », négligées dans la théorie de Langevin. P. Weiss [4] supposa qu’il était possible, en première approximation, d’en tenir compte en ajoutant au champ H appliqué le champ Hm (champ moléculaire) créé par les voisins. Ceci donne : C H + Hm M = (3.28) T En outre, il postula que ce champ moléculaire était de la forme Hm = K M Cette hypothèse devait rendre compte de la nature coopérative de l’ordre. Il obtint alors : CH KC = M 1− (3.29) T T c’est-à-dire : M =
CH T − Tc
(3.30)
où Tc = KC est la température d’apparition d’une aimantation spontanée, c’est-àdire une valeur finie de M quand H → 0. Voyons ceci plus précisément.
85
Physique de la matière condensée
On considère une assemblée de spin d’Ising (pour simplifier) sur un réseau de Bravais. Nous écrirons, après un changement de variables : H = −J σi σj
L’interaction est supposée ferromagnétique (J > 0). Les σi sont des variables scalaires définies en chaque site i du réseau et qui peuvent prendre les valeurs ±1. La sommation est limitée aux paires < i, j > de sites premiers voisins.
Première méthode : Bragg et Williams Nous allons appliquer la méthode variationnelle où la quantité variationnelle est l’opérateur densité. Nous considérons donc un opérateur densité approché. Les états propres de chaque spin σi appartiennent à un espace vectoriel de dimension 2, Ei . Les états du système de N spins (σ1 , σ2 , · · · , σi , · · · , σN ) appartiennent à l’espace produit tensoriel, E , de dimension 2N . E = E1 ⊗ E2 ⊗ · · · ⊗ Ei ⊗ · · · ⊗ EN
(3.31)
L’opérateur densité approché ρ0 est pris égal au produit tensoriel des opérateurs densités relatifs à un seul spin ρ0i , chaque ρ0i étant défini dans le sous-espace Ei . ρ0 = ρ01 ⊗ ρ02 ⊗ · · · ⊗ ρ0i ⊗ · · · ⊗ ρ0N
(3.32)
C’est une approximation qui consiste à découpler les différents spins (dans la suite, tous les sites i seront équivalents). Chaque opérateur densité partiel, relatif à un seul spin est soumis aux deux contraintes : Tr ρ0i = 1
et
Tr ρ0i σ = m
(3.33)
Chaque ρ0i est donc une matrice 2 × 2, diagonale dans la base des états propres du spin σi ⎛ 1+m ⎞ 0 2 ⎠ (3.34) ρ0i = ⎝ 1−m 0 2 m est le paramètre d’ordre caractérisant ρ0 . L’énergie libre variationnelle s’écrit : 1 1+m 1+m 1−m 1−m 1 βF = Ln + Ln − βJzm 2 N 2 2 2 2 2 où z est le nombre des sites voisins d’un site donné. En écrivant ∂F /∂m = 0
86
(3.35)
3. Approximations de champ moyen
Fig. 3.1 Discussion graphique de la résolution de l’équation de self-consistence de la méthode de Bragg et Williams : il faut rechercher les intersections du graphe de la fonction f(m) = (1/2)Ln((1+m)/(1-m)) avec la droite de pente zJβ .
on obtient :
1 1+m βJzm = Ln 2 1−m
(3.36)
On peut discuter graphiquement l’existence des solutions (figure 3.1) : Il faut rechercher les intersections de la courbe y = f (m) =
1 1+m Ln 2 1−m
avec la droite y = βJzm. Le comportement à l’origine de f (m) est donné par : f (m) =
1 1+m Ln ∼ m. 2 1−m
La nature des solutions dépend de la pente de la droite. Si βJz < 1, la seule solution est m = 0. Si βJz > 1, il y a trois solutions possibles m = 0 et m = ±m0 . La transition entre les deux régimes s’effectue quand la pente de la droite vaut 1, c’est-à-dire pour βJz = 1. Ceci définit la température de transition : Tc =
Jz kB
(3.37)
87
Physique de la matière condensée
Fig. 3.2 Allure des variations du paramètre d’ordre avec la température dans l’approximation de Bragg-Williams.
La discussion de la stabilité de ces diverses solutions permet de déduire la courbe donnant les variations de m en fonction de la température (figure 3.2). Si on veut étudier le voisinage de m = 0, on peut développer l’énergie libre autour de ce point : F est une fonction paire de m. Le développement s’écrit (figure 3.3) : m2 m4 1 βF = −Ln2 + 1 − βzJ + + ··· N 2 12
(3.38)
En posant Jz = kB Tc , on observe les différents comportements de βF pour T > Tc et T < Tc . On en déduit aussi le comportement de m, à partir de la condition de minimisation de l’énergie libre ∂F /∂m = 0 : m3 T − Tc m+ =0 T 3
(3.39)
Les solutions correspondantes sont : m=0
et
m02 = 3
Tc − T T
(3.40)
La solution stable correspond à un comportement parabolique. On peut aussi introduire un champ magnétique h. Il faut alors minimiser le potentiel thermodynamique F − mh : kB Tc 3 ∂F = h = kB T − Tc m + m ∂m 3
88
(3.41)
3. Approximations de champ moyen
Fig. 3.3 Développement de l’énergie libre au voisinage de m=0 dans l’approximation de Bragg-Williams.
Donc, si on définit la susceptibilité : χ=
∂m ∂h
(3.42) T
on obtient, en dérivant par rapport à h kB (T − Tc )χ + kB Tc m02 χ = 1
(3.43)
Si T > Tc , on est dans la phase désordonnée, appelée paramagnétique : m0 = 0 χ=
1 kB T − Tc
(3.44)
Si T < Tc , on est dans la phase ordonnée, appelée ferromagnétique : m0 = 0 χ=
1 kB (T − 4Tc + 3Tc2 /T )
(3.45)
−γ
c Dans les deux cas, χ diverge quand T → Tc , comme : T T−T
avec γ = 1 c On peut calculer la chaleur spécifique à champ h constant : Ch = T
∂S ∂S ∂m =T ∂T ∂m ∂T
(3.46)
Dans la phase paramagnétique : m ≡ 0, donc Ch = 0.
89
Physique de la matière condensée
Fig. 3.4 Allure des variations avec la température de la chaleur spécifique dans l’approximation de Bragg-Wiliams. Ici, il n’a pas été tenu compte de la contribution de la chaleur spécifique de la phase désordonnée.
Dans la phase ferromagnétique : m0 = 0 Ch =
dm 2 1 kB Tc 02 2 dT
(3.47)
On prévoit donc une discontinuité de la chaleur spécifique à la transition (figure 3.4). On retrouve les résultats prévus par la théorie d’Ehrenfest. C , qui est une dérivée seconde du potentiel thermodynamique G = F − mh, dans le cas présent est discontinue, mais ne diverge pas à la transition. On notera la continuité de l’entropie S , ce qui implique qu’il n’y a pas de chaleur latente. Tous ces résultats se retrouvent facilement par la deuxième méthode variationnelle.
Deuxième méthode : champ moyen Dans le paragraphe précédent, c’est la propriété de découplage : ρ0 = ρ01 ⊗ ρ02 ⊗ · · · ⊗ ρ0i ⊗ · · · ⊗ ρ0N qui a permis d’effectuer très simplement les calculs. Cette fois-ci, on suppose que : ρi0 =
1 exp +βhσi Zi0
(3.48)
c’est-à-dire que le système est décrit par un hamiltonien approché Ha , donc par l’opérateur densité : 1 ρa = exp −βHa (3.49) Za
90
3. Approximations de champ moyen
avec
Ha = −h
σi
(3.50)
i
Le paramètre variationnel est ici le « champ moyen » h. Il s’agit encore d’une méthode qui découple les spins et par conséquent néglige toute corrélation, puisque l’hamiltonien à N corps est approché par une somme d’hamiltonien à un spin. Il y a donc, comme dans la méthode précédente une factorisation de la fonction de partition à N spins. C’est bien cette propriété de découplage qui rend les méthodes équivalentes. La fonction de partition du site i correspondant à cet hamiltonien approché s’écrit : Zia = exp βh + exp −βh = 2 cosh βh
(3.51)
d’où l’énergie libre « approchée » par spin : 1 Fa = − Ln 2 cosh βh N β
(3.52)
et pour l’énergie libre variationnelle par spin : 1 1 1 Fv = − Ln 2 cosh βh − z Jm 2 + hm N β 2
(3.53)
Le premier terme correspond à Fa ; les deux suivants correspondent à < H − Ha >a , en gardant les notations du paragraphe précédent. On a posé : m = < σ >= = tanh βh
1 Tr σ exp βhσ Za
(3.54) (3.55)
On doit minimiser, cette fois-ci, Fv par rapport à h. Il vient : − tanh βh − zJm
∂m ∂m +m+h =0 ∂h ∂h
D’où l’équation de self consistence que doit vérifier le champ moyen : ⎧ ⎨ h = zJ tanh βh avec ⎩ m = tanh βh
(3.56)
(3.57)
91
Physique de la matière condensée
Si on écrit cette équation en fonction de m, on retrouve la même condition que dans la méthode de Bragg-Williams du paragraphe précédent : βzJm = arctg m
(3.58)
Remarquons qu’on peut traiter de façon élémentaire le problème précédent, en disant que H se comporte comme : hi σi (3.59) H =− i
avec
hi =
J σi
(3.60)
et on fait l’approximation : hi =
J σj
(3.61)
i
qui doit être indépendant de j , d’où : h = zJ < σ >
(3.62)
Mais nous savons qu’en présence d’un champ extérieur effectif h, des spins indépendants soumis à ce champ effectif acquièrent un moment moyen :
Par conséquent :
< σ >= th βh
(3.63)
< σ >= th [βzJ < σ >]
(3.64)
On doit résoudre une équation dite de « self-consistence » : on a remplacé le problème de spins en interactions par un problème de spins indépendants placés dans le champ moyen des autres spins. Ce champ moyen, qui détermine l’aimantation moyenne, est lui-aussi fixé par cette aimantation moyenne. D’où un problème de « cohérence interne » à résoudre. Cette méthode de champ moyen self-consistent est complètement équivalente à la méthode variationnelle. Il est toujours important, quand on utilise une méthode d’approximation variationnelle, de comprendre le sens physique de l’approximation utilisée, notamment pour en déterminer la limite de validité. Or ce sens physique n’est pas toujours transparent. Dans le cas présent, l’approximation variationnelle résulte du choix de l’opérateur densité d’essai ou de l’hamiltonien d’essai. Dans l’un et l’autre cas (BraggWilliams et champ moyen), ce choix revient à découpler les variables de spin en les traitant comme indépendantes, puisque on factorise les opérateurs densité des différents spins (Bragg-Williams) ou qu’on remplace un hamiltonien de spins couplés par une somme d’hamiltoniens à un spin (champ moyen). Il existe une autre façon, évidemment équivalente, de caractériser cette approximation : le champ moyen est
92
3. Approximations de champ moyen
une approximation de plus bas ordre en fluctuations, c’est à dire en écart à la valeur moyenne. En effet, développons l’hamiltonien en puissances de termes fluctuatifs en écrivant : (3.65) σi =< σi > + σi − < σi > où le terme entre parenthèse décrit l’écart à la valeur moyenne, supposé petit en valeur relative. L’hamiltonien s’écrit : H = −J (3.66) < σi > + σi − < σi > < σj > + σj − < σj >
Si on fait un développement de plus bas ordre en fluctuations : ⎛ ⎞ 2 σi ⎝ < σj> ⎠ + J < σi >< σj > +O σi − < σi > H −J i
j =v(i)
(3.67) où la sommation sur j porte sur les z sites j = v i premiers voisins du site i et la sommation sur < i, j > porte sur les paires de sites premiers voisins. À une constante près : H − hi σi (3.68) i
avec
hi = J
< σj>
(3.69)
On voit alors que la méthode variationnelle de champ moyen est également une méthode de linéarisation de l’hamiltonien, qui consiste à négliger les termes quadratiques en fluctuations. Décrire les spins comme des variables indépendantes est équivalent à traiter au plus bas ordre les fluctuations par rapport à la moyenne. Bien entendu, la linéarisation de l’hamiltonien, qui résulte du fait qu’on néglige les termes quadratiques en fluctuations, aboutit à un problème de self-consistence. En effet l’hamiltonien linéarisé dépend de la valeur moyenne de l’aimantation < σi >, qui elle-même doit dépendre de l’hamiltonien approché. Il faut que cette interdépendance préserve la cohérence interne de la théorie. Comme et que
< σi >= th βhi
(3.70)
hi = zJ < σi >
(3.71)
on aboutit bien à l’équation de self consistence du cham moyen : < σ >= th [βzJ < σ >]
(3.72)
93
Physique de la matière condensée
3.2 Théorie thermodynamique de Landau 3.2.1 Principes généraux Au chapitre précédent, nous avons dégagé les principes du modèle de Landau des transitions de phase [1]. Il s’agit, tout d’abord, de transitions de phase du second ordre, dans lesquelles une symétrie est spontanément brisée. On adopte la démarche suivante : 1) par une analyse des propriétés de symétrie de la phase haute température on recherche des paramètres d’ordre possibles, variables extensives, nulles par symétrie dans la phase haute température, mais qui deviennent nécessaires pour décrire la phase basse température et la brisure spontanée de symétrie. 2) à partir des invariants irréductibles de la phase de haute température, on construit une fonctionnelle de l’énergie libre [2], qui est invariante dans les opérations de symétrie de cette phase : le paramètre d’ordre m(r) est a priori une fonction de l’espace. La donnée de cette fonction permet de décrire une ‘« configuration » donnée. La fonctionnelle établit la correspondance entre cette configuration et l’énergie libre qui doit lui être associée 3) on établit un développement de cette fonctionnelle en puissances de m pour m suffisamment petit, en supposant qu’elle est analytique. 4) on calcule la fonction de partition en prenant la trace de exp −βF [m(r)], c’està-dire en calculant une intégrale fonctionnelle. Bien entendu, cette intégrale fonctionnelle est, en général, impossible à calculer de façon exacte et nécessite donc la mise en œuvre d’approximations plus ou moins sophistiquées. Ce qu’on appelle « approximation de Landau », que nous avons tenu à distinguer du modèle de Landau des transitions de phase, est précisément une façon approchée de calculer cette intégrale fonctionnelle. Il s’agit, encore une fois, d’une approximation de type « champ moyen », qui consiste à négliger les fluctuations par rapport à la moyenne. On peut la présenter comme une approximation du col dans le calcul de la fonction de partition.
3.2.2 Approximation du col La fonction de partition dans l’ensemble canonique s’écrit : Zc = Tr exp −βH qu’il est commode de réécrire Zc =
{C }
94
exp −βE C
(3.73)
3. Approximations de champ moyen
Dans cette somme sur toute les configurations C, on regroupe ensemble toutes celles qui ont même énergie E Zc = W E exp −βE (3.74) {CE }
où la nouvelle somme ne porte maintenant que sur les configurations d’énergie distincte, car on a regroupé ensemble toute les configurations de même énergie, qui ont même poids statistique. W (E ) est le nombre de configurations microscopiques du système d’énergie E . Ce nombre est relié à l’entropie microcanonique du système : W (E ) = exp D’où Zc =
S (E ) kB
exp −β E − TS E
(3.75)
(3.76)
{CE }
On écrit E − TS = F à l’aide de la fonctionnelle du paramètre d’ordre m(r ) donnant la densité d’énergie libre correspondant à la valeur de la fonction m(r ). Les configurations C (E ) sont supposées entièrement déterminées par la donnée des fonctions m(r ). On écrit alors F [m(r )] d d r (3.77) Zc = Dm(r ) exp −β
où est le volume du système.
Cas d’une transition du deuxième ordre Dans l’approximation de Bragg et Williams, l’énergie libre d’un système magnétique décrit par le hamiltonien d’Heisenberg est une fonction analytique de la température T et de l’aimantation m. Au voisinage de la température de transition Tc , m est petite et il suffit de considérer les premiers termes du développement en puissances de m : 1 b F T, m F T, 0 + a T − Tc m 2 + m 4 (3.78) 2 4 où 3 4kB ∂ F a= = (3.79) 2 ∂m ∂T m=0, T =Tc N 16kB Tc 1 ∂ 4F = (3.80) b= 4 6 ∂m 3N 3 m=0, T =Tc
95
Physique de la matière condensée
m est compris entre − N2 et + N2 et Tc =
zJ 4kB .
Ceci définit, dans ce cas particulier très simple, ce qu’on appelle, de façon générale, pour une transition du second ordre donnée caractérisée par un paramètre d’ordre m, la fonctionnelle de Landau de l’énergie libre F (T, m), analytique par rapport à m et à T au voisinage du point de transition. La valeur du paramètre d’ordre à l’équilibre m0 est déterminée par la minimisation de F (T, m). Puis on fait l’approximation que la fonction de partition du système à l’équilibre, qui devrait s’écrire comme une intégrale fonctionnelle sur m(r), se réduit simplement à : F [m(r )] d d r ∼ Zc = Dm(r ) exp −β = exp −β F m0
où m0 est la valeur du paramètre d’ordre à l’équilibre. Il s’agit donc d’une approximation du col qui néglige complètement les fluctuations par rapport à la valeur d’équilibre m0 . Cette approximation « eikonnale » est analogue à l’approximation de l’optique géométrique, où on ne considère que le rayon lumineux qui minimise le chemin optique, ou à l’approximation de la Mécanique Classique, qui ne considère que la trajectoire classique, qui minimise l’action. On conçoit que cette approximation devienne de plus en plus mauvaise à mesure que l’on s’approche de la température critique. En effet, le minimum de F (m0 ) devient de moins en moins marqué et les fluctuations de plus en plus importantes. Il est équivalent de dire que l’approximation consiste à confondre l’énergie libre du système physique à l’équilibre F avec la valeur de la fonctionnelle F (m0 ), calculée pour la valeur de m(r) qui minimise la fonctionnelle. Dans ce paragraphe où nous discutons le cas d’une transition du second ordre, nous supposerons que le développement de l’énergie libre ne contient que des termes de puissances paires du paramètre d’ordre et que le terme d’ordre 4 est positif. Dans ces conditions, on peut écrire, comme dans le cas particulier précédent : 1 b F T, m F T, 0 + a T − Tc m 2 + m 4 2 4 Le signe de a détermine le domaine de stabilité de la phase ordonnée. Si a > 0, la phase ordonnée est stable pour T < Tc . En outre, la stabilité de l’équilibre exige que b soit positif.
Paramètre d’ordre La valeur de m qui minimise l’énergie libre est solution de l’équation : a(T − Tc )m + bm 3 = 0, avec b > 0 Si T > Tc , la seule solution est m = 0. Le paramètre d’ordre est nul. Nous sommes dans la phase désordonnée.
96
3. Approximations de champ moyen
Si T < Tc , il y a 3 solutions : ⎧ ⎪ ⎨
m=0
⎪ ⎩ m = ± a(Tc −T ) = ±m0 b
La solution m = 0 est à rejeter, car elle correspond à un équilibre instable. La solution stable correspond à une valeur non nulle du paramètre d’ordre. Nous sommes dans la phase ordonnée (voir figure 3.5).
Fig. 3.5 Allure de la fonctionnelle de Landau dans le cas d’une transition du second ordre.
Ceci constitue le premier résultat de la théorie de Landau : au voisinage de la température de transition Tc , le paramètre d’ordre varie en (Tc − T )1/2 . Au voisinage de Tc , l’énergie libre est invariante quand on change m en −m, d’où les deux solutions équivalentes ± m0 . En réalité ces deux états sont identiques. Le système peut être décomposé en sous-systèmes pour chacun desquels m a un signe défini. Un tel sous-système constitue un domaine.
Chaleur spécifique On peut calculer la chaleur spécifique par dérivation de l’énergie libre : C =T
∂S ∂T
(3.81)
où l’entropie S est donnée par : ∂F T, 0 ∂F 1 S =− =− − am 2 ∂T ∂T 2
(3.82)
97
Physique de la matière condensée
Dans la phase désordonnée m = 0 et au voisinage de Tc , la chaleur spécifique s’écrit : ∂ 2 F T, 0 (3.83) C = −T ∂T 2 T =Tc
Dans la phase ordonnée, il faut tenir compte du terme en m 2 dans l’entropie, et au voisinage de Tc , la chaleur spécifique est donnée par : ∂ 2 F T, 0 a 2 Tc + C = −T (3.84) ∂T 2 2b T =Tc
À la température de transition Tc , la chaleur spécifique est discontinue. a 2 Tc C Tc− − C Tc+ = >0 2b
(3.85)
Susceptibilité relative au paramètre d’ordre Soit h le paramètre intensif conjugué de m. Pour calculer la susceptibilité isotherme : ∂m χT = (3.86) ∂h T Il faut connaître la fonction m = m(T, h). On raisonne sur le potentiel thermodynamique G = F (T, m) − hm (3.87) Par minimisation de G, on obtient : a(T − Tc )m + bm 3 − h = 0
(3.88)
dont la solution est m(T, h). En dérivant par rapport à h, on obtient : a(T − Tc )χT + 3bm 2χT − 1 = 0
(3.89)
Dans la phase désordonnée, m = 0 et au voisinage de Tc : χT =
1 a T − Tc
(3.90)
Dans la phase ordonnée, m n’est pas nul. Au voisinage de Tc et dans la limite où h → 0: 1 χT = (3.91) 2a Tc − T
98
3. Approximations de champ moyen
Donc au voisinage de Tc , la susceptibilité se comporte comme |Tc − T |−1 . On retrouve la loi de Curie-Weiss. À T = Tc , la susceptibilité isotherme n’est pas définie et, en revenant à l’équation de minimisation, on trouve que pour T = Tc , m se comporte comme h 1/3 . En réalité, à part certains cas comme celui des supraconducteurs usuels, l’expérience ne confirme pas, en général, la valeur de ces exposants critiques.
Cas d’une transition du premier ordre En principe, la méthode de Landau ne s’applique qu’aux transitions du second ordre, au voisinage du point critique. Est-il possible de l’étendre au cas de certaines transitions de phase du premier ordre ? La première condition à remplir est, évidemment, qu’il s’agisse d’une transition de phase « à la Landau », c’est à dire montrant une brisure spontanée de symétrie. La deuxième condition est d’appliquer cette méthode dans la région où le paramètre d’ordre reste suffisamment petit, pour que le développement de l’énergie libre en puissances du paramètre d’ordre reste valable, ce qui est toujours possible si la transition est du second ordre, mais ne l’est en général pas si la transition de phase est du premier ordre. En réalité, il est souvent possible de l’étendre au cas des transitions très faiblement du premier ordre, c’est-à-dire où la discontinuité du paramètre d’ordre reste très faible. En fait, nous supposerons que le comportement qualitatif reste valable, même quand la discontinuité du paramètre d’ordre est plus importante, ce qui est souvent vérifié pour les propriétés très générales que nous dérivons ici. Bien entendu, les résultats quantitatifs ne doivent pas être pris au pied de la lettre. Nous discuterons dans ce paragraphe le cas d’une transition du premier ordre induite par un terme d’ordre 3 dans le développement de l’énergie libre. On obtient des résultats analogues dans le cas où le premier ordre est induit par un terme d’ordre 4 négatif. Le développement de l’énergie libre s’écrit ici : F (T, m) =
1 1 1 a1 m 2 + a2 m 3 + bm 4 2 3 4
Nous supposons que le coefficient du terme d’ordre 2 change de signe et que, suffisamment près de la transition, celui varie linéairement avec T : a1 = a (T − T0 )
avec a > 0
(3.92)
La stabilité de l’équilibre impose b > 0. Par ailleurs, nous supposerons que a2 < 0. Cette dernière hypothèse ne restreint pas du tout la généralité du problème. Elle permet simplement de se restreindre aux valeurs positives de m (évidemment, dans le cas contraire, on étudierait le cas m < 0).
99
Physique de la matière condensée
Fig. 3.6 Allure de la fonctionnelle de l’énergie libre dans le cas d’une transition du premier ordre.
À l’équilibre, la condition de minimisation de l’énergie libre ∂F /∂m = 0 nous permet de calculer m(T ) à toute température : 0 = a1 m + a2 m 2 + bm 3 Cette équation présente dans le cas général, trois solutions réelles ou complexes : ⎧ m1 = 0 ⎪ ⎨ (3.93) √ ⎪ ⎩ m = −a2 ± a22 −4a1 b 2 2b Discutons les différents cas selon les valeurs de T (voir figure 3.6). 1er cas : Pour T > T0 +
a22 4ba
= T+ , la seule solution réelle est m1 = 0
2ème cas Pour T + > T > T0 : il apparaît trois solutions réelles, dont une instable. Parmi les deux autres, m1 = 0 et m2 = 0, l’une est stable, car elle correspond au minimum absolu de l’énergie libre, l’autre est métastable, car elle correspond à un minimum relatif. Les deux solutions correspondent à des énergies libres qui deviennent égales pour une température T = Tc donnée par : 2 a22 . Tc = T0 + 9 ba
100
3. Approximations de champ moyen
Au-dessus de Tc , la solution stable est m1 = 0. En-dessous de Tc , c’est m2 = 0 qui devient stable, et m1 = 0 qui est métastable. 3ème cas Pour T < T0 : la seule solution stable est m2 . Si on est constamment à l’équilibre thermodynamique, on prévoit donc le comportement du paramètre d’ordre en fonction de la température schématisé en pointillé dans la figure 3.7. En réalité, en raison des barrières de potentiel séparant les solutions m1 et m2 , il existe une certaine cinétique de mise à l’équilibre thermodynamique. Si l’évolution de la température est rapide par rapport à cette cinétique, le système restera dans l’état métastable. Ainsi, lors d’un refroidissement très rapide, le système restera dans l’état m1 jusqu’à T = T0 , température où il basculera dans le seul état stable m2 , jusqu’à T = 0. De même, si le système est réchauffé très rapidement, il restera dans l’état m2 , non seulement jusqu’à Tc , mais jusqu’à T+ , où il basculera dans l’état m1 . Ceci est une source d’hysteresis (en fait nous avons décrit ici le cycle d’hysteresis maximum, schématisé dans la figure 3.7, en supposant une évolution en température infiniment rapide devant la cinétique de mise à l’équilibre du système).
Fig. 3.7 Variations schématiques du paramètre d’ordre avec la température dans le cas d’une transition du premier ordre. Les flèches indiquent le sens de variation de la température. La ligne pointillée représente le cas idéal d’une variation infiniment lente de la température, de façon que le système reste constamment à l’équilibre thermodynamique.
Cas tricritique Dans ce paragraphe, nous supposons qu’il n’existe pas de terme impair dans le développement de l’énergie libre. La transition peut être du second ordre. Comme d’habitude, le coefficient du terme d’ordre 2 s’annule pour une certaine
101
Physique de la matière condensée
température :
1 b F T, m F T, 0 + a T − Tc m 2 + m 4 + cm 6 2 4 La stabilité de l’équilibre impose c > 0. Le fait nouveau est que le coefficient b, qui habituellement varie peu au voisinage de la transition, peut lui aussi s’annuler et changer de signe sous l’effet d’un paramètre extérieur comme, par exemple, la pression. - Pour b > 0, la transition est du second ordre. - Pour b < 0, on a une transition du premier ordre. Le point où, sous l’effet de la pression et de la température, on parvient à annuler simultanément les coefficients a(p, T ) et b(p, T ) est un point de transition tricritique. Cette condition très particulière vient de ce que pour b > 0, la ligne de transition est du deuxième ordre et pour b < 0, du premier ordre (voir figure 3.8).
Fig. 3.8 Diagramme de phase schématique, dans un plan (pression, température), montrant un point tricritique.
Dans ce cas tricritique, on obtient, dans le modèle de Landau, les exposants critiques suivants : pour la chaleur spécifique, α = 1/2 pour T < Tc , α = 0 pour T > Tc ; pour le paramètre d’ordre, β = 1/4 ; pour la susceptibilité γ = 1 et pour δ, défini par m ∼ h 1/δ , δ = 5.
3.3 Théorie d’Ornstein-Zernike – Approximation gaussienne La théorie thermodynamique de Landau prévoit une divergence en χ ∼ |T − Tc |−1
102
3. Approximations de champ moyen
de la susceptibilité relative au paramètre d’ordre. Ce résultat compromet la cohérence interne de la théorie : celle-ci suppose que les fluctuations sont négligeables et trouve qu’en réalité elles jouent un rôle important. On cherche donc une théorie aussi simple que celle de Landau, mais qui tienne compte, même partiellement, des fluctuations du paramètre d’ordre.
3.3.1 Modèle gaussien Si on veut décrire, même de façon approchée, les fluctuations, nous devrons prendre en compte des configurations où les degrés de libertés mis en jeu dans la transition (les spins dans le cas magnétique) sont corrélés sur un volume fini (dont la taille divergera à Tc ). Nous devons donc tenir compte, dans le calcul de la fonction de partition, des configurations où le paramètre d’ordre n’est pas contraint à rester égal à sa valeur moyenne à l’équilibre thermodynamique < m0 >. Ces configurations seront décrites par des fonctions m(r), susceptibles de varier spatialement. Cette fonction m(r) est une variable statistique qui suit une distribution de probabilité exp −β F . Puisque le paramètre d’ordre est maintenant une fonction de la position m(r), il faut donc prendre en compte, dans l’expression de l’énergie libre, le coût d’énergie de ces variations spatiales. Ceci nécessite de prendre en compte un terme supplémentaire dans la fonctionnelle de Landau. On considère une fonctionnelle de l’énergie libre de la forme : 1 1 1 F= d d r (3.94) a (T − Tc )m 2 (r) + bm 4 ( r) + c |∇m(r)|2 2 4 2
où est le volume du système. C’est ce terme en gradient qui assure que l’équilibre thermodynamique est réalisé pour des configurations où le paramètre d’ordre est uniforme. Pour réaliser, à partir d’un état uniforme, une configuration où l’ordre varie localement, il est nécessaire de dépenser une énergie de déformation. C’est cette énergie qui est responsable du phénomène de rigidité généralisée, évoqué au chapitre précédent. Le coefficient c du terme en gradient est lié à la portée de interactions. Cette fonctionnelle de Landau-Ginzburg est construite dans le même esprit que celle du paragraphe précédent : on suppose qu’au voisinage du point de transition, seuls les termes de plus bas degré en m et en ∇m sont à prendre en considération. À la température T et en présence d’un champ non uniforme h(r), le paramètre d’ordre est solution de l’équation de minimisation δF /δm(r) = 0.
103
Physique de la matière condensée
3.3.2 Fonction de corrélation F est une densité d’énergie libre. Elle prend une valeur F [m(r)] en chaque point. On cherchera les fluctuations de m dans la phase haute température où < m >= 0 avec h = 0. La fonction de partition s’écrit comme une intégrale fonctionnelle : Z = exp −β F [m] Dm (3.95) où :
F=
ddr
1 1 1 a T − Tc m 2 (r) + bm 4 ( r) + c |∇m(r)|2 2 4 2
(3.96)
Nous souhaitons donner une expression approchée de cette intégrale fonctionnelle moins grossière que l’approximation du col, qui néglige complètement toutes les fluctuations. Malheureusement, si on prend en compte les trois termes qui rentrent dans l’expression de F, le calcul sera tout de suite très difficile. On fait alors l’approximation de négliger le terme en m 4 , de sorte que l’intégrale fonctionnelle se factorise en produit d’intégrales gaussiennes : c’est l’approximation gaussienne. Ceci revient à prendre en compte les fluctuations harmoniques autour du minimum de l’énergie libre. Trop près du point critique, l’approximation harmonique deviendra mauvaise, car le terme en m 4 deviendra trop important pour que l’approximation reste valable. On sortira de la limite de validité de l’approximation. Il faut souligner immédiatement que ce modèle gaussien n’a de sens que dans la phase désordonnée, pour T > Tc . Cette condition assure que le coefficient du terme en m 2 soit positif, condition nécessaire pour assurer la convergence des intégrales gaussiennes que nous allons calculer. Pour T < Tc , le coefficient du terme en m 2 devenant négatif, il est nécessaire, pour assurer l’équilibre thermodynamique, d’inclure un terme en m 4 positif, qui, par définition n’existe pas dans le modèle gaussien. Nous sommes donc contraints de limiter la définition de ce modèle à la phase désordonnée. On est plus exigeant que dans l’approximation du col. La forme de F est plus riche. Elle donne des informations sur les corrélations spatiales. Pour tirer profit de l’invariance par translation du modèle, nous introduisons la transformée de Fourier du paramètre d’ordre. Cette transformation de Fourier est ici particulièrement pertinente, car les deux termes de la fonctionnelle de Landau, le terme en m 2 comme le terme en |∇m|2 , sont simples dans la représentation de Fourier. Nous définissons les composantes de Fourier mk du paramètre d’ordre m(r) exp −i k · rd d r (3.97) mk =
104
3. Approximations de champ moyen
Ceci nous permet d’écrire la fonctionnelle de l’énergie libre, de façon particulièrement simple, en fonction de ces composantes de Fourier mk
F = F0 +
a 1 c mk m−k + k2
2 2
(3.98)
k
Il en résulte une particularité très importante et très simple du modèle gaussien. Les composantes de Fourier m±k sont en fait découplées. Ceci résulte du fait que le terme en m 4 est absent. En effet, ce terme additionnel couplerait entre elles les composantes de Fourier mk différentes. Comme ce couplage n’existe pas, l’énergie libre F est une somme de termes harmoniques indépendants. De ce fait, l’approximation gaussienne est encore une méthode de champ moyen. Elle est certes améliorée par rapport à l’approximation du col, qui néglige toutes les fluctuations, puisqu’elle prend en compte les fluctuations harmoniques par rapport à l’équilibre. Mais comme ces fluctuations harmoniques sont découplées, cela reste une approximation de champ moyen. On définit la fonction de corrélation : G (k) =< mk m−k > et la susceptibilité relative au paramètre d’ordre : ∂mk χmm k = ∂h−k
(3.99)
(3.100)
où h−k est le champ couplé au paramètre d’ordre mk . Cela signifie que ce champ couplé au paramètre d’ordre introduit un perturbation proportionnelle à mk : Hint = −h−k mk
(3.101)
et que la réponse linéaire du paramètre d’ordre lui-même à cette perturbation s’écrit : < mk >= χmm k h−k (3.102) d’où la signification des deux indices (m, m) de la fonction de réponse linéaire. Les quantités G (k) et χmm (k) ne sont pas indépendantes. Elles sont reliées entre elle par un théorème important, qu’on appelle le théorème de fluctuation-dissipation. Écrivons la fonction de partition : dmk = Z = exp −β F exp − k
k
1 2 2 a + ck |mk | dmk 2 kB T (3.103)
105
Physique de la matière condensée
Le calcul de G (k) s’effectuant en écrivant que : " ! 2 exp − 1 2 |m |2 dm |m | a + ck k k k k 2 kB T " ! (3.104) G (k) =< |mk |2 >= 1 2 dm 2 k k exp − 2 kB T a + ck |mk | < · · · > est une moyenne d’ensemble sur toutes les configurations {mk }. Les termes correspondant à k = k se simplifient au numérateur et au dénominateur. Le seul terme restant au numérateur se calcule aisément par une intégrale gaussienne. Dans l’approximation gaussienne, G (k) =< |mk |2 >=
kB T a + ck 2
(3.105)
< |mk |2 > est l’écart quadratique moyen de mk . La dépendance en vecteur d’onde de la fonction de corrélation est une dépendance lorentzienne.
3.3.3 Longueur de corrélation On peut caractériser les fluctuations spatiales dans l’espace direct à l’aide de la fonction de corrélation : G (r) =< m(0)m(r) > (3.106) On définit la transformée de Fourier : d 1 d k G k exp i k · r G (r) =
8π 3
(3.107)
Le calcul de la transformée de Fourier s’effectue très simplement. On se place dans un espace à 3 dimensions : kB T 1 1 exp i k · rd 3 k (3.108) G (r) = 3 2 8π c k + κ2 kB T exp −κr kB T = = κg (κr ) (3.109) c 4π r c où la fonction g (x ) est définie par : g (x ) =
exp −x 4πx
(3.110)
et la quantité κ par : κ2 =
106
a c
(3.111)
3. Approximations de champ moyen
Nous supposerons que le paramètre d’ordre est écrit en variable réduite, de sorte que G (r ), définie comme une quantité sans dimension, est homogène à un nombre. κ(T ) est homogène à l’inverse d’une longueur. Nous posons : κ(T ) =
1 ξ T
(3.112)
Dans la phase désordonnée, la fonction de corrélation décroît de façon exponentielle. La longueur ξ , qui décrit la portée spatiale des corrélations est appelée longueur de corrélation. ξ(T ) croît comme [(T − Tc )/Tc ]−1/2 quand T → Tc + . G (r ), qui traduit les corrélations du paramètre d’ordre, a donc une portée de plus en plus grande lorsque T → Tc +. On définit un nouvel exposant critique : ξ(T ) = ξ0 [(T − Tc )/Tc ]−1/2 ∼ (t )−ν
(3.113)
Dans cette approximation de champ moyen, ν = 1/2. L’introduction du terme en ∇m est liée à la portée des interactions. Il permet de calculer les fluctuations du paramètre d’ordre. La forme du terme (c/2) |∇m|2 limite l’amplitude des fluctuations pour T = Tc .
3.3.4 Susceptibilité relative au paramètre d’ordre Le calcul de la susceptibilité relative au paramètre d’ordre χmm k se fait en ajoutant un champ h(r) couplé à m(r). Il faut alors ajouter dans l’énergie libre le terme d’énergie induit par le champ : 1 mk h−k (3.114) − d d rh(r)m(r) = −
k
La moyenne de la réponse induite par le champ s’écrit donc : ! " h−k mk a+ck 2 2 |m | mk exp − 2 k − k
kB T dmk BT ! " < mk >= h−k mk a+ck 2 2 |m | exp − 2 k − k
kB T dmk BT
(3.115)
On retrouve à nouveau le calcul d’une intégrale gaussienne, mais translatée en mk . Il suffit, pour retrouver une variable gaussienne centrée, d’effectuer le changement de variable : h−k #k = mk − (3.116) mk → m a + ck 2
107
Physique de la matière condensée
La moyenne gaussienne de la nouvelle variable m #k étant nulle, on trouve pour la moyenne de mk : 1 < mk >= h−k (3.117) a + ck 2 ce qui donne pour la susceptibilité : χmm k =
1 a + ck 2
La fonction de réponse est reliée à la fonction de corrélation : G k = kB T χmm k
(3.118)
(3.119)
Cette égalité résulte du théorème de fluctuation dissipation.
3.3.5 Validité de l’approche – Critère de Ginzburg Dans un premier temps, nous avons fait l’approximation de négliger le terme d’ordre 4 (b/4)m 4, en supposant le paramètre d’ordre, mais aussi ses fluctuations suffisamment faibles pour que ce terme soit négligeable devant le terme d’ordre 2 : c’est l’approximation gaussienne. Or, si < m 2 > augmente, quand T → Tc , il arrivera un moment où l’amplitude des fluctuations sera tellement grande que le terme en m 4 deviendra plus important que le terme en m 2 . Les calculs précédents cessent d’être valables. On sortira du domaine de validité de la théorie de Landau. On trouve la limite de validité (en ordre de grandeur) en prenant pour critère : 1 b a < m 2 > < m 4 > 2 4
(3.120)
Dans le deuxième membre, on fait l’approximation < m 4 > < m 2 >2 , qui deviendrait exacte si les fluctuations étaient réellement indépendantes.Cette approximation est justifiée ici, puisqu’on cherche, en ordre de grandeur, la limite de validité de l’approximation de découplage des fluctuations. Exprimons les conditions correspondantes sur l’écart à la température critique T −Tc . De façon équivalente, nous écrivons : aG (r ) b [G (r )]2
(3.121)
Nous obtenons le critère de Landau-Ginzburg [5] en écrivant G (r ) sous forme d’une quantité sans dimension : G (r ) =
108
kB T κg (κr ) c
(3.122)
3. Approximations de champ moyen
Si on suppose que le nombre sans dimension g (κr ) reste d’ordre 1, le critère de validité de l’approximation gaussienne s’exprime par : kB T κ c
(3.123)
ξ(T ) < ξG
(3.124)
a>b inégalité équivalente à la condition :
où nous avons introduit une nouvelle longueur : ξG =
c2 bkB Tc
(3.125)
On peut vérifier explicitement que cette quantité ξG a bien la dimension d’une longueur. Il s’agit d’une longueur caractéristique du système, liée aux interactions entre fluctuations : elle traduit la portée de ces interactions. Tant que ξ(T ) < ξG , la taille des régions corrélées restera plus petite que la portée des interactions entre fluctuations. On pourra alors, en moyennant sur ces fluctuations, négliger ces interactions : la théorie de Landau restera valable. Inversement, si ξ(T ) > ξG , on ne pourra plus les négliger. Les interactions entre fluctuations deviendront au contraire très importantes. On rentrera dans le domaine des fluctuations critiques, où l’approximation gaussienne n’est plus valable (figure 3.9). ξ (T)
ξG
T-TC TC région critique
modèle gaussien valable
Fig. 3.9 Critère de Ginzburg : la figure montre le comportement de la longueur de corrélation en fonction de t, écart relatif à la température critique. La validité de l’approximation gaussienne requiert que cette longueur n’excède pas la longueur de Ginzburg. Comme cette longueur de corrélation diverge au point critique, cette condition définit une largeur de la « région critique », au voisinage du point critique, en gris sur la figure, où l’approximation gaussienne n’est plus valable.
Cette analyse explique le comportement comparé de la transition supraconductrice et de la transition suprafluide de l’Hélium 4 liquide. Nous verrons plus loin que ces deux
109
Physique de la matière condensée
transitions devraient présenter les mêmes propriétés critiques, car elles appartiennent à la même « classe d’universalité ». Expérimentalement, si les exposants critiques de la transition suprafluide s’écartent de la valeur de champ moyen, ce n’est pas le cas pour les transitions des supraconducteurs usuels, dits « conventionnels », tels que l’Aluminium ou le Niobium. La différence provient des ordres de grandeurs de ξG . Dans l’hélium liquide ξG est reliée à la portée des interactions entre atomes, typiquement la distance interatomique, soit quelques angströms, alors que dans les supraconducteurs usuels, ξG , de l’ordre du rayon des paires de Cooper, est très grand devant la distance moyenne entre électrons : le champ moyen, dans ce cas, reste très bon jusqu’à des températures très proches de Tc . La région critique est si étroite qu’elle ne peut pas être mise en évidence expérimentalement. Dans les supraconducteurs à haute température critique, où ξG est nettement plus petite, bien qu’il semble que le comportement général observé soit également en bon accord avec le champ moyen, il n’est pas impossible, cependant, que certaines expériences aient pu montrer des écarts aux prédictions du champ moyen. Nous avons dérivé le critère de validité de l’approximation gaussienne en supposant que la dimension d’espace était 3. Rien n’empêche de le faire pour une dimension d’espace d quelconque. Dans ce cas, il suffit d’écrire : aGd (r ) > b [Gd (r )]2
(3.126)
où la fonction de corrélation Gd (r ) est maintenant calculée pour une dimension d’espace d d d k kB Tc 1 Gd (r ) = exp i k · r (3.127) 2 (2π )d c k + κ2 soit en posant x = k/κ, Gd (r ) =
kB Tc d −2 gd (κr ) κ T c
(3.128)
où gd (κr ) est un nombre sans dimension. Le critère de Ginzburg s’écrit alors, en considérant que gd (κr ) est d’ordre 1 : a>b
kB Tc d −2 κ T c
(3.129)
C’est-à-dire, en posant : [ξGd ]4−d =
c2 bkB Tc
$ %4−d ξ T
b < m 6 > (3.134) c’est-à-dire
&
kB Tc d −2 a>b κ c
'2 (3.135)
Le critère de Ginzburg prend alors la forme $
ξG d ξ T
%d −3 Tc , la phase stable est une phase désordonnée. Cependant si T est proche de Tc , la phase ordonnée a une stabilité comparable et il apparaît, par fluctuations, des zones localement ordonnées, pendant un certain laps de temps. On est alors tenté de définir, physiquement, pour ces fluctuations, une longueur de corrélation ξ , donnant leur taille moyenne et un temps de corrélation τ , donnant leur durée de vie moyenne. Cette longueur ξ et ce temps τ deviennent de plus en plus grands au fur et à mesure que l’on s’approche du point de transition, et ceci entraîne l’importance de plus en plus marquée des phénomènes critiques associés à ces fluctuations. La longueur de
113
Physique de la matière condensée
Fig. 4.1 Dans la phase désordonnée, il apparaît localement des régions corrélées, dont la taille finie est fixée par la longueur de corrélation ξ et dont le temps de vie est fixé par le temps de corrélation, τ . Au point critique, ξ et τ divergent.
corrélation ξ gouverne les phénomènes critiques statiques, tandis que le temps τ gouverne les phénomènes critiques dynamiques (figure 4.1). Nous discuterons d’abord les phénomènes statiques. Tous les autres paramètres étant fixés, ξ est fonction de la température T. ξ(T ) croît lorsque T s’approche du point critique Tc (T → Tc ). La question cruciale qu’il faut poser est la suivante : ξ diverge-t-elle à Tc ? Si ξ → ∞ quand T → Tc , le régime de fluctuations se développe complètement près de Tc ; si ce n’est pas le cas, le régime avorte, la transition de phase se produisant prématurément. Cette classification recouvre très largement la classification à la Landau pour l’ordre des transitions. Si la transition est du second ordre à la Landau (pas de saut du paramètre d’ordre), la longueur de corrélation diverge à Tc , et il y a un régime de fluctuations complètement développé. Si la transition est du premier ordre à la Landau (saut du paramètre d’ordre), en règle générale, la longueur de corrélation est finie à Tc , et il y a avortement, plus ou moins prématuré, du régime de fluctuations. Il y a toutefois quelques cas particuliers où la correspondance entre classifications ne s’applique pas strictement : en fait, du point de vue de l’étude des phénomènes critiques, la classification la plus intéressante est celle fondée sur le comportement de la longueur de corrélation. On peut distinguer deux types de mesures : – les mesures thermodynamiques déterminant des grandeurs macroscopiques : chaleur spécifique, aimantation, susceptibilité uniforme, etc... – les mesures déterminant des grandeurs liées aux corrélations microscopiques entre différents points, telles que la fonction d’auto-corrélation du paramètre d’ordre (r, t ) =< m(r, t )m 0, 0 > ou des fonctions de corrélation d’ordre supérieur. Les expériences de diffusion de rayons X, de neutrons, etc. apportent des informations directes sur q, ω , transformée de fourier de (r, t ). Les singularités des grandeurs thermodynamiques et des fonctions de corrélations ont même origine physique dans le développement des fluctuations critiques. La
114
4. Phénomènes critiques
connection entre les comportement de ces deux types de grandeurs est assurée par le théorème de fluctuation - dissipation. Les propriétés critiques statiques concernent les grandeurs thermodynamiques et les fonctions de corrélation prises en temps égaux. Les propriétés critiques dynamiques comprennent les dépendances en temps (ou en fréquence) des fonctions de corrélation.
4.1.2 Exposants critiques On observe au voisinage d’un point critique (donc dans le cas d’une transition du deuxième ordre) des comportements singuliers. Chaque grandeur thermodynamique A comprend, en règle générale, une partie régulière, qui est continue à la transition, et une partie singulière, qui se comporte en lois de puissance avec des exposants non nécessairement entiers. (4.1) A T = Areg T + Asing T Asing T =
⎧ ⎨ A+ t −a ⎩
pour
A− ( − t )−a
t = pour
T −Tc Tc
>0 (4.2)
t∼
1 x d −2+η
4.1.3 Universalité Ce qu’on trouvera de remarquable, c’est que ce comportement, pour singulier qu’il soit, présente des caractères de grande simplicité. Les exposants critiques ne prennent pas n’importe quelles valeurs. Dans la très grande diversité des systèmes physiques, qui présentent les transitions de phase les plus variées, on trouve, expérimentalement, une grande unité. Il est possible de classer ces différents systèmes en un petit nombre de groupes, qu’on appelle classes d’universalité, caractérisés par l’ensemble des valeurs que prennent les exposants critiques à l’intérieur de cette classe : si un système appartient à une classe d’universalité donnée, tous les exposants critiques de ce système sont ceux de la classe d’universalité, et ceci indépendamment de l’infinie diversité des paramètres qui peuvent décrire ce système physique particulier. Seulement un nombre très limité de ces paramètres sont pertinents pour définir la classe d’universalité. Il y a donc là une propriété d’universalité très importante des phénomènes critiques. On observe, de plus, entre les exposants critiques, des relations très simples. Par exemple, on observe que : α + 2β + γ = 2 (4.4) Bien d’autres relations entre exposants critiques, vérifiées par tous les systèmes physiques lors d’une transition de phase du second ordre, ont été mises en évidence.
116
4. Phénomènes critiques
Ces relations, appelées lois d’échelle, présentent un caractère d’universalité encore plus grand que les exposants critiques. Elles ne sont pas seulement vraies à l’intérieur d’une classe d’universalité donnée. Elles sont totalement universelles et vérifiées pour tout système, quelle que soit la classe d’universalité à laquelle il appartienne. Le tableau précédent d’exposants critiques appelle deux commentaires 1. l’universalité des exposants critiques dans l’approximation de champ moyen est totale. Leurs valeurs sont indépendantes du système physique étudié, et notamment de la dimension d’espace d . 2. Ces valeurs de champ moyen sont en général inexactes, comme le montre la comparaison avec la solution exacte du modèle d’Ising à deux dimensions, ou encore le fait qu’il n’existe pas de transition de phase à température finie à une dimension. L’universalité du champ moyen est trop forte.
Rôle de la dimension d’espace d Il est clair que, contrairement à ce qu’indique l’approximation de champ moyen, la dimension d’espace influe fortement sur les propriétés critiques et, notamment, sur la valeur des exposants critiques. On peut illustrer ce fait par deux exemples. L’étude du modèle sphérique permet de montrer explicitement le rôle de la dimension d’espace sur les phénomènes critiques. Il existe peu de modèles de mécanique statistique exactement solubles. Le modèle sphérique est l’un de ces modèles : il est même possible, dans ce cas précis, de calculer de façon exacte les propriétés critiques pour une dimension d’espace arbitraire. Ce modèle est défini de la façon suivante : des spins Si sont situés aux noeuds d’un réseau. Ils interagissent entre eux par l’hamiltonien de couplage H = −J Si Sj − h Si (4.5)
i
où < i, j > désigne une paire de sites premiers voisins et h le champ couplé au paramètre d’ordre. Les spins Si sont des quantités scalaires qui peuvent varier continûment de −∞ à +∞. De plus, ils sont soumis à la contrainte imposée sur l’ensemble du réseau : N Si2 = N i
où la somme sur i porte sur tous les N sites du réseau. Dans la limite où le nombre de spins tend vers l’infini (N → ∞), la fonction de partition est donnée exactement par la méthode du col. Dans ce cas-là, la méthode du col n’est pas approchée, comme dans l’approximation de champ moyen du chapitre précédent, mais au contraire devient exacte.
117
Physique de la matière condensée
Ce résultat important peut être montré simplement. En effet, utilisons la représentation intégrale de la distribution de Dirac +∞ dα δ(x ) = exp i αx (4.6) −∞ 2π La fonction de partition s’écrit donc : Z =
−∞
i
=
+∞
+∞
−∞
i
dSi exp −βH δ
dSi exp −βH
Si2
−N
i
d α exp i α
(4.7)
Si2
−N
(4.8)
i
Introduisons maintenant la matrice M, dont les éléments sont définis par :
Mij = βJij + 2i αδi,j
(4.9)
où Jij vaut J si i et j sont plus proches voisins et 0 sinon. En présence d’un champ couplé aux Si , la fonction de partition s’écrit : ⎤ ⎡ N 1 1 Mij Si Sj + βh Si ⎦ exp −i αN (4.10) dα Z = dSi exp ⎣ 2π 2 i=1
i,j
i
On se place dans la base {Sλ } qui diagonalise M ⎤ ⎡ N 1 1 Z = Mλλ Sλ Sλ + βh Sλ ⎦ exp −i αN dα dSλ exp ⎣ 2π 2 λ=1
i,j
λ
(4.11) En effectuant les N intégrales gaussiennes sur les Sλ N 1 β 2 −1 d α exp N −i α − Z = 2π 2 hi M ij hj Ln det M exp 2N 2 i,j
(4.12) où det M est le déterminant de la matrice M et M−1 l’inverse de cette matrice. Effectuons une transformation de Fourier M q1 , q2 = Mij exp iq1 ri − iq2 rj
(4.13)
i,j
= βJ q1 + 2i α δq1 ,q2
118
(4.14)
4. Phénomènes critiques
Comme Jij ne dépend que de la distance entre i et j , nous pouvons écrire, dans la base qui diagonalise M 1 1 lim d d qLn M q (4.15) ln det M = d N →∞ N P.Z.B. 2π où P.Z.B. est un acronyme pour la première zone de Brillouin. Dans la limite N → ∞, on peut donc utiliser la méthode du col, qui devient exacte. En effet, l’exponentielle qui intervient dans l’intégrale est de la forme
où
exp −NfN (α)
(4.16)
lim fN (α) = f∞ (α)
(4.17)
N →∞
où f∞ est une constante indépendante de N , si bien que lim d α exp −NfN (α) = exp −Nf∞ α ∗ N →∞
où α0 est défini par
df dα
(4.18)
α=α0
=0
(4.19)
Dans la limite N → ∞, il existe donc une solution exacte du modèle sphérique à toute dimension. Le col est donné par l’équation :
∂ 1 d d qLn M q = 0 (4.20) −i α − d ∂α 2π Ce qui équivaut à
1
−1 − d 2π
1 ddq βJ q + 2i α ∗
=0
(4.21)
La susceptibilité χ = − ∂∂hF2 est donnée par ⎧ −β ⎪ χ = βJ (0)+2iα ∗ ⎨ 2
⎪ ⎩1 = −
1 (2π )d
1 d d q βJ (q)+2iα ∗
(4.22)
119
Physique de la matière condensée
d’où l’équation 1
β = d 2π Dans la limite q → 0
1 ddq J 0 − J q + χ −1
J 0 − J q ∼ q2
(4.23)
(4.24)
Pour une dimension d’espace d > 2, la condition χ −1 = 0 donne le point critique : 1 1 βc = d (4.25) ddq 2 q 2π d’où
1
ddq
βc − β = d 2π
χ −1 q 2 q 2 + χ −1
(4.26)
Pour 2 < d < 4, quand χ −1 → 0, l’intégrale diverge. 1
d 2π
χ −1 ∼ χ −1 d q 2 2 q q + χ −1
d
0
d −2 ∼ χ −1 2 Donc
2
χ −1 ∼ [βc − β] d −2
q d −3 dq q 2 + χ −1 (4.27) (4.28)
L’exposant critique de la susceptibilité est donc γ =
2 d −2
(4.29)
Pour d > 4, l’intégrale converge : βc − β ∼ χ −1
(4.30)
γ =1
(4.31)
Donc
On retrouve l’exposant de champ moyen. La méthode du col permet de la même façon de calculer exactement tous les autres exposants critiques. Ils sont donnés dans le tableau ci-dessous. La contrainte sur les spins
i
120
Si2 = N
4. Phénomènes critiques
peut se traduire par l’introduction d’un multiplicateur de Lagrange qui établit entre ce modèle sphérique et le modèle gaussien une relation du type transformation de Legendre. En fait, il existe un isomorphisme entre un modèle de type « échange entre spins classiques » dont le nombre de composantes du paramètre d’ordre n → ∞ et le modèle sphérique. Ainsi, pour le modèle sphérique, on part d’un modèle de spins à une seule composante et on aboutit à une valeur effective infinie pour n, nombre de composantes du paramètre d’ordre. Le modèle sphérique (tableau 4.2), qui correspond au cas n → ∞, montre que le champ moyen est exact pour d ≥ 4 comme le laissait prévoir le critère de Ginzburg, mais inexact pour d < 4, où les exposants critiques exacts dépendent de d .
Tab 4.2
Tableau des exposants critiques exacts du modèle sphérique. Exposant Modèle sphérique Modèle sphérique 2= G2 (x, T, H, réseau)
(4.33)
Cette fonction G2 est universelle quand on a effectué les changements d’échelle sur x , T et H qui en font des variables sans dimension. De même, pour l’équation d’état
123
Physique de la matière condensée
f (T, H, M ) = 0
(4.34)
À des changements d’échelle près, f est la même pour tout système de n et d donnés. Soit l’équation d’état f (t, H, M ) = 0 (4.35) Cette équation doit rester vérifiée si on fait le changement d’échelle ⎧ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎩
t → t = λt H → H = λβδ H
(4.36)
M → M = λβ M
Une fois ce changement d’échelle effectué, l’équation d’état s’écrit : f (t , H , M ) = 0 Si on choisit λ tel que M = 1, c’est-à-dire : ⎧ −1 ⎪ λ=M β ⎪ ⎪ ⎪ ⎨ t = M t1/β ⎪ ⎪ ⎪ ⎪ ⎩ H = MHδ L’équation d’état s’écrit :
(4.37)
t H = g Mδ M 1/β
La fonction g est universelle. L’existence d’une telle loi au voisinage du point critique a été vérifiée avec une grande précision et il apparaît que la fonction g (x ) présente des caractères d’universalité étendus, analogues à ceux des exposants critiques.
4.2 Lois d’échelles – Hypothèse d’homogénéité De plus on a observé expérimentalement des relations entre exposants critiques, ce qu’on appelle les lois d’échelle : α = α
124
(4.38)
4. Phénomènes critiques
γ = ν(2 − η)
(4.39)
γ = γ
(4.40)
α + 2β + γ = 2
(4.41)
dν = 2 −α
(4.42)
δ=
d +2−η d −2+η
(4.43)
ν = ν Il existe donc 7 relations entre ces 9 exposants critiques. On ne sait pas démontrer de façon générale ces relations, à partir des premiers principes. Ce qu’on sait faire, à partir des principes généraux (notamment à partir des propriétés de convexité de F ), c’est démontrer certaines inégalités. Par contre, si on fait l’hypothèse que la partie singulière de l’énergie libre F(t, H) et de la fonction de corrélation (t, r) sont des fonctions homogènes de leurs variables, on peut démontrer que ces lois d’échelles sont automatiquement vérifiées, ainsi que la loi d’états correspondants pour l’équation d’état. Une fonction de p variables f (x1 , x2 ...xp ) est dite homogène de degré n, par rapport à la variable x1 si f (λx1 ) = λn f (x1 ) (4.44) Il est possible de généraliser cette notion de la façon suivante : on appelle fonction homogène généralisée une fonction f (x1 , x2 , ..., xp ) des p variables x1 , x2 , ..., xp qui, quel que soit λ, vérifie l’identité : (4.45) f λa1 x1 , λa2 x2 ...λap xp ≡ λn f x1 , x2 ...xp ce qui s’écrit également : f x1 , x2 ...xp ≡ λ−n f λa1 x1 , λa2 x2 ...λap xp Cette fonction homogène généralisée est donc invariante dans un certain groupe de transformations d’échelle : ⎧ ⎨ xi → xi = λai xi (4.46) ⎩ f → f = λ−n f soit : f
x1 , x2 ...xp ≡ f x1 , x2 ...xp
(4.47)
125
Physique de la matière condensée
Nous faisons d’abord, avec Widom [1], une hypothèse d’homogénéité de la partie singulière de l’énergie libre F (λt, λb m) = λ2−a F (t, m)
(4.48)
Les exposants a et b qui apparaissent dans cette identité ne sont pas a priori connus, mais nous allons montrer qu’ils ne peuvent pas prendre n’importe quelles valeurs. En fait, la propriété d’homogénéité ne peut être vérifiée que si ces exposants sont reliés à certains exposants critiques du système. Cherchons donc d’abord à relier les valeurs des exposants a et b à des exposants critiques usuels (de la chaleur spécifique, du paramètre d’ordre, etc.). Pour cela, plaçons nous à m = 0, et prenons pour facteur d’échelle λ = t −1 . On obtient alors : F (t, m) ∼ t 2−a
(4.49)
ce qui montre qu’en fait a = α, exposant critique de la chaleur spécifique, comme on peut le vérifier en dérivant deux fois l’énergie libre par rapport à la température. 1
Si maintenant on fixe la valeur du facteur d’échelle λ à m − b , on obtient : F (t, m) = F (
t m
1 b
, 1)m
2−α b
(4.50)
Puisque m ∼ t β , où β est l’exposant critique du paramètre d’ordre, on doit avoir b = β. Si on fixe la valeur du facteur d’échelle λ à |t |−1 , où t = (T − Tc )/Tc est l’écart relatif à la température critique :
m (4.51) F T, m = |t |2−α F ±1, β t Plaçons nous d’abord dans le cas t > 0 (phase désordonnée) et h = 0 (champ couplé au paramètre d’ordre nul). Par dérivation, on obtient facilement des propriétés d’homogénéité pour les dérivées secondes de F (t, m) : ⎧ ∂2 β −α ∂ 2 ⎪ ⎨ ∂x 2 F x = λt, y = λ m = λ ∂t 2 [F (t, m)] (4.52) ⎪ ⎩ ∂ 2 F x = λt, y = λβ m = λ2−α−2β ∂ 2 [F (t, m)] ∂y 2 ∂m 2 Faisons d’abord m = 0 et λ = t −1 . On obtient :
⎧ ⎪ ⎨
∂2F ∂t 2
∼ t −α
⎪ ⎩ ∂ 2 F ∼ t 2−α−2β ∂m 2
126
(4.53)
4. Phénomènes critiques
ce qui montre que α est bien l’exposant critique de la chaleur spécifique. De plus, puisque la susceptibilité χ est donnée par : ∂ 2 F ∂m 2 ∂ 2F ∂m =− 2 ∼ t −γ (4.54) = χ= ∂h ∂h 2 ∂m ∂h d’où,
∂ 2F ∼ t +γ ∂m 2
(4.55)
α + 2β + γ = 2
(4.56)
la loi d’échelle suivante est vérifiée : De même, on obtient, pour t = 0 : F (0, λβ m) = λ2−α F (0, m) c’est-à-dire :
F (0, m) ∼ m
2−α β
(4.57)
En présence d’un champ h couplé au paramètre d’ordre, la valeur de m s’obtient par minimisation du potentiel thermodynamique F (0, m) − mh, c’est-à-dire : d 2−α F 0, 1 m β − mh = 0 dm ce qui donne : h∼m L’exposant critique est défini par : h ∼
(2−α−β) β
mδ.
(4.58)
(4.59)
Il doit donc vérifier la loi d’échelle :
α + β(δ + 1) = 2
(4.60)
Cette hypothèse d’homogénéité de la partie singulière de l’énergie libre ne suffit cependant pas, à elle seule, pour démontrer les lois d’échelle où entrent les exposants ν et δ, qui concernent les propriétés critiques de la fonction de corrélation. Nous allons devoir faire, également, une hypothèse de propriété d’homogénéité de la fonction de corrélation. Cette loi d’homogénéité, nous allons essayer d’en deviner la forme, à partir de ce que nous savons sur l’expression approchée, en champ moyen, de la fonction de corrélation. Nous avons, en effet, calculé la fonction de corrélation à deux spins dans le modèle gaussien. Cette approximation nous avait conduit à l’expression d’Ornstein-Zernike : r goz (t, r) = r 2−d exp − (4.61) ξ Cette valeur approchée possède la propriété d’homogénéité suivante : Si on change, simultanément, t en λ−2 t , et r en λr , nous obtenons la transformation suivante :
127
Physique de la matière condensée
⎧ ⎨ t → λ−2 t ⎩
r → λr
⎧ ⎨ ξ → λξ ce qui entraîne
⎩
r ξ
→
r ξ
(4.62)
Le rapport ξr reste invariant. Dans l’approximation gaussienne, la fonction de corrélation présente donc la propriété d’homogénéité suivante : g (λ−2 t, λr ) = λ2−d g (t, r )
(4.63)
Nous proposons de généraliser ce résultat du modèle gaussien, en faisant l’hypothèse qu’au voisinage de Tc , la forme asymptotique pour r → ∞ de g (t, r ) est une fonction homogène généralisée, telle que, quel que soit λ : 1 g λ− x t, λr ≡ λ2−d −y g (t, r ) (4.64) La forme d’Ornstein-Zernike correspond aux valeurs de champ moyen des exposants critiques ⎧ ⎨ x = 12 (4.65) ⎩ y =0 Considérons, par exemple : t = 0 et λ = r −1 . L’identité (4.64) donne g 0, r = r 2−d −y g 0, 1
(4.66)
Ceci montre que l’exposant y dans l’identité (4.64) est nécessairement égal à η, où η est l’exposant critique habituel de la fonction de corrélation. Considérons maintenant la valeur du facteur d’échelle : λ = t x . À partir de (4.64), on obtient : r g t, −x = t x (2−d −η) g (t, r ) t
(4.67)
Comme le comportement critique, à t donné, de la fonction de corrélation doit avoir pour seule échelle de longueur ξ , l’équation (4.67) implique que ξ ∼ t −x
(4.68)
où ξ est la longueur de corrélation. Ceci montre que x = ν, où ν est l’exposant critique habituel de la longueur de corrélation. Introduisons maintenant la variable champ magnétique. Nous généralisons la propriété d’homogénéité de la fonction de corrélation de la façon suivante : 1 −1 (4.69) g λ− ν t, λ ν0 h, λr ≡ λ2−d −η g t, h, r
128
4. Phénomènes critiques
Si on pose t = 0 et λ = h
ν0 ,
dans l’identité précédente, on obtient :
g (0, h, r ) = h ν0 (d −2−η) g (0, 1,
r h −ν0
)
(4.70)
d’où on tire ξ ∼ h −ν0 . Ces deux derniers résultats nous montrent que ce n’est que par l’intermédiaire de la longueur de corrélation ξ que les fonctions g (t, 0, r ) et g (0, h, r ) dépendent respectivement de t et de h. En tant que fonction de ξ et de r , la fonction de corrélation est une fonction homogène. Elle satisfait à l’identité g (λξ , λr ) ≡ λ2−d −η g (ξ , r )
(4.71)
r g (ξ , r ) = r 2−d −η g (1, ) ξ
(4.72)
qui implique :
Si on pose h = 0 et λ = ( − t )ν dans l’identité (4.69), on démontre facilement que : ξ ∼ ( − t )−ν
(4.73)
ν = ν
(4.74)
ce qui démontre la loi d’échelle :
Nous ne donnerons pas ici les démonstrations détaillées de toutes les lois d’échelle qu’on peut déduire des propriétés d’homogénéité de l’énergie libre et de la fonction de corrélation. Les lois suivantes se démontrent très simplement de manière similaire : (2 − η)ν = γ (4.75) ν(d − 2 + η) = 2β
(4.76)
dν = 2 −α
(4.77)
δ=
d +2−η d −2+η
(4.78)
γ =
2 d −2+η
(4.79)
Les lois d’échelle permettent de calculer tous les exposants critiques que nous avons définis, dès lors qu’on en connaît deux. Les exposants que l’on sait calculer exactement, comme ceux du modèle d’Ising bidimensionnel et ceux du modèle sphérique satisfont aux lois d’échelle. Les exposants obtenus par les développements en série sont en général en bon accord avec les valeurs calculées à partir des lois d’échelle. Les exposants du modèle de Landau satisfont aux lois d’échelle, à l’exception de celles où figure la dimensionalité d’espace d, lorsque celle-ci est inférieure à 4. Ceci n’est pas surprenant, car l’énergie libre de Landau satisfait les propriétés
129
Physique de la matière condensée
d’homogénéité qui sont à la base des lois d’échelle. Cependant, nous savons que la théorie de Landau n’est plus cohérente pour d < 4, puisqu’elle revient à négliger les contributions des fluctuations, qui deviennent divergentes quand T → Tc . Néanmoins, nous connaissons, grâce à la théorie de Landau, les exposants exacts pour d = 4. Nous pouvons donc les calculer pour d < 4 par une série de perturbation en puissances de ε = 4 − d . La méthode repose sur deux hypothèses : 1 - L’universalité : il nous suffit, pour calculer ce développement en puissances de ε, de choisir le modèle le plus simple pour représenter une classe d’universalité donnée, sans s’embarrasser de tous les détails d’un système donné, qui compliqueraient les calculs. 2 - L’homogénéité : il nous suffit, grâce aux lois d’échelle de calculer deux exposants critiques pour les déterminer tous. Les bases physiques sont les suivantes : au voisinage d’un point critique, les propriétés d’homogénéité des diverses grandeurs physiques sont étroitement reliées à des propriétés d’invariance dans une certaine transformation d’échelle. En effet, l’identité d’homogénéité : F (λt, λβ m) = λ2−α F (t, m) peut s’interpréter comme une propriété d’invariance de la partie singulière de la densité d’énergie libre dans la transformation d’échelle suivante : ⎧ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎩ soit
t = λt m = λβ m
(4.80)
F = λα−2 F
F (t, m) ≡ F (t , m )
(4.81)
La partie singulière de l’énergie libre est le point fixe de cette transformation. La raison physique est que les singularités du comportement critique sont toutes entièrement associées à la divergence de la longueur de corrélation. On fait l’hypothèse que, près du point critique, la seule échelle de longueur pertinente soit la longueur de corrélation ξ . Il existe, bien sûr, d’autres échelles de longueur dans le problème détaillé, telles que les distances interatomiques, mais elles ne sont pas pertinentes pour la détermination des propriétés critiques. La transformation d’échelle indiquée ci-dessus est définie par le facteur d’échelle de l’écart à la température critique t = λt . Il lui correspond, évidemment, un facteur d’échelle pour la longueur de corrélation ξ = λ−ν ξ
130
4. Phénomènes critiques
Cette transformation établit donc une correspondance entre un problème de longueur de corrélation donnée et un problème de longueur de corrélation plus petite. Le cas où la longueur de corrélation est strictement infinie au départ, c’est-à-dire le cas d’un point critique, et en conséquence, le reste au cours de la réduction, correspond au cas du point fixe. L’hypothèse d’homogénéité permet de dériver les relations entre exposants critiques et s’avère un outil indispensable pour la compréhension des phénomènes critiques. Toutefois, elle ne permet pas de donner la valeur numérique de chaque exposant. Pour cela, il faut faire appel à une méthode plus sophistiquée, la méthode du groupe de renormalisation.
4.3 Introduction au groupe de renormalisation Dans un système physique à l’approche d’une transition de phase, le nombre de degrés de liberté interagissant effectivement entre eux est fourni par le nombre de degrés de liberté contenus dans un volume dont le rayon est de l’ordre de la longueur de corrélation. Les méthodes d’approximation les plus courantes, négligeant les corrélations entre un grand nombre de particules, sont valables lorsque la longueur de corrélation est petite. En pratique, on sait traiter de façon simple les corrélations à deux particules. Le problème à trois particules est déjà beaucoup plus difficile. Ce type de méthodes est voué à l’échec quand la longueur de corrélation est grande. D’où l’idée de réduction du nombre de degrés de liberté : on cherche à établir une correspondance entre un problème de longueur de corrélation donnée et un problème de longueur de corrélation plus petite. Le groupe de renormalisation établit ainsi des correspondances entre systèmes de longueurs de corrélation différentes. Si la chaîne de correspondance aboutit à un système soluble, par quelque méthode, on peut obtenir, en remontant la chaîne, la solution du système de départ. Dans le cas des transitions de phase, la solution du comportement critique est obtenue en étudiant les petites déviations autour du cas particulier du point critique, où la longueur de corrélation reste infinie dans les opérations de réduction. Lorsqu’on parle de réduire la longueur de corrélation, le langage fait penser à une opération de symétrie : la dilatation (dilatation de l’unité de longueur, contraction de la longueur de corrélation). On peut dire qu’au point critique un système est invariant par dilatation et qu’au voisinage du point critique, la symétrie de dilatation est brisée, d’autant plus qu’on s’écarte davantage du point critique. Si on connaît l’expression de l’énergie libre F, ce qui, en général, n’est évidemment pas le cas, on peut trouver le point fixe de la transformation : ⎧ t = λt ⎪ ⎪ ⎪ ⎨ m = λβ m ⎪ ⎪ ⎪ ⎩ F = λα−2 F
131
Physique de la matière condensée
et en déduire les valeurs des paramètres α et β de la transformation, c’est-à-dire les exposants critiques de la chaleur spécifique et du paramètre d’ordre. Prenons, par exemple, l’énergie libre d’une assemblée de spins 1/2 localisés aux noeuds d’un réseau de Bravais, dans l’approximation de Bragg-Williams. En gardant les mêmes notations : 1 1 F = − zJm 2 + kB T 1 + m Ln 1 + m + 1 − m Ln 1 − m (4.82) 2 2 où F (T, m) = F (T, m) − F (T, 0). Au voisinage de T = Tc =
Jz 4kB
et de m = 0, on peut écrire
4 F = 2kB T − Tc m 2 + kB Tc m 4 + · · · 3
(4.83)
Lorsqu’on effectue la transformation ⎧ t = λt ⎪ ⎪ ⎪ ⎨ m = λβ m ⎪ ⎪ ⎪ ⎩ F = λα−2 F On obtient : 4 F t , m = 2kB λα+2β−1 tm 2 + kB Tc λα+4β−2m 4 + · · · 3
(4.84)
La condition pour qu’on tende vers un point fixe quand m → 0 et t → 0 s’écrit donc ⎧ ⎨ α + 2β = 1 (4.85) ⎩ α + 4β = 2 ce qui entraîne : α=0
β=
1 2
(4.86)
On retrouve les exposants du modèle de Landau et ce résultat ne dépend que des propriétés d’analyticité de l’énergie libre au voisinage du point de transition. Le but de ce calcul n’était évidemment pas de déterminer ces exposants critiques, puisqu’ils étaient connus dès le départ. Nous avons seulement voulu montrer comment la façon dont le système tend vers le point fixe de la transformation d’échelle déterminait ces exposants critiques. Lorsque l’énergie libre est inconnue, la méthode est évidemment inapplicable, mais l’idée de base du calcul précédent nous permet de comprendre comment la procédure du groupe de renormalisation peut permettre le calcul des
132
4. Phénomènes critiques
exposants critiques : il s’agit d’étudier le comportement du système quand il tend vers le point fixe.
4.3.1 Le groupe de renormalisation On peut présenter la méthode du groupe de renormalisation [4, 5] de la façon suivante : Considérons à d dimensions, un système cubique de côté L, de volume L d , représenté par un hamiltonien de Landau-Ginzburg. Un système de taille Ls (avec s > 1) contient s d fois autant de particules que le système de taille L et par conséquent s d fois autant de degrés de liberté. Par exemple, le nombre de composantes de Fourier est ( La )d pour une dimension d’espace d (a est la longueur de la maille), car il est déterminé, à partir des conditions aux limites périodiques par : ki =
2π n L
n = 1, 2, · · · n0 = i = 1, 2, · · · d
L a
(4.87)
La condition n ≤ n0 = L/a est équivalente à la condition |k| < 1 . Dans un système de taille Ls, la limite supérieure pour n est Ls/a. Les deux systèmes, celui de taille L et celui de taille Ls diffèrent par leurs volumes et donc par leurs nombres de degrés de liberté, mais ils sont, à part cela, identiques. Les grandeurs extensives sont multipliées par s d dans le système de taille Ls et les grandeurs intensives sont inchangées. En particulier la densité d’énergie libre et la longueur de corrélation sont identiques dans les deux systèmes. On veut, cependant, définir un système qui garde encore les mêmes propriétés critiques que le système initial, mais qui comprenne le même nombre de degrés de liberté. Il s’agit donc de renoncer à spécifier les degrés de liberté qui ne sont pas pertinents pour définir le comportement critique, c’est-à-dire les degrés de liberté qui régissent le comportement à courte distance dans l’espace direct, ou bien à grands vecteurs d’onde dans l’espace réciproque. L’opération de réduction du nombre de degrés de liberté du système de taille Ls peut se faire de la façon suivante : si nous imposons une restriction sur k (ou sur n) |k|
Tf où le liquide hexatique laisse place à un liquide isotrope. Les prédictions sont analogues à celle de la théorie de Kosterlitz-Thouless : 72 lim Ka T = T →Ti − π 1 lim η6 T = 4
T →Ti −
(5.146)
(5.147)
La longueur de corrélation orientationnelle se comporte comme ξ6+ ∼ exp √
b T − Ti
(5.148)
Les études expérimentales sur la fusion à deux dimensions ont été très nombreuses. Elles ont porté principalement sur quatre types de systèmes : – – – –
les couches minces de cristaux liquides, les électrons confinés à la surface de l’Hélium, les couches de gaz rares adsorbés sur le graphite, les suspensions colloïdales de sphères chargées sub-microniques.
La comparaison entre expérience et théorie est difficile, à la fois parce que les expériences en elles-mêmes sont difficiles et parce que les quantités intéressantes sur le plan théorique sont difficiles à mesurer.
Électrons à la surface de l’Hélium liquide Le système d’électrons confinés à la surface de l’Hélium fournit un exemple presque idéal de système bidimensionnel simple, où une symétrie continue peut être brisée. Le substrat d’Hélium liquide ne fournit aucun potentiel susceptible d’induire un ordre. Par ailleurs le comportement du gaz d’électrons, pour les faibles densités réalisables expérimentalement, se comporte, en pratique, de façon purement classique. La transition classique de cristallisation d’électrons à la surface de l’Hélium a été observée, pour la première fois par Grimes et Adams [49]. Un champ électrique
204
5. Les transitions de Kosterlitz-Thouless
Solide
Liquide
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
T (K)
Fig. 5.14 Portion de la frontière entre phases solide et liquide pour une couche bidimensionnelle d’électrons. Les points expérimentaux indiquent les températures de fusion mesurées pour différentes valeurs de la densité surfacique d’électrons. Le long de la ligne droite, le rapport de l’énergie potentielle sur l’énergie cinétique par électron vaut 137.
perpendiculaire à la surface de l’Hélium est établi au dessus du liquide au moyen d’un condensateur dont le plateau positif est immergé dans l’Hélium liquide. La force électrostatique appliquée aux électrons est équilibrée par la répulsion entre les électrons et le substrat d’Hélium. Le gaz d’électrons est ainsi confiné dans un espace bidimensionnel. En pratique, la densité d’électrons qu’il est possible d’obtenir est toujours suffisamment faible pour que les électrons se comportent classiquement. Les électrons se repoussent entre eux par un potentiel en 1/r. Le paramètre déterminant le diagramme de phase du système bidimensionnel d’électrons est le rapport sans dimension √ e 2 π ns = (5.149) kB T où ns est la densité superficielle d’électrons. Les densités accessible à la température de 0, 5K, c’est-à-dire 105 < n < 109 cm−2 correpondent à une valeur de comprise entre 2 et 200. Le système d’électrons forme un gaz pour < 1 et un liquide pour 1 < < 100. Le système électronique est étudié en mesurant la dépendance en densité des modes couplés entre le système d’électrons et les ondes de capillarité de l’Hélium. Ces modes apparaissent quand le système d’électrons cristallise, parce que la répulsion entre les électrons et l’Hélium produit de petites dépressions autour de chaque électron (dont la profondeur est de l’ordre de 10−2 nm), ce qui induit un couplage des phonons longitudinaux du réseau d’électrons avec les ondes de capillarité (ou « ripplons ») à la surface de l’Hélium [50]. L’apparition de ces signaux de résonance couplés est la signature du début de cristallisation, puisque ce couplage phonon-ripplons ne peut pas exister dans la phase où les électrons forment un liquide. Ces résonances apparaissent très rapidement quand la température est abaissée en dessous de la température critique, c’est-à-dire pour = 137 ± 15, mais de façon continue et sans hysteresis.
205
Physique de la matière condensée
Bibliographie 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31.
32. 33. 34.
206
A.A. Migdal, Zh. Eksp. Teor. Fiz. 69, 1457 (1975) [Sov. Phys. JETP 42, 743 (1976)] L.P. Kadanoff, Ann. Phys (New York)100, 359 (1976) D.J. Wallace et R. K. P. Zia, Phys. Rev. 43, 808 (1979) N.D. Wagner er H. Wagner, Phys. Rev. Lett. 17, 1133 (1966) P.C. Hohenberg, Phys. Rev. 158, 383, (1967) N.D. Mermin, J..Math. Phys. (New York) 8, 1061 (1967) N.D. Mermin, Phys. Rev. 176, 250 (1968) N.D. Mermin, Rev. Mod. Phys. 51, 591 (1979) L. Michel, Rev. Mod. Phys. 52, 617 (1980) A.M. Polyakov, Phys. Lett.B57, 79 (1975) E. Brézin et J. Zinn-Justin, Phys. Rev. Lett. 36, 691 (1976) E. Brézin et J. Zinn-Justin, Phys. Rev. B 14, 3110 (1976) V.L. Berezenskii, Zh. Eksp. Teor. Fiz 61, 1144 (1972), [Sov. Phys. JETP, 34, 610 (1972)] J.M. Kosterlitz et D.J. Thouless, J. Phys. C 5, L124 (1972) J.M. Kosterlitz et D.J. Thouless, J. Phys. C 6, 1181 (1973) F. Bloch, Z. Phys 61, 206 (1930) R.E. Peierls, Ann. Inst. Henri Poincaré 5, 177 (1935) L.D. Landau, Phys. Z. Sowjetunion II 26, (1937) T.M. Rice, Phys. Rev. 140, A1889 (1965) J.W. Kane et L. P. Kadanoff, Phys. Rev. 155, 80 (1967) G. Lasher, Phys. Rev. 172, 224 (1968) B. Jancovici, Phys. Rev. Lett. 19, 20 (1967) H.J. Mikeska et H. Schmidt, J. Low Temp. Phys. 2, 371 (1970) Y. Imry et L. Gunther, Phys. Rev. B 3, 3939 (1971) F. J. Wegner Zut fur Physik 206, 465 (1967) V. L. Berezenskii, Zh. Eksp.Teor. Fiz. 59, 907 (1970), [Soviet Phys. JETP 32, 493 (1971) J. Friedel, Dislocations (Pergamon Press, Oxford, 1964) R. Balian, M. Kléman et J.-P. Poirier, Physics of defects (North Holland, New York, 1981) M. Kléman, Points, Lines and Walls, in Liquid Crystals, Magnetic Systems and Various Disordered Media (J. Wiley, New York, 1983) J. Villain, J. Phys. C 36, 581 (1975) Au sujet du découplage ondes de spin-vortex dans le modèle de Villain, on pourra aussi consulter des ouvrages généraux, tels que P.M. Chaikin et T.C. Lubensky, Principles of condensed matter physics (Cambridge University Press, 1997), page 578, ou M. Le Bellac, Des phénomènes critiques aux champs de jauge (InterEditions/Éditions du CNRS, 1990), page 159 D.R. Nelson et J.M. Kosterlitz, Phys. Rev. Letters 39, 201 (1977) J.M. Kosterlitz, J. Phys. C 7, 1046 (1974) J.M. Kosterlitz et D.J. Thouless, Prog. Low Temp. Phys. 78, 371 (1978)
5. Les transitions de Kosterlitz-Thouless
35. J.D. Weeks, in Ordering in strongly fluctuating condensed matter systems, p. 293, T. Riste editor (Plenum Press, New York, 1980) 36. J.G. Dash, Films on Solid Surfaces (Academic Press, New York, 1975) 37. P. Minnhagen, Rev. Mod. Phys. 59, 1001 (1987) 38. J. José, L.P. Kadanoff, S. Kirkpatrick et D.R. Nelson, Phys. Rev. B 16, 1217 (1977) 39. K.J. Strandburg, Rev. Mod. Phys. 60, 161 (1988) 40. K.R. Atkins, Phys. Rev. 113, 962 (1959) 41. D.R. Nelson, in Phase Transitions and critical Phenomena, Volume 7, page 2 (Academic Press, 1983), C. Domb and J. L. Leibowitz editors 42. K.R. Atkins et I. Rudnick, Prog. Low Temp. Phys. 6, 37 (1970) 43. I. Rudnick, Phys. Rev. Lett. 40, 1454 (1978). 44. D.J. Bishop et J.D. Reppy, Phys. Rev. Lett. 40, 1727 (1978) 45. D.J. Bishop et J. D. Reppy, Phys. Rev. B 22, 5171 (1980) 46. D.C. McQuenney, G. Agnolet, J.D. Reppy, Phys. Rev. Lett. 52, 1325 (1984) 47. V. Ambegaokar, B.I. Halperin, D.R. Nelson et E.D. Siggia, Phys.Rev Lett. 40, 786 (1978) 48. V. Ambegaokar, B.I. Halperin, D.R. Nelson et E.D. Siggia, Phys. Rev B21, 1806 (1980) 49. C.C. Grimes et G. Adams, Phys. Rev. Lett. 42, 795 (1979) 50. D.S. Fisher, B.I. Halperin et P.M. Platzman, Phys.Rev. Lett. 42, 798 (1979) 51. B.I. Halperin et D.R. Nelson, Phys. Rev. Lett, 41, 121 (1978) 52. D.R. Nelson et B.I. Halperin, Phys. Rev. B 19, 2457 (1979) 53. A.P. Young, Phys. Rev. B 19, 1855 (1979)
207
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Le gaz d’électrons 6.1 Introduction Le but de ce chapitre est de discuter dans le cadre le plus simple possible les propriétés électroniques des métaux, caractérisés par la présence d’électrons itinérants. L’approximation d’ordre zéro correspond au modèle du gaz parfait de fermions. Nous introduirons dans ce chapitre les interactions, à savoir les interactions coulombiennes entre électrons et entre électrons et ions. En pratique, nous ne discuterons pas, dans ce chapitre, l’effet de la présence d’un réseau cristallin, et nous nous contenterons presque toujours, sauf exception expressément signalée, de remplacer les ions positifs par un fond continu de charge positive pour assurer la neutralité électrique (ce qui est nécessaire pour éliminer des divergences non physiques). Nous discuterons les propriétés des électrons dans le cadre d’un formalisme quantique, le mouvement des ions, quand ils sont pris en compte, étant traité classiquement. Dans ce modèle extrêmement simplifié, il existe deux situations extrêmes simples : 1) la limite des basses densités, où les corrélations de Coulomb dominent, ce qui conduit à la cristallisation de Wigner ou à la localisation de Mott (voir chapitre 8). 2) limite des fortes densités, où l’énergie cinétique domine, justifiant un modèle de bande. C’est dans cette limite que les méthodes de champ moyen sont
209
Physique de la matière condensée
applicables. C’est le cas que nous discuterons dans ce chapitre. Nous présenterons l’approximation de Hartree, puis celle de Hartree-Fock et ses difficultés liées au potentiel coulombien à longue portée. Puis nous verrons comment l’approximation de la phase aléatoire (R.P.A.), en décrivant les excitations collectives, qui écrantent le potentiel en 1/r, résout le problème des divergences de la série de perturbation.
6.2 Gaz quantique – Premières approches et difficultés L’intérêt est d’expliquer les propriétés des métaux, pour lesquels on est toujours dans la situation d’un gaz de fermions presque totalement dégénéré, car kB T εF : l’ordre de grandeur de l’énergie de Fermi est, typiquement, dans la gamme des 30000 K dans les métaux usuels. Dans toute la suite, on supposera donc être à température nulle, sauf cas contraire explicitement signalé.
6.2.1 Particule sans interaction – Trou d’échange Nous allons d’abord expliciter comment l’antisymétrie des fonctions d’onde conduit au phénomène d’interaction d’échange. Considérons d’abord des électrons supposés sans interaction. Nous voulons calculer Pσ σ (r ), la probabilité d’avoir une particule de spin σ à l’origine et une particule de spin σ à la distance r de celle-ci, dans un volume . L’opérateur densité d’électrons de spin σ s’écrit : ρσ (r) = ψσ+ (r)ψσ (r) =
1 + ck1 ,σ ck2 ,σ exp i (k2 − k1 ) · r
(6.1)
k1 ,k2
où les opérateurs ψσ+ (r) et ψσ (r) sont les opérateurs champs pour un électron de spin σ au point de coordonnées r. On en déduit l’expression de la probabilité Pσ σ (r ) dans l’état fondamental du gaz d’électrons sans interaction | F > : Pσ σ (r ) =
1 + + | F > exp i k3 − k4 · r < F | c c c c k ,σ k ,σ 2 4 ,σ ,σ k k 1 3 2
(6.2)
{ki }
Si les spins sont antiparallèles, σ = σ , il faut, pour que la valeur moyenne dans l’état fondamental soit non nulle, que : k1 = k2 k3 = k4
210
6. Le gaz d’électrons
Alors, P↑↓ (r ) = P↓↑ (r ) =
n2 1 N2 = 0 2 4 4
où N est le nombre de particules dans le volume et n0 leur densité. La probabilité est uniforme et correspond bien à celle qu’on attend pour des particules non corrélées de densité n0 /2 par direction de spin. Ceci exprime la propriété que les positions d’électrons de spins antiparallèles ne sont pas corrélées, ce qui est normal, dans ce modèle sans interaction. Par contre, dans le cas où les spins des deux particules sont parallèles, σ = σ , il est également possible d’obtenir le terme diagonal supplémentaire correspondant à : k2 = k3 k1 = k4 On appelle ce terme le terme d’échange. Il donne la contribution supplémentaire : 1 + 1 − n c ·r < F | c | F > exp i k − k 1 2 k ,σ k ,σ 2 1 ,σ k 1 2 k1 ,k2 ⎛ ⎞⎛ ⎞ 1 1 =⎝ exp i k · r ⎠ ⎝ exp −i k · r ⎠ kkF
En utilisant : 1 1 1 exp −i k · r = exp −i k · r− exp −i k · r k>kF
et en posant :
k
k +(A− < A > )] [< B > +(B− < B > )] < A > (B− < B > )+ < B > A− < A > + < A >< B > < A > B+ < B > A− < A >< B >
(6.13)
où le dernier terme < A >< B > est un scalaire qui décale simplement l’origine des énergies. Dans cette approximation, nous avons négligé les termes (A − < A >) (B − < B >), quadratiques en fluctuations par rapport à la moyenne, qui sont évidemment les termes qui rendent le problème difficile. Cette méthode de champ moyen est donc une méthode de linéarisation du terme d’interaction : + ck+ −qσ ck σ ckσ ck+qσ
La linéarisation donne deux types de termes : les termes « directs » et les termes « d’échange ». Les termes directs correspondent à : + ckσ > ck+ −qσ ck σ < ck+qσ
(6.14)
+ ck+qσ ckσ < ck+ −qσ ck σ >
(6.15)
Pour déterminer les valeurs moyennes dans l’état fondamental de Hartree-Fock intervenant dans ces termes, il est nécessaire de préciser la symétrie de l’état Hartree-Fock recherché. Dans cette méthode, on impose donc la symétrie de l’état fondamental que l’on veut déterminer : ici, nous supposerons que cette symétrie reste la même que celle du gaz parfait, c’est-à-dire que les interactions n’ont pas induit de brisure de symétrie. En particulier, on suppose que les composantes de Fourier de la densité d’électrons sont nulles pour tous vecteurs d’onde q = 0. Dans cette hypothèse, les 1
Cette expression est si couramment utilisée que nous ne chercherons pas à la traduire, même si on peut penser qu’elle n’est pas très heureuse en « langue française ».
215
Physique de la matière condensée
+ seules valeurs moyennes non nulles de ck+qσ ckσ et de ck+ −qσ ck σ correspondent au vecteur d’onde q = 0.
On pourrait, bien sûr, imaginer d’autres états de Hartree ou de Hartree-Fock où, par exemple, l’invariance par translation serait brisée et où d’autres composantes de Fourier apparaîtraient. Nous en étudierons des exemples dans les chapitres suivants, où nous rechercherons des états de Hartree-Fock qui ne préservent pas la symétrie du gaz parfait. Dans ces solutions, les interactions induisent des brisures de symétrie, comme la symétrie par renversement du sens du temps dans les phases magnétiques, ou la symétrie de jauge dans les phases supraconductrices. Dans le cas présent, au contraire, ce type de solutions est rejeté. Soulignons donc que dans ce type de méthode, la symétrie de l’état fondamental de Hartree-Fock est choisie au départ. Or, le terme q = 0 est précisément celui qui est compensé par l’interaction avec le fond continu de charge positive assurant la neutralité électrique. 1) Approximation de Hartree : Elle consiste à ne garder que les termes « directs » dans la linéarisation de l’hamiltonien. Ceci revient, en fait, à ne pas prendre en compte l’antisymétrisation des fonctions d’onde. Dans ce cas, l’hamiltonien linéarisé se réduit à : + εk ckσ ckσ (6.16) HHartree = k,σ
Dans cette approximation, l’hamiltonien se réduit à l’hamiltonien des électrons libres, puisque les termes linéarisés de l’interaction sont, soit compensés par le fond continu uniforme de charge positive (termes directs correspondant à q = 0), soit ignorés (termes d’échange). Les fonctions propres de cet hamiltonien sont les ondes planes : 1 ϕkm σ (r) = √ exp i km ·r|σ >
(6.17)
qui sont précisément les fonctions d’onde de départ. La self-consistence est donc automatiquement assurée, dès le départ, grâce à un choix judicieux des fonctions d’essai. C’est, en général, la symétrie qui guide ce choix : ici le choix des ondes planes comme fonctions d’essai s’imposait en raison de la symétrie de l’hamiltonien, invariant par le groupe des translations continues. En présence d’un réseau périodique, nous aurions tout naturellement choisi, pour fonctions d’essai, les fonctions de Bloch du cristal, en raison de l’invariance de l’hamiltonien par le groupe des translations discrètes du réseau. Les énergies à un électron sont ici : Em = εkm =
216
h¯ 2 km2 2m
(6.18)
6. Le gaz d’électrons
et l’énergie totale : E =
h¯ 2 k 2 3 m = N εF 2m 5
(6.19)
km ck+ −qσ ckσ − < ck+qσ
(6.20)
+ ck σ < ck+ −qσ ckσ > −ck+qσ
(6.21)
Notons le signe −, qui provient de la permutation entre les opérateurs de fermions, qui a été nécessaire avant de prendre la valeur moyenne de deux opérateurs parmi quatre. L’interaction linéarisée s’écrit maintenant −
2π e 2 k,k σ ,σ q=0
q2
+ + < ck+qσ ck σ > ck+ −qσ ckσ + ck+qσ ck σ < ck+ −qσ ckσ >
(6.22)
En effet, il n’y a pas de termes directs puisque les termes correspondant à q = 0 sont exactement compensés par l’interaction avec le fond continu uniforme de charge positive. Comme dans l’approximation de Hartree, les valeurs moyennes qui apparaissent dans l’hamiltonien linéarisé sont calculées dans l’état fondamental de Hartree-Fock. On suppose, ici encore, que la symétrie de ce fondamental reste celle du gaz d’électrons sans interaction, c’est-à-dire que les interactions n’induisent pas de brisure de symétrie. Les valeurs moyennes ne sont non nulles que si : ⎧ ⎨ σ = σ et (6.23) ⎩ k + q = k
217
Physique de la matière condensée
Soulignons que les termes d’échange ne concernent, évidemment, que les électrons de même spin. L’hamiltonien linéarisé de Hartree-Fock s’écrit alors : HHF =
+ εk ckσ ckσ −
k,σ
=
4πe 2 k,σ q =0
q2
+ < nk+qσ > ckσ ckσ
+ Ekσ ckσ ckσ
(6.24)
(6.25)
k,σ
Ici encore, les ondes planes de départ diagonalisent l’hamiltonien linéarisé, ce qui assure d’emblée la self-consistence. Cette propriété est liée, comme précédemment, à l’invariance de l’hamiltonien par toutes les translations continues. Les énergies à un électron sont : Ekσ =
h¯ 2 k 2 1 4πe 2 − 2m |k − k |2 k = ckσ |0>
(6.31)
k est l’état vide d’électrons.
221
Physique de la matière condensée
L’énergie cinétique par électron, dans cet état, est : < εk >=
3 εF 5
(6.32)
Le vecteur d’onde de Fermi kF est donné par : 2 × 4π/3 kF3 N = 3 2π
(6.33)
où N est le nombre d’électrons et le volume. On définit rs le rayon de la sphère disponible par électron : 4π 3 =N (6.34) r 3 s rs est relié au vecteur d’onde de Fermi par la relation : (kF rs )3 =
9π 4
En exprimant rs en unités atomiques (les densités métalliques usuelles représentent des valeurs rs dans l’intervalle 2 rs 6) : Ecin e´ tique /´e lectron = E (0) =
3 1 2, 21 2 = 2 5 αrs rs
u.a.
(6.35)
où l’unité d’énergie électronique, en unités atomiques, est le Rydberg. L’étape suivante consiste à calculer la correction au premier ordre en perturbation. On écrit l’énergie d’interaction au premier ordre en perturbation : E (1) =< F |
2π e 2 k,k σ ,σ q =0
q2
+ ck+qσ ckσ ck+ −qσ ck σ | F >
(6.36)
Pour calculer les termes non nuls dans cet élément de matrice diagonal, on fait apparaître les opérateurs nombres. Ceci est possible de deux façons différentes : 1) en prenant le terme q = 0 : c’est le terme de Coulomb ; mais celui-ci est contrebalancé par le fond continu uniforme de charges positives. 2) en prenant le terme d’échange, c’est-à-dire : ⎧ ⎨ k + q = k ⎩ σ = σ
222
6. Le gaz d’électrons
soit :
q = k − k
La contribution au premier ordre en perturbation donne l’énergie d’échange : E (1) = Ee´ change = −
1 1 2π e 2 = − F k 2 N 2N k
2πe 2 2π e 2 × 2 q q12
(6.43)
où on a sommé sur tous les états intermédiaires | I > couplés au fondamental | F > par l’hamiltonien d’interaction. EI − EF est la différence entre l’énergie de l’état intermédiaire et celle de l’état fondamental. Ce terme du second ordre peut se représenter, de façon diagrammatique en associant les deux diagrammes du premier ordre de la figure 6.4.
Fig. 6.4 Les termes du second ordre en perturbation doivent associer, de toutes les façons possibles, ces deux diagrammes du premier ordre. Il y a deux types de termes : le terme de Coulomb pur et le terme d’échange.
Il y a deux façons d’associer ces diagrammes : 1) Le terme de « Coulomb pur » ou terme direct correspond au diagramme de la figure 6.5, c’est-à-dire au choix :
224
6. Le gaz d’électrons
⎧ ⎨ k1 = k
σ = σ1
⎩ k = k 1
σ = σ1
avec q = q1
(6.44)
Fig. 6.5 Diagramme du second ordre en perturbation : terme de Coulomb pur.
La correction d’énergie correspondante fait intervenir, au dénominateur de la formule de perturbation, la différence d’énergie : 2 2 h¯ 2 2 k + k2 − k − q − k + q 2m h¯ 2 2 q + q · k − k =− m
E =
La contribution de ce terme de Coulomb s’écrit : 3 d q 3 d 3 kd 3 k (2) Ec = − 3 8π q 4 q 2 + q · k − k avec les conditions : k < kF ,k + q > kF , k < kF , k − q > kF .
(6.45)
(6.46)
L’intégration sur les vecteurs d’onde k et k donne un terme en q(1 − Log 2) Soit : Ec(2) ∼
0
qd 3 q ∼ q4
0
dq q
Ce terme est logarithmiquement divergent à cause des petites valeurs de q. 2) Le terme d’échange correspond au diagramme de la figure 6.6 : Ce diagramme impose les choix : ⎧ ⎧ ⎨ k1 + q1 = k + q ⎨ k1 = k ⎩ k = k 1
⎩ k − q = k − q 1 1
σ = σ = σ1 = σ1 (6.47)
225
Physique de la matière condensée
Fig. 6.6 Diagramme du second ordre en perturbation : terme d’échange.
ce qui impose le vecteur d’onde : q1 = q + k − k
(6.48)
Le fait que les deux interactions ne correspondent pas au même vecteur d’onde, comme dans le cas du diagramme de Coulomb, rend évidemment le terme d’échange moins divergent. Sa contribution s’écrit : Ee(2)
3 = 16π 2
d 3 qd 3 kd 3 k 2 q 2 q 2 + q · k − k q + k − k
(6.49)
ce qui donne une contribution constante en fonction de rs . Le fait de prendre en compte le terme d’ordre 2 en perturbation n’a pas résolu le problème de la singularité apparu dans le traitement de Hartree-Fock. Cette singularité existe à tout ordre de perturbation. Plus l’ordre de perturbation est élevé, plus la singularité est importante. Si on continue le calcul de perturbation aux ordres plus élevés, à l’ordre 3, le terme de Coulomb pur diverge comme : dq Ec(3) = 3 0 q Au même ordre, le terme d’échange diverge comme : dq (3) Ee = 0 q À tous les ordres, le terme le plus divergent est le « terme de Coulomb pur », qui, à l’ordre n diverge comme : Ec(n) =
0
dq q 2n−3
Dans le paragraphe suivant, nous allons exposer une méthode d’approximation, qui, tout en restant dans le cadre du champ moyen, permet de décrire des excitations
226
6. Le gaz d’électrons
collectives, ce que la méthode d’Hartree-Fock ne permet pas. Les oscillations collectives de la densité, décrites dans cette approximation, vont guérir le comportement singulier observé à tout ordre de perturbation, en introduisant, de façon approchée, mais qualitativement correcte, l’effet d’écran.
6.3 Méthode de la RPA La divergence à tous les ordres de la série de perturbation provient du comportement à petits vecteurs d’onde, c’est-à-dire à longue portée de l’interaction coulombienne. En effet, l’interaction « nue » entre deux charges dans le vide décroît en 1/r, ce qui correspond à un potentiel à longue portée. En réalité, bien sûr, ces divergences de la série de perturbation ne sont pas physiques et doivent donc disparaître dans un traitement correct. La raison tient au fait que, si l’interaction « nue » entre deux charges « tests » est bien en 1/r , l’interaction « effective » entre ces deux charges tests en présence du gaz d’électrons est une interaction à courte portée, qui décroît exponentiellement et non plus en 1/r . Ceci est dû à l’effet d’écran du gaz d’électrons. En présence d’une charge extérieure test, le gaz d’électrons est perturbé. Sa densité est modifiée autour de la charge perturbatrice, ce qui va réduire le potentiel coulombien effectif créé autour de cette charge. Le résultat physique est l’effet d’écran, qui coupe la partie à longue portée du potentiel coulombien. Cet effet d’écran est le résultat d’une réponse collective du gaz d’électrons à la perturbation. Il est directement lié à l’existence de modes collectifs d’excitations du gaz d’électrons, des modes d’oscillations collectives de la densité de charge (de « textitquasiparticules plasmons » dans le langage quantique). Dans l’approximation de Hartree-Fock, il n’est possible de décrire que des excitations individuelles correspondant à la formation de paires électron-trou : un électron est excité au-dessus du niveau de Fermi, laissant un état inoccupé, c’est-à-dire un « trou » au-dessous de EF . Les excitations de type plasmon, et donc l’effet d’écran, ne peuvent donc être décrits dans cette approximation. C’est la cause des divergences non physiques de la série de perturbation. On comprend bien qu’il faille sommer un nombre infini de termes de cette série pour prendre en compte des excitations collectives, et donc pour retrouver un résultat convergent. C’est bien à cela que revient l’approximation que nous allons discuter dans ce paragraphe : la série de perturbation est sommée jusqu’à l’infini, mais on ne retient à chaque ordre que le terme le plus divergent, c’est-à-dire que les diagrammes dits « en échelle », qui représentent les processus de « Coulomb pur ». En fait, nous allons en donner une description différente, mais, bien sûr, tout à fait équivalente. Pour retrouver l’effet d’écran, nous allons étudier les excitations collectives du gaz d’électrons. Nous allons rechercher ces excitations comme combinaisons linéaires des excitations individuelles de Hartree du système. Pour cela, nous allons écrire l’équation du mouvement des opérateurs de création d’excitations du système. Cette équation est très difficile à résoudre en raison de son caractère non linéaire.
227
Physique de la matière condensée
Nous allons donc la « linéariser ». Il s’agit donc encore d’une méthode de champ moyen. Mais cette fois-ci, au lieu de linéariser l’hamiltonien comme dans l’approximation de Hartree ou de Hartree-Fock, nous linéarisons l’équation du mouvement. Il s’agit donc d’une méthode de champ moyen dépendant du temps, plus précisément d’une méthode de Hartree dépendant du temps, puisque les termes d’échange sont négligés devant les « termes directs », plus divergents. Ce traitement nous permettra de décrire des excitations collectives de type « plasmon » et donc l’effet d’écran, une interaction effective à courte portée et une détermination finie de l’énergie de corrélation.
6.3.1 Méthode RPA – Plasmons Équations du mouvement Les excitations individuelles du gaz d’électrons sans interaction sont formées en prenant un électron dans un état d’onde plane de vecteur d’onde k0 et de spin σ0 , situé à l’intérieur de la mer de Fermi (|k0 | < kF ) et en l’excitant dans un état d’onde plane de vecteur d’onde k0 + q0 en dehors de la mer de Fermi (k0 + q0 > kF ) et de même spin σ0 .La modification par rapport à l’état fondamental consiste en la création d’une paire électron-trou, puisqu’on a créé un état de vecteur d’onde k0 + q0 et qu’on a en même temps annihilé un état d’électron de vecteur d’onde k0 , c’est-à-dire créé un trou de vecteur d’onde k0 . Cette excitation du gaz parfait est représentée par l’opérateur : ρk+0 q0 σ0 = ck+0 +q0 σ0 ck0 σ0
(sans changement de spin)
(6.50)
Pour le gaz parfait, cet opérateur crée, de façon évidente, un état propre exact de l’hamiltonien de gaz parfait + H0 = εk ckσ ckσ (6.51) k,σ
qui excède l’énergie de l’état fondamental E0 de la quantité ; E = εk0 +q0 − εk0
(6.52)
Si | F > est l’état fondamental de H0 , avec la valeur propre E0 , ρk+0 q0 σ0 | F > est également état propre de H0 avec la valeur propre E0 + E. ρk+0 q0 σ0 représente donc, par définition, un opérateur de création d’excitation du gaz parfait. Ceci peut s’écrire : H0 ρk+0 q0 σ0 | F > = E0 + E ρk+0 q0 σ0 | F > (6.53)
228
6. Le gaz d’électrons
c’est-à-dire :
ou encore :
H0 ρk+0 q0 σ0 | F >= ρk+0 q0 σ0 H0 | F > +E ρk+0 q0 σ0 | F >
(6.54)
H0 , ρk+0 q0 σ0 | F >= E ρk+0 q0 σ0 | F >
(6.55)
On aurait pu établir directement ce résultat en calculant le commutateur ⎡ ⎤ + ρk+0 q0 σ0 , H0 = ⎣ck+0 +q0 σ0 ck0 σ0 , εk ckσ ckσ ⎦ = − εk0 +q0 − εk0 ρk+0 q0 σ0 k,σ
(6.56) Cette relation se démontre immédiatement à partir des relations d’anticommutation des opérateurs de fermions : (6.57) ckσ , ck+ σ + = δk,k δσ ,σ (6.58) ckσ , ck σ + = 0 + + ckσ , ck σ + = 0 (6.59) On dit que l’opérateur de création d’excitation ρk+0 qσ0 diagonalise l’équation du mouvement : d −i h¯ ρk+0 q0 σ0 = H0 , ρk+0 q0 σ0 = E ρk+0 q0 σ0 (6.60) dt L’esprit de la méthode d’approximation de la phase aléatoire(RPA) consiste à essayer de décrire les excitations collectives par une combinaison d’excitations individuelles ρk+0 q0 σ0 . L’équation du mouvement précédente n’est évidemment valable que pour le gaz parfait. De ce fait, l’opérateur ρk+0 q0 σ0 ne crée une excitation exacte que pour le gaz parfait ou bien dans l’approximation de Hartree. Si on tient compte des interactions entre électrons, l’équation du mouvement de ρk+0 q0 σ0 est modifiée et s’écrit : −i h¯
d + ρk0 q0 σ0 = H, ρk+0 q0 σ0 = H0 , ρk+0 q0 σ0 + Hint , ρk+0 q0 σ0 dt
où Hint =
2π e 2 k,k σ ,σ
q2
+ ck+qσ ck+ −qσ ck σ ckσ
(6.61)
(6.62)
q =0
Le premier terme vient de l’énergie cinétique. C’est celui que nous venons de calculer dans l’équation (6.56). Il faut le corriger par le terme d’interaction. Le commutateur
229
Physique de la matière condensée
Hint , ρk+0 q0 σ0 comprend des produits de 6 opérateurs de fermions, 4 venant de
Hint et 2 de ρk+0 q0 σ0 . Pour calculer ce commutateur
Hint , ρk+0 q0 σ0 = Hint ρk+0 q0 σ0 − ρk+0 q0 σ0 Hint
(6.63)
on effectue toutes les permutations d’opérateurs de fermions dans le premier terme Hint ρk+0 q0 σ0 , pour retrouver le même ordre que dans le deuxième terme ρ +k 0 q0 σ0 Hint , en utilisant systématiquement les propriétés d’anticommutation. Les termes qui vont subsister à la fin sont ceux qui correspondent aux symboles de Kronecker δk,k δσ ,σ quand on permute deux opérateurs ckσ et ck+ σ .Il en résulte : ⎧ ⎫ ⎬ ⎨ 4πe 2 + + + c c −c c c c Hint , ρk+0 q0 σ0 = k ,σ k +q,σ k,σ 0 0 0 0 k0 +q0 ,σ0 k+q,σ ⎩ q 2 k0 +q0 −q,σ0 ⎭ q =0
k,σ
(6.64) On obtient donc, au total d −i h¯ ρk+0 q0 σ0 = H, ρk+0 q0 σ0 (6.65) dt + (6.66) = εk0 +q0 − ε k 0 ρk0 q0 σ0 ⎧ ⎫ ⎬ ⎨ 4π e 2 + + + c − c c ρ + c k ,σ k +q,σ 0 0 0 0 k0 +q0 ,σ0 kqσ ⎭ ⎩ q 2 k0 +q0 −q,σ0 q =0
k,σ
Méthode de la RPA Cette équation est jusqu’ici exacte, dans le cadre du modèle décrit par l’hamiltonien H. Cependant, cette équation n’est pas simple à résoudre, car elle n’est pas linéaire. Contrairement à l’équation simple obtenue dans le modèle du gaz parfait, l’équation d’évolution fait intervenir des termes de couplage quadratiques entre excitations + de Hartree de vecteurs d’onde différents ρk+0 q0 σ0 et ρkqσ . Nous sommes amenés à rechercher des approximations pour rendre ce problème soluble. La méthode de la RPA consiste à faire les approximations suivantes dans l’équation du mouvement : – On linéarise l’équation du mouvement en faisant apparaître les opérateurs nombres et en prenant la valeur moyenne < nk > dans la solution de Hartree statique : nous faisons donc une approximation de champ moyen, mais cette fois-ci sur l’équation d’évolution et non pas sur l’hamiltonien, comme dans les approximations de Hartree ou de Hartree-Fock. Comme dans toute méthode de champ moyen, la valeur moyenne qui apparaît ici est calculée dans l’état fondamental recherché. De fait, on impose donc la symétrie de l’état fondamental que nous voulons
230
6. Le gaz d’électrons
déterminer. Cette symétrie est supposée être la même que celle du gaz parfait. On suppose donc que les interactions entre électrons n’induisent pas de brisure spontanée de symétrie. – On ne garde que les termes coulombiens purs. Nous faisons donc une approximation de Hartree sur l’équation d’évolution : 4π e 2 H, ρk+0 q0 σ0 εk0 +q0 − εk0 ρk+0 q0 σ0 + < nk0 σ0 > − < nk0 +q0 σ0 > ρq+0 2 q0 (6.67) où + ρq+0 = ck+q c (6.68) 0 ,σ k,σ k,σ
On aurait pu obtenir d’autres termes de type échange. Dans une approximation de type Hartree-Fock de l’équation d’évolution, il faudrait prendre en compte, par exemple, des termes tels que : 4π e 2 k,σ q =0
q 2
+ < ck+0 +q0 −q,σ0 ck,σ > ck0 ,σ0 ck+q,σ
(6.69)
Il existe de tels termes non nuls, à condition de choisir convenablement k et σ dans la somme : k = k0 + q0 − q (6.70) σ = σ0 Ces termes sont analogues au terme d’échange pris en compte dans l’approximation de Hartree-Fock. Ici, dans la RPA, on ne tiendra pas compte de ces termes. On peut donc décrire la méthode d’approximation de la phase aléatoire de la façon suivante : l’opérateur ρk+0 q0 σ0 crée une excitation individuelle de vecteur d’onde q0 . Dans l’équation d’évolution exacte, cette excitation est couplée de façon non linéaire aux excitations de vecteurs d’onde q = q0 . L’approximation de la RPA consiste à négliger ces termes de couplage en arguant que leur moyenne sur les fluctuations s’annulent comme si les phases d’excitations de vecteurs d’onde différents étaient aléatoires. D’où le nom historiquement donné à cette méthode d’approximation. En réalité, la justification précise de cette approximation repose sur des arguments diagrammatiques. À tout ordre en perturbation, on ne retient que les diagrammes les plus divergents et on somme cette série partielle jusqu’à l’ordre infini. Dans cette approximation, le problème se ramène alors simplement à la diagonalisation d’un système d’équations linéaires. On cherche la solution sous la forme (à partir de maintenant, on omettra les indices 0, que nous avons écrits, jusqu’ici dans ρk+0 q0 σ0 ) : a+ =
+ αkσ ρkqσ
(6.71)
k,σ
231
Physique de la matière condensée
L’opérateur a + doit vérifier : [H, a + ] = Ea +
(6.72)
Alors, si |F > est l’état fondamental, on peut en conclure que a + |F > représente un état excité du système et E est l’énergie d’excitation. On doit avoir : 4π e 2 + αkσ εk+q − εk ρkqσ + > − < n > α < n kσ k+qσ kσ q 2 k,σ k,σ + × ρk+ qσ = E αkσ ρkqσ (6.73) k ,σ
k,σ
En intervertissant les k et k dans le second terme, il apparaît : 4π e 2 + ρkqσ > − < n > α < n kσ k +qσ kσ q 2 k,σ
(6.74)
k ,σ
+ Nous écrivons que le coefficient de chaque opérateur ρkqσ est nul, car ces opérateurs sont linéairement indépendants :
4π e 2 ! σ > − < nk +qσ > αk σ = 0 αkσ εk+q − εk − E + < n k q 2 k ,σ
(6.75) Nous posons : ! 4π e 2 < nk σ > − < nk +qσ > αk σ = λ 2 q
(6.76)
k ,σ
La constante λ est indépendante de k. On obtient : αkσ =
λ E − εk+q − εk
(6.77)
En reportant cette expression de αkσ dans l’expression précédente qui définit λ, nous obtenons l’équation aux valeurs propres que doit vérifier l’énergie E des excitations du système : 4π e 2 < nkσ > − < nk+qσ > (6.78) 1= q 2 E − εk+q − εk k,σ
232
6. Le gaz d’électrons
Fig. 6.7 Discussion graphique de l’équation aux valeurs propres de la RPA ; les énergies d’excitations correspondent aux intersections de F (E ) avec la droite y = 1.
Appelons F (E ) la fonction qui apparaît au second membre de l’équation (6.78). Cette fonction présente N pôles qui correspondent aux excitations individuelles de la solution Hartree du système. La discussion graphique de l’équation F (E ) = 1 s’obtient en recherchant les intersections du graphe de y = F E avec la droite y = 1. Ceci est présenté dans la figure 6.7. On trouve (N − 1) solutions très proches des excitations obtenues dans l’approximation de Hartree. De façon plus précise, ces solutions ont une énergie comprise entre deux valeurs successives des énergies d’excitations individuelles de l’approximation de Hartree. Elles n’en diffèrent donc que par un terme d’ordre 1/N . Il en résulte que les coefficients αkσ sont très piqués autour de ces deux valeurs de k. Ces (N − 1) solutions correspondent donc à des excitations individuelles. Par contre, il existe une solution d’énergie supérieure à toutes les solutions de type Hartree. La différence d’énergie de cette solution, d’un type différent, avec les énergies Hartree est, cette fois, d’ordre 1 √ et ne tend pas vers 0 quand N → ∞. Pour cette excitation, αkσ est d’ordre ∼ 1/ N quel que soit k, alors que αkσ est très piqué sur les valeurs voisines pour les excitations individuelles. Il s’agit, cette fois, d’une excitation collective, qui fait intervenir un nombre macroscopique de degrés de liberté.
Énergie du plasmon Étudions l’énergie de cette excitation collective, qu’on appelle plasmon. Elle est donnée par l’équation :
233
Physique de la matière condensée
< nkσ > − < nk+qσ > 3 4πe 2 2 d k 3 2 q 2π E − εk+q − εk εk+q − εk 2e 2 3 = 2 2 2 < nkσ > d k 2 π q E − εk+q − εk
1=
(6.79) (6.80)
Dans la limite q → 0, on fait l’approximation (εk+q − εk ) E dans le dénominateur de l’intégrand. En prenant l’intégrale sur les orientations du vecteur k, le seul terme du numérateur dont la moyenne est non nulle est h¯ 2 q 2 /2m. On obtient donc : 2e 2 h¯ 2 q 2 4π 3 (6.81) E2 = 2 2 k π q 2m 3 F En utilisant l’expression de la densité n d’électrons, on obtient : #1 " 4π ne 2 2 E = hω ¯ p= m
(6.82)
ωp est la fréquence classique d’oscillations d’un plasma de densité n (nous verrons plus loin, dans le paragraphe consacré au modèle du jellium, le calcul des modes d’oscillations classiques d’un gaz de particules chargées).
Dispersion pour les petites valeurs de q Au lieu de négliger (εk − εk+q )2 devant E 2 au dénominateur de l’équation comme nous l’avons fait dans l’équation (6.80), on fait un développement limité de l’intégrand à petits q : Le premier terme de valeur moyenne non nulle est en : 2e 2 1= 2 2 π q
% $ 2 4 εk+q − εk εk+q − εk εk+q − εk + + ··· 1+ E2 E2 E4
× < nkσ > d 3 k
(6.83)
On trouve facilement, dans la limite des petits vecteurs d’onde q kF : & ' E 2 q = h¯ 2 ωp2 + v 2 q 2 & ' où la vitesse quadratique moyenne des électrons v 2 vaut : & 2 ' 3 h¯ 2 kF2 v = 5 m2
234
(6.84)
6. Le gaz d’électrons
c’est-à-dire :
3 vF2 q 2 E q =E 0 + 10 2
(6.85)
Spectre d’excitations Le spectre d’excitations du gaz d’électrons est représenté schématiquement sur la figure 6.8. Il comporte une branche d’excitation collective bien définie, le plasmon, qui se dégage des excitations individuelles. Elle part, pour q = 0, d’une valeur finie h¯ ωp , en raison du caractère à longue portée du potentiel coulombien. À petit vecteur d’onde, pour q kF , la relation de dispersion est quadratique.
Fig. 6.8 Spectre d’excitations du gaz d’électrons en RPA. Au quasi continuum des excitations individuelles, s’ajoute la branche d’excitation collective du plasmon.
À cette branche d’excitation collective, il faut ajouter les excitations individuelles dont l’énergie diffère peu des excitations de Hartree : EHartree = εk+q − εk =
h¯ 2 2k · q + q 2 2m
(6.86)
Ces excitations individuelles forment un quasi-continuum. À q fixé, leurs énergies sont comprises entre une énergie minimum : h¯ 2 2 Emin q = q − 2kF q 2m
(6.87)
h¯ 2 2 q + 2kF q Emax q = 2m
(6.88)
et une énergie maximum :
235
Physique de la matière condensée
c’est-à-dire dans le plan E, q , entre les deux paraboles d’équations données par (6.87) et (6.88). En réalité le plasmon n’est bien défini que pour q < qc , le vecteur d’onde de coupure qc étant déterminé par la propriété que la branche d’excitation collective pénètre, pour ce vecteur d’onde, dans le continuum des excitations individuelles [4] : E (qc ) = Emax (qc ) Il est d’ailleurs facile de montrer que la branche d’excitation collective rentre tangentiellement dans le continuum des excitations individuelles : ∇q Ecoll (q) = ∇q Eind (q) Dans ce cas, la distance entre les deux plus grandes racines de l’équation devient d’ordre 1/N , alors que pour q < qc , elle est d’ordre unité.
Amortissement de Landau Au delà de qc , il faut tenir compte de l’amortissement très important que subit le mode collectif à cause du fort couplage avec les excitations individuelles. Pour q > qc , il se produit un amortissement de l’excitation collective quand Ecoll ∼ Eind , tout à fait anologue à « l’amortissement de Landau » [5], (mécanisme d’amortissement d’une oscillation classique de plasma) : dans un langage classique, on attribue l’amortissement de l’onde aux électrons qui se déplacent à une vitesse peu différente de la vitesse de phase de l’onde et sont donc capables d’échanger de l’énergie de l’onde. Soit ω la fréquence du mode collectif et q son vecteur d’onde. Considérons une quasiparticule d’impulsion p, et de vitesse vp , telle que ω = q · vp . La composante de sa vitesse dans la direction de q est égale à la vitesse de phase ω/q du mode collectif. La phase perçue par la quasiparticule en mouvement est alors stationnaire, ce qui conduit à un transfert d’énergie continu entre la quasiparticule et l’onde progressive. Si la quasiparticule se déplace légèrement plus vite que l’onde, elle cèdera de l’énergie à l’onde. Dans le cas contraire, si elle est légèrement plus lente, elle recevra de l’énergie de l’onde. Dans des conditions d’équilibre, la fonction de distribution des quasiparticules décroît avec la vitesse, si bien que le nombre de particules qui absorbe de l’énergie de l’onde est toujours plus élevé que le nombre de particules qui restitue de l’énergie à l’onde. Le bilan global d’énergie, au total, correspond donc à un transfert d’énergie du mode collectif aux quasiparticules individuelles, c’est-àdire à un amortissement du mode collectif. Quand l’oscillation de densité se propage dans le plasma d’électrons, il existe toujours, dans la queue de la distribution de Boltzmann, des électrons qui sont capables d’absorber un plasmon, en respectant la conservation de l’énergie et de l’impulsion. Cependant, dans la limite des grandes longueurs d’onde, le nombre de tels électrons est exponentiellement faible, si bien que l’amortissement de Landau est négligeable. Par contre, ce n’est plus le cas pour q > qc , où l’amortissement est très important.
236
6. Le gaz d’électrons
Déterminations des énergies de plasmons La méthode la plus directe pour déterminer expérimentalement les énergies de plasmon est la spectroscopie de pertes d’énergie d’électrons (EELS). Le principe de la méthode consiste à observer le spectre en énergie d’électrons, d’énergie de l’ordre du kiloVolt, soit après transmission à travers une couche mince, soit après reflexion sur une surface solide. Le but est de mettre en évidence des processus où les électrons analysés ont échangé de l’énergie avec le gaz d’électrons du métal étudié par création de plasmons. L’utilisation d’un microscope électronique en transmission est une des méthodes souvent utilisées pour la spectroscopie de pertes d’énergie d’électrons. L’expérience consiste à mesurer la perte d’énergie que subit un faisceau d’électrons rapides à la traversée d’un échantillon mince. Le spectre ainsi obtenu (figure 6.8) présente les caractéristiques suivantes. Si l’échantillon est suffisamment mince (typiquement inférieur à 50 nm), la contribution principale à l’intensité détectée est un pic étroit, appelé pic de pertes nulles, qui résulte de la détection d’électrons n’ayant pas interagi avec l’échantillon. Les électrons diffusés de façon inélastique donnent lieu à un spectre complexe. Dans la région de basse énergie (typiquement de 1 à 50 eV), on observe des résonances, qui sont habituellement attribuées à des modes de plasmons de volume. On trouve à plus haute énergie des signaux de section efficace plus faible, qui correspondent à l’excitation individuelle d’électrons du coeur du matériau. Ces signaux sont appelés seuils d’absorption ou signaux de coeur. Une autre méthode de détermination de l’énergie de plasmon est la spectroscopie optique. On y utilise le rôle joué par la fréquence de plasmon dans la dépendance en fréquence de la constante diélectrique du matériau, discutée ci-dessous. Ainsi ωp marque la fréquence de transition entre le régime de réflexion et celui de transmission optique du métal. Le tableau 6.3 compare différentes déterminations d’énergie de plasmons pour quelques métaux typiques, dont les rs varient d’environ 2,5 à environ 5,5. La première détermination est un calcul théorique, obtenu à partir de l’équation (6.83) de la RPA, dans notre modèle extrêmement simplifié. La deuxième est obtenue à partir de mesures de pertes d’énergie d’électrons. La troisième résulte de mesures de seuil de réflectivité. L’accord est tout à fait remarquable et même très étonnant pour un modèle aussi simpliste. Tab 6.3
Énergies de plasmons de quelques métaux typiques (en eV) [3]. Métal
Al
Mg
Li
Na
K
Rb
Cs
rs en u.a.
2, 58
2, 90
3, 22
3, 96
4, 87
5, 18
5, 57
h¯ ωp (éq. (6.82))
15, 9
10, 9
8, 1
6, 0
4, 4
4, 0
3, 6
E.E.L.S.
15, 3
10, 6
-
5, 87
3, 87
-
-
r e´ flect. optique
-
-
8, 02
5, 91
3, 94
3, 65
3, 27
237
Physique de la matière condensée
Zéro son d’un liquide de Fermi neutre Nous venons d’étudier les excitations du gaz d’électrons, fermions chargés qui interagissent par l’intermédiaire du potentiel coulombien. Nous avons vu que le caractère à longue portée de ce potentiel entraînait des propriétés particulières. Nous pouvons reproduire le même type de calcul pour un gaz de particules obéissant à une statistique de Fermi, mais neutres et interagissant par un potentiel à courte portée. L’hamiltonien comporte toujours deux termes : un terme d’énergie cinétique qui reste inchangé, et un terme d’interaction à courte portée caractérisée par ses composantes de Fourier V (q). L’approximation la plus simple consiste à choisir V (q) = U, quel que soit q Un tel modèle a notamment été souvent utilisé pour décrire l’Hélium 3 liquide. Si on cherche le spectre d’excitation de ce liquide de Fermi neutre, dans l’approximation de la phase aléatoire, on peut reproduire à l’identique les calculs précédents. L’équation aux valeurs propres pour les énergies d’excitation s’écrit simplement : & ' & ' nk,σ − nk+q,σ (6.89) 1=U E − εk+q − εk k,σ
La discussion des solutions est identique au cas du gaz d’électrons. On retrouve le quasi-continuum des excitations individuelles, faiblement modifiées par rapport à la solution de Hartree, et une excitation de caractère collectif, d’énergie située au-dessus de ce continuum. Il s’agit d’un mode d’oscillation collective de la densité de particules. On appelle ce mode collectif le zéro son. Nous n’avons pas introduit ici, dans ce modèle très simplifié, la discussion de l’effet des processus de diffusion sur la définition des modes. En fait, il se produit des processus de collisions avec les quasiparticules, qu’on caractérise par leur fréquence 1/τ . Si la fréquence du mode collectif ωZS reste grande devant 1/τ ωZS τ 1
(6.90)
Il est possible de montrer, par exemple, en écrivant l’équation de Boltzmann du mode collectif, que les collisions sont suffisamment peu fréquentes pour que leur contribution à l’intégrale de collision, dans l’équation de transport, puisse être négligée. On est alors dans le régime sans collision. Dans ce régime, le Zéro Son est un mode collectif bien défini. La force de rappel est fournie par le champ moyen self-consistent d’un grand nombre de particules. Les collisions entre quasiparticules apportent une perturbation à cette force et, par conséquent, amortissent le Zéro Son. Un tel amortissement reste faible tant que la condition (6.90) est vérifiée. Dans la limite opposée, caractérisée par ωτ 1
238
6. Le gaz d’électrons
il se produit un très grand nombre de collisions entre quasiparticules durant le temps caractéristique ω−1 . On est alors dans un régime dominé par les collisions, le régime hydrodynamique. Dans ce cas, le mode collectif Zéro Son n’est plus défini. Cependant, il est possible de construire un mode collectif d’ondes sonores complètement différent. Les collisions entre quasiparticules très fréquentes conduisent à un équilibre thermodynamique local. Physiquement, il est clair que de telles collisions fournissent la force de rappel nécessaire à la propagation du Son Ordinaire, qu’on a appelé, pour le distinguer du Zéro Son, le « Premier Son ». Pour que ces collisions parviennent en permanence à restaurer l’équilibre local, il est évidemment nécessaire qu’elles se produisent suffisamment fréquemment pendant un temps court devant la période de l’onde. La condition nécessaire pour l’existence d’un mode hydrodynamique bien défini correspondant au Son Ordinaire est donc : ωSO τ 1
(6.91)
Pour obtenir le comportement de ωZS à petit vecteur d’onde, il suffit d’écrire, comme dans le cas des plasmons : εk+q − εk V q 3 (6.92) 1 = 3 2 d k 2 E − εk+q − εk 2π ce qui donne la solution, à petit vecteur d’onde q : q2 2 ωZS = V q n m
(6.93)
où n est la densité de particules et m leur masse effective. Pour une interaction à courte portée, V q tend vers une constante quand q → 0. Dans cette limite, la relation de dispersion est linéaire. Le zéro son est le mode de Goldstone correspondant à la brisure d’invariance par translation. Le spectre d’excitations est schématisé dans la figure 6.9. Ce mode collectif d’oscillation de la densité a été prédit par Landau [6] dans le cadre de la théorie phénoménologique des liquides de Fermi normaux (voir le chapitre 7). Il a bien été observé dans un liquide de Fermi neutre, l’Hélium 3, pour la première fois par Abel et al. [7] en étudiant la propagation ultrasonore, à des températures descendant jusqu’à 2 mK. Ce liquide peut être considéré comme le modèle quasiment idéal de liquide de Fermi neutre. L’existence et les caractéristiques de la branche de Zéro Son de 3 He ont été étudiées par diffusion de neutrons : la première observation d’un mode de zéro son bien défini, en utilisant cette technique a été faite par Sköld et al. à Argonne [8]. La relation de dispersion observée est indiquée sur la figure 6.10. La largeur en énergie du mode collectif est petite devant la fréquence tant que le vecteur d’onde reste faible, mais croît fortement à plus grands vecteurs d’onde, quand l’énergie du Zéro Son se rapproche des énergies d’excitations à une particule. Le comportement linéaire de la relation de dispersion à petits vecteurs d’onde a bien été vérifié.
239
Physique de la matière condensée
Fig. 6.9 Spectre d’excitations du liquide de Fermi neutre. La branche d’excitation collective correspond au Zero Son, mode de Goldstone correspondant à la brisure de symétrie continue de translation.
Fig. 6.10 Observation du mode de Zéro Son par diffusion de neutrons (cercles et rectangles noirs) a 15 mK pour des vecteurs d’onde compris entre 0,5 et 2,2 Å (d’apres [8]).
Fonction d’onde du plasmon Nous venons de définir aq+ , opérateur d’excitation « plasmon » de vecteur d’onde q. Considérons l’état : |ψ(q) >= aq+ |F > (6.94)
240
6. Le gaz d’électrons
où |F > est l’état fondamental. |ψ(q) > est un état excité contenant un plasmon, construit en appliquant au fondamental l’opérateur de création de l’excitation collective. Que représentent les opérateurs aq et aq+ ? Ils obéissent aux propriétés de commutation suivantes : + ∗ aq , aq+ = αkσ αk σ ckσ ck+qσ , c + ck σ k,k σ ,σ
=
k,k σ ,σ
k +q σ
+ ∗ αkσ αk σ ckσ ck σ δk+q,k +q − c +
k +q σ
= δq,q
δσ ,σ c δ k+qσ k,k (6.95)
Les aq ne satisfont donc pas exactement les règles de commutation des bosons. Étudions par contre la projection des relations de commutation sur l’état fondamental |F>: + ∗ ] | F >= αkσ αk σ (6.96) < F |[aq , aq k,k σ ,σ
+ ck σ | F > δk+q,k +q − < F |c + ck+qσ | F > δk,k × < F |ckσ k +q σ ∗ αkσ αkσ nkσ − nk+qσ = δq,q (6.97) = δq,q k,σ
Si on se restreint au sous-espace des états à un plasmon, les opérateurs aq et aq+ sont des opérateurs de bosons. On peut cependant construire des excitations à deux plasmons : à l’ordre 1/N près, le résultat est le même que la somme de deux excitations à un plasmon. Les plasmons restent des bosons tant que le nombre de plasmons excités est d’ordre unité par rapport au nombre N de particules du système.
6.3.2 Constante diélectrique Dans ce paragraphe, nous allons calculer le coefficient de réponse diélectrique, dans le cadre de la réponse linéaire, en utilisant toujours l’approximation de la RPA. Nous verrons que les informations physiques contenues dans cette constante diélectrique sont très riches. Elles nous permettront de retrouver les modes collectifs du système, mais aussi, grâce au théorème de fluctuation-dissipation, de calculer l’énergie d’interaction et de remonter ensuite à l’énergie de l’état fondamental.
241
Physique de la matière condensée
Mettons une charge extérieure, oscillant dans le temps et l’espace représentée par : ρext (q, ω) exp i (q · r − ωt ) Éventuellement nous ajouterons une petite partie imaginaire à la fréquence, que nous écrirons donc ω + i η, en supposant η → 0, pour assurer les propriétés de convergence. Ceci revient à introduire la perturbation de façon infiniment lente. Cette charge extérieure donne lieu à l’énergie d’interaction : + ϕext (q, ω) exp −i ωt + hermitique conjugu e´ Hp = −e ρ−q où ϕext (q, ω) = (
4π )ρext q, ω 2 q
(6.98)
(6.99)
est le potentiel coulombien créé par la charge extérieure. Comme nous travaillons dans le domaine de la réponse linéaire, nous n’avons pas besoin de considérer le terme hermitique conjugué. En présence de cette charge extérieure, nous devons tenir compte de Hp, qui en s’ajoutant à l’hamiltonien, rajoute + . Nous obtenons un terme supplémentaire dans l’équation du mouvement de ρkqσ ainsi la contribution supplémentaire :
+ Hp , ρkqσ
=−
4π e nkσ − nk+qσ ρext q, ω exp −i ωt 2 q
(6.100)
L’équation du mouvement linéarisée, dans l’approximation de la phase aléatoire, s’écrit maintenant : d + + (6.101) = H + Hp , ρkqσ −i h¯ ρkqσ dt + 4π e = εk+q − εk ρkqσ − 2 nkσ − nk+qσ q ( ) + e ρq × − (6.102) + ρext q, ω exp −i ωt Conformément à la méthode de la RPA, on prend les valeurs moyennes des opérateurs nombres dans l’état fondamental. Mais il s’agit maintenant de l’état fondamental en présence de la charge extérieure. −i h¯
242
+ d + ρkqσ = εk+q − εk ρkqσ (6.103) dt ( ) e ρq+ 4πe − 2 < nkσ > − < nk+qσ > − + ρext q, ω exp −i ωt q
6. Le gaz d’électrons
La présence de cette charge extérieure induit des valeurs moyennes non nulles dans + l’état fondamental pour les opérateurs ρkqσ . Dans ce calcul de réponse linéaire, nous supposerons qu’il ne se produit pas de brisure spontanée de symétrie. Posons :
+ induit >= ρkqσ exp −i ωt −e < ρkqσ
et
induit ρkqσ = δρqind
(6.104) (6.105)
kσ
Prenons, maintenant, la valeur moyenne de l’équation du mouvement ci-dessus dans l’état fondamental : induit induit hωρ ¯ kqσ = εk+q − εk ρkqσ 4π e 2 + 2 < nkσ > − < nk+qσ > δρqind + ρext q, ω (6.106) q Dans cette expression < · · · > symbolise en principe la valeur moyenne dans l’état fondamental en présence de la charge extérieure. Mais, en fait, dans le cadre de la réponse linéaire, on pourra négliger les termes du second ordre en ρext q, ω . Il suffira donc de calculer les valeurs moyennes des nombres d’occupation à l’ordre zéro en ρext q, ω , c’est-à-dire, en fait, de les calculer dans l’état fondamental en l’absence de charge extérieure. On obtient : induit = ρkqσ
4π e 2 < nkσ > − < nk+qσ > ind δρ + ρ q, ω ext q q2 h¯ ω − εk+q − εk
(6.107)
On somme les deux membres de cette équation sur k et σ : kσ
4π e 2 0 induit ρkqσ = δρqind = δρqind + ρext q, ω * χ q, ω 2 q
où on a posé :
< nkσ > − < nk+qσ > * χ 0 q, ω = h¯ ω − εk+q − εk
(6.108)
(6.109)
k,σ
La charge induite par la charge extérieure, dans le cadre de la réponse linéaire s’écrit donc : 4π e 2 0 * χ q, ω 2 q ρext q, ω (6.110) δρqind = 2 1 − 4πq 2e * χ 0 q, ω
243
Physique de la matière condensée
On en déduit la fonction de réponse linéaire : χ q, ω = avec
δρqind χ 0 q, ω = ρext q, ω 1 − χ 0 q, ω
4π e 2 0 χ 0 q, ω = * χ q, ω q2
(6.111)
(6.112)
Cette forme pour χ q, ω est typique d’une approximation de champ moyen. La quantité < nkσ > − < nk+qσ > * χ 0 q, ω = h¯ ω − εk+q − εk k,σ
n’est autre que la fonction de réponse densité-densité du gaz d’électrons parfait (c’est-à-dire sans interaction entre les électrons) à une densité de particules extérieure ρext (q, ω), comme le montre facilement un calcul élémentaire de perturbation au premier ordre sur un gaz d’électrons libres. En RPA, la réponse linéaire à la charge extérieure ρext (q, ω) est celle d’électrons indépendants, puisque nous avons fait une approximation de champ moyen, mais soumis non seulement à la charge extérieure, mais aussi au champ moyen des autres électrons, c’est-à-dire à une charge supplémentaire δρqind . On définit la constante diélectrique généralisée : ε q, ω =
ρext (q, ω) ρext (q, ω) + δρqind
(6.113)
Cette expression généralise la constante diélectrique définie par la relation D = εE où D et E sont les champs qui vérifient les équations de Maxwell dans les milieux diélectriques D = 4πρext E = 4πρtot où ρext et ρtot sont respectivement la charge extérieure introduite dans le milieu diélectrique et la densité de charge totale. ε q, ω est évidemment reliée très simplement à χ q, ω :
et donc à * χ 0 q, ω
244
1 = 1 + χ q, ω ε q, ω
(6.114)
4πe 2 0 ε q, ω = 1 − 2 * χ q, ω q
(6.115)
6. Le gaz d’électrons
Comme nous allons le voir, la constante diélectrique généralisée ε q, ω est une quantité très riche. C’est une fonction de réponse linéaire qui contient beaucoup d’informations sur la physique du système. Son calcul nous permettra de déterminer les modes propres longitudinaux. En effet, dans un mode propre longitudinal, il y a formation de charge induite δρqind , même en l’absence de charge extérieure ρext q, ω . Ceci doit donc correspondre à un zéro de la constante diélectrique, puisque le dénominateur peut rester différent de zéro même dans le cas d’un numérateur nul. L’équation
ε q, ω(q) = 0 donne la fréquence de plasmon ω(q).
(6.116)
Expression explicite de ε q, ω Séparons l’expression RPA de la constante diélectrique en sa partie réelle et sa partie imaginaire : (6.117) ε(q, ω) = ε1 + i ε2 À partir de l’expression de * χ 0 q, ω obtenue, pour des électrons libres, qu’on appelle formule de Lindhard [9], il est possible d’écrire les expressions de ε1 et ε2 . La partie réelle s’écrit : $( + " #2 ) ω − qvF − q 2 /2m q02 1 kF ω − q 2 /2m 1− Ln ε1 q, ω = 1 + 2 + q 2 4q qvF ω + qvF − q 2 /2m ( %, " #2 ) ω + qvF + q 2 /2m ω + q 2 /2m + 1− (6.118) Ln qvF ω − qvF − q 2 /2m et la partie imaginaire : π ω ε2 q, ω = 2 qvF
"
#2
q2 pour 0 ≤ ω ≤ qvF − 2m $ % " # 2 q02 ω − q 2 /2m π kF 1− = 4 q qvF q2 q0 q
q2 q2 ≤ ω ≤ qvF + 2m 2m q2 pour ω ≥ qvF + 2m
pour qvF − =0
(6.119) (6.120)
245
Physique de la matière condensée
Dans ces expressions, q0 est le vecteur d’onde de Thomas-Fermi, défini par : q02
=
3ωp2 vF2
=
4kF me 2 π h¯ 2
(6.121)
Dans la limite q → 0, les expressions se simplifient beaucoup. On retrouve : ε1 (q = 0, ω) = 1 −
ωp2 ω2
(6.122)
On obtient en particulier une partie imaginaire qui s’annule pour ω > qvF +q 2 /2m, car il est impossible, à des fréquences supérieures, de produire une paire électron-trou de vecteur d’onde q en respectant le principe de Pauli. De plus, comme nous l’avons vu, la partie réelle doit s’annuler pour ω = ωp , dans un domaine de fréquence où ε2 q, ω = 0. Cette fréquence marque le seuil entre le régime de réflexion et de transmission optique pour le métal. Cette propriété est à la base de la méthode optique de détermination de la fréquence de plasmon ωp .
6.3.3 Application : Cas statique – Écran Dans la limite statique ω → 0 l’expression de * χ 0 q, ω , qu’on appelle la formule de Lindhard se simplifie beaucoup. On en déduit très simplement : " # q2 q ε q, ω = 1 + 02 g (6.123) 2q 2kF où
1 − x 2 1 + x g (x ) = 1 + Ln 2x 1−x
(6.124)
Les variations de la fonction g (x ) sont indiquées sur la figure 6.11. Elle part de la valeur 2 avec une tangente horizontale pour q = 0 et reste à peu près constante tant que q < 2kF , puis présente une singularité logarithmique en q = 2kF . Cette singularité de pente est liée à la discontinuité de la distribution de Fermi. Dans la limite des petits vecteurs d’onde, g (x ) tend vers une constante : ε(q, ω = 0) 1 +
246
q02 q2
pour q kF
(6.125)
6. Le gaz d’électrons
Fig. 6.11 Variations de la fonction g (x ).
La composante de Fourier Veff (q) du potentiel effectif devient : Veff (q) =
1 4π e 2 4π e 2 2 = , ε q, 0 q q 2 + q02
(6.126)
c’est-à-dire, pour le potentiel effectif dans l’espace réel, en effectuant la transformation de Fourier : e2 (6.127) Veff (r ) = exp −q0 r, r 1/q0 est la longueur d’écran de Thomas-Fermi. La formule (6.127) est due à Mott (Mott et Jones, 1936). Les oscillations de Friedel ont été établies dans la thèse de J. Friedel en 1951 et utilisées par E. Daniel pour expliquer les forts élargissements de déplacement de Knight dans les alliages (Blomberg et Rowland). Le potentiel coulombien à longue portée en 1/r a été écranté et cède la place à un potentiel exponentiellement décroissant de portée 1/q0 . On peut retrouver ce résultat très simplement par la méthode de Thomas-Fermi. On considère une oscillation spatiale de la densité de charge ρ(r ). On écrit l’équation de Poisson pour le potentiel électrostatique ϕ(r) : ϕ = −4π [ρ(r) − ρ0 ] = 4π e [n(r) − n0 ]
(6.128)
On considère que la variation de n(r) est suffisamment lente (c’est-à-dire q kF ) pour pouvoir écrire, en supposant qu’on puisse définir un niveau de Fermi local, relié à la densité locale d’électrons : εF + e ϕ = puis, on linéarise :
2 h¯ 2 2 3π n(r ) 3 2m
3 eϕ n(r ) n0 + n0 2 εF
(6.129)
(6.130)
247
Physique de la matière condensée
En reportant dans l’équation de Poisson : ϕ(r ) = q02 ϕ(r ) avec q02 =
6π n0 e 2 4kF me 2 = εF π h¯ 2
(6.131)
(6.132)
Dans les métaux monovalents, la valeur typique de 1/q0 est de l’ordre de 0, 055 nm. Il s’agit donc d’un effet d’écran très efficace. En réalité, dans ce calcul, nous avons en fait supposé que la fonction g (x ) était constante puisque nous avons remplacé g (x ) par g (0), ce qui n’est valable que pour x 1, c’est-à-dire q 2kF . À plus grand vecteur d’onde, il faut tenir compte de la dépendance en vecteur d’onde de g (q/2kF ). Cette fonction présente une singularité à q = 2kF , dite singularité de Kohn [10] que nous discuterons plus en détail cidessous, due à l’existence d’une surface de Fermi. Cette singularité se traduit dans l’espace direct, en transformée de Fourier, par un comportement oscillant : ce sont les oscillations de Friedel [11]. Anomalie de Kohn et oscillations de Friedel sont deux aspects d’un même phénomène, l’un dans l’espace réciproque, l’autre dans l’espace réel. En fait, c’est bien l’effet dans l’espace réel qui a été découvert et publié en premier par E. Daniel et J. Friedel. Considérons une charge extérieure +e, localisée à l’origine, de densité de charge :
de transformée de Fourier :
ρext (r) = +e δ(r)
(6.133)
ρext (q) = +e
(6.134)
Par définition de la constante diélectrique généralisée, la charge induite par la présence de la charge extérieure s’écrit : ( ) 1 −1 (6.135) δρqind = +e ε q, 0 La charge induite dans l’espace réel est donc : ) ( 1 +e − 1 exp i q·r d 3 q δρ ind (r ) = (2π)3 ε q, 0 Le potentiel créé par une charge à la distance r , Veff (r ) s’écrit : 4π e exp i q·rd 3 q Veff (r ) = 3 ε q, 0 q 2 2π
248
(6.136)
(6.137)
6. Le gaz d’électrons
Si on prend en compte la variation complète de ε(q, 0) avec q afin d’évaluer le comportement global de δρ ind (r ) en ne se limitant pas aux composantes de Fourier de très petits vecteurs d’onde, alors la courbe des variations de ε q, 0 présente une « largeur » 2kF dans l’espace réciproque. En transformée de Fourier, V (r ) et δρ ind (r ) vont présenter, dans l’espace direct des oscillations de vecteur d’onde 2kF associées à cette « largeur ». Il en résulte un comportement original par rapport à l’approximation de Thomas-Fermi et à la décroissance exponentielle très rapide du potentiel effectif et de la charge induite. La charge induite à une distance r de la charge test placée à l’origine δρ ind (r ) présente en réalité une décroissance en loi de puissance, donc beaucoup plus lente, et un comportement oscillant, donc de signe variable en fonction de la distance : δρ ind (r ) = où ξ=
2ξ cos 2kF r 2 r3 π 4+ξ
e 2 kF 2αrs = 0, 33rs πεF π
(6.138)
en u.a.
(6.139)
Le potentiel effectif Veff (r ) exercé par la charge extérieure n’est plus donné, à grande distance, par l’expression de Thomas-Fermi, mais par : Veff (r )
2ξ π cos 2kF r 2 2 r3 π 4 + ξ kF
(6.140)
Ces oscillations autour d’une impureté chargée (figure 6.12) ont reçu le nom d’oscillations de Friedel. Elles sont la source d’effets importants dans les alliages [11]. Ainsi, par exemple, deux impuretés de même charge pourront présenter une interaction attractive si elles sont placées à distance convenable l’une de l’autre. Cette détermination de la charge induite et du potentiel effectif autour d’une charge extérieure a
V (r)
∼ Cos 2k3Fr ( kFr)
π/2kF
r
Fig. 6.12 Oscillations de Friedel : à grande distance, le potentiel effectif du à une charge ponctuelle ne decroit plus exponentiellement, mais en r −3 et oscille avec la distance.
249
Physique de la matière condensée
permis d’interpréter des expériences de résonance magnétique nucléaire mettant en évidence l’influence d’impuretés sur le déplacement de Knight [12].
6.3.4 Énergie de l’état fondamental Connaissant la partie imaginaire de la fonction de réponse (figure 6.13), 1 χ " q, ω = Im ε q, ω
(6.141)
il est possible de remonter à l’énergie d’interaction et donc à l’énergie totale de l’état fondamental. Im 1/ε(q,ω)
ω
ωP
Fig. 6.13 Im ε(q1, ω) en fonction de la fréquence, dans l’approximation de Hartree-Fock (tirets) et en RPA (trait plein).
L’énergie d’interaction dans l’état fondamental s’écrit : Eint =< F |
2π e 2 q =0
q2
ρq+ ρq − N
où N est l’opérateur nombre total d’électrons : + ckσ ckσ N =
|F>
(6.142)
(6.143)
k,σ
Le premier terme de l’équation (6.140) est une somme de fonctions de corrélation densité-densité et s’écrit, à l’aide du théorème de fluctuation-dissipation, en
250
6. Le gaz d’électrons
fonction de χ " q, ω , partie imaginaire de la fonction de réponse linéaire densité-densité (figure 6.13) : + , 2π e 2 ∞ 1 dω Eint = − Im +N (6.144) q2 ε q, ω 2π 0 q =0
où
⎡ ⎤ * χ 0 q, ω 1 = χ" q, ω Im ⎣ Im ⎦ 2 ε q, ω 1 − 4π2e * χ 0 q, ω
(6.145)
q
On peut donc définir une contribution du vecteur d’onde q à l’énergie d’interaction : 2π e 2 1 ∞ Eint q = − 2 N + χ " q, ω d ω (6.146) q π 0 L’énergie totale d’interaction s’obtient en sommant sur tous les vecteurs d’onde : Eint = Eint q (6.147) q
Il est donc possible, à partir de la connaissance de la fonction de réponse linéaire, de déterminer l’énergie d’interaction. Cette dernière nous permet de remonter à l’énergie totale de l’état fondamental grâce à un théorème bien connu, qui est dû, semble-t-il, à Pauli : Si l’hamiltonien est de la forme H = H0 + gHint
(6.148)
où g est une constante de couplage, caractérisant la force de l’interaction, l’énergie d’interaction moyenne, dans l’état fondamental, s’écrit : Eint (g ) =< 0 (g )|gHint |0 (g ) >
(6.149)
où |0 (g ) > est l’état fondamental exact de l’hamiltonien total. Par définition : H0 + gHint |0 (g ) >= E0 |0 (g ) > L’énergie de l’état fondamental s’écrit : E0 (g ) =< 0 (g )|H0 + gHint |0 (g ) >
(6.150)
Quand on dérive cette expression par rapport à g, on obtient un premier terme qui vient de la dépendance en g de l’hamiltonien et un deuxième terme qui vient de la dépendance de la fonction d’onde : dE0 d 1 = Eint (g ) + E0 (g ) < 0 (g ) | 0 (g ) > dg g dg
(6.151)
251
Physique de la matière condensée
En fait, ce deuxième terme s’annule à cause de la normalisation de la fonction d’onde : puisque < 0 (g ) | 0 (g ) >= 1, sa dérivée est nulle. Il reste donc : dE0 Eint (g ) = dg g
d’où le théorème : E0 (g ) = E0 (0) +
0
g
Eint (g ) dg g
(6.152)
(6.153)
Il est donc ainsi possible de remonter à l’énergie totale de l’état fondamental dans l’approximation de la RPA [13], en prenant pour paramètre caractérisant la force de l’interaction e 2 : e2 Eint (e 2 ) 2 de (6.154) E RPA = Ecin e´ tique + e2 0 On peut donc déterminer l’énergie de l’état fondamental, une fois que la dépendance de ε q, ω en fonction de e 2 est connue. La contribution du vecteur d’onde q à l’énergie de l’état fondamental, pour q petit, peut s’écrire : hω 2π e 2 ¯ p − 2 N 2 q
(6.155)
La quantité correspondante, calculée dans l’approximation d’Hartree-Fock était donnée, dans la limite des petits vecteurs d’onde, par : # " 3π e 2 2π e 2 N (6.156) − 2 2qkF q L’énergie de corrélation, c’est-à-dire la correction par rapport à l’approximation de Hartree-Fock, pour un transfert de vecteur d’onde q s’écrit donc : hω 3π e 2 ¯ p Ecorr q = N − 2 2qkF
(6.157)
En sommant sur les vecteurs d’onde, on trouve dans la limite de haute densité : Ecorr e´ lation = 0.622Lnrs − 0, 142 Ryd.
(6.158)
C’est le début d’un développement valable pour rs 1. Les termes suivants s’écrivent : (6.159) ars + brs Lnrs + crs2 + · · · Le terme logarithmique provient de la sommation de tous les « processus de Coulomb purs », c’est-à-dire des diagrammes en « échelle » (figure 6.14).
252
6. Le gaz d’électrons
Fig. 6.14 Les diagrammes pris en compte dans la RPA.
En allant à tous les ordres en perturbation, on somme des contributions du type : n dq dq dq + · · · + −1 +··· (6.160) − 3 2n+1 q q q En utilisant la somme d’une série géométrique : 1 1+
qo2 q2
n q2 = 1 − o2 + · · · + −1 q
"
qo2 q2
#n + ···
(6.161)
où q0 est le vecteur d’onde de Thomas-Fermi, on obtient une contribution proportionnelle à : q 2qdq 2dq = = Ln q 2 + q02 0c 2 2 2 q q + q0 q 1 + qo2 ∼ Lnq02 ∼ Lnrs On peut également calculer les fonctions de distribution de paires : en l’absence d’interaction nous avions trouvé le comportement schématisé par les courbes en pointillé dans la figure 6.15. Pour la fonction de corrélation de spins antiparallèles, P↑↓ (r ) était simplement une constante, tandis que pour des spins parallèles, P↑↑(r ) montrait un trou d’échange à courte distance, résultat du principe d’exclusion de Pauli. Sur la même figure, nous avons indiqué le comportement qu’on attend pour les mêmes fonctions de corrélation, si on introduit des interactions entre électrons de force croissante. L’interaction coulombienne crée maintenant un « trou de corrélation » entre électrons de spins différents, mais au contraire, diminue le « trou d’échange » entre électrons de même spin. Le calcul explicite de ces fonctions de corrélations a été fait, dans l’approximation de la RPA, par Ueda [14].
6.4 Modèle du jellium Nous nous intéressons dans ce paragraphe aux effets associés aux mouvements des ions. Nous devons donc nous libérer de l’approximation du fond continu uniforme,
253
Physique de la matière condensée
P
Sans interaction (ou Hartree-Fock)
Correlation de spins antiparallèles pour des intéractions croissantes r/rs P
(1) rs = 0,1
(2) rs = 0,5
(3) rs = 1
Sans interaction (ou Hartree-Fock)
Correlation de spins antiparallèles pour des intéractions croissantes r/rs
Fig. 6.15 Effet d’interactions croissantes sur les fonctions de corrélations de paires ; l’importance relative des corrélations est augmentée en augmentant la valeur de rs il apparait, en RPA, un trou de corrélation pour des electrons de spins différents, tandis que le trou d’échange entre spins parallèles diminue.
mais nous restons dans le cadre d’un modèle très simplifié : les ions seront décrits par un plasma de densité N0 de particules de charge Z et de masse M . La neutralité électrique impose N0 Z = n0 , densité du gaz d’électrons. En raison de leur masse M m, les ions seront traités classiquement. La fréquence d’oscillation classique du gaz d’ions est donnée par : 2p
2 4π N0 Ze 4π n0 e 2 = ωp2 = M m
(6.162)
Nous allons redériver très simplement ce résultat de mécanique classique en écrivant : 1) L’équation du mouvement classique, linéarisée, et en champ moyen : L’équation classique de la dynamique s’écrit : M
d vi Eij = +Ze dt i=j
254
(6.163)
6. Le gaz d’électrons
où Eij est le champ électrique local exercé par la particule j sur la particule i . Dans cette équation du mouvement classique, nous avons remplacé la vitesse individuelle d’un ion i ,vi , par la vitesse moyenne des ions contenus dans un petit volume, de dimensions microscopiques mais grandes devant la distance moyenne entre ions, < v >. d M < v >= Ze E (6.164) dt Le champ électrique qui apparaît alors au second membre, E, n’est plus le champ local, mais le champ de Maxwell. Il s’agit d’une approximation de champ moyen. D’autre part, nous avons fait l’approximation : d /dt = ∂/∂t + v · ∇r ∂/∂t
(6.165)
Il s’agit d’une approximation légitime dans la limite de petits mouvements. En effet, le deuxième terme, qui est négligé dans l’expression précédente, est bien du second ordre, dans le cas de mouvements de petite amplitude, car aussi bien la vitesse v que le gradient par rapport à r, ∇r sont du premier ordre. 2) L’équation de Maxwell : Soit ρ(t ) la densité de charge ionique, et δρ l’écart à l’équilibre de cette densité de charge : (6.166) ρ(t ) = ρ0 + δρ(t ) = ZeN0 + δρ(t ) où ρ0 = ZeN0 est la densité de charge ionique à l’équilibre. Comme ρ0 est compensée par le fond continu de charge négative, qui assure la neutralité électrique, la densité de charge totale se réduit à δρ(t ). L’équation de Maxwell s’écrit donc ; divE = 4πδρ
(6.167)
Notons que le fait que le champ E qui intervient dans l’équation du mouvement satisfasse l’équation de Maxwell résulte d’une approximation de champ moyen. Ce ne serait pas exact pour le champ local microscopique.
3) L’équation de conservation du nombre de particules : Celle-ci s’écrit :
∂ ρ + div ρ < v > = 0 ∂t
(6.168)
Dans une approximation linéaire, on remplace ρ, facteur de < v >, quantité d’ordre 1, par son approximation d’ordre zéro, c’est-à-dire ρ0 = ZeN0 . Bien entendu, la charge qui est conservée dans cette équation, c’est la charge ionique. Nous n’avons évidemment pas à tenir compte du fond continu dans le calcul de ρ0 . L équation de
255
Physique de la matière condensée
conservation de la charge ionique s’écrit donc, au premier ordre : ∂ δρ + ZeN0 div < v >= 0 ∂t
(6.169)
En combinant ces trois équations, on obtient : 2 N0 ∂ 2 δρ + 4π Ze δρ = 0 2 ∂t M
(6.170)
L’écart à l’équilibre de la densité de charge δρ obéit donc à une équation d’oscillateur harmonique de fréquence d’oscillation p , telle que : 2p
2 4π N0 Ze = M
(6.171)
ce qui établit le résultat annoncé pour la fréquence d’oscillation classique d’un gaz de particules chargées.
6.4.1 Généralités – Constante diélectrique À cause du rapport des masses M /m 1, nous allons considérer, dans toute cette étude, que les ions sont très lents par rapport au mouvement des électrons. Au contraire, ceux-ci suivent le mouvement des ions de façon pratiquement instantanée. Ainsi, l’interaction effective entre ions est écrantée par le gaz d’électrons. La constante diélectrique qui intervient dans cet effet d’écran est pratiquement la constante diélectrique de fréquence nulle : 2 4π exp i k · r d 3q (6.172) Veff = Ze εe q, ω = 0 q 2 Par un raisonnement analogue à celui qui précède, on trouve la fréquence du mouvement des ions en présence de l’effet d’écran des électrons : 2 N0 2 4π N0 Ze 1 Veff q q = ω q = M M εe q, ω = 0 2
(6.173)
2p = εe q, ω = 0 En utilisant le développement de la constante diélectrique des électrons pour les faibles valeurs de q,
256
6. Le gaz d’électrons
εe (q, 0) 1 + On obtient :
q02 q2
(6.174)
q q = p q0
(6.175)
Proposons maintenant de retrouver ce résultat simple par un raisonnement plus complet. La première étape consiste d’abord à calculer la constante diélectrique du gaz classique d’ions seul. On cherche pour cela l’équation du mouvement classique, linéarisée et en champ moyen comme précédemment, mais maintenant en tenant compte de la présence d’une charge extérieure décrite par ρext q, ω . La modification apportée par la présence de cette charge extérieure est de modifier le champ électrique auquel les ions sont soumis. Cet effet se traduit dans les équations par une modification de l’équation de Maxwell qui s’écrit maintenant : (6.176) divE = 4π δρ + ρext q, ω Le terme supplémentaire en ρext q, ω va avoir pour seul effet d’ajouter un second membre dans l’équation harmonique, en jouant le rôle d’une force extérieure. L’équation classique du mouvement, linéarisée et en champ moyen s’écrit alors : ∂ 2 δρ + 2p δρ = −2p ρext q, ω 2 ∂t
(6.177)
On recherche la réponse linéaire à cette charge ρext q, ω . Nous devons donc chercher unesolution de cette équation du mouvement qui oscille à la même fréquence que ρext q, ω . D’où la solution : δρ q, ω =
2p ω2
ρext − 2p
q, ω
En définissant toujours de la même façon la constante diélectrique du gaz d’ions, en présence de son fond continu de charge négative, εi (q, ω), on obtient : εi (q, ω) =
ρext
2p ρext q, ω =1− 2 ω q, ω + δρ q, ω
(6.178)
Calculons la constante diélectrique totale du Jellium, constitué du gaz d’électrons et du gaz d’ions, par une méthode de superposition linéaire ; on considère le Jellium
257
Physique de la matière condensée
comme la superposition : – d’une part, du plasma d’électrons, avec son fond continu de charge positive ; – d’autre part, du plasma d’ions avec son fond continu de charge négative. Les deux sous-systèmes sont, chacun séparément, électriquement neutres. Les deux fonds continus de densités de charge égales et opposées, que nous avons rajoutés pour la commodité du raisonnement, se compensent. Plaçons, maintenant, une charge extérieure ρext . Elle va avoir pour effet l’apparition de charges induites ioniques d’une part, et électroniques d’autre part, que nous appelerons, respectivement, δρi et δρe . D’après la définition de εe et εi , constantes diélectriques généralisées des plasmas d’électrons et d’ions, respectivement, en présence seulement de leur fond continu : εe =
ρext + δρi ρext + δρi + δρe
(6.179)
En effet, la charge extérieure au système (gaz d’électrons + fond continu positif ) est bien ρext + δρi , alors que la charge totale est ρext + δρi + δρe . De même : εi =
ρext + δρe ρext + δρi + δρe
(6.180)
puisque la charge extérieure au système (gaz d’ions + fond continu de charge négative) est bien ρext + δρe , alors que la charge totale est toujours ρext + δρi + δρe . La constante diélectrique du Jellium est définie par : ρext εT = ρext + δρi + δρe
(6.181)
puisque cette fois-ci, la charge extérieure au Jellium est uniquement ρext . Ce qui donne tout de suite : εT = εe + εi − 1
(6.182)
c’est-à-dire, en utilisant l’expression de la constante diélectrique du plasma d’ions classique, que nous venons de dériver : 2p εT = εe q, ω − 2 ω
(6.183)
6.4.2 Modes propres d’oscillations Les modes propres d’oscillations longitudinaux sont donnés par l’annulation de la constante diélectrique. En effet, cette condition d’annulation de la fonction de
258
6. Le gaz d’électrons
réponse assure que la réponse à une perturbation infiniment faible reste finie. On trouve donc, de cette façon, les modes d’oscillations spontanées : 2p εe q, ω − 2 = 0 ω Étant donné le rapport des masses M /m 1 : p 1 ωp
(6.184)
Les deux termes du premier membre de l’équation (6.185) sont très petits devant 1 pour ω ∼ ωp , puisque ωp est la fréquence à laquelle s’annule la constante diélectrique des électrons : (6.185) εe q, ωp = 0 Il existe donc une solution de l’équation (6.185) de fréquence ω ∼ ωp . Pour ω ∼ ωp , l’équation des modes propres s’écrit : # " #2 " ∂εe p = εe q, ω εe q, ωp + ω − ωp ∂ω ω=ωp ω
(6.186)
qui admet la solution de haute fréquence ω ∼ ωp : ω ωp +
p 2 ωp
∂εe ∂ω ω=ω p
(6.187)
Il s’agit essentiellement d’un mode de plasmon du gaz d’électrons, légèrement modifié par la présence des ions. La correction relative est d’ordre ∼ 10−4 . Il existe une deuxième solution de basse fréquence ω ωp . En effet si ω ωp , on peut approcher l’équation du mode propre par : ω2 =
2p 2p εe q, ω εe q, ω = 0
(6.188)
Nous avons remplacé la constante diélectrique électronique à la fréquence ω par la constante diélectrique statique. Ceci revient à dire que les électrons suivent pratiquement de façon instantanée le mouvement des ions. Leur inertie est négligeable. Ceci reste vrai tant que la fréquence caractéristique du mouvement électronique ωp reste
259
Physique de la matière condensée
grande devant celle des ions p. On retrouve alors : p ω= - εe q, ω = 0
(6.189)
qui, dans la limite des petits vecteurs d’onde, donne : q ω q → 0 p q0 Ceci correspond à un mode de phonons longitudinaux, pour des ions interagissant par un potentiel coulombien écranté par le mouvement des électrons. En fait, ce sont les modes d’oscillations collectives qui jouent cet effet d’écran. On retrouve bien, alors, que pour des forces à courte portée, le mode collectif a une énergie qui tend vers 0 quand q → 0. Il s’agit du mode de Goldstone correspondant à la symétrie continue de translation. C’est bien l’effet d’écran des électrons, qui, en supprimant la partie longue portée de l’interaction coulombienne entre ions, permet à l’énergie de ce mode de s’annuler pour q = 0. Si on tient compte de la dépendance en fréquence de εe (q, ω), on obtient : 1) une légère modification de la fréquence. 2) une petite partie imaginaire donnant lieu à un amortissement. Pour les petites valeurs de q, on trouve la relation de dispersion : ω sq
(6.190)
p q0
(6.191)
où la vitesse du son s est donnée par : s= avec
"
q02
ωp =3 vF
#2 =
soit, 1 p 1 s=√ vF = √ 3 ωp 3
4kF me 2 π h¯ 2 "
Zm M
(6.192)
#1 2
vF
(6.193)
ce qui correspond à un ordre de grandeur de quelques 10−3 vF dans les métaux usuels. Dans le cas du cuivre, les valeurs numériques donnent : s 2103 m/s. Pour un modèle aussi simpliste, on obtient donc un bon ordre de grandeur.
260
6. Le gaz d’électrons
Si on ne considère plus seulement la limite q → 0, il faut tenir compte de la dépendance en vecteur d’onde de εe (q, 0). On écrit encore : p ω= - εe q, 0 mais avec : q2 εe q, 0 = 1 + 02 q
+
1 kF + 2 2q
(
q2 1− 2 4kF
)
, q + 2kF Ln q − 2kF
L’existence d’une surface de Fermi, qui se traduit par une singularité logarithmique à q = 2kF dans χ (q, 0) et εe (q, 0) est également reflétée dans le spectre de phonons : cette singularité se produit pour les vecteurs d’onde Q tels que la surface de Fermi définie par εk = μ et cette surface translatée de Q , Q , définie par εk+Q = μ sont tangentes, c’est-à-dire quand Q est un « diamètre » de la surface de Fermi. Pour des électrons libres, cette singularité, dite de Kohn [10] se produit pour |Q | = 2kF . C’est W. Kohn qui a souligné qu’il devait exister des anomalies dans le spectre de phonons, qui sont le reflet d’anomalies correspondantes dans la constante diélectrique statique du système électronique (figure 6.16). L’origine de cette singularité résidant dans la discontinuité de la distribution de Fermi, nous sommes amenés à en déduire que cette singularité doit être caractéristique de tous les systèmes de fermions normaux et n’est absolument pas restreinte à la RPA. W. Kohn a suggéré qu’il était possible d’observer des images de la surface de Fermi dans le spectre de phonons des métaux. De telles images ont bien été observées dans le plomb par Brookhouse et al. [15], cas particulièrement favorable (pour un métal tridimensionnel) parce que le couplage électron-phonon y est fort. À trois dimensions, on obtient une singularité de pente dans χ 0 q, 0 , car et Q sont tangentes en un point (figure 6.17).
Fig. 6.16 Anomalie de Kohn dans le spectre de phonons.
261
Physique de la matière condensée
Fig. 6.17 Anomalie de Kohn à trois dimensions.
Fig. 6.18 Anomalie de Kohn à deux dimensions.
Cependant, pour les systèmes de basse dimensionalité, on s’attend à des anomalies beaucoup plus importantes. À deux dimensions, χ 0 q, 0 présente un point anguleux, car et Q sont tangentes selon une génératrice de la surface de Fermi cylindrique (figure 6.18). À une dimension, les surfaces planes et Q sont tangentes selon un plan (figure 0 6.19) : χ q, 0 présente une divergence logarithmique (figure 6.20). Cette divergence se traduit, dans le spectre de phonons, par un mode de phonon qui s’annule à q = 2kF , c’est-à-dire à une instabilité du réseau. Dans la pratique, les conducteurs ne sont pas rigoureusement unidimensionnels. Il existe un couplage entre chaînes t⊥ , qui rend non plane la surface de Fermi (figure 6.21).
262
6. Le gaz d’électrons
Fig. 6.19 Surface de Fermi plane pour un conducteur unidimensionnel
Fig. 6.20 Divergence logarithmique de χ 0 (q = 2kF )à température nulle, dans un conducteur unidimensionnel.
Fig. 6.21 Surface de Fermi quasi-unidimensionnelle.
Celle-ci présente des ondulations qui empêchent la susceptibilité sans interaction χ0 (q = 2kF ) de diverger, même pour q = 2kF (figure 6.22). De même à température finie, l’adoucissement de la surface de Fermi arrondit la singularité de Kohn.
263
Physique de la matière condensée
Fig. 6.22 Anomalie de Kohn pour une surface de Fermi quasi-unidimensionelle.
Cette divergence logarithmique de χ 0 (q = 2kF ) ne se produit pas seulement pour des métaux unidimensionnels, mais chaque fois que les surfaces et Q définies plus haut s’emboîtent parfaitement, sans pour cela être forcément planes, c’est-à-dire quand, quel que soit k : εk − μ = −(εk+Q − μ)
(6.194)
On dit qu’on a alors « nesting » parfait, ou « emboîtement » parfait en français, de la surface de Fermi. Dans ce cas, infiniment près de la surface de Fermi mais à l’intérieur de celle-ci, εk − μ → 0− et le facteur d’occupation de Fermi-Dirac fFD (εk ) = 1, alors que εk+Q − μ → 0+ et fFD (εk+Q ) = 0 ; de sorte que pour ces valeurs de k, le numérateur de : χ 0 (Q ) =
fFD (εk ) − fFD (εk+Q ) k
εk+Q − εk
est non nul et le dénominateur tend vers 0, d’où la divergence de χ 0 (Q ). Quand le « nesting » est presque parfait, c’est-à-dire quand t⊥ , énergie caractéristique de la violation de la condition de « nesting » parfait, est très petite devant la largeur de bande, χ 0 (Q ) se comporte comme Ln(t⊥/εF ). Toutes ces singularités ou ces pics de χ 0 (Q ) se traduisent dans le spectre de phonons. Ces singularités sont alors beaucoup plus fortes que celles observées, dans les années soixante, dans les métaux tridimensionnels. Des effets beaucoup plus spectaculaires ont été mis en évidence dans les conducteurs quasi-unidimensionnels, très largement étudiés à partir du milieu des années soixante-dix, et qui font encore aujourd’hui l’objet de recherches très actives. Un des effets importants, étroitement relié à ce que nous venons de discuter dans ce paragraphe, est l’instabilité de Peierls, qui se produit dans de nombreux conducteurs quasi-unidimensionnels, en bouleversant leurs propriétés physiques.
264
6. Le gaz d’électrons
6.5 Instabilités de Peierls La singularité qui se produit dans le spectre de phonons peut se traduire, dans certains cas, par une instabilité du système couplé gaz d’électrons + réseau cristallin [16]. Pour discuter cette instabilité, il convient d’introduire explicitement le réseau d’ions du cristal. On considère un système unidimensionnel (ou présentant la propriété de nesting parfait, ce qui revient au même) décrit par l’hamiltonien : g + + + (6.195) εk akσ akσ + ωq bq+ bq + √ ak+qσ akσ bq + b−q H = L q k,σ k,q,σ + Ici akσ et akσ sont les opérateurs de création et d’annihilation d’électrons dans l’état de Bloch k avec le spin σ et l’énergie εk (l’origine des énergies est prise au niveau de Fermi). εk est la transformée de Fourier de l’intégrale de transfert tij . bq+ et bq sont les opérateurs de création et d’annihilation d’un phonon de vecteur d’onde q et d’énergie ωq . L est la longueur du système. Les deux premiers termes décrivent les systèmes d’électrons et de phonons sans interaction (donc non couplés).
Le troisième terme est un terme de couplage électron-phonon. Il s’introduit, par exemple, si on prend en compte la dépendance de l’intégrale de transfert t (Rij ) en fonction de la distance Rij qui est modulée par les déplacements ui et uj des atomes i et j associés aux phonons : Rij = Rijo + (uj − ui ) où Rijo est la valeur d’équilibre de Rij . Ceci introduit alors un terme u(x ) · ∇t dans l’hamiltonien, responsable du couplage électron-phonon. On supposera la constante de couplage g indépendante de q.
6.5.1 État fondamental à température nulle Le calcul de la susceptibilité diélectrique des électrons sans interaction montre, pour un système unidimensionnel, une divergence à température nulle, pour le vecteur d’onde q = 2kF. Cette divergence de la fonction de réponse implique nécessairement une instabilité du système à température nulle et une annulation de l’énergie de phonon pour ce vecteur d’onde. On s’attend donc à ce qu’il apparaisse une distorsion spontanée du réseau montrant cette modulation de vecteur d’onde q = 2kF. Il est par conséquent important d’étudier l’état fondamental du système unidimensionnel, ce qui nécessite, dans un premier temps, de se placer à T = 0. On fait sur l’hamiltonien, une approximation de champ moyen en prenant la valeur moyenne des opérateurs de phonons : on suppose qu’il existe une modulation statique du réseau d’amplitude finie pour le vecteur d’onde 2kF , comme les calculs précédents
265
Physique de la matière condensée
nous incitent à le faire. Ce calcul de champ moyen implique que le fondamental de champ moyen n’a plus la symétrie des électrons sans interaction, mais que le terme de couplage avec les phonons a brisé une symétrie en induisant une distorsion de vecteur d’onde q = 2kF . Comme le champ de déplacement u(x ) s’écrit : u(x ) =
.
q
1 + bq + b−q exp −iqx 2Lωq
(6.196)
cette modulation statique, présente dans l’état fondamental, est décrite par : & ' / + 0∗ b2kF = b−2k = 0 F En champ moyen, on néglige les fluctuations autour de cette valeur moyenne ainsi que les autres modes de phonons (qui, eux, contrairement aux modes à ±2kF , ne sont pas macroscopiquement occupés), si bien que l’hamiltonien de champ moyen se réduit à : & '2 + HCM = εk akσ akσ + 2ω2kF b2kF k,σ
& ' & ' 2g + + ak+2kF ,σ akσ b2kF + ak−2k +√ a b (6.197) kσ −2k F F ,σ L k,q,σ Cette approximation de champ moyen réduit l’hamiltonien à un hamiltonien à un électron, mais qui n’est pas diagonal dans l’ancienne base. En effet, la modulation du réseau de vecteur d’onde 2kF mélange les états k avec les états k ± 2kF . Nous devons donc trouver la base des états qui diagonalisent HCM et calculer les nouvelles énergies propres à un électron Ek . Il est possible de calculer Ek de façon perturbative, en traitant le terme de couplage proportionnel à g en perturbation devant l’énergie de bande. L’effet le plus important de cette perturbation est dû au mélange entre états presque dégénérés de vecteurs d’onde |k| kF (voir figure 6.23), qui pour une modulation d’amplitude suffisamment faible, peuvent être traités dans l’approximation des électrons presque libres. Ceci conduit à : HCM
k,σ
avec :
+ Ek ckσ ckσ + L
ω2kF | |2 2g 2
1 2 2 Ek = signe |k| − kF vF2 |k| − kF + | |2
(6.198)
(6.199)
Ici, on a linéarisé la relation de dispersion électronique εk autour du niveau de Fermi : (6.200) εk vF |k| − kF
266
6. Le gaz d’électrons
Fig. 6.23 Relation de dispersion des électrons avant couplage (trait plein). Les effets principaux de la perturbation se produiront sur les états aux croisements de cette courbe avec les courbes translateés de +2kF et −2kF (tirets).
Cette linéarisation reste valable tant que l’énergie ne s’éloigne pas trop du niveau de Fermi, soit pour |εk | < εc . Cette énergie de coupure est de l’ordre d’une fraction de la demi-largeur de bande εc γ EF . Cette approximation n’est pas essentielle. Elle a pour intérêt de simplifier les calculs sans modifier sensiblement les propriétés physiques réelles du système. On a défini le paramètre d’ordre : ' & 2g b2kF = √ L
(6.201)
qui a la dimension d’une énergie. + et ckσ sont les opérateurs de création et d’anihilation d’électrons Les opérateurs ckσ dans des états, qui sont combinaisons linéaires des anciens états k et k ± 2kF , et qui diagonalisent HCM .
La modulation du réseau ouvre un gap de largeur 2 | | dans le spectre électronique au niveau de Fermi (figure 6.24). L’origine de ce gap est le même que dans la théorie des bandes des cristaux : la réflexion de Bragg associée à la nouvelle périodicité créée par la modulation périodique du réseau. Évidemment, l’énergie des électrons est abaissée par l’ouverture du gap, puisque seuls les états dont l’énergie est abaissée par la modulation sont peuplés. Ceux dont l’énergie électronique est augmentée par la distorsion sont tous inoccupés à T = 0. Par contre, la modulation du réseau cause une augmentation de l’énergie élastique décrite par le second terme : ω2kF | |2 (6.202) L 2g 2
267
Physique de la matière condensée
Fig. 6.24 Effet du couplage sur la relation de dispersion électronique : un gap est ouvert au niveau de Fermi.
Considérons l’énergie totale du système électronique : +k F Ek Eel = 2 −kF
L =− π
+kF
(6.203)
−kF
1 2 2 vF2 |k| − kF + | |2 dk
# EF EF2 + | |2 + | |2 arcsinh | | ( )) ( 2 | |2 2EF LEF =− + O 1 + 2 Ln | | 2 EF EF
=−
L π vF
(6.204)
"-
(6.205) (6.206)
où EF = vF kF est l’énergie de Fermi mesurée à partir du bas de la bande. L’énergie électronique gagnée est, pour petit, toujours supérieure à la perte d’énergie élastique, car elle est proportionnelle à − | |2 Ln | |, alors que l’énergie élastique, elle, est seulement proportionnelle à | |2 , si bien qu’en champ moyen, le système est instable vis à vis d’une modulation du réseau pour un couplage électron-phonon arbitrairement faible. On obtient la valeur du gap (et de l’amplitude de modulation) en minimisant l’énergie totale. Cette minimisation conduit à : | | = 2EF exp − avec λ=
268
2g 2 π vF ω2kF
1 λ
(6.207)
(6.208)
6. Le gaz d’électrons
Notons que le gain d’énergie logarithmique n’apparaît que si le gap est ouvert exactement à ±kF : le vecteur d’onde de la modulation du réseau q = 2kF est donc fixé par le remplissage de la bande d’électrons, de façon à obtenir l’abaissement d’énergie électronique maximum. L’amplitude de la modulation est donnée par : 1 2 | | u(x ) = (6.209) cos 2kF x + ϕ ω2kF g où · · · signifie la valeur moyenne dans l’état fondamental et ϕ est la phase de = | | exp i ϕ. Remarquons que l’énergie du système ne dépend pas de la phase du paramètre d’ordre, mais seulement de l’amplitude | | . Un changement de phase correspond à une translation de la modulation du réseau, et de l’onde de densité de charge par rapport au référentiel du laboratoire. Le fait que l’énergie ne dépende pas de la phase traduit l’invariance par translation du système. Celle-ci reste vraie tant que la longueur d’onde de la modulation et la constante du réseau sous-jacent a sont incommensurables. Un changement de la phase uniforme dans l’espace ne coûte pas d’énergie, et une modulation de la phase de grande longueur d’onde ϕ(x ) = ϕ0 exp i κx , avec κ 2kF , coûte très peu d’énergie. De tels modes sont appelés des « phasons ». La fréquence des oscillations de la phase pour κ 2kF est de la forme : 2 m vF |κ| ωϕ (κ) = m∗ où la masse effective m ∗ de l’onde de densité de charge est $ % 2 ∗ m = m 1 + 4 ω2kF et m est la masse effective de l’électron due au potentiel du réseau. Le phason est le mode de Goldstone qui résulte de la brisure de l’invariance par translation de l’hamiltonien original. Non seulement la phase, mais aussi l’amplitude de la modulation peuvent osciller. Toutefois la valeur d’équilibre de | | est bien déterminée, si bien qu’il existe une force de rappel finie qui s’oppose aux déviations par rapport à l’équilibre, et la fréquence d’oscillation du mode d’amplitude est donnée par : 3 ωA (κ) =
2 ω2k F
2 4 m vF κ + 3 m∗
41 2
qui reste finie quand κ → 0. Un tel mode est appelé « amplitudon ». Ce n’est en aucune façon un mode de Goldstone.
269
Physique de la matière condensée
w(q)
wA (q)
wf(q)
2 kF
Fig. 6.25
q
Relation de dispersion des modes de phason et d’amplitudon dans une phase de Peierls non commensurable.
Le spectre des modes d’oscillations couplées du réseau et de la densité d’électrons a l’allure indiquée dans la figure 6.25.
6.5.2 Température finie La description à température nulle de l’état ordonné de Peierls reste qualitativement valable (dans une description de champ moyen) à température finie mais faible, tant que l’ordre à grande distance n’est pas détruit. Toutefois, à suffisamment haute température, on s’attend à la destruction complète de l’ordre pour la raison suivante : les électrons excités thermiquement au-dessus du gap ont une énergie | |, donc ces électrons abaissent leur énergie en réduisant l’amplitude du gap à l’équilibre thermodynamique. On s’attend donc à ce que le gap décroisse quand la température augmente. Cette décroissance du gap va encore faciliter l’excitation de nouveaux électrons à travers le gap, ce qui aura, à nouveau pour effet de réduire l’amplitude du gap à l’équilibre. Il se produit donc un mécanisme coopératif qui va détruire inéluctablement l’état de Peierls : on s’attend à ce que le gap et l’ordre à grande distance disparaissent complètement au-dessus d’une certaine température. Il est possible de trouver ce résultat très simplement. L’approximation de champ moyen du paragraphe précédent aboutit à un hamiltonien à un électron, que nous avons diagonalisé de façon approchée. Les valeurs propres correspondantes sont ±Ek . Nous avons donc à calculer l’énergie libre de ce gaz d’électrons indépendants, dans l’ensemble grand-canonique : ln 1 + exp −βEk + ln 1 + exp +βEk (6.210) Fe´ lectronique = −kB T k
270
6. Le gaz d’électrons
À cette énergie libre électronique, il convient d’ajouter l’énergie élastique de la distortion, pour obtenir l’énergie libre totale de la phase distordue : FT = Fe´ lectronique + L
ω2kF | |2 2g 2
(6.211)
Enminimisant, FT par rapport à , on trouve l’équation donnant la valeur du gap T en fonction de la température : √ εc 1 dε ε2 + 2 = (6.212) √ tanh 2 2 2k T λ ε + B 0 La variation de T est donnée sur la figure 6.26.
Fig. 6.26 Variations du paramètre d’ordre avec la température.
Le gap est maximal à température nulle, puis décroît quand T augmente, comme nous l’avions prévu, puis s’annule à la température critique, dite température de Peierls Tp . Cette température est donnée par l’équation du gap obtenue pour =0 : εc 1 ε dε = tanh (6.213) ε 2kB Tp λ 0 5y c’est-à-dire, avec 0 dxx tanh x2 = ln 1, 13y , kB Tp = 1, 13εc exp −
1 λ
(6.214)
Intéressons nous maintenant au système couplé électrons + réseau et, en particulier au comportement des modes propres de vibrations à température non nulle, couplés aux électrons. Nous avons vu que la polarisabilité des électrons s’écrit : 2 fFD εk − fFD εk+q 0 (6.215) χ q, ω = L εk+q − εk − ω k
271
Physique de la matière condensée
Au voisinage de q = 2kF , on obtient, dans le cadre de l’approximation de la relation de dispersion linéarisée : " # 2γ EF 1 1 0 (6.216) Ln χ ±2kF + q, ω = − + π vF πT 2 ( ( ) ), 1 1 i vF q − ω 1 1 i vF q + ω − + − − 2 2 4π T 2 2 4πT valable pour Max {vF q, ω, T } EF . Dans cette expression, (x ) est la fonction digamma et γ la constante d’Euler. χ 0 (±2kF, 0) diverge logarithmiquement comme nous l’avons déjà remarqué. Considérons les propriétés dynamiques du réseau à température finie. L’équation du mouvement d’une composante de Fourier du déplacement s’écrit : 2g ωq ∂2 + − 2 − ωq2 bq (t ) + b−q (t ) = √ nq (t ) (6.217) ∂t L ou, par transformation de Fourier : 2g ωq + = √ nqω ω2 − ωq2 bqω + b−qω L
(6.218)
La composante de Fourier de la densité d’électrons nqω agit comme une force sur le réseau. Par ailleurs, la densité électronique dépend du déplacement. En posant : √ + (t ) V q, t = g L bq (t ) + b−q
(6.219)
le couplage électron-phonon se met sous la forme : 1 V q, t nq L q
(6.220)
Le déplacement agit comme un potentiel extérieur sur les électrons. Au plus bas ordre, la relation entre déplacement et densité électronique est donnée par : √ + (6.221) nqω = g Lχ 0 q, ω bqω + b−qω En reportant ceci dans l’équation du mouvement du déplacement, on obtient :
+ =0 (6.222) ω2 − ωq2 − 2g 2 ωq χ 0 q, ω bqω + b−qω Cette approximation est équivalente à la RPA.
272
6. Le gaz d’électrons
On obtient donc les fréquences de phonons du système couplé 4 3 2 12 2kF + q = ± 0 2kF + q − −i 4 2
(6.223)
où l’on a posé 02
2 2kF + q = ω2k F
+
$
%, 7ζ 3 vF q 2 πT 1 + λ Ln + 2γ EF 16π 2 T
(6.224)
valable pour | |, vF q π T. À cause de la possibilité de diffusion en paires électron-trou, les phonons ont maintenant un temps de vie fini −1 . Le spectre présente un minimum marqué à 2kF . C’est l’anomalie de Kohn, particulièrement forte à une dimension à cause de la possibilité d’exciter tous les électrons d’un côté de la distribution de Fermi vers l’autre d’un même vecteur d’onde, sans fournir d’énergie. Les phonons autour de 2kF ne représentent pas seulement des déplacements du réseau, mais doivent être considérés comme des oscillations collectives fortement couplées du réseau et de la densité électronique. C’est ce couplage qui est responsable du minimum à 2kF . Quand la température diminue, le minimum devient de plus en plus profond, et à une température critique Tc , on obtient finalement l’annulation de la fréquence de phonon : 2kF = 0 ce qui indique l’instabilité du système homogène vis-à-vis d’une modulation de vecteur d’onde 2kF : on dit que le mode de phonon devient mou (voir figure 6.27).
Fig. 6.27 Allure du spectre de phonons acoustiques à l’approche d’une transition de Peierls ; à haute temperature (T1 Tc ) proche du point critique (T2 Tc ).
On obtient :
2γ 1 1 EF exp − 1, 13EF exp − (6.225) π λ λ Les propriétés caractéristiques de l’état de Peierls : modulation du réseau, gap électronique, absence d’ordre magnétique, mode de phonon qui s’amollit, ont été observées expérimentalement dans un grand nombre de systèmes quasi-unidimensionnels. kB Tc =
273
Physique de la matière condensée
En réalité, le traitement que nous avons discuté ici est un traitement de champ moyen pour un système strictement unidimensionnel. On sait que, pour de tels systèmes, les fluctuations détruisent toute possibilité d’ordre à grande distance. En réalité, il ne peut exister de phase ordonnée que si on tient compte d’un couplage entre chaînes, par exemple d’un effet tunnel électronique. L’hamiltonien de bande s’écrit alors : + + t// ci+1,m ci,m + c.c. + t⊥ ci,m ci,m + c.c. . (6.226) H0 = i,m,m
i,m
où i repère un site sur la chaîne m, et où m repère une chaîne voisine de la chaîne m. Une valeur finie de t⊥ permet l’existence de l’ordre à grande distance, mais tend à détériorer les propriétés de nesting. Dans une théorie de champ moyen qui prend en compte t⊥ , on montre qu’il existe une valeur critique de t⊥ au-dessus de laquelle le nesting n’est plus assez bon pour permettre un état de Peierls à température finie. La variation de la température d’ordre avec t⊥ a l’allure donnée schématiquement dans la figure 6.28. (b)
T
(a) Tc
métal métal état de Peierls
état de Peierls
g
métal t^ t^ critique
t^
Fig. 6.28 Transition de Peierls d’un conducteur quasi-unidimensionnel : a) variations de la température critique en fonction du couplage transverse entre chaînes ; b) diagramme de phase.
6.5.3 Observations expérimentales La théorie de l’instabilité de Peierls [16] et de la phase à laquelle elle donne naissance a été élaborée, à l’origine, pour décrire les propriétés d’un métal supposé quasi-unidimensionnel, le bismuth. En fait, c’est avec l’étude intensive des conducteurs organiques quasi-unidimensionnels que vont être mises en évidence les nombreuses propriétés expérimentales prévues dans l’état de Peierls. Les premiers conducteurs organiques où cet état a été clairement mis en évidence sont KCP
274
6. Le gaz d’électrons
Fig. 6.29 Structure cristalline de KCP.
(i.e. K2 Pt CN 4 Br0,30 3, 2H2 O) et TTF − TCNQ (tétra-thia-fulvalène-tétracyano-quinodiméthane). Ces deux composés organiques se comportent comme des systèmes électroniques fortement unidimensionnels [17, 18]. Leurs comportements diffèrent de ce qui est habituellement observé dans d’autres conducteurs moléculaires sur deux points : d’une part, de nombreuses évidences expérimentales incontestables de propriétés métalliques et, d’autre part, un changement structural clair, accompagnant une transition métal-isolant. L’origine de cette transition a été attribuée sans ambiguité à une transition de Peierls, comme nous le discutons ci-dessous. La découverte de la transition de Peierls dans KCP et dans TTF − TCNQ a été suivie d’observations analogues dans d’autres conducteurs organiques, tels que TSeF − TCNQ , HMTTF − TCNQ , HMTSF − TCNQ , NMP − TCNQ , TMTSF − DMTCNQ , ainsi quedans des conducteurs inorganiques anisotropes comme TaS3 , NbSe3 , K0,3 MoO3, TaSe4 3 I et NbSe4 3 I [19]. Dans ce qui suit, nous avons choisi d’exposer le cas de TTF − TCNQ . La figure 6.30 montre la structure cristalline [20] de ce composé. Les deux molécules organiques, TTF et TCNQ , forment chacunes leurs empilements unidimensionnels selon la direction de l’axe cristallographique b. La partie supérieure de la figure 6.30 montre le plan (a, c) : les molécules TTF et TCNQ sont planes et orientées parallèlement à ce plan. Ces molécules forment deux types de chaînes unidimensionnelles selon l’axe b, c’est-à-dire perpendiculaires à ce plan. La partie inférieure de la figure montre le plan (b, c). Les chaînes unidimensionnelles permettent un recouvrement important entre les orbitales π des molécules organiques, parallèlement à l’axe b. Par contre, les recouvrements selon les directions a et c sont beaucoup plus faibles. Ce composé, aux propriétés électroniques très anisotropes, montre une claire évidence de comportement métallique pour des températures supérieu-res à 55 K. La figure 6.31 montre la dépendance en température de la conductivité électrique dans la direction b, qui reste croissante quand la température décroît, jusqu’à environ 60 K [21]. Le caractère métallique est confirmé par de nombreuses autres évidences expérimentales, telles que la réflectivité optique, la susceptibilité magnétique de spin et le pouvoir thermoélectrique [22]. Des mesures similaires à plus basse température
275
Physique de la matière condensée
TTF
TCNQ
a c
b c
Fig. 6.30 Structure cristalline de TTF-TCNQ.
suggèrent fortement l’ouverture d’une bande interdite au niveau de Fermi. Les expériences montrent qu’une transition métal- isolant se produit à 53 K. En dessous de cette température, le comportement de la résistivité électrique est clairement celui d’un isolant (voir figure 6.31) [21]. Des études de diffusion diffuse de rayons X et de diffusion élastique de neutrons révèlent l’apparition d’un changement structural accompagnant la transition métalisolant. Dans l’état isolant, en-dessous de 53 K, un ensemble de réflexions satellites a été découvert, démontrant la formation d’un super-réseau de période b = 3, 4 b [23]. La superstructure est formée par un déplacement moléculaire sinusoïdal, dont
1 b ∗. le vecteur d’onde a une composante selon b donnée par Qb = 0, 295 b ∗ = 3,4 La dépendance en température de l’intensité des réflexions satellites a été mesurée. Elle suit le carré de l’amplitude du déplacement moléculaire [23] [24].
Dans l’état métallique, en-dessous d’environ 150 K, un ensemble de traînées diffuses ont été observées par des études de rayons X. Ces traînées suggèrent l’apparition de distorsions périodiques du réseau, de vecteur d’onde Qb = 0, 295 b ∗ , mais qui n’ont pas de corrélations entre elles perpendiculairement à l’axe b unidimensionnel [23]. Parallèlement à l’observation de ces traînées diffuses en rayons X, des études de diffusion inélastique de neutrons ont révélé la décroissance de la fréquence de phonon de vecteur d’onde Qb = 0, 295 b ∗ , quand la température décroît.
276
6. Le gaz d’électrons
Fig. 6.31 Variations avec la température de la conductivité de TTF-TCNQ selon l’axe b.
Fig. 6.32 Anomalie de Kohn dans le spectre de phonons transverses acoustiques de TTF-TCNQ, obtenu par diffusion de neutrons.
La figure 6.32 montre le spectre de phonons transverses acoustiques à 120 K et à 83 K [25], avec la claire évidence d’une anomalie de Kohn [10] pour ce vecteur
277
Physique de la matière condensée
d’onde. On est amené à interpréter la transition métal-isolant comme la condensation d’un mode de phonon, qui s’amollit à la température de transition, à 53 K, causant l’apparition de la superstructure décrite ci-dessus. Si on interprète la transition observée dans TTF − TCNQ comme une transition de Peierls, on est amené à attribuer à 2kF la valeur expérimentalement observée pour le vecteur d’onde de la distorsion, soit, 0, 295b ∗. Cette valeur conduit à un remplissage de 29,5% de la première zone de Brillouin. On s’attend donc à des valences moyennes de +0,59 pour TTF et −0, 59 pour TCNQ . Ceci est bien vérifié par les mesures de spectroscopie de photoélectrons de rayons X (XPS) [26].
Bibliographie 1. J. Bardeen, Phys. Rev. 50, 1098 (1936) 2. D. Pines, Advances in Solid State Physics, édité par F. Seitz et D. Turnbull (Academic Press, New York, 1955), Vol. 1, p. 373 3. d’aprés D. Pines, Elementary excitations in solids, Perseus Books, 1966) 4. R.A. Ferrell, Phys. Rev. 107, 450 (1957) ; K. Sawada„ K.A. Brueckner, N. Fukude, et R. Brout, Phys. Rev. 108, 507 (1957) 5. L.D. Landau, J. Phys. USSR 10, 25 (1946) 6. L.D. Landau, Sov. Phys. JETP 5, 101 (1957) 7. W.R. Abel, A.C. Anderson et J.C. Wheatley, Phys. Rev. Lett. 17, 74 (1966) 8. K. Sköld, C.A. Pelizzari, R. Kleb et G.E. Ostrowski, Phys. Rev. Lett. 37, 842 (1976) ; K. Sköld et C.A. Pelizzari, Proc. Int. Symposium on Quantum Fluids and Solids (Sanibel Island, Florida, 1977) 9. J. Lindhard, Kgl. anske Videnskab. Selskab., Mat-fys. Medd. 28, 8 (1954) 10. W. Kohn, Phys. Rev. Lett. 2, 393 (1959) ; E.J. Woll et W.Kohn,Phys. Rev.126, 1693 (1962) 11. J. Friedel, Nuovo Cimento Suppl. 7, 287 (1958) 12. T. Rowland, Phys. Rev. 119, 900 (1960) ; W. Kohn et S.H. Vosko, Phys. Rev. 119, 912 (1960) 13. P. Nozières et D. Pines, Nuovo Cimento, 9, 470 (1958) 14. S. Ueda, Prog. Theoret. Phys. 26, 45 (1961) 15. B.N. Brookhouse, K.R. Rao et A.D.B. Woods, Phys. Rev. Lett. 7, 93 (1961) ; B.N. Brookhouse, T. Arase, G. Caglioti,K.R. Ras et A.D.B. Woods, Phys. Rev. 128, 1099 (1962) 16. R.E. Peierls, Quantum Theory of Solids (Clarendon Press, Oxford, 1955), Chap. 5 p. 108 17. Voir, par exemple, J. Bernasconi, P. Bruesch et H.R. Zeller, J. Phys. Chem. Solids, 35, 145 (1974) ; H.R. Zellerand A. Beck, J. Phys. Chem. Solids 35, 77 (1974) 18. F.Wudl, G.M.Smith et E.J. Hufnagel, J.C.S. Chem. Commun. 1453 (1970) ; J.P. Ferreris, D.O. Cowan, V. Walatka, J.H. Perlstein, J. Am Chem. Soc. 95, 948 (1973) ; L.B. Coleman, M.J. Cohen, D.J. Sandman, F.G. Yamagishi, A.F. Carito et A.J. Heeger, Solid State Commun. 12, 1125 (1973)
278
6. Le gaz d’électrons
19. Pour une revue, voir, par exemple, J.P. Pouget et R. Comès, Charge Density Waves in Solids, Ed. L.P. Gor’kov et G. Gruner, in Modern problems in Condensed Matter Sciences, Ed. V.W.M. Agranovich et A.A. Maradudin (North Holland, Amsterdam, Oxford, New York, Tokyo, 1989) ; S. Kagoshima, H. Nagasawa et T. Sambongi, One Dimensional Conductors (Springer-Verlag, Berlin, Heidelberg, 1988) ; G. Gruner, Density Waves in Solids (Addison-Wesley, Massachusetts, 1994) ; J.P. Farges, Organic Conductors (Marcel Dekker, New York, Basel, Hong Kong, 1994) 20. M.J. Cohen, L.B. Coleman, A.F. Garito et A.J. Heeger, Phys. Rev. B 10, 1298 (1974) 21. T. Ishiguro, S. Kagoshima et H. Anzai, J. Phys. Soc. Japan 41, 351 (1976) 22. A.A. Bright, A.F. Garito et A.J. Heeger, Solid State Commun. 13, 943 (1973) ; D.B. Tanner, C.S. Jacobsen, A.F. Garito et A.J. Heeger, Phys. Rev. B 13, 3381 (1976) ; Y. Tomkiewicz, B.A. Scott, L.J. Tao et R.S. Title, Phys. Rev. Lett. 32, 1363 (1974) ; J.C. Scott, A.F. Garito et A.J. Heeger, Phys. Rev. B 10, 3131 (1974) ; J.F. Kwak, P.M. Chaikin, A.A. Russel, A.F. Garito et A.J. Heeger, Solid State Commun. 16, 729 (1975) ; P.M. Chaikin, R.L. Grene, S. Etemad et E.M. Engler, Phys. Rev. B 13, 1627 (1976) 23. F. Dénoyer, R. Comès, A.F. Garito et A.J. Heeger, Phys. Rev. Lett. 35, 445 (1975) ; S. Kagoshima, H. Anzai, K. Kajimura et T. Ishiguro, J. Phys. Soc. Japan, 39, 1143 (1975) ; S. Kagoshima, T. Ishiguro et H. Anzai, J. Phys. Soc. Japan, 41, 2061 (1976) ; J.P. Pouget, S.K. Khanna, F. Dénoyer, R. Comès, A.F. Garito et A.J. Heeger, Phys. Rev. Lett. 37, 437 (1976) ; S.H. Khanna, J.P. Pouget, R. Comès, A.F. Garito et A.J. Heeger, Phys. Rev. B 16, 1468 (1976) 24. R. Comès, S.M. Shapiro, G. Shirane, A.. Garito et A.J. Heeger, Phys. Rev. Lett. 35, 1518 (1975) ; W.D. Ellenson, R. Comès, S.M. Shapiro, A.F. Garito et A.J. Heeger, Solid Sate Commun. 20, 53 (1976) ; R. Comès, G. Shirane, S.M.Shapiro, A.F. Garito et A.J. Heeger, Phys. Rev. B 14, 2376 (1976) 25. G. Shirane, S.M. Shapiro, G. Shirane, R. Comès, A.F. Garito, et A.J. Heeger, Phys. Rev. B 14, 2325 (1976) 26. W.D. Grobman et B.Q.D. Silvermann, Solid State Commun. 19, 319 (1976)
279
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Théorie de Landau des liquides de Fermi 7.1 Introduction Ici, les longueurs r sont exprimées par des nombres sans dimension rs = est le rayon de l’orbite de Bohr de l’atome d’Hydrogène ao =
h2
r ao ,
où ao
mez .
Les théories de champ moyen des systèmes d’électrons itinérants en interaction peuvent être considérées comme des développements perturbatifs en puissances de rs , essentiellement valables quand le terme d’énergie cinétique est beaucoup plus grand que le terme d’interaction, c’est-à-dire pour rs 1, donc dans la limite des fortes densités. En pratique, cette condition n’est jamais remplie pour les systèmes de fermions accessibles aux expériences de laboratoire. Dans les métaux usuels, les valeurs typiques de rs sont plutôt comprises entre 2 et 5. Pourtant, ces modèles de champ moyen semblent constituer une description au moins qualitativement valable de la réalité expérimentale, et même, dans une large mesure, quantitative, si l’on utilise des grandeurs à un électron renormalisées. Il semble donc que la validité du champ moyen soit nettement plus étendue qu’on ne le prévoirait sur la base des critères théoriques habituels de validité. C’est en fait la théorie de Landau des Liquides de Fermi normaux [1, 2, 3] qui justifie l’application d’une théorie de type champ moyen dans des domaines où les corrélations électroniques seraient en principe trop fortes pour pouvoir être négligées, comme elles le sont dans un traitement de Hartree-Fock.
281
Physique de la matière condensée
L’idée de Landau est de ne pas s’intéresser au calcul détaillé de l’état fondamental du « liquide de Fermi » (c’est-à-dire un système de fermions où les corrélations ne sont pas faibles), a priori extrêmement complexe, mais seulement aux excitations de faible énergie devant le niveau de Fermi ε EF , et dans la limite des basses températures kB T EF , puisque seules ces excitations déterminent les propriétés des métaux dans les conditions expérimentales usuelles. Le point important, qui est à la base de la théorie de Landau, est que la durée de vie de ces excitations, dans les limites indiquées, est très longue, en raison de l’exclusion de Pauli, qui limite fortement les processus de diffusion électron-électron, comme expliqué ci-dessous. On peut alors traiter ces excitations comme des « quasiparticules » faiblement couplées, pour lesquelles une théorie de champ moyen est applicable. Le prix à payer est que les paramètres de cette théorie de champ moyen de ces quasiparticules ne sont pas données par les paramètres du gaz d’électrons sans interaction, mais sont extrêmement difficiles à calculer. En fait, on renonce à les calculer ab initio. La théorie de Landau consiste à considérer ces paramètres comme déterminés de façon phénoménologique, c’est-à-dire ajustés pour rendre compte de quantités physiques connues expérimentalement.
7.2 Principe d’exclusion et diffusion électron-électron près du niveau de Fermi Considérons un système d’électrons sans interaction, puis, imaginons qu’on établisse de façon graduelle l’interaction entre électrons. On obtient deux effets : – Les niveaux d’énergie à un électron sont modifiés. C’est ce que nous obtenons, au moins de façon approchée, dans l’approximation de Hartree-Fock. – Les électrons subissent des diffusions, et les états à un électron ne sont plus des états propres. L’approximation de Hartree-Fock ne décrit pas cet effet puisqu’elle traite les états propres du système en interaction dans l’approximation des électrons indépendants. La question de savoir si ces diffusions invalident complètement la description en électrons indépendants dépend de la rapidité du taux de diffusion. S’il est assez faible, on peut introduire un temps de relaxation et traiter la diffusion électron-électron de la même façon que les autres mécanismes de diffusion. Si le temps de relaxation électron-électron est beaucoup plus grand que les autres temps de relaxation, comme c’est souvent le cas, on peut même en pratique l’ignorer. On pourrait penser que le taux de diffusion électron-électron est très élevé dans les solides usuels, puisque l’interaction de Coulomb, même écrantée, est plutôt forte. En réalité, grâce au principe d’exclusion, la diffusion des électrons près du niveau de Fermi est dramatiquement réduite, dans la plupart des cas qui nous intéresserons. Cette réduction se produit quand la configuration électronique ne diffère que faiblement de la distribution d’équilibre thermique (comme dans tous les phénomènes de transport usuels). Pour illustrer cet effet, supposons, par exemple, que l’état à N électrons consiste en une sphère de Fermi remplie (état d’équilibre à T = 0), plus
282
7. Théorie de Landau des liquides de Fermi
un électron célibataire dans un niveau d’énergie ε1 > εF . Pour que cet électron soit diffusé, il doit interagir avec un électron d’énergie ε2 , qui doit être inférieure à εF pour que cet état soit occupé. Le principe d’exclusion exige que ces deux électrons soient diffusés vers des états inoccupés, d’énergies ε3 et ε4 supérieures à εF . On doit donc avoir : ε2 ≤ εF , ε3 ≥ εF , ε4 ≥ εF avec la relation de conservation de l’énergie ε1 + ε2 = ε3 + ε4 Si on a exactement ε1 = εF , ces deux relations imposent nécessairement que ε2 , ε3 et ε4 soient aussi exactement égales à εF . Donc la région de l’espace réciproque permise pour les électrons 2, 3 et 4 occupe un volume nul (à savoir la surface de Fermi) et donne donc une contribution nulle à la section efficace de diffusion. Le temps de vie d’un électron à la surface de Fermi à T = 0 est infini. Quand ε1 diffère un peu de εF , un certain volume de l’espace des phases devient disponible pour le processus de diffusion, puisque les trois autres énergies peuvent varier dans une coquille d’épaisseur |ε1 - εF | autour de la surface de Fermi. Ceci conduit à un taux de diffusion d’ordre ∼ (ε1 − εF )2 , puisque, une fois que ε2 et ε3 ont été choisies dans cet intervalle d’énergie de largeur |ε1 − εF |, ε4 est fixée par la conservation de l’énergie. Si l’électron en excès ne se rajoute pas à une sphère de Fermi complètement remplie, mais à une distribution de Fermi à l’équilibre thermique à température non nulle, il y aura des états partiellement vides sur un intervalle de largeur kB T autour de εF , ce qui conduit à un taux de diffusion variant comme (kB T )2 , même si ε1 = εF . À température T , un électron d’énergie ε1 près de la surface de Fermi aura un taux de diffusion τ1 qui dépendra de son énergie et de la température de la façon suivante : 2 2 1 = a ε1 − εF + b kB T τ
(7.1)
où les coefficients a et b sont indépendants de ε1 et de T . Par conséquent, le temps de vie électronique limité par les interactions électron-électron peut être rendu aussi grand que l’on veut, à suffisamment basse température et suffisamment près de la surface de Fermi. Puisque seuls les électrons dont l’énergie ne diffère de εF que de kB T affectent de façon significative la plupart des propriétés métalliques, le temps de relaxation physiquement pertinent varie comme 1/T 2 . Une estimation grossière de ce temps de vie peut être donnée de la façon suivante : On suppose que la dépendance en température de τ est bien donnée par une loi en T −2 . On s’attend, au plus bas ordre en perturbation, dans le cadre de l’approximation de Born, à ce que τ dépende de l’interaction électron-électron comme le carré de 2 l’interaction écrantée, qui est partout inférieure à 4πq 2e où qo est le vecteur d’onde 0
283
Physique de la matière condensée
de Thomas-Fermi, ce qui conduit à : 2 1 ∼ kB T τ 2 ∼ kB T
4π e 2 q02
2 π 2 mkF
2 2 (7.2)
Une analyse dimensionnelle montre qu’on peut alors écrire le temps de relaxation sous la forme : 2 A kB T 1 (7.3) ∼ τ εF où A est un nombre sans dimension, qu’on peut supposer d’ordre 1. À température ambiante, kB T ≈ 10−2 eV, εF ≈1 eV, (kBεTF ) í ≈ 10−4 eV, ce qui conduit à τ ≈ 10−10 seconde, une valeur très élevée par rapport aux temps de relaxation typiques, à température ambiante, soit ≈ 10−14 seconde. Puisque ce temps croît comme T −2 quand T décroît, il est possible que la relaxation électronélectron joue peu de rôle à toute température. Du moins pour les niveaux d’énergie à moins de kB T de εF , les interactions électron-électron ne semblent pas invalider la description en électrons indépendants. Il manque, cependant, un maillon dans ce raisonnement, qui nous est précisément fourni par la théorie de Landau des liquides de Fermi. 2
L’argument de ce paragraphe nous indique que, si la description en électrons indépendants est, en première approximation, un bon point de départ, alors, du moins pour les niveaux près de l’énergie de Fermi, la diffusion électron-électron n’invalidera pas cette description, même si les interactions sont fortes. Toutefois, si l’interaction électron-électron est forte, il y a peu de chance que la description en électrons indépendants soit un bon point de départ. Landau est parti du fait qu’en effet, aux densités électroniques des métaux usuels, il était impossible de partir d’un point de vue d’électrons indépendants. Il a postulé alors l’existence de quantités, qu’il a appelé des quasiparticules, permettant de décrire les états excités des liquides de Fermi, qui, elles, pourraient valablement être considérées comme indépendantes, même si les interactions entre particules étaient fortes. En supposant qu’elles obéissent au principe d’exclusion, on peut alors leur appliquer l’argument de ce paragraphe. Nous essayerons dans ce qui suit de préciser ce concept de quasiparticule de Landau.
7.3 Les quasiparticules 7.3.1 Gaz parfait et Liquide de Fermi dégénéré La théorie de Landau des liquides de Fermi s’appuyant sur une analogie avec les états du gaz parfait, nous allons d’abord rappeler rapidement quelques notions de
284
7. Théorie de Landau des liquides de Fermi
base sur les systèmes de fermions sans interaction. Soit un système de particules, obéissant à la statistique de Fermi-Dirac, et sans interaction, en équilibre avec un thermostat, à la température T, et un réservoir de particules, de potentiel chimique μ. Ce gaz sans interaction est constitué de fermions et est donc décrit par la fonction de distribution de Fermi-Dirac fFD (ε). Cette dernière mesure la probabilité qu’une particule individuelle ait une énergie ε. Elle est donnée par : fFD (ε) =
1 1 + exp
ε−μ kB T
où kB est la constante de Boltzmann. À haute température, fFD (ε) se réduit à la distribution classique de Maxwell-Boltzmann : le gaz d’électrons est « classique ». Dans la limite opposée, T → 0, fFD (ε) devient la fonction échelon de FermiDirac : le gaz est dit complètement dégénéré. Quand le gaz est dégénéré, le principe de Pauli joue pleinement. Il influence toutes les propriétés thermodynamiques, en restreignant le volume de l’espace des phases disponibles. À la température T, seules les particules dont l’énergie ne diffère de l’énergie de Fermi que de moins de kB T sont affectées par une petite perturbation, que celle-ci soit liée à la température, au champ magnétique appliqué ou au champ électrique appliqué. C’est pour cette raison que la chaleur spécifique devient proportionnelle à T, ou que la susceptibilité de spin devient indépendante de la température, selon la loi de Pauli. Quand nous discuterons les propriétés des systèmes réels de fermions, la statistique de Fermi-Dirac continuera à s’appliquer. Mais les interactions entre particules, dans la matière condensée, vont devenir importantes et ne pourront pas être traitées, en général, comme de petites perturbations. Nous devrons donc étudier des systèmes où les interactions entre particules et le principe d’exclusion agissent simultanément ; nous sommes donc conduits à étudier les liquides de Fermi dégénérés. Quand on introduit l’effet des interactions dans un système de fermions qui jusqu’ici en était dépourvu, ses propriétés en sont évidemment modifiées. Mais les modifications introduites permettent de classer les liquides de Fermi en deux catégories : Dans certains systèmes, les effets des interactions sont non seulement quantitativement, mais ausi qualitativement considérables. C’est la structure même des états propres du liquide qui est bouleversée. On peut citer, par exemple, le cas de l’isolant de Mott, où l’introduction d’interactions répulsives particulièrement fortes déstabilise la surface de Fermi et aboutit, de façon non perturbative, à la formation d’un état où la structure des excitations est complètement modifiée. Le cas des interactions attractives, mêmes faibles, conduit à la formation d’un état superfluide, où les propriétés du gaz parfait sont également bouleversées. On dit de tels systèmes que ce ne sont pas des liquides de Fermi normaux. Mais fréquemment, le liquide de particules en interaction conserve la même structure d’états propres que le gaz parfait. Il en résulte que de nombreuses propriétés du gaz reste qualitativement vérifiées par le liquide : on dit alors que le liquide de Fermi
285
Physique de la matière condensée
est « normal ». Une telle ressemblance est à la base de la justification des théories de champ moyen, où les particules sont traitées comme indépendantes. Ce type d’approximation permet de rendre compte de nombreuses propriétés de systèmes de fermions en interaction, même quand ces interactions sont relativement fortes. Les descriptions théoriques à un électron de la Physique des Solides ont obtenu des succès spectaculaires, y compris pour interpréter des phénomènes relativement complexes. L’explication de ce succès repose sur le fait que les propriétés étudiées reposent, essentiellement, sur le comportement, à basse température, d’excitations de basse énergie devant l’énergie de Fermi. La base de la théorie de Landau consiste à décrire ces excitations comme des quasiparticules faiblement couplées. Nous allons voir, dans ce qui suit, qu’un liquide de Fermi normal à T = 0 conserve, comme le système sans interaction, une surface de Fermi F précisément définie, avec sa discontinuité franche. Ses excitations élémentaires peuvent être schématisées par des quasiparticules en dehors de F et par des quasi-trous à l’intérieur de F , en étroite analogie avec les excitations à une particule du gaz de Fermi sans interaction. Bien évidemment, il subsiste, malgré tout, des « effets à N corps » qui résultent des interactions entre particules et donc échappent à une approximation à une particule. De tels effets sont caractéristiques de l’état liquide. La description théorique complète des propriétés d’un liquide de Fermi en interaction à toute température et à toute échelle d’énergie, que nous n’aborderons pas dans le cadre de cet ouvrage, est évidemment d’une toute autre complexité. Le problème peut être formulé au moyen de techniques de théorie des champs [4, 5, 3]. Cependant, l’objectif de ce chapitre est beaucoup plus limité. Nous souhaitons comprendre comment il est possible d’obtenir des résultats simples dans la limite des basses températures, pour des phénomènes se produisant à une échelle macroscopique. La théorie correspondante a été construite par Landau sur une base semi-phénoménologique, que nous adopterons dans ce chapitre. Signalons que les hypothèses de Landau ont été, après coup, détaillées par des analyses microscopiques (L.P. Pitaevskii [7], J.M. Luttinger [8], P. Nozières [5], D. Pines [9]). Nous ne discuterons pas ces études ici. Dans ce qui suit, nous présenterons la notion de quasiparticule en étudiant la correspondance introduite par Landau entre systèmes sans et avec interaction. Dans les liquides de Fermi réels, les quasiparticules ne peuvent pas réellement être considérées comme totalement indépendantes, comme nous le ferions dans une théorie à un électron. Il subsiste une certaine énergie d’interaction entre quasiparticules excitées. Ce fait physique établit la différence avec une simple théorie à un électron et constitue l’apport essentiel de la théorie de Landau. Cette théorie peut être appliquée pour décrire diverses propriétés à l’équilibre et hors d’équilibre. Une analyse complète et détaillée de cette théorie et de ses applications peut être trouvée dans la référence [9]. Nous consacrerons un paragraphe à 3 He liquide. Il s’agit d’un cas particulièrement simple, car c’est un liquide de Fermi neutre et isotrope, accessible aux expériences. On peut le considérer comme l’archétype des systèmes susceptibles d’être décrit par la théorie de Landau des liquides de Fermi normaux neutres.
286
7. Théorie de Landau des liquides de Fermi
De nombreuses mesures expérimentales ont permis de déterminer avec précision les grandeurs phénoménologiques de la théorie et de permettre ainsi une prédiction théorique de coefficients de transport, en bon accord avec l’expérience. Le cas des électrons dans les métaux est évidemment important, mais moins simple, en raison de l’interaction coulombienne à longue portée entre particules chargées. Toutefois, en prenant en compte de façon adéquate les effets d’écran, il est possible d’étendre la théorie de Landau à ces systèmes [9]. L’anisotropie du potentiel cristallin complique, cependant, l’analyse en harmoniques sphériques. Ceci n’introduit pas de difficultés conceptuelles, mais affaiblit le pouvoir prédictif de la théorie, parce qu’il est nécessaire d’introduire un plus grand nombre de paramètres phénoménologiques.
7.3.2 La notion de quasiparticule Pour introduire la notion de quasiparticule, nous partirons de la description des états propres, en particulier des états excités du système sans interaction. Ce gaz parfait est constitué de N particules libres sans interaction, obéissant à la statistique de FermiDirac. La masse des particules est m. Le volume du système est . Les états propres à une particule sont complètement décrits par l’impulsion de la particule p = h¯ k (k est le vecteur d’onde) et par son spin σ = ± 12 . La fonction d’onde à une particule correspondante est une onde plane 1 | ψk,œ (r) >= √ exp i k.r | σ > + Appellons ckσ l’opérateur de création de fermion dans l’état | ψk,σ (r) >, et ckσ l’opérateur d’annihilation correspondant. Ils obéissent aux propriétés d’anticommutation habituelles des opérateurs de fermions. Les états à N particules du système sans interaction sont définis par
| N >=
N
ck+i σi | 0 >
(7.4)
i=1
Ils obéissent automatiquement aux propriétés d’antisymétrie voulues. les états Tous propres du système peuvent être caractérisés en spécifiant les états ki , σi qui apparaissent dans ce produit d’opérateurs de fermions. On définit, pour cela, la fonction de distribution nkσ , qui est égal à 1 si l’état k, σ est occupé, à zéro sinon (dans ce qui suit nous omettrons l’indice de spin σ , et l’inclurons dans k, sauf exception mentionnée). L’énergie cinétique d’une particule de vecteur d’onde k s’écrit εk = h¯ 2 k 2 /2m. Puisque nous sommes dans le cas du gaz parfait, l’énergie totale E du système est donnée par la somme des énergies à une particule :
287
Physique de la matière condensée
fFD(E)
1
EF
E
Fig. 7.1 Distribution de Fermi-Dirac pour T=0.
E =
k
nk
h¯ 2 k 2 2m
Pour construire l’état fondamental, nous occupons les N états d’onde plane de plus basse énergie, en accord avec le Principe de Pauli. La distribution de l’état fondamental est la fonction échelon de Fermi-Dirac (figure 7.1), égale à 1 pour k < kF et zéro pour k > kF , où le vecteur d’onde de Fermi kF est donnée par N 1 3 kF = 3π 2 Il est possible de définir une surface de Fermi F , par la propriété qu’à T = 0, dans l’état fondamental, tous les états à l’intérieur de F sont occupés et tous les états à l’extérieur de F sont inoccupés. Ici, F est simplement une sphère de rayon kF . Elle conserve la propriété d’isotropie du gaz parfait. L’état fondamental du système à (N + 1) particules est obtenu en plaçant la particule additionnelle dans le plus bas état d’impulsion disponible, donc sur la surface de Fermi. Le potentiel chimique μ, défini par ∂E0 μ = E0 N + 1 − E0 (n) = ∂N
(7.5)
est donc donné par μ=
h¯ 2 kF2 2m
(7.6)
Le potentiel chimique est donné par l’énergie d’une particule sur la surface de Fermi. Les excitations élémentaires du gaz parfait de Fermi sont les suivantes : – une addition de particule de vecteur d’onde k. Ceci requiert que |k| > kF , et donc que l’énergie d’excitation soit ξk = εk − μ > 0
288
7. Théorie de Landau des liquides de Fermi
εk
trous
E
particules
(a)
kF
k
2k F (b)
k
Fig. 7.2 Excitations du gaz parfait : (a) relation énergie-vecteur d’onde pour les excitations de type particule et de type trou. (b) le continuum particule trou.
– une destruction de particules de vecteur d’onde k,c’est-à-dire la création d’un trou. Ceci requiert |k| < kF ,et donc que l’énergie d’excitation soit ξk = μ − εk > 0 La relation de dispersion des excitations élémentaires de type particule et de type trou est schématisée sur la figure 7.2. Ces excitations changent le nombre total de particules. La construction d’états à nombre constant de particules est évidemment immédiat : on une particule d’un état k, avec |k| < kF et on la met dans un
prend état k , avec k > kF . Ces excitations particule-trou sont paramétrisées par deux nombres quantiques, k et k et forment un continuum. Les restrictions sur les valeurs permises de k et k assurent que tous les états excités ainsi formés aient une énergie positive. Des états excités d’ordre plus élevé, c’est-à-dire des états avec de nombreuses particules et de nombreux trous, peuvent être ainsi construits, avec pour seule restriction le principe de Pauli. Les propriétés thermodynamiques sont facilement obtenues et sont toutes déter minées par la densité d’états à l’énergie de Fermi ρ EF . Par exemple, la chaleur spécifique est linéaire en température : cv = γ T
(7.7) où le coefficient γ est proportionnel à la densité d’états au niveau de Fermi ρ EF . γ =
2π 2 2 ρ EF kB 3
La susceptibilité de spin est indépendante de la température : χ = 2ρ EF μ2B
(7.8)
(7.9)
où μB est le magnéton de Bohr. Ici, pour la relation de dispersion quadratique, la 2 densité d’états par spin à l’énergie de Fermi est donnée par ρ EF = mkF / 2π , mais les équations (7.8) et (7.9) restent valables pour une densité d’états arbitraire,
289
Physique de la matière condensée
en particulier dans les solides où des effets de structure de bandes peuvent modifier la relation de dispersion de façon très importante. Par conséquent, pour des électrons sans interaction, on s’attend à ce que le « rapport de Wilson » : RW =
π 2 kB2 χ 3μ2B γ
(7.10)
vaille 1, indépendamment des détails de la structure de bandes. Toute déviation de l’unité sera nécessairement l’indication d’une certaine forme d’effet d’interaction. Il est particulièrement commode, dans l’esprit de la théorie de Landau, de spécifier les états excités du système par référence à l’état fondamental. Ce point de vue sera même tout à fait essentiel dans la description du liquide de Fermi, car nous souhaiterons nous limiter à des déviations faibles par rapport à l’état fondamental. Dans ce cadre, on définit un état excité du système en spécifiant qu’un certain nombre d’états, en dehors de la surface de Fermi, ont été remplis par des particules qui occupaient des états à l’intérieur de cette surface. Dans cette procédure, un nombre nécessairement égal de particules en dehors de F et de trous à l’intérieur de F ont été créés. Les particules et les trous apparaissent ainsi comme les « excitations élémentaires », dont les configurations donnent naissance à tous les états excités. Ce qui caractérise « l’excitation » du système, c’est-à-dire la façon dont le système a été modifié par rapport à l’état fondamental, c’est l’écart de la fonction de distribution à sa valeur dans l’état fondamental : (7.11) δnk = nk − nk0
Une excitation individuelle de type particule, d’impulsion k > kF , correspond à
δnk = δkk , tandis qu’une excitation individuelle de type trou, d’impulsion k < kF , correspond à δnk = −δkk . Pour le système sans interaction, l’énergie d’excitation est simplement h¯ 2 k 2 (7.12) δnk E − E0 = 2m k
À basse température, les particules et les trous ne seront excités qu’au voisinage immédiat de la surface de Fermi : δnk sera typiquement de l’ordre de 1 dans une petite région dans le voisinage immédiat de F et sera ailleurs négligeable. Nous considèrerons presque toujours, sauf exception dûment signalée, un système en contact avec un réservoir de particules, avec lequel il est susceptible d’échanger des particules. Le réservoir de particules est caractérisé par son potentiel chimique μ. Dans ce cas, c’est le potentiel chimique du système qui est fixé. Son nombre de particules N n’est fixé qu’en moyenne. Alors, la quantité pertinente pour déterminer l’équilibre thermodynamique du système est l’énergie libre donnée par F = E −μN à température nulle. L’énergie libre du système décrit par la distribution δnk est
290
7. Théorie de Landau des liquides de Fermi
donnée par
h¯ 2 k 2 F − F0 = − μ δnk 2m
(7.13)
k
2 2 On peut associer à une particule de vecteur d’onde k une « énergie libre » h¯2mk − μ , qui correspond à l’énergie libre d’une excitation en dehors de la surface de Fermi. À l’intérieur de F , les excitations sont des trous, pour lesquels
δnk = −1. 2 2
k . Ce « L’énergie libre » associée à des excitations de type trou est alors μ − h¯2m. résultat se comprend très facilement en calculant l’énergie restituée par le système, en contact avec le réservoir de particules, de potentiel chimique μ, quand il revient à la distribution de l’état fondamental. L’énergie libre système
du
comprenant une
h¯ 2 k 2
excitation élémentaire d’impulsion k peut être écrite 2m − μ , expression valable à la fois à l’intérieur et à l’extérieur de la surface de Fermi. Cette quantité est bien toujours positive, ce qu’exige la stabilité de l’état fondamental (notons que la notion d’énergie libre est habituellement définie à la limite thermodynamique, pour un système où le nombre de particules est grand devant 1. L’expression « énergie libre » d’une quasiparticule est donc, en toute rigueur, un abus de langage, mais ne risque pas ici d’entraîner de confusion).
Passons maintenant au cas d’un liquide de Fermi, c’est-à-dire à un système où les interactions entre particules, qui peuvent être importantes, sont maintenant prises en compte. Nous adopterons ici une approche de nature phénoménologique. Landau a cherché à établir une comparaison ou, plus précisément, une correspondance entre le liquide « réel » en interaction avec le gaz idéal sans interaction. Une correspondance sera établie, état par état, entre les états propres des deux systèmes. Nous allons construire les états excités du liquide de Fermi de la façon suivante : Ajoutons une particule individuelle, d’impulsion h¯ |k| > hk ¯ F , à l’état fondamental du gaz parfait sans interaction. Nous formons un état à N + 1 particules : | k, N + 1 >= ck+ | 0, N >
(7.14)
Ici, ck+ est un opérateur de création de fermion d’impulsion hk, ¯ et | 0, N > est l’état fondamental à N particules du système sans interaction. Cet état est l’état propre du système sans interaction avec la valeur propre E0 (n) + εk0 = E0 (n) +
h¯ 2 k 2 2m
Maintenant nous introduisons, sous une certaine forme, des interactions particuleparticule. Dans un système invariant par translation, les interactions, de façon générale, conservent l’impulsion totale. Par conséquent, même après avoir branché les interactions, l’état ainsi formé conservera l’impulsion totale k du gaz parfait. Cependant, l’interaction de la particule ajoutée avec la mer de Fermi remplie, ainsi
291
Physique de la matière condensée
que l’interaction des particules de la mer elles-mêmes, changeront la distribution des particules dans l’espace des k, et, bien sûr, modifieront l’énergie de l’état que nous avons formé. Le complexe formé par la particule ajoutée à l’impulsion k et la distribution perturbée des autres particules constitue ce qu’on appelle une quasiparticule. Le principe de Pauli, qui s’applique évidemment aux particules du gaz parfait, impose que |k| > kF en l’absence d’interaction, et, étant donné la façon dont nous avons construit l’état à une quasiparticule, la même restriction s’impose pour l’impulsion de la quasiparticule. Des considérations analogues peuvent être établies pour des états où on a détruit une particule, c’est-à-dire créé un trou. Soit l’état propre du gaz parfait à N − 1 particules : (7.15) | k, N − 1 >= c−k | 0, N > Notons que l’impulsion totale de l’état ainsi créé est encore k, puisqu’on fait agir c−k ; opérateur d’annihilation d’une particule d’impulsion −k. En branchant l’interaction, nous créons un quasi-trou. Les états propres du système idéal sont caractérisés par leur fonction de distribution nk . Le raisonnement introduit par Landau, pour établir une connection avec le système réel, consiste à imaginer que l’interaction entre particules est établie infiniment lentement. Dans de telles conditions adiabatiques, les états propres du système idéal se transforment progressivement en certains états propres du système réel avec interaction. Cependant, il n’y a a priori pas de raison pour qu’une telle procédure engendre tous les états propres. Par exemple, il peut très bien arriver que l’état fondamental réel ne puisse pas être obtenu de cette façon. Les supraconducteurs ou les isolants de Mott nous fournissent deux exemples spécifiques d’un tel échec. Il s’agit donc d’une hypothèse cruciale et restrictive de la théorie : nous supposons que l’état fondamental réel peut être engendré de façon adiabatique en partant d’un certain état propre du système idéal de distribution n 0k . C’est cette propriété qui définira, du moins pour l’essentiel, ce que nous appelerons, dans la suite, un système de fermions normal. Soulignons que cette hypothèse, de toute évidence restrictive, écarte de larges classes de systèmes physiques. La théorie de Landau ne traite donc que des liquides de Fermi normaux. Nous avons donc ajouté une particule d’impulsion k à la distribution idéale nk0 et branché l’interaction entre particules de façon adiabatique. Nous avons ainsi engendré un état excité du liquide réel, qui possède également l’impulsion k, comme nous l’avons vu. Quand l’interaction croît, il est physiquement clair que la particule additionnelle va perturber les particules dans son voisinage. Nous supposerons que, dans ce processus adiabatique, le système des N + 1 particules restera à l’équilibre. À la fin du processus, nous aurons formé un état où la particule en excès est accompagnée, dans son déplacement, d’une distorsion qui l’entoure et qui est créée par l’interaction entre particules. Cette distorsion décrit l’effet que la particule additionnelle produit sur la distribution des autres particules. Insistons bien sur le fait que c’est le complexe particule ajoutée + distorsion de la distribution des autres particules, que nous appellerons une quasiparticule, considérée comme une entité indépendante.
292
7. Théorie de Landau des liquides de Fermi
7.3.3 Surface de Fermi des quasiparticules Soit F la surface de Fermi caractérisant la distribution non perturbée nk0 à partir de laquelle l’état fondamental réel a été construit. À cause du principe d’exclusion, les excitations de quasiparticules ne peuvent être engendrées que si leur vecteur d’onde k se trouve à l’extérieur de la surface de Fermi F . La distribution de quasiparticules dans l’espace des impulsions et donc limitée par la même contrainte sur les vecteurs d’onde. Nous pouvons définir de façon exactement analogue un quasi-trou, dont le vecteur d’onde k se trouve à l’intérieur de la surface de Fermi F , en partant de la correspondance avec l’état propre du système sans interaction où on a retiré une particule à l’état fondamental du système à N particules. Nous pouvons procéder de façon identique pour des configurations d’ordre plus élevé, comportant plusieurs quasiparticules et quasi-trous excités. Ces quasiparticules et ces quasi-trous apparaissent donc comme des excitations élémentaires du système réel. Ces excitations élémentaires permettent, en les combinant, de donner naissance à une large classe d’états excités. Cette procédure nous a ainsi permis d’établir la correspondance, état par état, entre les états propres du système idéal et ceux du système réel. La distribution de quasiparticules du liquide de Fermi présente, évidemment, comme celle du système sans interaction, une discontinuité dont l’origine physique est la même. Grâce à cette correspondance, état par état, entre le système sans interaction et le liquide, cette procédure nous permet donc de définir une surface de Fermi pour les quasiparticules. En réalité, nous voyons ici apparaître une difficulté, qui risque de remettre en cause la validité et la cohérence de la théorie. Nous avons construit l’état à une quasiparticule du liquide à partir de l’état excité du système sans interaction où l’on a rajouté un électron, état propre exact du gaz parfait, en branchant infiniment lentement l’interaction. Nous avons jusqu’ici supposé que l’état excité du liquide, ainsi formé, restait un état propre exact. Ceci ne pourrait être vrai que si les processus de diffusion électron-électron étaient totalement supprimés. Or, ce n’est pas le cas. Ces processus de diffusion, même si leur probabilité est fortement réduite pour les états proches de la surface de Fermi, ne sont totalement supprimés qu’exactement sur la surface de Fermi. Les états à une quasiparticule ne seront donc que des états propres approchés du liquide réel. Ils auront une durée de vie finie. L’état réel formé étant amorti sous l’effet des interactions entre particules, la méthode consistant à établir l’interaction de façon adiabatique rencontre des difficultés : le temps nécessaire pour introduire l’interaction doit nécessairement être limité par la durée de vie de l’état que nous souhaitons engendrer. En effet, si ce temps d’introduction est plus long, l’état aura disparu avant que le liquide de Fermi ait été réellement formé. A contrario, si l’interaction est établie trop vite, le processus n’est plus adiabatique, et le système ne reste pas à l’équilibre ; nous n’engendrons pas des états propres du système en présence d’interaction. Cette difficulté ne peut être résolue, en toute rigueur, que si la probabilité des collisions particule-particule tend vers 0, car c’est la condition pour que la durée de vie de l’état du liquide tende effectivement vers l’infini. Bien
293
Physique de la matière condensée
entendu, comme nous venons de le souligner, les quasiparticules et les quasi-trous ne définissent pas des états propres exacts du liquide de Fermi. Les interactions entre quasiparticules, très fortement réduites au voisinage de la surface de Fermi, mais cependant non totalement supprimées, confèrent à l’état propre approché, ainsi défini, une certaine largeur en énergie, c’est à dire une durée de vie limitée. Cependant, nous savons, comme nous l’avons vu plus haut, que la durée de vie de la quasiparticule devient très longue au voisinage immédiat de la surface de Fermi et, même diverge sur la surface de Fermi. Cette conséquence du Principe de Pauli est essentielle. Elle permet que le concept de quasiparticule garde tout son sens dans cette région. Il en résulte une propriété importante. Puisque la quasiparticule est de mieux en mieux définie à mesure qu’on se rapproche de la surface de Fermi, F demeure définie de façon précise, même en présence d’interaction. Nous voyons, en fait, qu’une quasiparticule, à strictement parler, n’est définie, en toute rigueur, que sur la surface de Fermi. Considérons un état propre du système sans interaction caractérisé par une fonction de distribution nk pour les particules nues sans interaction. Cette fonction de distribution définit comment les particules du système sans interaction occupent les différents états disponibles. À partir de cet état du système sans interaction défini par nk , nous construisons un état propre du liquide réel en branchant l’interaction de façon adiabatique. La fonction de distribution nk du gaz parfait, elle-même, nous servira donc à définir complètement l’état du liquide réel. En effet, dans le système avec interaction, nk décrit, par construction, la distribution de quasiparticules. L’excitation du système est décrite par l’écart δnk avec la distribution de l’état fondamental (7.16) δnk = nk − nk0 En fait, il faut garder à l’esprit que la validité de toute la théorie de Landau des liquides de Fermi est restreinte à des excitations de très basse énergie. Elle n’aura véritablement de sens que pour des écarts de la distribution δnk localisés au voisinage immédiat de la surface de Fermi. δnk est en fait la seule quantité qui soit réellement pertinente. Cela n’aurait pas véritablement de sens de définir une distribution d’équilibre de quasiparticules nk0 dans une région où les quasiparticules ne sont pas vraiment définies, c’est-à-dire en dehors du voisinage immédiat de la surface de Fermi. Il faut donc se garder d’une confusion qui vient du fait que la distribution nk est aussi bien celle du système sans interaction que celle des quasiparticules du liquide de Fermi. Si nk a bien un sens dans tout l’espace des phases pour le système sans interaction, elle n’a de sens qu’au voisinage immédiat de la surface de Fermi pour les quasiparticules. En fait, les résultats seront toujours exprimés en fonction de quantités qui restent localisées sur la surface de Fermi. Considérons un système sans interaction isotrope, sa fonction de distribution nk0 présente la symétrie sphérique, ainsi que sa surface de Fermi. Si le système est isotrope, après branchement adiabatique des interactions, la fonction de distribution nk0 des quasiparticules reste isotrope. En conséquence, la surface de Fermi reste sphérique. Les choses sont différentes quand la surface de Fermi du système sans interaction est
294
7. Théorie de Landau des liquides de Fermi
anisotrope. Dans ce cas là, la surface de Fermi sera certainement déformée quand les interactions seront établies. La géométrie sphérique de la surface de Fermi sera en général modifiée par les interactions. En revanche le volume à l’intérieur de la surface de Fermi est fixé par le nombre de particules. La conservation du nombre de particules impose donc que le volume de la surface de Fermi ne dépende pas de la force des interactions, du moins tant que la description du liquide de Fermi normal reste valable. Ce résultat est connu sous le nom de « théorème de Luttinger ».
7.3.4 Énergie des quasiparticules Pour le sytème sans interaction, l’énergie totale Eid e´ al d’un état donné est simplement la somme des énergies de toutes les particules, puisqu’il n’y a pas d’interaction. La relation entre l’énergie de cet état et sa fonction de distribution est simplement linéaire : εk0 nk = E0,id e´ al + εk0 δnk (7.17) Eid e´ al = k
k
h 2 k 2 /2m
=¯ est l’énergie d’une particule d’impulsion k du gaz parfait et E0,id e´ al est l’énergie du fondamental du sytème sans interaction. Évidemment, ce résultat extrêmement simple est spécifique du système sans interaction et n’est plus valable, dès que les interactions entre particules sont introduites. La relation entre l’énergie de l’état, E , et la fonction de distribution de quasiparticule, nk , pour des interactions qui ne sont pas de petites perturbations, devient extrêmement compliquée. Nous ne pouvons pas l’écrire de façon exacte, et son calcul, même approché, est très difficile. La seule exception serait le cas, très spécifique et peu réaliste dans les problèmes de Physique de la Matière Condensée où les interactions entre particules pourraient être considérées comme une petite perturbation. Face à cette difficulté, l’attitude adoptée par Landauconsiste à exprimer la relation entre E et nk sous la forme d’une fonctionnelle E nk . Évidemment, cette fonctionnelle ne peut pas, en général être spécifiée explicitement. Ce qu’il est possible de faire, si nk est suffisamment proche de la distribution de l’état fondamental nk0 , c’est d’effectuer un développement de Taylor de cette fonctionnelle. Pour δnk suffisamment petit ou s’étendant sur une région suffisamment restreinte dans l’espace des impulsions, nous écrivons alors : εk δnk + O δn 2 (7.18) E nk = E0 + Dans cette expression, εk0
p
où εk est la dérivée fonctionnelle première de E. Si δnk décrit un état avec une quasiparticule k, l’énergie de l’état est E0 + εk ; εk est l’énergie de la quasiparticule. Bien évidemment, il faut souligner que εk n’a rien à voir avec εk0 , énergie d’une particule d’impulsion k du système sans interaction. En fait, dans le cadre de cette analyse phénoménologique, nous ne chercherons pas à calculer εk , car ce calcul serait, d’une façon générale, très difficile. En fait, εk sera considérée comme une quantité phénoménologique.
295
Physique de la matière condensée
Si les valeurs que prend εk , quantité phénoménologique, ne sont pas possibles à calculer de façon générale, par contre, nous connaissons la valeur qu’elle doit prendre, nécessairement, exactement sur la surface de Fermi : sur cette surface, elle doit être égale à une constante εF , l’énergie de Fermi. En effet, il est très simple de montrer que, si ce n’était pas le cas, l’état fondamental serait rendu instable par l’excitation de quasiparticules (ou de quasi-trous) d’énergie négative. Puisque l’état fondamental pour N + 1 particules est obtenu en ajoutant une quasiparticule sur la surface 0 de Fermi, εF est simplement le potentiel chimique, μ = ∂E ∂N , à température nulle. Cette propriété du gaz parfait reste donc vraie pour le liquide de Fermi. Dans la théorie de Landau des liquides de Fermi, on n’échantillonne toujours que des états au voisinage immédiat de l’énergie de Fermi. Comme pour toutes les quantités, les valeurs pertinentes de εk seront toujours celles au voisinage de la surface de Fermi. Nous nous limiterons alors à un développement en série de εk εk = εF + δk · ∇ k εk + O |δk|2 (7.19) où δk est l’écart du vecteur d’onde à la surface de Fermi. Le gradient de εk vk = ∇k εk
(7.20)
joue le rôle d’une vitesse de groupe de la quasiparticule. En l’absence de champ magnétique et pour un système possédant un centre de symétrie, εk et vk ne dépendent pas du spin σ . Si on suppose que le système est isotrope, εk ne dépend que de k = |k| et peut être dénoté εk . La vitesse vk est alors parallèle à k, de sorte que, sur la surface de Fermi h¯ kF vkF = ∗ (7.21) m où m ∗ est appelée masse effective de la quasiparticule. La masse effective qui est introduite ici trouve son origine dans l’interaction avec les autres particules. Il faut évidemment éviter la confusion avec la notion de masse effective introduite dans la théorie des bandes d’énergie à un électron et qui traduit l’effet du potentiel périodique du réseau sur le mouvement d’un électron indépendant. Comme dans le cas du gaz parfait, il est possible d’introduire la notion de densité d’états. Cette quantité jouera un rôle important également dans le cas d’un liquide de Fermi. Nousallons donc introduire ρ(ε), la densité d’états de quasiparticules ayant une énergie μ + ε : δ εk − μ − ε (7.22) ρ(ε) = k
À partir du développement de la fonctionnelle de l’énergie libre, il est facile de montrer qu’à basse température, comme dans le cas du gaz parfait, toutes les propriétés physiques du liquide de Fermi dépendront de la densité d’états sur la surface de Fermi ρ 0 .
296
7. Théorie de Landau des liquides de Fermi
Le cadre conceptuel de la théorie de Landau est fondé sur cette correspondance, état par état entre le gaz parfait et le liquide de Fermi. Il en découle immédiatement une similitude évidente entre les particules nues dans le gaz de Fermi et les quasiparticules dans le liquide de Fermi. Les unes et les autres ont la même distribution dans l’espace des k, sont dans les deux cas, à T = 0, limitées par une surface de Fermi définie de façon précise. Toutes obéissent à une statistique de Fermi-Dirac. Il existe cependant des différences, qui résident essentiellement dans deux faits : – des quantités comme εk et donc comme m ∗ sont maintenant des quantités phénoménologiques définies à partir de la dérivée fonctionnelle première de l’énergie. En raison d’interactions qui peuvent être fortes, elles peuvent être notablement différentes des quantités relatives aux particules nues. – bien plus, nous devrons également prendre en compte le fait qu’il existe des interactions entre quasiparticules. Pour cela, nous devrons décrire ces interactions par des termes d’ordre 2, jusqu’ici ignorés, dans le développement de la fonctionnelle de l’énergie libre. Ces termes seront reliés aux dérivées fonctionnelles secondes de l’énergie. Ceci est l’objet du paragraphe suivant.
7.4 Interation entre quasiparticules 7.4.1 Fonctionnelle de l’énergie libre Dans le paragraphe précédent, nous avons écrit un développement, limité au premier ordre, de l’énergie du liquide de Fermi en fonction de la distribution de quasiparticules δnk . Il est souhaitable d’écrire un développement analogue de l’énergie libre, dans la mesure où il est plus commode de travailler sur des systèmes à potentiel chimique fixé, plutôt qu’à nombre de particules fixé. Quand on modifie la distribution de quasiparticles d’une quantité infiniment petite δnk , le nombre total de particules N subit une variation : δnk (7.23) N − N0 = k
où N0 est le nombre de particules dans l’état fondamental. En effet, en ajoutant une quasiparticule à l’état fondamental, nous ajoutons exactement une particule nue au système dans son ensemble : l’étatavec une quasiparticule supplémentaire est dérivé d’un état du gaz parfait contenant N + 1 particules et le nombre total de particules est conservé quand les interactions sont établies de façon adiabatique. L’énergie libre d’excitation, mesurée à partir de la valeur dans le fondamental F0 , est donc donnée par (7.24) εk − μ δnk F − F0 =
2
k
à des corrections d’ordre δn près. Nous savons que la validité de la théorie de Landau est limitée aux températures très basses devant l’énergie de Fermi et à des
297
Physique de la matière condensée
excitations de très basse énergie. Nous ne considèrerons toujours que des écarts à la distribution du fondamental δnk très faibles. Il est en fait primordial d’écrire le développement de Taylor de la fonctionnelle F − F0 (7.24), jusqu’à l’ordre 2 en écart à la distribution de l’état fondamental (c’est même nécessaire pour garder la cohérence du calcul). Nous devons donc écrire : F − F0 =
1 fkk δnk δnk + O δn 3 εk − μ δnk + 2 k
(7.25)
k,k
Le terme supplémentaire inclus dans le développement de la fonctionnelle est un terme quadratique, qui décrit les interactions entre quasiparticules. Il va apporter aux propriétés physiques du système des modifications importantes. Ces dernières sont un des apports essentiels de la théorie de Landau. Le coefficient fkk est la dérivée fonctionnelle seconde de E (ou de F ) par rapport à nk . Il est invariant dans une permutation de k et de k . On voit facilement que fkk est l’énergie d’interaction de quasiparticules excitées k et k . En pratique, on n’a besoin des valeurs de f que sur la surface de Fermi, aux points tels que εk = εk = μ. Alors, fkk ne dépend que de la direction de k et k et des spins σ et σ . Nous rappelons, cidessous, comment Landau a défini les parties symétriques de spin et antisymétriques de de spin de fkk et comment il a écrit un développement en harmoniques sphériques de ces quantités. En l’absence de champ magnétique appliqué, le système est invariant par renversement du temps, ce qui implique : fk σ , k σ = f−k −σ , − k −σ
(7.26)
(ici, les spins ont été explicitement introduits). Si, de plus, la surface de Fermi possède un centre de symétrie, alors fk σ , k σ = fk −σ , k −σ
(7.27)
Dans ce cas, fk σ , k σ ne dépend que de l’orientation relative des spins σ et σ . Il n’y a que deux composantes indépendantes, correspondant respectivement aux spins parallèles et antiparallèles. Il est commode de les écrire sous la forme ↑↑
fkk = fkks + fkka ↑↓
fkk = fkks − fkka
(7.28) (7.29)
où fkks et fkka sont les parties symétrique de spin et antisymétrique de spin de l’interaction entre quasiparticule. Si le système est isotrope, cette expression peut être encore simplifiée. Dans ce cas, quand k et k se trouvent sur la surface de Fermi, fkks et fkka ne dépendent que
298
7. Théorie de Landau des liquides de Fermi
de l’angle ξ entre les directions de k et k , et peuvent être développés en série de polynômes de Legendre : fkka
=
fkks =
∞ l =0 ∞
fl a Pl cos ξ
(7.30)
fl s Pl cos ξ
(7.31)
l =0
f est complètement déterminé par la donnée de l’ensemble des coefficients fl a et fl s . Il est commode d’utiliser des quantités sans dimension. Pour cela, on pose : m ∗ kF a ρ 0 fl a = f = Fla π 2 2 l
(7.32)
m ∗ kF s f = Fls ρ 0 fl s = π 2 2 l
(7.33)
Les quantités sans dimension Fls et Fla permettent ainsi de caractériser l’importance relative des interactions et de se rendre compte immédiatement si celles-ci sont importantes comparées à l’énergie cinétique.
7.4.2 Énergie locale d’une quasiparticule Si nous ajoutons à un système décrit par une certaine distribution de quasiparticules excitées δnk , une quasiparticule additionnelle de vecteur d’onde k, l’énergie libre de cette quasiparticule supplémentaire ne sera pas simplement donnée par εk − μ . Cette quantité n’est que la dérivée fonctionnelle première de l’énergie libre. Elle ne représente pas l’énergie de la quasiparticule en présence des autres quasiparticules. Nous devons maintenant tenir compte du terme du second ordre, décrivant les effets d’interactions entre quasiparticules. L’énergie de la quasiparticule est corrigée par ces interactions : fkk δnk (7.34) εk − μ = εk − μ + k
L’énergie libre d’une quasiparticule dépend donc de l’état du système à travers l’énergie d’interaction avec les autres quasiparticules excitées. Cet effet apparaît, parce que nous sommes sortis de l’approximation linéaire, où les énergies des quasiparticules étaient simplement additives. Comme nous l’avons déjà indiqué, il est crucial de prendre en compte ces effets d’interaction entre quasiparticules. Ce sont eux qui font la différence avec une théorie de particules indépendantes.
299
Physique de la matière condensée
Pour un système légèrement inhomogène, l’écart à l’équilibre peut être décrit par une distribution de quasiparticules excitées qui dépend de la position δnk (r). En conséquence εk dépend aussi de r et peut être considérée comme une énergie locale, perturbée par la distorsion environnante du milieu. Il est commode d’introduire la fonction de distribution εk −μ nk0 = n 0
(7.35)
où n 0 est la fonction échelon habituelle de Fermi-Dirac. Pour un système légèrement inhomogène, la distribution nk0 correspond à un équilibre local de quasiparticules, de la même façon que nk0 = n 0 εk − μ décrit le véritable équilibre. L’écart à cet état d’équilibre local est mesuré par la différence n0 δ nk = n k −
k
(7.36)
Il est immédiat de montrer que ; δ nk = δnk −
∂n 0 f δn ∂εk kk k
(7.37)
k
Il en résulte que δn et δ n , à très basse température, sont tous deux restreints à la surface de Fermi. Pour un système isotrope à température nulle, la relation entre δn et δ n se simplifie beaucoup. Il est possible de séparer δn et δ n en une partie symétrique de spin et une partie antisymétrique de spin en posant δnk,± = δnks ± δnka
(7.38)
δ nk,± = δ nks ± δ nka
(7.39)
Nous développons ces quantités en série d’harmoniques sphériques normalisées : s δ εk − μ δnlm Ylm θ, ϕ (7.40) δnks = lm
et des développements similaires pour les autres quantités. On obtient simplement : Fls s δnlm = 1+ 2l + 1 Fla a a δnlm δ nlm = 1 + 2l + 1
s δ nlm
300
(7.41) (7.42)
7. Théorie de Landau des liquides de Fermi
7.4.3 Distribution d’équilibre de quasiparticules à température finie Jusqu’ici, nous avons défini la fonction de distribution des quasiparticules à température nulle nk0 T = 0, μ , par référence à la fonction de distribution des états propres du sytème sans interaction. Il est maintenant nécessaire d’étendre cette notion à température finie. Considérons un système macroscopique à l’équilibre thermodynamique avec un réservoir de particules de potentiel chimique μ, et un thermostat à la température T. Appelons nk0 T, μ sa fonction de distribution. L’entropie de l’état macroscopique du système peut être calculé en dénombrant le nombre d’états microscopiques correspondant à cet état. Puisque les états du liquide de Fermi correspondent, état par état, à ceux du gaz parfait de Fermi, la densité d’entropie doit nécessairement avoir la même forme que celle du gaz parfait : s =−
kB nkσ Ln nkσ + 1 − nkσ Ln 1 − nkσ
(7.43)
k,σ
Puisque les interactions conservent le nombre de particules, le nombre total de particules dans l’état du liquide de Fermi doit être le même que celui de l’état correspondant du système sans interaction. La densité de particules est donc donnée par : 1 nkσ n= k,σ
Soit une transformation infinitésimale du système où l’énergie varie de δE, la densité d’entropie de δs et la densité de particules de δn : δE = T δs + μδn Dans cette transformation infinitésimale, la fonction de distribution des quasiparticules est modifiée de la quantité δnkσ . La variation correspondante de la densité d’entropie s’écrit : nkσ kB Ln δnkσ (7.44) δs = − 1 − nkσ k,σ
et de la densité de particules : δn =
1 δnkσ
(7.45)
k,σ
301
Physique de la matière condensée
La variation d’énergie est donnée par : δE =
1 εkσ δnkσ
(7.46)
k,σ
en présence des autres quasiparticules de où εkσ est l’énergie d’une quasiparticule fonction de distribution nk0 T, μ . D’où les deux expressions pour δE ; δE = −
nkσ μ kB T δnkσ Ln + δnkσ 1 − nkσ k,σ
k,σ
1 = εkσ δnkσ k,σ
En égalant identiquement, dans ces deux expressions de δE, les coefficients de δnkσ , on obtient ; nkσ εkσ = μ − kB TLn (7.47) 1 − nkσ ce qui donne la distribution habituelle de Fermi-Dirac : nk0 T, μ =
1 + exp
1
( εkσ −μ) kB T
(7.48)
Ici εk est l’énergie de la quasiparticule, dans l’expression de laquelle il faut tenir compte de l’interaction avec les autres quasiparticules, modifiée par le fait que la distribution, à la température T est maintenant donnée par nk0 T, μ et non plus par nk0 0, μ . D’où : fkk nk0 T, μ − nk0 0, μ εkσ − μ = εkσ − μ +
(7.49)
k
En principe, la vraie distribution d’équilibre devrait donc être dérivée, de façon selfconsistente à partir des deux équations précédentes (7.48) et (7.49). Cependant, il est facile de montrer qu’à très basse température, le deuxième terme de l’équation (7.49), c’est-à-dire l’énergie d’interaction entre quasiparticules thermiquement excitées est d’ordre T 2 et peut donc être négligée par rapport à εk − μ , qui est d’ordre T. Dans la limite des basses températures, il est donc possible de remplacer εk par εk dans la distribution d’équilibre.
7.5 Propriétés d’équilibre Nous consacrons ce paragraphe au calcul des propriétés thermodynamiques macroscopiques du liquide de Fermi, telles que la chaleur spécifique, la susceptibilité de spin ou la compressibilité, à l’aide des quantités phénoménologiques qui apparaissent
302
7. Théorie de Landau des liquides de Fermi
dans la fonctionnelle de l’énergie libre. C’est ce calcul qui nous permettra de fixer la valeur des paramètres de Landau, à l’aide des déterminations expérimentales de ces quantités.
7.5.1 Chaleur spécifique Considérons d’abord la chaleur spécifique, définie par : ∂E cv = ∂T N qu’il est plus commode d’écrire, de façon équivalente : ∂F cv = ∂T μ
(7.50)
(7.51)
Pour calculer cv , nous écrivons l’énergie libre sous la forme : F − F0 =
1 fkk δnk δnk + O δn 3 εk − μ δnk + 2 k
(7.52)
k,k
où δnk est donné par : δnk = nk0 T, μ − nk0 0, μ
(7.53)
Nous avons vu que l’intégrale de δnk dans toute direction de l’espace des impulsions s’annule à l’ordre T 2 . L’énergie d’interaction dans l’expression ci-dessus est donc devant le terme principal d’ordre T 2 . L’énergie libre d’ordre T 4 et donc négligeable thermique F T − F0 est donnée, à basse température, par une expression de la même forme que pour le système sans interaction. Un calcul simple donne : 2 π2 F T − F0 = ρ 0 kB T 6
(7.54)
m ∗ kF ρ 0 = π 2 2
(7.55)
où ρ 0 estladensité d’états au niveau de Fermi définie plus haut. Pour un système isotrope, ρ 0 est donnée par :
Ce qui donne pour la chaleur spécifique : cv =
m ∗ kF 2 k T 32 B
(7.56)
303
Physique de la matière condensée
Une mesure de l’ordonnée à l’origine du graphe de cv /T = f (T 2 ) donne donc la masse effective des quasiparticules. Remarquons que les interactions entre quasiparticules n’affectent pas le fait que la chaleur spécifique soit linéaire en température, ni même l’expression du coefficient γ de proportionnalité en fonction de la densité d’états au niveau de Fermi ρ 0 . L’effet des interactions est tout entier compris dans la valeur de ρ 0 , proportionnelle à la masse effective des quasiparticules m ∗ , qui, elle, dépend bien des interactions.
7.5.2 Susceptibilité de spin Pour déterminer la susceptibilité de spin, nous calculons l’aimantation de spin produite par un champ magnétique uniforme et statique H, appliqué au liquide de Fermi. Dans le champ H , une particule de spin σ = ± 12 acquiert une énergie magnétique ∓g μB σ H, où g = 2 est le facteur de Landé et μB le magnéton de e Bohr 2mc. . Les deux orientations de spin ne sont plus à l’équilibre et possèdent deux gμ H potentiels chimiques différents μ ± 2B . Pour rétablir l’équilibre, il est nécessaire de déplacer les surfaces de Fermi des deux directions de spin ± 12 , de façon que les potentiels chimiques redeviennent égaux. En champ faible, chacune des deux surfaces de Fermi est déplacée d’un montant égal et opposé, le potentiel chimique final restant égal à μ (à des corrections d’ordre H 2 près). La distribution d’équilibre, pour le spin σ , en présence du champ peut s’écrire : (7.57) εk − μ − g μB σ H nkσ H = n 0 d’où l’écart à l’équilibre local δ nkσ = −g μB σ
∂n 0 ∂εk
(7.58)
Pour calculer l’aimantation, il faut passer de δ nkσ à δnkσ . Si on suppose que le système est isotrope, δ nkσ est isotrope et antisymétrique de spin. On trouve alors δnkσ =
δ nkσ g μB σ H ∂n 0 = − 1 + F0a 1 + F0a ∂εk
(7.59)
Le calcul de l’aimantation est alors immédiat :
g μ 2 ρ 0 B M = H 2 1 + F0a
(7.60)
La susceptibilité de spin est alors donnée par : 2 m ∗ kF g μB /2 χP = 2 2 π 1 + F0a
304
(7.61)
7. Théorie de Landau des liquides de Fermi
χP n’est pas simplement donné par la densité d’états, comme c’est le cas pour le système sans interaction. Nous voyons que, contrairement au cas de la chaleur spécifique, (où les effets des interactions n’entrent que par la modification de la masse effective m ∗ ), la susceptibilité de spin est modifiée par l’interaction d’échange F0a . F0a est le seul coefficient qui apparaît ici, parce que la distorsion de la fonction de distribution de Fermi induite par le champ magnétique est antisymétrique par rapport aux indices de spin et est de symétrie sphérique (c’est à dire correspond à L = 0). En comparant les valeurs expérimentales de la chaleur spécifique (c’est-à-dire de m ∗ ) et de la susceptibilité de spin, il est possible de déterminer F0a . Le rapport de Wilson est donné par RW =
1 1 + F0a
7.5.3 Compressibilité et vitesse du son Soit E0 l’énergie de l’état fondamental du système, considérée comme une fonction du volume . La pression P peut être définie par : P =−
∂E0 ∂
(7.62)
La compressibilité κ est alors donnée par
2 −1 ∂P ∂ E0 1 = − = κ ∂ ∂2
(7.63)
Pour un grand système, E0 est une quantité extensive, proportionnelle au volume quand la densité n = N est maintenue constante. On peut alors écrire
On trouve alors directement
E0 = f (n)
(7.64)
1 = n 2 f (n) κ
(7.65)
Ces quantités peuvent être reliées au potentiel chimique μ = diat de montrer que 1 ∂μ = Nn κ ∂N
∂E0 ∂N . Il est alors immé-
(7.66)
La compressibilité est reliée à la vitesse du son, s : s2 =
1 N ∂μ = κmn m ∂N
(7.67)
305
Physique de la matière condensée
L’énergie locale d’une quasiparticule sur la surface de Fermi est toujours égale au potentiel chimique μ. Quand μ augmente de de d μ, l’énergielocale est aussi augmentée εk − μ − d μ . L’écart à la distribution de d μ. La nouvelle distribution s’écrit n0 d’équilibre locale n0 εk − μ est égal à : ∂n 0 dμ δ nk = − ∂εk
Pour un système isotrope, δ nk est isotrope et indépendant du spin : 0 1 1 ∂n dμ δnk = δ n = − k 1 + F0s 1 + F0s ∂εk d’où dN =
1 δ εk − μ d μ s 1 + F0
δnk =
k
d’où, finalement :
(7.68)
(7.69)
(7.70)
k
ρ 0 N ∂N = = ms 2 ∂μ 1 + F0s
(7.71)
Nous obtenons le résultat qu’on obtiendrait pour des particules indépendantes de −1 masse m ∗ modifié par le facteur 1 + F0s . Ce dernier facteur est une conséquence directe de l’interaction entre quasiparticules. On peut écrire, pour la vitesse du son s, 2 2 k h ¯ F 1 + F0s s2 = 3mm ∗ et pour la compressibilité κ=
m ∗ kF h 2π 2n 2 ¯
(7.72)
1 1 + F0s
Puisque la masse effective m ∗ est connue à partir de la chaleur spécifique, une mesure de s détermine F0s . Dans la limite d’interactions faible, m ∗ → m, tandis que F0s → 0. vF . La vitesse du son tend alors vers √ 3
7.6 Propriétés hors d’équilibre Pour ce qui concerne les propriétés d’équilibre, la théorie de Landau est phénoménologique et fait quelques prédictions qualitatives importantes. L’une des plus importantes est que la chaleur spécifique à basse température reste linéaire en
306
7. Théorie de Landau des liquides de Fermi
température, même en présence d’interactions, et que la susceptibilité de spin tend vers une constante quand T → 0. Cependant, la théorie de Landau garde un faible pouvoir prédictif, parce que les paramètres cruciaux de Landau doivent, en réalité, être déterminés à partir des expériences. La situation n’est pas la même en ce qui concerne les propriétés hors d’équilibre, où l’existence de nouveaux phénomènes, en particulier de modes collectifs, est prédite. Ces modes collectifs constituent un autre type d’excitations élémentaires qui, contrairement aux quasiparticules, impliquent un mouvement cohérent de l’ensemble du système. Nous n’entrerons pas ici dans les détails du traitement des propriétés hors d’équilibre des liquides de Fermi [6, 9, 10]. Nous nous contenterons d’esquisser brièvement le cadre conceptuel général et quelques uns des résultats les plus importants. Pour décrire des situations hors d’équilibre, nous devons faire deux hypothèses de base : – Les déviations par rapport à l’équilibre sont décrites par une équation de Boltzmann que doit vérifier une fonction de distribution des quasiparticules n k, r, t , qui décrit la densité de quasiparticules de vecteur d’onde et de spin k,σ au point r et au temps t . À l’équilibre n k, r, t est évidemment donnée par n0 k = 1 si |k| < kF =0 si |k| > kF Le fait que la fonction de distribution spécifie simultanément l’impulsion et la position impose évidemment certaines restrictions, dues à la nature quantique du problème sous-jacent. Plus précisément, les variations spatiales et temporelles de la fonction de distribution doivent être lentes comparées à la longueur d’onde et à la fréquence typiques des quasiparticules. Ceci impose les conditions
vF q , |ω| EF où q et ω caractérisent les échelles des variations spatiales et temporelles de n k, r, t . – À cause de la dépendance en r de n k, r, t , la quasiparticule est elle-même dépendante de r. On suppose alors que les équations quasi-classiques ci-dessous sont vérifiées : dr (7.73) = ∇k εk (r) dt dk h¯ (7.74) = −∇r εk (r) dt Notons en particulier qu’une fonction de distribution dépendant de l’espace donne lieu, à travers la fonction fkk à une force agissant sur la quasiparticule. En linéarisant l’équation de Boltzmann et en étudiant le régime sans collision, où le terme de collision de l’équation de Boltzmann peut être négligé, on trouve les solutions de mode collectif qui correspondent à des oscillations de la surface de Fermi. Le plus important est le mode symétrique longitudinal qui, comme le son ordinaire,
307
Physique de la matière condensée
implique des fluctuations de la densité de particules. Ce type de son apparaît dans un régime où les collisions sont négligeables, c’est-à-dire dans un régime où le son ordinaire ne peut pas exister, puisque l’existence de collisions est en réalité crucial pour la propagation du son ordinaire. Ce mode collectif est un effet purement quantique. Puisque les collisions peuvent toujours être négligées à température nulle, ce nouveau type de son a été dénommé par Landau le Zéro Son. C’est le mode collectif que nous avons étudié dans le cadre de la RPA au chapitre 6. Le terme de collision de l’équation de Boltzmann est au contraire essentiel pour calculer la durée de vie τ de la quasiparticule. On peut trouver facilement que pour une quasiparticule d’énergie εp , l’inverse du temps de vie se comporte comme : 2 2 1 ∗ 3 π T + εp ∼ m τ 1 + exp −βεp
(7.75)
Ici, le résultat le plus important est la divergence de la durée de vie à basse énergie et à basse température puisque −2 τ ∼ max εp , T
(7.76)
de sorte que le produit εp τ diverge quand on s’approche de la surface de Fermi. Ceci montre que la quasiparticule devient un état propre bien défini (ou plutôt un « quasi-état propre »), à faible énergie d’excitation, c’est-à-dire dans le régime où la théorie de Landau est applicable. D’autre part, à plus haute énergie, la quasiparticule devient de moins en moins bien définie. Nous avions initialement supposé qu’une quasiparticule était un état propre exact du système en interaction, obtenu à partir d’un état propre du système sans interaction en branchant l’interaction. Il était donc nécessaire que la particule ait une durée de vie infinie. Nous arrivons maintenant à la conclusion que la durée de vie n’est pas strictement infinie, mais seulement très longue à basse énergie.
7.7 Application à 3 He liquide Les atomes d’3 He ont des noyaux formés de trois nucléons et de ce fait, obéissent à la statistique de Fermi-Dirac, alors que les atomes d’4 He , avec leurs 4 nucléons, obéissent à la statistique de Bose-Einstein. 3 He liquide, dans sa phase normale, est un liquide de haute densité dont les atomes sphériques interagissent fortement [11]. À cette densité, la distance entre particules est du même ordre que le diamètre atomique, et l’interaction entre atomes d’hélium est principalement due à une forte répulsion de coeur dur, à laquelle s’ajoute une faible attraction de Van der Waals, à longue distance, qui ici ne jouera aucun rôle. En raison de la faible valeur des masses atomiques, les vibrations de point zéro des atomes ont une telle amplitude que, sous pression normale, l’énergie cinétique et l’énergie potentielle des atomes de gaz rares sont pratiquement égales, même à une température arbitrairement basse. C’est pour
308
7. Théorie de Landau des liquides de Fermi
cette raison que 3 He (de même que 4 He ) reste liquide quand T → 0 et ne se solidifie que si une pression supérieure ou égale à environ 34 bars est appliquée. Étant donné que les atomes d’3 He sont des fermions, 3 He normal constitue un liquide de Fermi. En dessous de la température de dégénérescence TF , ses propriétés sont gouvernées par la statistique de Fermi-Dirac. Il s’agit d’un liquide quantique. En l’absence d’effets d’interaction entre atomes d’3 He , la température de dégénérescence correspondant à l’énergie de Fermi serait donnée par kB TF = EF =
pF2 5K 2m
(7.77)
Cette estimation a été obtenue en utilisant pour m la masse nue d’un atome d’3 He 5 × 10−24 g et en calculant pF à partir de la densité de particules mesurée 1/3 (7.78) pF = 3π 2 hρ ¯ On peut estimer que les effets quantiques de la statistique de Fermi-Dirac sur des grandeurs comme la chaleur spécifique ou la susceptibilité de spin prennent tous leurs effets en dessous d’environ TF /10, soit environ 0, 5 K. En fait, expérimentalement, les comportements quantiques sont observés à des températures notablement plus basses, de l’ordres de 0, 1 K. Il s’agit là d’un effet des interactions entres atomes d’3 He , qui ont pour résultat, en particulier, d’augmenter la masse effective m ∗ et donc de réduire l’énergie de Fermi. On voit déjà que ces effets d’interactions doivent être forts pour réduire aussi sensiblement la température de dégénérescence. 3 He
est donc un liquide quantique de fermions, simple, invariant par translation et isotrope, dont les particules sphériques interagissent par des interactions isotropes très fortes et à courte portée. Il est maintenant possible d’étudier les propriétés expérimentales de ce liquide quantique à des températures basses devant la température de dégénérescence. Pour toutes ces raisons, 3 He liquide peut être considéré comme l’archétype du liquide de Fermi neutre susceptible d’être décrit par la théorie de Landau des liquides de Fermi. Les paramètres de Landau ont pu être déterminés à partir des mesures expérimentales de la chaleur spécifique, de la susceptibilité de spin et de la compressibilité en fonction de la pression, pour des pressions appliquées comprises entre 0 et 34 bars. La figure 7.3 montre les variations en fonction de la pression des paramètres suivants, tels qu’ils ont été déterminés par Greywall [12] : – la masse effective normalisée m ∗ /m (à partir de la mesure de chaleur spécifique), −1 χ /χ 0 – la quantité 1 + F0s = ms∗ /ms , rapport entre la susceptibilité de spin normalisée et la masse effective normalisée, – la compressibilité normalisée κ/κ0 .
309
Physique de la matière condensée
Fig. 7.3 Paramètres de Landau de 3 He liquide en fonction de la pression, déterminés expérimentalement, à partir des mesures de chaleur spécifique, de susceptibilité magnétique et de compressibilité (d’après Greywall) : les variations de la masse normalisée m ∗ /m, du rapport entre la susceptibilité de spin et la masse effective (1 + F0a )−1 , et la compressibilité normalisée κ/κ0 sont reportées.
Il est possible de donner le tableau 7.1 des principaux coefficients de Landau à différentes pressions, comprises entre la pression ambiante et la pression de solidification, à partir des mesures de Greywall.
Tab 7.1
Paramètres de Landau pour 3 He liquide Pression
m ∗ /m
F0s
F0a
F1s
0 atm
2, 78
9, 42
−0, 70
5, 34
9 atm
3, 72
29, 0
−0, 74
8, 16
18 atm
4, 50
52, 1
−0, 76
10, 50
27 atm
4, 83
64, 3
−0, 76
11, 49
34 atm
5, 74
84, 7
−0, 76
14, 22
On peut faire les remarques suivantes : – les valeurs de m ∗ /m et des coefficients F sont grandes, ce qui indique que 3 He se situe dans le régime de couplage fort à toutes les pressions. – F0s augmente rapidement avec la pression, bien plus vite que la densité. – la forte valeur de la masse effective m ∗ abaisse la température effective de dégénérescence de façon cohérente avec les déterminations expérimentales. – F0a est négatif, ce qui montre que l’interaction moyenne entre spins antiparallèles est plus forte qu’entre spins parallèles.
310
7. Théorie de Landau des liquides de Fermi
À partir de ces valeurs des paramètres de Landau, déterminées par les mesures des propriétés thermodynamiques à l’équilibre, il est possible de prévoir théoriquement certains coefficient de transport. Les valeurs obtenues pour la conductivité thermique, la viscosité et le coefficient de diffusion de spin sont en bon accord avec les déterminations expérimentales. Le caractère phénoménologique de la théorie de Landau des liquides de Fermi ne lui permet pas de faire des prédictions sur la valeurs des paramètres de Landau. Elle ne peut pas non plus donner une interprétation microscopique de la valeur de ces paramètres et de leurs variations en fonction de la pression. Deux types d’interprétations théoriques microscopiques ont été avancés pour tenter de comprendre l’origine physique des valeurs élevées de ces paramètres [13]. Dans la première, il est proposé que 3 He soit un liquide quantique presque ferromagnétique. On sait qu’au dessus de la température d’ordre ferromagnétique, mais suffisamment près de celle-ci, il existe des fluctuations de spin de grande amplitude, qui divergent à la transition du second ordre, comme la susceptibilité de vecteur d’onde q = 0. Ces fluctuations de spin ont un effet important sur toutes les propriétés thermodynamiques. Elles ont été étudiées dans le cadre de la RPA, pour interpréter les propriétés expérimentales de métaux et d’alliages presque ferrommagnétiques, tels que Pd ou PdNi [14]. Nous verrons au chapitre 10, que si on modélise les interactions entre fermions par un hamiltonien de Hubbard, avec une interaction à courte portée entre atomes U, modèle théorique simple souvent proposé pour décrire les propriétés d’ 3 He liquide [13], la susceptibilité statique s’écrit, en RPA : χ0 q (7.79) χ q = 1 − U χ0 q où χ 0 q est la susceptibilité du système sans interaction. Cette formule (7.79) a été établie initialement pour les électrons a des métaux de transition. Dans la phase paramagnétique, la susceptibilité statique est donc renforcée par un facteur S , dit de Stoner : 1 S = (7.80) 1 − U χ0 q = 0 La transition ferromagnétique se produit quand S diverge. Les métaux presque ferromagnétiques correspondent à de grandes valeurs de S. Le renforcement de la susceptibilité par rapport à sa valeur dans le système sans interaction peut être interprété par l’existence de fortes fluctuations de spin de basse fréquence ou « paramagnons ». La chaleur spécifique et la masse effective normalisée m ∗ /m peuvent être calculées dans la même approximation que la susceptibilité. On trouve que cette masse effective diverge, elle aussi, mais selon une loi différente [15] : m ∗ /m − 1 ∼ LnS ∼ Ln
χ χ0
(7.81)
311
Physique de la matière condensée
L’application de la théorie des paramagnons à 3 He a été étudiée en détails [16]. Dans cette théorie, le renforcement de la masse effective m ∗ /m est dû au nuage de fluctuations de spins ce vecteur d’onde q = 0 habillant la quasiparticule. La principale difficulté de cette théorie vient de l’observation expérimentale qu’aucune augmenta−1 n’est corrélée à celle de m ∗/m, ainsi qu’on l’attendrait si cette tion forte de 1 + F0s ∗ augmentation de m /m était due à l’approche d’une instabilité ferromagnétique. Une idée complètement différente a été proposée pour interpréter les fortes valeurs des paramètres de Landau. Il a d’abord été souligné, par Anderson et Brinkman −1 variait très peu avec la pression, précisément, alors [17], que la quantité 1 + F0a que, dans le même intervalle de pression m ∗ /m était, au contraire, une fonction −1 fortement croisante. En particulier 1 + F0a devient pratiquement indépendant de la pression à haute pression, au-dessus d’environ 10 bars. Selon ces auteurs, cet argument indique que la forte augmentation de la susceptibilité χ = χ0
−1 m∗ 1 + F0a m
−1 est essentiellement due à la masse effective, plutôt qu’au facteur 1 + F0a . Ils en 3 déduisent que He liquide ne doit pas être considéré comme un liquide « presque ferromagnétique », mais, plutôt, comme un liquide « presque localisé » ou « presque solide ». Un argument supplémentaire en faveur de ce point de vue est apporté par le comportement de la compressibilité, qui diminue fortement quand la pression croît. Cette propriété est bien celle qu’on attend d’un système qui tend de plus en plus vers une phase solide [18]. De fait, 3 He liquide est solidifié sous une pression de 34,36 bars. Les atomes sont alors complètement localisés. Anderson et Brinkman [17] ont proposé de discuter la solidification de 3 He liquide comme une localisation par les corrélations, c’est-à-dire comme une transition de Mott, ou plutôt de Wigner, analogue au phénomène de localisation des électrons par les corrélations coulombiennes dans les solides à bandes étroites [19]. Ce phénomène sera discuté dans le chapitre 8. La localisation de Mott a été étudiée, dans le cadre du modèle de Hubbard, par de très nombreux auteurs. La méthode variationnelle de Gutzwiller [20] décrit relativement bien la phase métallique corrélée, c’est-à-dire la phase liquide corrélée. Cette approche théorique sera discutée en détail au chapitre 8. Elle prévoit qu’une localisation se produit quand l’interaction intra-atomique U atteint une valeur critique Uc . À la transition, à la fois la masse effective et la susceptibilité divergent, mais contrairement à la théorie des paramagnons, où ∗ χ m /m paramagnons ∼ Ln 0 χ dans une transition de Mott, ∗ χ m /m Mott ∼ 0 χ
312
7. Théorie de Landau des liquides de Fermi
Anderson et Brinkman [17], Castaing et Nozières [18] et Vollhardt [22] proposent de discuter les propriétés de 3 He liquide dans ce cadre conceptuel, qui décrit mieux, selon eux, les variations avec la pression des paramètres de Landau. La question ne paraît pas totalement tranchée. Il semble d’ailleurs difficile, en tout état de cause, d’exclure totalement l’effet des fluctuations de spin, qui devraient de toute façon être présentes, même dans un modèle de localisation de Mott des atomes d’Hélium.
7.8 Conclusion Il faut évidemment garder présent à l’esprit que cette théorie de Landau des liquides de Fermi normaux repose sur une hypothèse essentielle : on suppose qu’on puisse établir l’interaction électron-électron de manière adiabatique, et que, à mesure que cette interaction est établie, les états du système de N électrons fortement corrélés (ou, du moins, ceux de plus basse énergie) évoluent de façon continue, de façon qu’on puisse établir une correspondance état par état entre les états du système réel et ceux du système de N électrons sans interaction. Il a été montré, par des méthodes de théorie des champs, que cette propriété restait vraie à tout ordre en perturbation. Soulignons, cependant, que ceci ne prouve en aucune façon qu’elle reste vraie dans tous les cas. Elle peut, en effet, être invalidée à chaque fois que l’état du liquide de Fermi ne peut être obtenue de façon perturbative à partir de l’état de gaz parfait. L’hypothèse de départ de Landau n’est, en fait, pas du tout triviale. Elle est même très restrictive. Nous savons, par exemple, qu’elle n’est pas vérifiée dans trois types de problèmes physiques qui font actuellement l’objet de recherches très actives : – le cas d’interactions attractives entre particules, si faible soit-elle, car alors l’état fondamental du système réel est radicalement différent de celui du système sans interaction. Il se produit une instabilité de la surface de Fermi par formation de paires particule-particule. Ce nouvel état ne peut être obtenu par modification perturbative de l’état fondamental du gaz parfait. C’est le cas des superfluides, neutres ou chargés. – le cas d’interactions répulsives trop fortes, qui détruisent la surface de Fermi par une localisation des électrons induite par leurs corrélations. Là encore, une transition de localisation (de Mott ou de Wigner) aboutit à un état auquel on ne peut arriver de façon perturbative. On parle, alors, de systèmes de fermions fortement corrélés. C’est un thème de recherche très actuel, redevenu d’actualité, à l’occasion de l’étude de la supraconductivité à haute température. Il semble bien, en effet, que les propriétés de la phase qui existe à des températures supérieures à la température critique d’apparition de la supraconductivité, ne puissent être correctement décrites dans le cadre d’une théorie de Landau des liquides de Fermi normaux. Ce qu’on appelle habituellement la « phase normale » (par référence, justement, à la théorie de Landau) ne serait justement pas une « phase normale ». Depuis, bien d’autres systèmes expérimentaux semblent également être des systèmes de fermions fortement corrélés qui ne peuvent être correctement décrits par la théorie de
313
Physique de la matière condensée
Landau des Liquides de Fermi. Les recherches sur ce thème sont importantes, car elles impliquent une modification essentielle de la description théorique simple des états à N corps qui avait été, jusqu’alors, à la base des succès considérables de la théorie quantique des solides – le cas des systèmes de basse dimensionalité. Ici, ce sont les fluctuations quantiques qui invalident l’hypothèse de départ du liquide de Fermi normal. À une dimension, il existe une solution exacte du modèle de Hubbard. Elle ne rentre pas dans le cadre du modèle de Landau. On sait qu’à une dimension la notion de quasiparticule n’a plus de sens. Les excitations de basse énergie du système sont des excitations collectives. Ce sont des oscillations collectives de la densité de charge et de la densité de spin. Elles se propagent indépendamment les unes des autres, ce qui donne lieu à un découplage des degrés de liberté de charge et des degrés de liberté de spin. De plus, les fonctions de corrélation décroissent avec la distance comme une loi de puissance. On a affaire, non à un liquide de Fermi, mais à un « liquide de Luttinger ». Nous discuterons ce cas plus en détail dans le chapitre 8. Dans le cas des liquides de Fermi normaux, où cette hypothèse de correspondance entre les états du gaz parfait et ceux du liquide en interaction peut être vérifiée, on peut introduire la notion de quasiparticule. Un état à une particule du liquide réel est le correspondant d’un état excité du gaz parfait. Insistons sur le fait que cette façon de procéder implique que le spectre d’excitations du système réel a la même structure que celui d’électrons sans interaction, ce qui n’a rien du tout d’évident. Mais à partir de cette hypothèse, on peut dire, qu’alors, à cause du principe d’exclusion, les interactions entre quasiparticules n’altèrent pas de façon importante cette structure, du moins pour ce qui concerne les quasiparticules près de l’énergie de Fermi. En effet, à partir du moment où cette hypothèse est vérifiée, les électrons du gaz parfait étant des fermions, les quasiparticules du système en interaction sont aussi des fermions. On en déduit aussi qu’il existe une surface de Fermi. L’autre hypothèse de base, absolument cruciale pour la théorie de Landau des Liquides de Fermi, est la description de ces quasiparticules de basse énergie et de grande durée de vie par la fonctionnelle de l’énergie libre de l’équation (7.25) : on écrit une fonctionnelle de l’énergie libre de l’état où les quasiparticules sont excitées, développée en série de l’écart de la fonction de distribution par rapport à la distribution d’équibre du fondamental. Dans ce développement, les termes d’interaction entre quasiparticules jouent un rôle essentiel. Les règles de calcul des propriétés thermodynamiques du liquide réel s’avèrent être très similaires (mais non pas identiques) à celles qui s’appliqueraient pour des électrons dans un gaz parfait. Elles font intervenir les coefficients de cette fonctionnelle de l’énergie libre. Le calcul ab initio de ces coefficients serait extrêmement difficile. La démarche adoptée est alors phénoménologique : on postule l’existence de la relation fonctionnelle, et à partir de celle-ci, on calcule la chaleur spécifique, la susceptibilité, la compressibilité, etc. Puis, on détermine les coefficients du développement en harmoniques sphériques de la fonction f à partir de données expérimentales. À ce niveau, le pouvoir quantitatif de la théorie est faible parce que les paramètres de Landau ne sont pas déterminés. Qualitativement, cependant, les prédictions sont importantes : les propriétés thermodynamiques de
314
7. Théorie de Landau des liquides de Fermi
basse température d’un système de fermions en interaction sont très similaires à celles d’un système sans interaction. Les interactions ne font qu’apporter des renormalisations quantitatives. De véritables prédictions quantitatives sont cependant obtenues quand on étend la théorie aux propriétés hors d’équilibre, en utilisant l’équation de Boltzmann. Un nouveau phénomène a été prédit, et réellement observé dans 3 He [7] ; l’existence d’excitations collectives, appelées le Zéro Son. Cette approche permet également le calcul de la durée de vie des quasiparticules et l’étude de sa divergence quand on approche l’énergie de Fermi. Elle permet également l’étude d’un grand nombre de phénomènes de transport. Comme nous l’avons mentionné, le système idéal pour l’application de la théorie de Landau est 3 He liquide, qui possède une interaction entre particules à la fois à courte portée et isotrope. L’application aux électrons des métaux est moins simple. D’abord, les interactions coulombiennes sont à longue portée. Le problème peut cependant être réglé en incluant correctement les effets d’écran. D’autres difficultés, au moins sur le plan quantitatif, viennent de ce que les métaux sont naturellement anisotropes. Il ne s’agit pas d’un problème de nature fondamentale, mais les développements en polynomes de Legendre que nous avons utilisés deviennent difficiles à écrire. La description des interactions entre particules à l’aide d’un petit nombre de paramètres devient impossible. Le cas des métaux alcalins, dont la surface de Fermi est presque sphérique, constitue une exception. La détermination des paramètres de Landau peut alors être tentée [9]. Il faut noter que les difficultés pour appliquer la description de Landau dans les métaux n’est pas de nature conceptuelle. Elles n’invalident pas ses résultats qualitatifs très importants, en particulier le concept de quasiparticule, mais introduisent plutôt des limitations à l’utilité à des fins quantitatives de cette théorie. En conclusion, on peut dire que la théorie de Landau des liquides de Fermi justifie la description en électrons indépendants dans certaines limites : – pourvu que nous traitions des électrons dans une tranche de largeur kB T autour de εF , – pourvu qu’on utilise la notion des quasiparticules, et non plus simplement d’électrons, – pourvu que les paramètres décrivant les quasiparticules et leurs interactions soient renormalisés, – pourvu qu’il n’existe pas d’instabilité de la surface de Fermi, remettant en cause l’image de liquide de Fermi normal.
Bibliographie 1. L.D. Landau, Sov. Phys. JETP, 3, 920 (1957) 2. L.D. Landau, Sov. Phys. JETP, 5, 101 (1957) 3. L.D. Landau, Sov. Phys. JETP, 8, 70 (1958) 4. A.A. Abrikosov, L.P. Gorkov et I.E. Dzyaloshinski, Methods of Quantum Field Theory in Statistical Mechanics (Dover, New York, 1963)
315
Physique de la matière condensée
5. 6. 7. 8. 9. 10. 11.
12. 13. 14. 15. 16.
17.
18. 19. 20. 21. 22.
316
P. Nozières, Interacting Fermi Systems, (Benjamin, New York, 1964) L.P. Kadanoff et G. Baym, Quantum Statistical Mechanics (Benjamin, Menlo Park, 1962) L.P. Pitaevskii, Sov. Phys. 10, 1267 (1959) J.M. Luttinger et P. Nozières, Phys. Rev. 127, 1423 (1962) D. Pines et P. Nozières, The Theory of Quantum Liquids (Addison-Wesley, Menlo Park, 1966) G. Baym et C. Pethic, in The Physics of Liquid and Solid Helium, edited by K.H. Bennemann et J.B. Ketterson (Wiley, New York, 1978), Vol. 2 Pour une revue sur les propriétés de l’hélium 3 liquide, voir par exemple, G. Baym et C. Pethic, in The Physics of Liquid and Solid Helium, edited by K.H. Bennemann et J.B. Ketterson (Wiley, New York, 1978), Vol. 2 D.S. Greywall, Phys. Rev. B 27, 2747 (1983) pour une revue, voir, par exemple, D. Vollhardt, Rev. Mod. Phys. 56, 99 (1984) Pour une revue, voir, par exemple, K. Levin et O.T. Valls, Phys. Rep. 98, 1 (1983) S. Doniach et S. Engelsberg, Phys. Rev. Lett. 17, 750 (1966) Voir, par exemple, M.T. Béal-Monod, S.K. Ma et D.R. Fredkin, Phys. Rev. Lett. 20, 929 (1968) ; K. Levin et O.T. Valls, Phys. Rev. B 20, 105 (1979) ; G. Baym et C. Pethic, in The Physics of Liquid and Solid Helium, edited by K.H. Bennemann and J.B. Ketterson (Wiley, New York, 1978), Vol. 2 ; ; K. Levin et O.T. Valls, Phys. Rep. 98, 1 (1983) P.W. Anderson et W.F. Brinkman, in The Helium Liquids, edited by J.G.M. Armitage and I.E. Fardhar (Academic, New York), p. 315 (1975) ; P.W. Anderson et W.F. Brinkman, in The Physics of Liquid and Solid Helium, edited by K.H. Bennemann and J.B. Ketterson (Wiley, New York, 1978), Vol. 2 B. Castaing et P. Nozières, J. Physique (Paris), 40, 257 (1979) ; B. Castaing, J. Physique (Paris) Lett. 41, 335 (1980) N.F. Mott, Proc. Phys. Soc. London, 62, 416 (1949) M. Gutzwiller, Phys. Rev. 137, A1726 (1965) W.R. Abel, A.C. Anderson et J.C. Wheatley, Phys. Rev. Lett. 17, 74 (1966) D. Vollhardt, Rev. Mod. Phys. 56, 99 (1984)
Au-delá du liquide de Fermi Nous avons vu au chapitre précédent que la théorie de Landau des liquides de Fermi cessait d’être valable quand les hypothèses de Landau n’étaient plus vérifiées et, notamment, dans deux limites extrêmes : – le cas des systèmes de fermions fortement corrélés où, si les corrélations deviennent trop fortes, elles vont jusqu’à détruire la surface de Fermi et à localiser les électrons. C’est le problème de la transition de Mott. – le cas des systèmes de basse dimensionalité et, notamment des systèmes unidimensionnels, où la notion de quasiparticle n’a plus de sens. Nous allons discuter brièvement dans ce chapitre ces deux cas. Nous allons voir pourquoi le modèle de liquide de Fermi cesse d’être valable et comment il faudrait modifier le traitement théorique de ces deux types de systèmes, qui posent des problèmes particulièrement difficiles.
8.1 Localisation par les corrélations électroniques Toute l’approche des deux précédents chapitres est une approche de champ moyen, qui suppose que les corrélations électroniques restent faibles devant l’énergie cinétique de bande. Ceci est valable en toute rigueur dans la limite des fortes densités.
317
Physique de la matière condensée
Nous avons vu que la RPA prenait en compte les premiers termes d’un développement en puissance de rs , ce qui suppose évidemment rs 1. En réalité cette limite n’est guère atteinte que dans le milieu très dense des étoiles à neutrons. Dans les métaux usuels, les ordres de grandeur sont en général compris dans l’intervalle 2 rs 6. En fait, la véritable justification d’une théorie de type champ moyen, dans ce cas, est donnée par la théorie de Landau des liquides de Fermi, qui introduit la notion de quasi-particules de basse énergie faiblement couplées, à température faible devant l’énergie de Fermi (voir le chapitre 7).
8.1.1 Transition de Wigner-Mott : généralités Nous voyons en particulier que l’approche RPA cesse complètement d’être valable dans la limite des faibles densités, où l’énergie cinétique devient négligeable devant l’énergie de corrélation. C’est l’énergie cinétique, qui varie en rs−2 , qui tend à délocaliser les électrons et à assurer le caractère métallique. Au contraire l’énergie de corrélation, qui varie typiquement en rs−1 , est minimisée quand les électrons s’évitent au maximum, c’est-à-dire quand ils restent localisés sur leurs sites. On sait qu’à cause de cet effet, l’état stable dans la limite des faibles densités, c’est-à-dire pour rs 1 est le cristal de Wigner, c’est-à-dire un réseau régulier d’électrons (probablement cubique centré). Dans cette limite, le terme dominant est, à l’ordre zéro en perturbation, l’énergie électrostatique entre charges ponctuelles. L’effet de l’énergie cinétique, petite perturbation dans cette limite, est d’introduire des vibrations de point zéro qui délocalisent chaque électron dans un petit volume entourant le site du réseau parfait. Dans la limite opposée du liquide de Fermi dense, le terme dominant est l’énergie cinétique qui délocalise les électrons : l’état stable est un liquide d’électrons itinérants qui possède la symétrie du gaz parfait. Les interactions peuvent être correctement traitées en champ moyen et ne provoquent aucune brisure spontanée de symétrie. Entre ces deux limites, il se produit nécessairement une transition de phase : en diminuant la densité, les interactions deviennent de plus en plus importantes par rapport à l’énergie cinétique. Pour une valeur critique de la densité, on passera d’un liquide d’électrons délocalisés, parfaitement symétrique, à un cristal de charges localisées, qui brise l’invariance par translation du liquide. Il s’agit donc d’une transition de cristallisation qui se produit quand la densité diminue, contrairement au phénomène habituel de cristallisation classique. En effet, ici, le caractère liquide de la phase dense est un phénomène quantique dû à l’énergie cinétique quantique des électrons. Contrairement à la fusion classique, la fusion quantique du cristal de Wigner est obtenue en augmentant la densité, parce que cette augmentation de la densité diminue l’importance relative des interactions entre électrons. Cette véritable cristallisation du système d’électrons a bien été observée expérimentalement en confinant un gaz d’électrons à la surface de l’Hélium, où il forme une couche bidimensionnelle, en appliquant un champ électrique suffisamment fort dans
318
8. Au-delá du liquide de Fermi
la direction normale à la surface de l’Hélium. La cristallisation est détectée par l’apparition d’un mode de phonon transverse, indiquant une phase où le module de cisaillement est non nul, ce qui est incompatible avec une phase liquide. La transition solide-liquide et le diagramme de phase en fonction de la température et de la densité d’électrons ont été étudiés en détail. Ce phénomène de cristallisation de Wigner entraîne la formation d’un réseau qui n’existe pas dans l’état liquide et brise donc l’invariance par translation du système. Cependant, le phénomène de localisation par les interactions électroniques peut se produire sans que cette brisure spontanée de symétrie apparaisse. C’est le cas des solides cristallins où les ions s’ordonnent sur un réseau régulier. Les électrons peuvent être délocalisés dans des états de Bloch si la largeur de bande électronique, c’està-dire le terme d’énergie cinétique, est suffisamment important. On a alors affaire à un système d’électrons itinérants, dont les propriétés sont celles d’un conducteur, coexistant avec un réseau ordonné d’ions localisés. Comme dans le cas de la transition de Wigner, le système d’électrons itinérants du conducteur peut subir une localisation quand les corrélations électroniques deviennent plus importante que l’énergie cinétique de bande. Bien entendu, dans ce cas, la localisation électronique s’effectue sur les sites du réseau ionique, qui existait déjà dans la phase conductrice. La localisation se produit donc sans brisure spontanée de l’invariance par translation. Il n’y a donc pas de brisure spontanée de symétrie. On appelle cette localisation électronique induite par les corrélations sur un réseau ionique préexistant la transition de Mott [1, 2, 3, 4]. On en connait un grand nombre d’exemples observés expérimentalement, dans les systèmes où la largeur de la bande de conduction est du même ordre que l’énergie moyenne d’interaction entre électrons. C’est notamment le cas de nombreux oxydes de métaux de transition, où la bande d est suffisamment étroite. L’archétype de l’isolant de Mott, qui contredit la prédiction de l’approximation des bandes est l’oxyde de Nickel NiO. Dans cet état d’oxydation, le Nickel, à l’état d’ion Ni 2+ , porte 8 électrons d. Le champ cristallin en site octaédrique (figure 8.1) lève partiellement la dégénérescence orbitale des états d en formant un triplet t2g , occupé par 6 électrons en tenant compte de la dégénérescence de spin, et un doublet eg , occupé par les deux électrons d restants. Ce doublet forme donc, à l’état solide, une bande à moitié remplie, qui donnerait lieu à un état conducteur dans l’approximation des bandes. Or NiO, pur et stoechiométrique, est connu comme un isolant. Cet état isolant est la conséquence de la localisation de Mott dans une bande d rendue très étroite par l’éloignement des atomes de Nickel causés par la présence des oxygènes. En fait, la bande est si étroite que la transition de Mott ne se produit pas, l’énergie cinétique restant toujours faible devant l’énergie de corrélation électronique. Pour que la transition de Mott puisse être observée, il faut pouvoir faire varier le rapport entre ces deux énergies de façon à créer deux situations différentes : celle où l’interaction électronique domine, on a alors un isolant ; et celle où l’énergie cinétique domine, on a alors un conducteur. Il faut pour cela que ces deux termes soient du
319
Physique de la matière condensée
Fig. 8.1 Le champ cristallin sépare les états 3d de l’ion Nickel, en site octaedrique, en un triplet t2g et un doublet eg . Les huit électrons 3d du Nickel dans NiO occupent les états du triplet t2g (soit 6 états en tenant compte du spin) et la moitié des états du doublet eg (soit 4 états). Le doublet eg, à moitié rempli, donne naissance à l’état solide à moitié rempli. Dans l’approximation des bandes, NiO devrait être conducteur.
même ordre. Un exemple typique est celui de l’oxyde de Vanadium, V2 O3 (figure 8.2), qui a été beaucoup étudié expérimentalement dans les années soixante-dix [5] et revisité récemment [6].
Point critique
Métal Isolant
Pression exp.
Isolant antiferromagnétique
Pression Croissante
Fig. 8.2 Diagramme de phase de V2 O3 .
320
8. Au-delá du liquide de Fermi
8.1.2 Le traitement de Hubbard Pour simplifier, considérons un réseau d’atomes d’hydrogène. Les orbitales 1s forment une bande à moitié remplie, puisqu’il y a un seul électron par atome. La théorie des bandes prévoit donc un comportement métallique. Ceci devrait rester vrai quelle que soit la valeur du paramètre du réseau cristallin et quelle que soit l’étroitesse de la bande. En réalité, on sait bien que cette description cesse d’être valable quand les atomes sont trop éloignés les uns des autres. Le point de départ correct est, au contraire, la limite atomique où chaque électron est localisé sur un site atomique, ce qui correspond à un état isolant. Localiser les électrons coûte une énergie cinétique par électron de l’ordre de zt où t est l’intégrale de transfert électronique entre sites premiers voisins et z le nombre de premiers voisins, mais déplacer un électron d’un site vers le voisin en créant un site vide et un site doublement occupé coûte une énergie de corrélation, qu’on appellera U, car la répulsion coulombienne entre électrons est plus forte quand ils occupent le même site. Pour U zt on aura un état isolant et pour U zt, on est dans la limite où l’approximation des bandes reste valable : le système est métallique. On prévoit pour une valeur intermédiaire de U /zt ∼ 1 une transition métal-isolant sans brisure de symétrie. Cette transition est nécessairement du premier ordre à cause du potentiel coulombien en 1/r . Pour un tel potentiel en 1/r , il existe toujours, à trois dimensions, un état lié entre un électron et un trou et donc il ne peut pas exister d’état métallique où la densité de porteurs libres tendrait continûment vers zéro. L’état métallique n’est compatible qu’avec un potentiel écranté V (r ) ∼
exp −q0 r r
où q0−1 , la longueur d’écran, doit être inférieure à la distance moyenne électron-trou dans l’état lié. Tant que la longueur d’écran est supérieure à cette dernière distance moyenne ∼ a0 , rayon de l’orbite de Bohr de l’état lié, l’existence d’un état lié électron-trou impose un état isolant. Ceci est une propriété du potentiel coulombien en 1r . La transition de Mott doit donc être du premier ordre et se produire pour 1
n 3 a0 ∼ 1 où a0 est le rayon de l’orbite de Bohr d’un électron de masse effective m. La concentration de porteurs de charge libres montre une discontinuité. Pour essayer de décrire ce phénomène de compétition entre énergie cinétique et énergie de corrélation, le modèle le plus simple consiste à décrire le terme de bande
321
Physique de la matière condensée
par un hamiltonien de liaisons fortes à une seule bande, sans dégénérescence orbitale + H0 = ti,j ciσ cj σ (8.1) i,j,σ + est où l’intégrale de transfert ti,j est non nulle entre sites premiers voisins, et où ciσ un opérateur de création d’électron dans une orbitale atomique localisée sur le site i. On considère ici le cas d’une bande sans dégénérescence orbitale, dans le but de simplifier le modèle le plus possible. En fait, bien souvent, la localisation de Mott se produit pour des bandes d ou f , parce qu’il s’agit de bandes étroites. Mais il subsiste souvent dans ces bandes une dégénérescence orbitale non entièrement levée par les effets de champ cristallin. Cette dégénérescence introduit des effets non triviaux qui ne seront pas discutés ici.
Le terme d’interaction entre électrons est simplifié à l’extrême puisqu’on ne conserve que l’interaction intra-atomique : ni↑ ni↓ (8.2) Hint = U i + ciσ est l’opérateur nombre d’occupation du site i . C’est une approxioù niσ = ciσ mation qui peut se justifier si le potentiel coulombien est suffisamment écranté, donc dans la phase métallique, mais qui ignore le caractère à longue portée de l’interaction dans la phase isolante, et qui donc affectera le caractère premier ordre de la transition de Mott. Un tel hamiltonien,
H = H0 + Hint
(8.3)
introduit par Hubbard [7], a donné lieu à de nombreuses études pour décrire, de la façon la plus simple, les effets de corrélation dans les métaux et, plus précisément la compétition entre énergie cinétique et énergie de corrélation. Le traitement de cet hamiltonien est simple dans la limite Hartree-Fock (approximation des bandes) est valable.
U t
→ 0, où le traitement
La limite opposée Ut → 0 est également simple. Dans cette limite atomique, on obtient deux niveaux d’énergie sur chaque atome : le niveau correspondant à un atome simplement occupé d’énergie 0, et le niveau correspondant à l’occupation par deux électrons, d’énergie U . Dans le cas d’un électron par atome, dans le fondamental, chaque atome est occupé une fois et une seule. Dans le cas Ut 1, le terme d’énergie cinétique introduit un couplage antiferromagnétique de superéchange 1 Jij Si · Sj − 4 qu’on peut calculer au deuxième ordre en perturbation : Jij =
322
4t 2 U
8. Au-delá du liquide de Fermi
Ce calcul de perturbation fait intervenir des états excités d’énergie U où le site i est vide et le site j premier voisin est doublement occupé, à condition que les électrons des sites i et j aient leurs spins antiparallèles ; sinon le processus serait interdit par le principe d’exclusion. Ce terme de perturbation tend à abaisser l’énergie cinétique des électrons. Ce couplage d’échange antiferromagnétique va lever la dégénérescence de spin qui existe pour Ut = 0. L’état fondamental pour 1 électron par atome, pour
t U
1, est donc un état isolant 2
t antiferromagnétique, avec une température de Néel TN = z U . Quand Ut croît, les niveaux atomiques s’élargissent jusqu’à former des bandes qui se chevauchent (figure 8.3). On a alors une transition vers un état métallique. Si l’idée physique à la base du phénomène est claire, sa description précise est difficile, parce que la transition se produit pour des valeurs intermédiaires du couplage zt ∼ U.
Énergie
E0 + u
E0
t
tcritique Isolant de Mott
Métal
Fig. 8.3 Schéma de l’élargissement des niveaux atomiques en deux sous-bandes dans une transition de Mott-Hubbard.
Hubbard a proposé un traitement simple de ce problème, qui consiste à écrire l’équation du mouvement de la fonction de Green à un électron. Celle-ci est elle-même couplée à la fonction de Green à deux électrons, dont l’équation du mouvement est couplée à la fonction de Green à trois électrons. Cette chaîne infinie d’équations couplées n’est pas soluble. La solution proposée par Hubbard consiste à tronquer cette chaîne par une approximation de découplage, où la fonction de Green à deux particules est approchée par le produit de deux fonctions de Green à une particule. Il s’agit d’une approximation mal contrôlée sur le plan théorique, qui fournit en fait une interpolation entre les deux limites simples, mais l’étude des propriétés de la transition par cette méthode n’offre aucune garantie. Il faut noter que la transition isolant-métal n’a lieu que dans le cas d’une bande à moitié pleine (1 électron par atome). C’est le cas dans cette approximation, mais aussi dans les traitements plus sophistiqués exposés plus loin, notamment dans la solution exacte de la théorie de champ moyen dynamique (Dynamical Mean Field Theory ou simplement DMFT en anglais) en dimension infinie.
323
Physique de la matière condensée
Métal
Isolant
ρ(ω)
U-2D
-U/2
0 ω
0 ω
+U/2
Fig. 8.4 Évolution schématique de la densité d’états a une particule, pour deux valeurs de l’interaction intra-atomique U , selon la méthode de Hubbard. Pour U faible devant la largeur de bande, les deux sous-bandes se chevauchent, le systeme est métallique. Pour U supérieur á la largeur de bande les deux sous-bandes sont disjointes. La densité d’états au niveau de Fermi est nulle : le système est isolant.
8.1.3 L’approximation variationnelle de Gutzwiller L’hamiltonien de Hubbard, bien qu’étant très simplifié par rapport à la réalité physique, est difficile à résoudre, en particulier dans le régime intermédiaire (t ∼ U ) où la compétition entre les effets de bande et de localisation due aux corrélations est la plus subtile. Seul le cas à une dimension a été résolu exactement par Lieb et Wu [11] en 1968. Les résultats obtenus pour cette dimension d’espace sont très spécifiques et ne peuvent pas être étendus à des dimensions plus élevées. Pour des dimensions supérieures, il n’existe que des approximations plus ou moins satisfaisantes, en plus de quelques résultats exacts en théorie des perturbations quand t /U ou U /t sont petits. L’approche de Gutzwiller est une approximation variationnelle d’un grand intérêt, car elle décrit assez bien la situation du métal fortement corrélé et permet de faire une interpolation correcte entre la limite non corrélée ( Ut → 0) et la limite opposée ( Ut → 0) [8]. Gutzwiller a proposé de résoudre l’hamiltonien de Hubbard à T = 0 par une méthode variationnelle. L’exposé de ce paragraphe reposera essentiellement sur les articles de Gutzwiller [8, 9, 10], de W.F. Brinkmann et T.M. Rice [12], l’article de revue de D. Vollhardt [13], ainsi qu’un cours de P. Nozières au Collège de France, malheureusement non publié [13]. Soit un réseau contenant L sites, N↑ spins ↑, N↓ spins ↓ et D sites doublement occupés. L’idée de Gutzwiller est de construire une fonction d’onde d’essai en prenant pour point de départ l’état non corrélé |0 > , valable pour U = 0, et en réduisant le nombre de sites doublement occupés sous l’effet des corrélations. En effet, quand l’interaction est établie, le nombre de sites doublement occupés décroît parce que l’énergie d’interaction, égale à UD, doit diminuer. La fonction d’onde variationnelle de l’état corrélé proposée par Gutzwiller est donnée par : (8.4) 1 − 1 − g ni↑ ni↓ |0 > |G > = i D
= g |0 >
324
(8.5)
8. Au-delá du liquide de Fermi
où g est un paramètre variationnel qui doit être calculé de façon à minimiser l’énergie de l’état fondamental donnée par : Eg =
< G | H | G > < G |G >
(8.6)
On voit que l’effet des corrélations est de modifier la valeur du coefficient g, paramètre variationnel qui doit être compris entre 0 et 1. Le choix g = 1 correspond à un état non corrélé, alors que dans la limite opposée g = 0, la fonction d’onde de Gutzwiller ne comporte aucun site doublement occupé. En effet 1 − ni↑ ni↓ (8.7) PG = i
peut être considéré comme le projecteur sur l’espace des états sans double ocupation de site. Pour 0 < g < 1, le choix de la fonction d’onde de Gutzwiller réduit l’amplitude des configurations comportant D sites doublement occupés par un facteur g D . La difficulté de cette approximation variationnelle est qu’on ne sait pas calculer la valeur moyenne de l’énergie < G | H | G >, même dans cet état variationnel | G >. D’autres approximation seront donc nécessaires.
8.1.3.1 Position du problème Nous allons supposer que l’état est spatialement homogène. On appelle L le nombre total de sites, N↑ le nombre d’électrons de spin ↑ et N↓ le nombre d’électrons de spin ↓ . L’occupation moyenne par site pour les électrons de spin σ est nσ = Nσ /L. Nous appelons n = n↑ + n↓ = 1 − δ, et nous ne considérerons que des situations où n↑ = n↓ = n/2. Soit D0 le nombre de sites doublement occupés dans l’état sans interaction |0 >. La concentration moyenne de sites doublement occupés dans |0 > est D0 n2 d0 = = n↑ n↓ = L 4 Le paramètre variationnel est g, mais il existe, en fait, une relation entre g et d = D /L , concentration moyenne de sites doublement occupés dans l’état |g >. Nous supposerons, que n ≤ 1. Ceci ne restreint pas la généralité du problème dans le cas où le réseau est alterné, (c’est-à-dire un réseau qui peut être séparé en deux sous-réseaux A et B, tels que tout premier voisin d’un site de A appartienne à B et vice versa). Dans ce paragraphe, nous nous placerons toujours dans ce cas. Le problème présente alors une symétrie électron-trou. Un site donné peut être occupé – soit par une paire de spins ↑ ↓, avec la probabilité d – soit par un seul électron de spin ↑, avec la probabilité n↑ − d
325
Physique de la matière condensée
– soit par un seul électron de spin ↓, avec une probabilité n↓ − d – soit par aucun électron, avec une probabilité 1 − n↑ − n↓ + d. Pour calculer l’énergie variationnelle, il est commode de classer les configurations de spin par D, nombre de sites doublement occupés. Pour une valeur donnée de D, le vecteur d’état est une superpositions de kets de la forme
|C = i1 , · · · iN↑ −D ; j1 , · · · jN↓ −D ; k1 , · · · kD (8.8) Le nombre de tels kets de D donné se calcule facilement, comme un problème combinatoire : L! GD = N↑ − D ! N↓ − D !D! L − N↑ − N↓ + D !
(8.9)
puisqu’on a, parmi L sites, (N↑ −D) sites occupés par un spin ↑ seulement, (N↓ −D) sites occupés par un spin ↓ seulement, D sites doublement occupés et (L − N↑ − N↓ + D) sites vides. Le nombre total de kets sans spécifier D, que nous appelerons GT , s’écrit : GD GT =
(8.10)
D
=
L! L! N↑ ! L − N↑ ! N↓ ! L − N↓ !
(8.11)
Comme nous l’avons vu, l’approximation variationnelle de Gutzwiller nécessite d’autres approximations, pour permettre de calculer l’énergie variationnelle, que nous allons signaler, au fur et à mesure où elles apparaissent nécessaires. Nous allons d’abord supposer que toutes les configurations sont également probables. Alors, |0 =
ϕ0 C |C
(8.12)
C
où
2
ϕ0 C = 1 GT
Alors, la norme de la fonction d’onde de Gutzwiller s’écrit 2D g GD G |G = D GT
(8.13)
(8.14)
À la limite thermodynamique, où N →
∞, cette somme de termes est en fait contrôlée par son plus grand terme, max g 2D , GD .
326
8. Au-delá du liquide de Fermi
En utilisant la formule de Stirling, valable dans la limite où N → ∞ N ! N ln N − N on obtient :
d 1 − n↑ − n↓ + d g = n↑ − d n↓ − d 2
(8.15)
Ceci fournit une relation entre la valeur optimale de D = dL) et le paramètre g (figure 8.5). Il sera donc possible d’effectuer le calcul variationnel en prenant pour paramètre variationnel soit g , soit d.
Fig. 8.5 Concentration de sites doublement occupés d en fonction du paramètre variationnel de Gutzwiller g.
Pour g = 1, c’est-à-dire en l’absence d’interaction, l’expression ci-dessus redonne d = n↑ n↓
(8.16)
ce qui correspond bien à la valeur de d en l’absence de corrélation. Pour g → 0, d est d’ordre g 2 si n = 1. Mais si n = 1, d reste d’ordre g quand g → 0.
8.1.3.2 Calcul de l’énergie variationnelle Pour calculer l’énergie variationnelle de Gutzwiller Eg =< G | H | G > / < G |G >, il est nécessaire de connaître, outre la norme de la fonction d’onde < G |G >, dont nous venons d’écrire une expression approchée, la valeur moyenne de l’hamiltonien de Hubbard.
8.1.3.3 Valeur moyenne d’opérateur à un site Cette dernière comprend des termes qui ne font intervenir qu’un seul site, à savoir l’interaction intra-atomique < G | U i ni↑ ni↓ | G >. Ces termes peuvent être calculés sans approximation supplémentaire (dans le cadre de l’approximation variationnelle). En effet, à la limite thermodynamique, | G > est fonction propre
327
Physique de la matière condensée
de l’opérateur nombre i ni↑ ni↓ , si bien que le terme d’interaction dans l’expression de Eg st simplement donné par < G | U i ni↑ ni↓ | G > = UD (8.17) < G |G >
8.1.3.4 Valeur moyenne d’opérateur à deux sites + Par contre, la valeur moyenne de l’énergie cinétique < G | i,j,σ tij ciσ cj σ | G >, qui fait intervenir des opérateurs agissant sur deux sites, est plus compliquée à calculer. Gutzwiller a fait des hypothèses concernant les amplitudes d’éléments de matrice de l’opérateur densité et des relations de phase entre les différentes configurations de spin [8]. Il suppose que le mouvement des électrons de spin ↑ est essentiellement indépendant du comportement des électrons de spin ↓ (et vice versa) : les électrons de spin ↓ pourraient simplement supposés être infiniment lourds, jouant simplement le seul rôle d’obstruction pour les électrons de spin ↑. Bien que l’approximation soit loin d’être transparente, le calcul de la valeur moyenne de l’énergie cinétique, sous ces hypothèses se réduit à un problème combinatoire. P. Nozières a donné de ces approximations une représentation en terme de propriétés de l’opérateur densité [13]. + cj ↑ , il convient de considérer l’effet de cet Pour calculer la valeur moyenne de ci↑ opérateur sur la fonction d’onde dans les quatre configurations de spin sur les sites i et j schématisées dans le tableau ci-dessous. Pour calculer la contribution à la valeur moyenne de l’énergie cinétique de ces quatre processus, nous allons d’abord regrouper ensemble toutes les configurations qui comprennent D sites doublement occupés en dehors des sites i et j et discuter l’effet de + cj ↑ sur ces configurations dans les quatre processus schématisés dans le tableau ci↑ ci-dessous : j 1) ↑
i → j i 0 → 0 ↑
2) ↑↓ ↓ → ↓ ↑↓ 3) ↑↓ 0 → ↓ ↑ 4) ↑
328
↓ → 0 ↑↓
8. Au-delá du liquide de Fermi
Processus n◦ 1 : soit D le nombre total de sites doublement occupés en dehors des sites i et j ; il y en a également D en incluant i et j , d’où le facteur g D ; il y a, en dehors des sites i et j, seulement L − 2 sites disponibles pour les N↑ − 1 spins ↑, mais L sites disponibles pour les N↓ spins ↓ ; le nombre de configurations possibles pour ce saut en ayant D sites doublement occupés est GD (L − 2, N↑ − 1, N↓ ). La contribution de ces processus, si on somme sur toutes les valeurs de D s’écrit donc : ε↑ g 2D P L − 2, N↑ − 1 P L, N↓ GD (L − 2, N↑ − 1, N↓ ) (8.18) T1 = D
où ε↑ =
1 + ti,j ci↑ cj ↑ | 0 > < 0 | L
(8.19)
i,j
est l’énergie cinétique moyenne des électrons de spin ↑ dans l’état non corrélé et où L−Nσ P L, Nσ = nσNσ 1 − nσ
(8.20)
est la probabilité d’avoir Nσ électrons de spin σ sur L sites. Processus n◦ 2 : dans le deuxième cas, il faut compter D sites doublement occupés, en dehors des sites i et j, auxquels il faut ajouter celui du site i dans le ket, plus celui du site j dans le bra ; il y a L − 2 sites disponibles pour les N↑ − 1 spins ↑, mais également L − 2 sites disponibles pour les N↓ − 2 spins ↓ ; le nombre de configurations possibles pour ce saut est ND (L −2, N↑ −1, N↓ −2). La contribution de ces processus, si on somme sur toutes les valeurs de D s’écrit donc : ε↑ g 2D+2 P L − 2, N↑ − 1 P L, N↓ GD (L − 2, N↑ − 1, N↓ − 2) T2 = D
(8.21)
n◦ 3
n◦ 4
et : ces deux processus donnent des contributions complexes Processus conjuguées, donc égales (puisqu’elles sont réelles) ; le nombre total de sites doublement occupés est D + 1, le nombre de spins ↑ en dehors des sites i et j est N↑ − 1 et le nombre de spins ↓ en dehors des sites i et j, N↓ − 1) ; d’où la contribution ε↑ g 2D+1 P L − 2, N↑ − 1 P L, N↓ GD (L − 2, N↑ − 1, N↓ − 1) T3 = 2 D
(8.22) Ce qui donne, au total : + ti,j ci↑ cj ↑ | G >= ε↑ g 2D P L − 2, N↑ − 1 P L, N↓ < G | i,j
D
ND (L − 2, N↑ − 1, N↓ ) + g 2 ND (L − 2, N↑ − 1, N↓ − 2) +2gND (L − 2, N↑ − 1, N↓ − 1)
(8.23)
329
Physique de la matière condensée
On peut écrire de la même façon la valeur moyenne de l’hamiltonien cinétique pour les électrons de spins ↓ dans l’état | G >, en permutant le rôle des deux directions de spin : + ti,j ci↓ cj ↓ | G >= ε↓ g 2D P L − 2, N↓ − 1 P L, N↑ < G | i,j
D
ND (L − 2, N↓ − 1, N↑ ) + g 2 ND (L − 2, N↓ − 1, N↑ − 2) +2gND (L − 2, N↓ − 1, N↓ − ↑ )
(8.24)
où ε↓ est l’énergie cinétique moyenne des électrons de spin ↓ dans l’état non corrélé. Un calcul équivalent pour la valeur moyenne de l’énergie d’interaction donne : ni↑ ni↓ | G > < G | i
=L
g 2D+2 GD (L − 1, N↑ − 1, N↓ − 1)P L, N↑ P L, N↓ (8.25)
D
En effet, le site i est un site doublement occupé, il y en a donc D + 1, d’où le facteur g 2D+2 (g D+1 pour le ket et g D+1 pour le bra). Il faut compter toutes les configurations avec D sites doublement occupés, N↑ − 1 spins ↑, N↓ − 1 spins ↓ et multiplier par la probabilité d’avoir N↑ spins ↑ parmi L sites et N↓ spins ↓ parmi L sites. Comme dans le calcul de la norme, les différentes sommes des équations (8.18– 8.25) sont remplacées, à la limite thermodynamique L, N↑ , N↓ → ∞ par leurs plus grands termes.
8.1.3.5 Calcul de l’énergie de l’état fondamental Après minimisation par rapport au paramètre variationnel g , dans la limite thermodynamique (L, N↑ , N↓ → ∞ ), Gutzwiller a obtenu un résultat simple pour l’énergie de l’état fondamental donnée par : Eg = q↑ d, n↑ , n↓ ε↑ + q↓ d, n↑ , n↓ ε↓ + Ud L
(8.26)
où d = D/L et nσ = Nσ /L Dans cette expression, les quantités 2 nσ − d 1 − nσ − n−σ + d + n−σ − d d qσ = n σ 1 − nσ
330
(8.27)
8. Au-delá du liquide de Fermi
représentent les discontinuités des fonctions de distribution des spins σ au niveau de Fermi (figure 8.6), calculées à l’aide de l’expression donnée ci-dessus pour la norme de la fonction d’essai < G | G >.
Fig. 8.6 Fonction de distribution à température nulle pour des électrons corrélés. La discontinuité au niveau de fermi est réduite par rapport au cas des électrons libres.
8.1.3.6 Propriétés de la solution W.F. Brinkman et T.M. Rice [12] ont été les premiers à utiliser la méthode variationnelle de Gutzwiller pour discuter la transition de Mott-Hubbard. Les calculs de Gutzwiller se simplifient beaucoup dans le cas d’une bande à moitié pleine (un électron par site) et d’une solution non magnétique. Alors, n = 1,
N↑ = N↓ ,
q↑ = q↓ ,
ε↑ = ε↓ = ε0
Dans ce cas, la distribution des électrons présentent une discontinuité à l’énergie de Fermi dont l’expression s’écrit simplement : q = 8d 1 − 2d (8.28) Cette quantité a une signification physique très importante, puisqu’elle traduit l’existence d’une surface de Fermi dans l’état métallique corrélé. q n’est pas autre chose qu’une mesure du poids de quasiparticule au niveau de Fermi. Évidemment, q dépend fortement de la concentration de sites doublement occupés et diminue quand les corrélations électroniques augmentent. L’expression de l’énergie variationnelle (figure 8.7) s’écrit : Eg (8.29) = −8d 1 − 2d |ε0 | + dU L En minimisant cette énergie variationnelle par rapport à d, on trouve l’expression de la concentration de sites doublement occupés : U 1 1− d = (8.30) 4 8 |ε0 |
331
Physique de la matière condensée
Fig. 8.7 Énergie variationnelle de Gutzwiller en fonction de la concentration de sites doublement occupés.
Nous trouvons bien que le nombre de sites doublement occupés décroît quand U croît. Il existe une valeur critique Uc = 8 |ε0 |
(8.31)
de l’énergie de corrélation intra-atomique pour laquelle la concentration de sites doublement occupée s’annule. Quand cette limite est atteinte, les électrons ne peuvent plus se propager sur le réseau. Le système est devenu isolant. Pour cette même valeur critique de l’interaction, la discontinuité de la distribution au niveau de Fermi disparaît. Les corrélations ont totalement détruit la surface de Fermi. En effet, les équations (8.17) et (8.19) donnent q U =1−
U Uc
2 (8.32)
qui s’annule bien pour U = Uc . L’énergie de l’état fondamental par site s’écrit Eg U 2 = − |ε0 | 1 − L Uc
(8.33)
Ce résultat implique que pour une valeur finie de l’interaction Uc , le nombre de doubles occupations s’annule, tous les sites du réseau sont simplement occupés, c’est-à-dire que les particules sont localisées. À ce point (U = Uc , q = 0), l’énergie cinétique s’annule et Eg tend vers zéro. Toutes ces propriétés sont la signature d’une transition métal-isolant. Cette localisation est, bien évidemment, la transition discutée qualitativement par Mott. Très près de la transition, l’expression de l’énergie de
332
8. Au-delá du liquide de Fermi
l’état fondamental donnée ci-dessus n’est pas entièrement correcte, dans la mesure où l’état discuté ici est non magnétique (N↑ = N↓ ). Un calcul de perturbations montre que pour |εU0 | ou Ut 1, quand les spins sont localisés, un ordre antiferromagnétique abaisse l’énergie du fondamental d’une quantité proportionnelle t2 . àU La distribution du nombre de simple occupation < nk >, dans l’espace réciproque, diffère de la distribution de Fermi pour des électrons indépendants. En effet, pour U > 0, < nk > présente une discontinuité au niveau de Fermi d’amplitude q < 1 ; de plus, il existe des états occupés pour k > kF même à T = 0 K. Ceci est caractéristique d’un système de fermions corrélés. La transition décrite dans cette approche de Gutzwiller est une transition de Mott entre une phase métallique pour U < Uc et une phase isolante pour U > Uc . Cette approche de la transition est intéressante, car elle permet de décrire un état de liquide de Fermi fortement corrélé, avec un facteur de renormalisation q 1. Il est possible, de façon très simple, d’utiliser la théorie de Landau des liquides de Fermi pour calculer le coefficient de chaleur spécifique linéaire en température γ , la susceptibilité de spin χ et la compressibilité κ. On trouve :
U −1 γ ∼ 1− −→ ∞ quand U → Uc Uc U −1 −→ ∞ quand U → Uc χ ∼ 1− Uc U −→ 0 quand U → Uc κ ∼ 1− Uc
(8.34) (8.35) (8.36)
Ces résultats indiquent comment l’état métallique est modifié par les corrélations. La température de Fermi effective est réduite d’un facteur q, de sorte que la dépendance en température est renforcée. Par exemple, le coefficient en T 2 de la résistivité ρ = ρ0 + AT 2 est renforcé par un facteur q12 . Un tel comportement est bien observé dans un grand nombre de systèmes d’électrons fortement corrélés. Par exemple, l’état métallique de V2 O3 , obtenu en appliquant une pression pour supprimer la phase isolante ordonnée antiferromagnétiquement, montre précisément un tel comportement avec des valeurs fortement augmentées de A, γ et χ , et un rapport de Wilson W faible, comparée à la valeur pour des électrons libres. Un comportement similaire est également observé dans de nombreux métaux de type « fermions lourds ». Un autre cas où ces résultats peuvent ête appliqués avec succès est celui de l’Hélium3 liquide. L’approche de Gutzwiller du modèle de Hubbard appliquée à la discussion
333
Physique de la matière condensée
des propriétés expérimentales de 3 He liquide semble apporter une bonne description de ce système.
8.1.4 La théorie de champ moyen dynamique La découverte de propriétés originales de système de fermions fortement corrélés, tels que les fermions lourds ou les supraconducteurs à haute température a revivifié l’intérêt pour ce type de systèmes où la force de l’interaction électron-électron est comparable ou plus grande que l’énergie cinétique. La recherche sur cette classe de systèmes remonte aux idées initiales de Wigner et de Mott, avant guerre, puis à l’étude expérimentale sur les oxydes de métaux de transition et des transitions métal-isolant qu’on y a observées, au cours des années soixante et soixante-dix. Les progrès théoriques dans ce domaine ont été considérablement freinés par l’extrême difficulté de traiter même le plus simple hamiltonien modèle approprié à décrire cette compétition entre énergie cinétique et énergie de corrélation, tel que l’hamiltonien de Hubbard. À deux ou trois dimensions, où il n’existe pas de solution exacte, il est souvent difficile de savoir si une prédiction théorique reflète une propriété réelle de l’hamiltonien plutôt qu’un artefact de l’approximation utilisée. La difficulté est due à la nature non-perturbative du problème et reflète la présence de plusieurs phénomènes physiques qui entrent en compétition, même pour les modèles les plus simples. C’est ainsi qu’interfèrent localisation et cohérence de réseau, fluctuations quantiques et spatiales, ainsi que plusieurs types d’ordre à grande distance en compétition. De nombreuses approximations ont été utilisées pour venir à bout de ces difficultés, mais les théoriciens du domaine ont appris à considérer avec précautions les prédictions issues d’approximations qui ne sont pas fondées sur une limite contrôlée. On entend par là le fait qu’ il existe une limite extrême du modèle considéré où le problème se simplifie et peut être résolu d’une manière exacte, ou du moins bien contrôlée. Au cours de ces dernières années, une nouvelle approche du problème des corrélations fortes a été développée et a conduit à des progrès certains dans notre compréhension de ces systèmes [14]. L’idée essentielle est de remplacer un modèle sur réseau par le problème d’une impureté quantique localisée sur un seul site, immergée dans un milieu effectif déterminé de façon self-consistente. Le modèle d’impureté offre une description intuitive de la dynamique locale du système quantique à N corps. Par ailleurs, un grand nombre de techniques ont été développées au cours des trente dernières années pour l’étude des problèmes d’impuretés. La condition de self-consistence rend compte de l’invariance par translation et des effets de cohérence du réseau. On appelle cette approche l’Approximation Self-consistente de l’Impureté Locale (L.I.S.A.). Cette approximation est la généralisation naturelle de l’approximation de champ moyen de Weiss, appliquée à des problèmes quantiques à N corps. Le terme « théorie de champ moyen » doit cependant être utilisé avec précaution : l’approche L.I.S.A. ne
334
8. Au-delá du liquide de Fermi
suppose pas que toutes les fluctuations soient gelées (ce qui conduirait à l’approximation de Hartree-Fock). En réalité, l’approche L.I.S.A. gèle les fluctuations spatiales, mais prend totalement en compte les fluctuations quantiques locales, c’est-à-dire les fluctuations temporelles entre les différents états quantiques possibles sur un site donné du réseau. Ainsi, la meilleure dénomination de la méthode L.I.S.A. est « la théorie de champ moyen dynamique » ou D.M.F.T.. La principale différence avec le cas classique est que le problème quantique à un site reste un véritable problème à N corps. Comme dans la mécanique statistique classique, la théorie de champ moyen dynamique devient exacte dans la limite des grandes dimensions d’espace d → ∞, ou, de façon plus appropriée, dans la limite des grands nombres de coordinance z. Mais cette méthode doit être considérée dans un cadre plus large, en fait, comme le point de départ pour des études de systèmes fortement corrélés en dimension finie, dans le même sens que la théorie de champ moyen de Weiss est le point de départ de nombreuses investigations de mécanique statistique classique à trois dimensions. En particulier, la méthode peut être utilisée comme une approximation pour l’étude de modèles plus réalistes de matériaux réels, prenant en compte plusieurs orbitales, une structure de réseau spécifique et des densités d’états réalistes. De nombreux auteurs ont contribué, au cours de ces dernières années à faire émerger l’approche L.I.S.A. sous sa forme actuelle. En particuler, Georges et Kotliar ont établi une correspondance précise avec la théorie de champ moyen classique et une identification de l’analogue quantique du champ effectif de Weiss. Ceci a permis une extension immédiate de la méthode L.I.S.A. à des phases où la symétrie a été brisée et à un grand nombre de modèles de fermions fortement corrélés. En utilisant les propriétés générales du modèle de Friedel-Anderson à une seule impureté, en conjonction avec l’équation de self-consistence, Georges et Kotliar ont aussi établi que la phase métallique du modèle de Hubbard en dimension infinie d → ∞ est un liquide de Fermi pour un nombre quelconque d’électrons par atome et une force d’interaction quelconque. On explore actuellement les nombreuses applications possibles de l’approche de champ moyen dynamique à des systèmes physiques. Ce domaine est actuellement très actif. En particulier, des progrès récents ont été accomplis sur le modèle de Hubbard et la transition métal-isolant de Mott. La méthode L.I.S.A. a résolu de nombreuses questions ouvertes reliées à ce phénomène, qui n’avaient pu être traitées par d’autres méthodes. Récemment, des applications concrètes à la physique des oxydes de métaux de transition sont également apparues. Donner la dérivation et la résolution détaillée des équations de la méthode de champ moyen dynamique appliquée au modèle de Hubbard sort du cadre de ce cours. Nous nous contenterons ici de décrire qualitativement quelques résultats importants, en reportant le lecteur intéressé à l’article de revue de A. Georges et al. [14]. L’analyse de L.I.S.A. établit l’existence d’une transition métal-isolant à T = 0, pour 1 électron par site, quand U croît.
335
Physique de la matière condensée
8.1.4.1 La phase métallique Dans la limite de U petit, la self-énergie du modèle d’impureté de FriedelAnderson est une fonction régulière de la fréquence, qui peut être calculée en traitant l’interaction defaçon perturbative. À demi-remplissage, la symétrie électron-trou im + plique que i 0 = U2 . On obtient alors, tant qu’on reste dans la phase liquide de Fermi, la limite basse fréquence du modèle d’Anderson. On obtient donc l’analogue du modèle standard d’Anderson décrivant une impureté immergée dans un bain d’électrons de conduction, avec une densité d’états au niveau de Fermi non singulière. Quand U augmente, on s’attend à ce qu’un effet Kondo se produise, conduisant à un état fondamental singulet non dégénéré. Le comportement de la self-énergie (ω) à basse fréquence est celui d’un liquide de Fermi local. Le résidu de quasiparticule z définit l’énergie de Fermi renormalisée du problème εF∗ = zD, où D est la demi-largeur de bande. C’est aussi la température Kondo du modèle d’impureté. z fournit directement la masse effective des quasiparticules : m∗ 1 ∂ = =1− Re ω + i 0+ ω=0 m z ∂ω
(8.37)
Toutes ces quantités peuvent être calculées de façon quantitative. Le résidu de quasiparticule z est donné sur la figure 8.8 en fonction de l’interaction U, et comparé au résultat obtenu dans l’approximation de Gutzwiller. z est proche de 1 à petit U, et tend vers zéro pour U = Uc2 T = 0 , indiquant la disparition des quasiparticules et donc de la solution métallique. La figure 8.9 donne la fonction spectrale locale
Fig. 8.8 Le poids de quasiparticule Z en fonction de l’interaction U. La ligne continue épaisse correspond à la diagonalisation exacte d’un système à 8 sites. La ligne pointillée est obtenue à partir d’une théorie perturbative itérée. Pour comparaison, les résultats obtenus à partir de la méthode variationnelle de Gutzwiller sont également indiqués (ligne continue). Le carreau plein représente l’emplacement exact de Uc obtenu à partir de la méthode projective.
336
8. Au-delá du liquide de Fermi
Fig. 8.9 Densité spectrale locale à température nulle pour différentes valeurs de U, obtenues à partir de la théorie perturbative itérée. Les quatre premières courbes (de haut en bas, U/D= 1, 2, 2,5, et 3) correspondent à un métal de plus en plus corrélé, tandis que la courbe du bas (U/D= 4) correspond à un isolant.
pour plusieurs valeurs de U ρ(ω) = −
1 ImG k, ω + i 0+ π
(8.38)
k
Pour U petit, la fonction spectrale ne montre pas de structure et est semblable à la densité d’états du réseau nu. Pour des valeurs plus élevées de U, il apparait un pic étroit de quasiparticule, formé au niveau de Fermi. Il faut noter que la densité d’états ρ 0 reste fixée à sa valeur en l’absence d’interaction. Deux structures additionnelles à des fréquences ± U2 sont associées aux sous-bandes inférieures et supérieures de Hubbard (correspondant aux sites simplement et doublement occupés). Mais une solution métallique ne peut rester stable, au demi-remplissage, pour une valeur arbitrairement grande de U. Pour U grand, l’apparition d’un effet Kondo produit une largeur de bande qui tend vers zéro pour U très grand. En fait, la solution métallique disparaît continument (à T = 0 ) à une valeur critique Uc2 3D.
8.1.4.2 La phase isolante Quand Ut est grand, on part d’une limite différente. Dans la limite atomique, la fonction spectrale présente un gap égal à U. Nous avons à traiter le cas d’une impureté immergée dans un isolant. Il est clair qu’un développement en puissances
337
Physique de la matière condensée
de t ne conduit pas, ici, à des singularités à basse fréquence. Nous savons, d’après la théorie du modèle d’Anderson, qu’une impureté d’Anderson immergée dans un milieu isolant ne donne pas d’effet Kondo. Le fondamental du modèle d’impureté est un moment local deux fois dégénéré. Donc, la superposition de deux solutions magnétiques de Hartree-Fock est qualitativement une approximation self-consistente. Elle est similaire à l’approximation de découplage de Hubbard. Elle est valable pour U très grand, mais devient quantitativement de plus en plus mauvaise à mesure que U décroît. Elle conduirait à une fermeture du gap pour U = D. L’échec de l’approximation, quand on la prolonge dans la phase métallique, est dû à son incapacité à prendre en compte l’effet Kondo, qui construit les quasiparticules du liquide de Fermi. Elle demeure toutefois valable dans la phase isolante de Mott. La figure 8.9 montre également la densité dans la phase isolante. Les variations du gap g , qui apparaît dans cette densité spectrale en fonction de U, sont données dans la figure 8.10. La solution isolante disparaît, à température nulle pour U < Uc1 2, 6D.
Fig. 8.10 Gap paramagnétique (ligne continue) en fonction de l’interaction U obtenu à partir d’une diagonalisation exacte. Pour comparaison, les résultats de la théorie perturbative itérée (ligne pointillée) et la valeur de Uc 1 dans l’approximation de Hubbard sont aussi montrés.
En résumé, l’existence de deux classes de solutions des équations paramagnétiques L.I.S.A. à température nulle peut être établie analytiquement. Les solutions métalliques sont caractérisées par une densité d’états non nulle, alors que les solutions isolantes correspondent à ρ 0 = 0, à la fois pour l’impureté et pour le bain de conduction effectif à fréquence nulle. La densité d’états à l’énergie nulle joue le rôle d’une sorte de « paramètre d’ordre » (ce terme est cependant abusif, puiqu’il n’y a pas de brisure de symétrie dans cette transition).
8.2 Conducteurs unidimensionnels 8.2.1 Introduction La réduction de la dimensionalité d’un système physique, c’est-à-dire le fait que les processus physiques mis en jeu aient lieu dans des plans ou des chaînes faiblement
338
8. Au-delá du liquide de Fermi
couplés entraîne parfois des comportements de ce système qualitativement différents de ce qu’ils seraient à trois dimensions. À cet égard, deux aspects sont particulièrement importants. Strictement à une dimension, la théorie de Landau des liquides de Fermi ne s’applique pas. Le concept de quasiparticules n’a plus de sens. On parle dans ce cas d’un liquide de Luttinger, dont les propriétés sont qualitativement différentes du liquide de Fermi. Bien entendu, il n’existe pas d’ordre à grande distance et les fonctions de corrélation ont un comportement en lois de puissances. Une autre conséquence du caractère unidimensionnel est la grande diversité d’états fondamentaux possibles : état métallique, état supraconducteur singulet, état supraconducteur triplet, onde de densité de charge, onde de densité de spin. À température finie, des fluctuations correspondant à ces différents types d’ordre entrent en compétition et sont fortement couplées entre elles. C’est ce couplage qui est responsable de l’absence de phase ordonnée. La physique des systèmes électroniques à une dimension présente donc un caractère original et diffère fortement du cas des conducteurs tridimensionnels, où la théorie de Landau des liquides de Fermi fournit une description simple et, le plus souvent correcte. La nature nous fournit de nombreux exemples de systèmes électroniques qui peuvent être considérés comme un assemblage de chaînes unidimensionnelles faiblement couplées entre elles. Ces conducteurs, qu’on peut qualifier de « quasiunidimensionnels » sont un lieu privilégié pour cette nouvelle physique : leur structure consiste en des empilements de molécules avec un recouvrement des orbitales électroniques dans une direction de l’espace formant ainsi des chaînes faiblement couplées, ce qui induit une forte anisotropie des propriétés électroniques. Cette anisotropie se traduit par une surface de Fermi ouverte dont les nappes constitutives sont presque planes. Elles le seraient parfaitement dans un composé strictement unidimensionnel. La conséquence de cette structure électronique est l’instabilité presque inévitable vis à vis d’un état fondamental caractérisé par un ordre Onde de Densité de Spin (ODS) ou Onde de Densité de Charge (ODC) dans lesquels la densité de spin ou la densité de charge sont modulées spatialement. L’origine de ce phénomène réside dans l’instabilité de la phase métallique induite par un potentiel Vq qui couple des états de vecteurs d’onde k et k + q, conduisant ainsi à un abaissement d’énergie E = −χ ◦ (q)Vq2 avec χ ◦ (q) = −
fFD (εk ) − fFD (εk+q ) k
εk − εk+q
(8.39)
où fFD (ε) est la distribution de Fermi-Dirac. La réponse du gaz d’électrons à une perturbation Vq est donc d’autant plus forte que se trouvent couplés le plus grand nombre d’états de vecteurs d’onde k et k + q (petits dénominateurs) avec un nombre
339
Physique de la matière condensée
d’occupation différent (grand numérateur, ce qui impose de coupler des états d’électrons et de trous), c’est-à-dire au voisinage de la surface de Fermi. En termes géométriques, la susceptibilité est d’autant plus forte que la surface de Fermi et la surface de Fermi translatée du vecteur q ont des parties communes plus importantes, c’est-à-dire qu’elles s’emboîtent mieux l’une dans l’autre. Cette propriété est décrite par le mot anglais « nesting », si utilisé dans la littérature que nous l’emploierons également ici. La modulation spatiale de l’état ODC ou ODS est caractérisée par le vecteur d’onde Q0 qui maximise la susceptibilité χ ◦ (Q ) de la phase métallique. Un nesting important et un état fondamental de type Onde de Densité n’est pas exceptionnel, même dans les composés traditionnels. En effet, les alliages cristallins de Hume-Rothery et les quasicristaux sont des exemples classiques, compris dans leurs principes par Mott et Jones dès 1936. Mais ils sont caractéristiques des composés quasi-unidimensionnels à surface de Fermi « ouverte », dont les « nappes », presque planes, s’emboîtent quasiment l’une dans l’autre. De tels composés ont été largement étudiés depuis une quinzaine d’années. On a notamment recherché la supraconductivité dans ce type de composés. Cependant, dans la plupart des cas, se forme d’abord une phase Onde de Densité qui, elle, est caractérisée par un état isolant ou très peu conducteur, notamment à cause de l’instabilité de Peierls qui se produit très souvent dans ces matériaux très anisotropes. L’étude de l’état Onde de Densité a été à l’origine d’une très grande diversité de résultats physiques originaux et de concepts nouveaux. Une caractéristique tout à fait essentielle de la physique de ces conducteurs quasiunidimensionnels est la compétition entre les différentes instabilités − de type supraconductrice ou Onde de Densité − du gaz d’électrons. Elle peut se traduire, suivant le caractère plus ou moins unidimensionnel du composé, par l’existence de fortes fluctuations, donc par l’absence d’ordre à longue distance caractéristique des systèmes à une dimension. Il est donc particulièrement intéressant d’étudier la compétition entre ces différentes phases (figure 8.11), dont la proximité en énergie est
Fig. 8.11 Diagramme de phase générique des conducteurs organiques quasi-unidimensionnels. Cette figure illustre le cas des conducteurs organiques, ici les sels de Bechgard, étudiés par Jérome, qui y a découvert la supreconductivité organique par des études sous pression.
340
8. Au-delá du liquide de Fermi
inhabituelle, mais dont les propriétés macroscopiques sont tout à fait différentes. Des variations modérées de paramètres extérieurs, tels que la pression, la température, la structure du réseau atomique, le champ magnétique, permettent d’induire toute une variété de transitions de phase. Parmi les conducteurs quasi-1D, ce sont les sels de Bechgard qui présentent la plus grande richesse de transitions de phase. En particulier, c’est dans cette famille qu’a été observée pour la première fois la supraconductivité dans un composé organique. C’est également dans cette famille qu’a été observée une cascade de transitions vers des états ODS, induits par un champ magnétique. Rappelons brièvement la structure de ces composés. Les molécules de TMTSF (tétraméthyl tétra séléna fulvalène) sont constituées d’atome de carbone, de sélénium et d’hydrogène. Ces molécules s’empilent comme des assiettes, formant ainsi des chaînes entre lesquelles s’intercalent les anions complètement ionisés. Il y a un recouvrement relativement important entre les orbitales π des molécules organiques premières voisines, dans la direction de la chaîne, permettant ainsi une bonne délocalisation électronique dans la chaîne. Mais cela ne suffit pas à assurer le caractère conducteur de ces composés. Il faut encore qu’il existe une bande de conduction partiellement remplie. Ce résultat est obtenu par le transfert de charge complet qui se produit entre la molécule organique et l’anion inorganique. Comme il y a un anion pour deux molécules de TMTSF, la bande électronique, constituée par le recouvrement des orbitales moléculaires des molécules organiques, est au 3/4 remplie. Le recouvrement des orbitales dans les directions perpendiculaires aux chaînes est faible, ce qui conduit à une anisotropie des conductivités qui est typiquement, à température ambiante : σa ≈ 500(cm)−1 , σb ≈ 10(cm)−1 , σc ≈ 0,01(cm)−1 Elle reflète l’anisotropie des intégrales de transfert : ta ≈ 3000 K, tb ≈ 300 K, tc ≈ 10 K Cette hiérarchie entre les valeurs des intégrales de transfert dans les trois directions cristallographiques justifie le vocable de conducteurs quasi-unidimensionnels attribués à ces composés.
8.2.2 Modèle de conducteur unidimensionnel 8.2.2.1 L’hamiltonien de g-ologie Nous décrivons tout d’abord le cas d’un conducteur strictement unidimensionnel, ce qui revient, dans un premier temps, à négliger les intégrales de transfert transverses tb et tc . L’hamiltonien décrivant les électrons comprend deux termes, un terme de bande et un terme d’interaction, qui présentent tous deux des spécificités liées à la basse dimensionalité du système.
341
Physique de la matière condensée
8.2.2.2 L’hamiltonien de bande L’hamiltonien de bande, ou d’énergie cinétique, qui décrit le transfert d’électrons de site à site, le long de la chaîne, mais qui ne prend pas en compte les interactions entre électrons s’écrit, à une dimension et en liaisons fortes : + H0 = − ckσ (8.40) 2ta cos ka ckσ k
Tous les phénomènes physiques intéressants seront associés aux états électroniques au voisinage immédiat du niveau de Fermi. Il est donc légitime de linéariser la relation de dispersion ε 0 (k) = −2ta cos ka par un développement au voisinage de ±kF + + H0 − μN = akσ − vF k + kF bkσ bkσ vF k − kF akσ (8.41) k,σ + où akσ et akσ sont les opérateurs de création et d’annihilation d’électron de vecteurs + d’onde au voisinage de +kF (« feuillet droit » de la surface de Fermi), tandis que bkσ et bkσ correspondent aux vecteurs d’onde au voisinage de −kF (« feuillet gauche » de la surface de Fermi). On s’est placé ici dans l’ensemble grand-canonique. Le système d’électrons est en contact avec un réservoir de particules, caractérisé par un potentiel chimique μ. N est l’opérateur nombre d’électrons. vF est la vitesse de Fermi des électrons sans interaction.
vF = −∇k ε0 (k) = 2ta a sin kF a Si on soumet ce système d’électrons sans interaction à un potentiel extérieur qui dépend du temps de façon sinusoïdale : Vext =
+ V0 + akF +k+q↑ b−k exp −i ωt F −k↓ L k
où L est la longueur de la chaîne, il en résultera une réponse à cette perturbation du système d’électrons, qu’on étudie dans le régime de la réponse linéaire, à la fréquence ω et au vecteur d’onde q. Soit Ass↓↑ q l’opérateur défini par : Ass↓↑ k, q Ass↓↑ q = k
avec Ass↓↑ k, q = b−kF −k↓ akF +k+q↑ Les commutateurs ci-dessous vérifient : Ass↓↑ k, q , H0 = vF 2k + q Ass↓↑ k, q
342
(8.42)
8. Au-delá du liquide de Fermi
et V 0 + exp −i ωt Ass↓↑ k, q , Vext = −ak+F +k+q↑ akF +k+q↑ + b−kF −k↓ b−k F −k↓ L (8.43) À partir de l’équation d’évolution pour un opérateur A, d A = [A, H ] dt on obtient la réponse linéaire Ass↓↑ q, ω à la perturbation Vext : i
a b − n 1 − n V0 kF +k+q↑ −kF −k↓ exp −i ωt Ass↓↑ q, ω = − L vF 2k + q − ω
(8.44)
k
où ..... dénote la moyenne thermodynamique à la température T et où nka = ak+ ak et nkb = bk+ bk . On voit facilement que, pour ω = 0 et pour T = 0, la réponse diverge quand q → 0 et que, pour ω = 0 et q = 0, la réponse diverge pour T → 0. La quantité Ass↓↑ q ; ω représente la valeur moyenne d’un opérateur de création de paire électron-électron induite par une perturbation proportionnelle à un paramètre d’ordre de type électron-électron. Elle mesure la tendance du gaz d’électrons à former un appariement électron-électron. Sa divergence va évidemment causer l’instabilité de la phase normale vis à vis de la formation d’un état où un paramètre d’ordre de type supraconducteur brisera la symétrie du gaz parfait. Le même système unidimensionnel, soumis maintenant à une perturbation extérieure s’écrivant : Vext = Vext
+ V0 akF +k↓ b−kF +k−q↑ exp −i ωt L k
fournira une réponse linéaire, ω et au vecteur d’onde Q = 2kF + q, à la fréquence à cette perturbation AODS k, q ; ω , où : AODS k, q AODS q = k
et
+ a AODS k, q = b−k F +k−q↑ kF +k↓
Cette réponse linéaire, comme dans le cas précédent, diverge, pour ω = 0 et T = 0, quand q → 0, et, pour ω = 0 et q = 0, diverge quand T → 0.
343
Physique de la matière condensée
On montre de la même façon, précédemment que a b n − n kF +k+q↑ −kF −k↓ V0 exp −i ωt AODS q, ω = − L vF 2k + q − ω
(8.45)
k
Cette réponse AODS q à une perturbation proportionnelle à un paramètre d’ordre de type électron-trou mesure la tendance du gaz d’électrons à former un appariemment électron-trou. Sa divergence traduit l’instabilité de la phase normale vis à vis de la formation d’une phase « Onde de Densité ». On impose une énergie de coupure E0 dans la relation de dispersion linéarisée des électrons sans interaction :
vF |k| − kF < E0 (8.46) Les différentes fonctions de réponse statiques des électrons sans interaction divergent, quand T → 0, comme 0 0 χonde de densit´e Q = 2kF , ω = 0, T = χsup ra q = 0, ω = 0, T (8.47) =
1.14E0 1 Ln π vF kB T
(8.48)
Cette double divergence des fonctions de réponse de type électron-trou et électronélectron est caractéristique des systèmes unidimentionnels. Elle trouve son origine dans les propriétés de nesting parfait de la surface de Fermi, qui, à une dimension, se réduit à deux plans kx = kF et kx = −kF . La fonction de réponse de type électron-trou diverge pour Q = 2kF à cause de la propriété particulière (8.49) ε 0 k + Q = −ε0 k La fonction de réponse de type électron-électron diverge pour q = 0 à chaque fois que la surface de Fermi présente un centre d’inversion (8.50) ε0 k = ε0 −k ce qui est évidemment le cas ici.
8.2.2.3 L’hamiltonien d’interaction entre électrons : modèle de « g-ologie » Les processus d’interaction qui vont jouer un rôle important sont ceux qui concernent les états électroniques au voisinage immédiat du niveau de Fermi. Lors de ces processus de basse énergie, où l’énergie et le vecteur d’onde sont conservés, les quatre
344
8. Au-delá du liquide de Fermi
états électroniques se trouvent tous nécessairement au voisinage immédiat du niveau de Fermi. Quatre types de termes vérifient cette condition (figure 8.12).
Fig. 8.12 Les processus d’interaction électron-électron dans le modèle de g-ologie.
Le premier terme est appelé terme de diffusion vers l’arrière (“backward scattering ”) : les électrons qui interagissent sont situés l’un sur le feuillet de droite de la surface de Fermi, l’autre sur le feuillet de gauche. Après la diffusion, les deux électrons ont échangé leurs places : le premier se retrouve sur le feuillet de gauche et le deuxième sur le feuillet de droite. Ceci correspond à un processus où un vecteur d’onde q ≈ 2kF est échangé par les deux électrons. La constante de couplage correspondante est appelée g1 . Le deuxième terme représente le processus de diffusion vers l’avant (“forward scattering ”) : les deux électrons situés, l’un sur le feuillet de droite et l’autre sur le feuillet de gauche, restent sur leurs feuillets après diffusion. Ils échangent un vecteur d’onde q ≈ 0. La constante de couplage correspondante est appelée g2 . Le troisième terme concernent des processus où les électrons sont sur le même feuillet avant la diffusion et sont tous deux diffusés sur l’autre feuillet. Dans ce processus, il y a une modification de 4kF du vecteur d’onde total. La constante de couplage correspondante est appelée g3 . Enfin, le quatrième terme correspond à un processus où les deux électrons sont sur le même feuillet avant diffusion, et y restent après diffusion. La constante de couplage correspondante est appelée g4 dans la terminologie habituelle. Nous ne prendrons pas en compte, ici, ce dernier terme d’interaction. Il est certes, a priori, du même ordre de grandeur que les termes en g1 ou g2 , mais il n’introduit rien de spécifiquement nouveau dans un système unidimensionnel. On supposera qu’il a été traité dans l’approximation de Hartree-Fock et inclus dans la définition de H0 .
345
Physique de la matière condensée
Nous ne discuterons pas non plus les effets liés au processus en g3 . Ce terme est, en fait, un processus Umpklapp. Contrairement aux autres termes, ce processus ne conserve pas le vecteur d’onde total, puisqu’il y a une différence de ±4kF entre les sommes des deux vecteurs d’onde avant et après diffusion. Ceci n’est en général pas permis puisque l’interaction conserve le vecteur d’onde. Mais cette conservation du vecteur d’onde n’est vérifiée qu’à un vecteur du réseau réciproque près. Ce processus est donc permis si 4kF est un vecteur du réseau réciproque. C’est notamment le cas quand la bande de conduction est demi-remplie (alors 2kF = πa et 4kF appartient au réseau réciproque). Plus généralement, le processus en g3 peut être important dans les cas où le remplissage de la bande est tel que 4kF soit commensurable à un vecteur du réseau réciproque. Cependant, par souci de simplicité, nous supposerons ici que ce terme n’existe pas. De plus, nous supposerons, pour simplifier, que les constantes de couplages g1 et g2 sont indépendantes du vecteur d’onde q. Sauf exception, cette hypothèse n’introduit pas de restriction supplémentaire à la pertinence du modèle, car les phénomènes physiques importants sont toujours au voisinage immédiat de q = 0, pour la diffusion vers l’avant et de q = 2kF , pour la diffusion vers l’arrière. L’hamiltonien d’interaction s’écrit donc : Hint = H1 + H2 1 H1 = L k1 ,k2
1 H2 = L
,q,σ ,σ
k1 ,k2 ,q,σ ,σ
(8.51) + b g1 ak+F +k1 σ b−k a F +k2 −qσ kF +k2 σ −kF +k1 −qσ
(8.52)
+ a g2 ak+F +k1 σ b−k b F +k2 −qσ −kF +k2 σ kF +k1 −qσ
(8.53)
8.2.3 Le traitement de champ moyen Bien que cette approximation ne soit pas réellement adaptée au cas unidimensionnel, nous allons d’abord effectuer un traitement de champ moyen de l’hamiltonien de g-ologie, c’est-à-dire rechercher les instabilités du gaz d’électrons et décrire leurs conditions d’apparition dans le cadre du champ moyen. En effet, bien que de nombreux résultats obtenus dans ce cadre soient qualitativement faux dans les systèmes de basse dimensionalité, cette étude nous permettra d’insister sur des concepts importants. Par ailleurs les résultats du champ moyen nous serons cependant utiles dans le cas des conducteurs quasi-unidimensionnels, pour discuter les phases qui apparaissent à basse température, quand la description en liquide de Fermi redevient correcte, c’est-à-dire pour des températures inférieures à la température de cross over dimensionnel T1D→3D , à condition de les modifier correctement pour prendre en compte les effets des fluctuations unidimensionnelles.
346
8. Au-delá du liquide de Fermi
Nous commençons par définir des opérateurs qui vont caractériser les brisures de symétrie qui peuvent apparaître et donner lieu à des transitions de phase du liquide de Fermi normal. Rappelons qu’à une dimension, il ne peut pas se produire de transition de phase à température finie, mais que l’approximation du champ moyen introduit, de façon erronée, cette possibilité. Ces opérateurs sont ceux dont la valeur moyenne est nulle, par raison de symétrie, dans le fondamental du gaz d’électrons sans interactions, mais non nulle dans la phase « Onde de Densité » ou la phase supraconductrice recherchée. Cette valeur moyenne non nulle caractérise la brisure spontanée de symétrie et définira donc le paramètre d’ordre correspondant (à une constante multiplicative près). Ce sont des opérateurs de création de paires électrontrou dans le cas des états « Onde de Densité », et de création de paires électron-électron dans le cas des états supraconducteurs. Ces opérateurs sont définis de la façon suivante : + b−kF +k−qσ akF +kσ AODC q =
(8.54)
k,σ
correspond à une Onde de Densité de charge. + + AODS,z q = b−kF +k−q↑ akF +k↑ − b−k a k +k↓ F +k−q↓ F
(8.55)
k
+ AODS,+ q = b−kF +k−q↑akF +k↓
(8.56)
k
correspondent à une Onde de Densité de Spin sinusoïdale pour le premier et hélicoïdale pour le second : b−kF −k↓ akF +k+q↑ − b−kF −k↑ akF +k+q↓ (8.57) Ass q = k
correspond à une supraconductivité singulet. b−kF −k↑ akF +k+q↑ Ast,Sz =1 q =
(8.58)
k
Ast,Sz =0 q = b−kF −k↓ akF +k+q↑ + b−kF −k↑ akF +k+q↓
(8.59)
k
Ast,Sz =−1 q = b−kF −k↓ akF +k+q↓
(8.60)
k
correspondent à une supraconductivité triplet avec des paires de Cooper de Sz = +1, Sz = 0, et Sz = −1 respectivement. Évidemment, les valeurs moyennes de ces opérateurs, dans la phase normale du gaz d’électrons et en l’absence de toute perturbation extérieure, sont nulles.
347
Physique de la matière condensée
Nous voulons exprimer le fait que les interactions introduites dans l’hamiltonien de « g-ologie » jouent le rôle de moteur pour les différents types de brisures de symétrie. Pour cela, il suffit de voir que cet hamiltonien d’interaction s’exprime très simplement à l’aide des divers opérateurs A. On montre facilement qu’à une constante près : ⎧ ⎨ g 1 2 + q AODC q − g1 AODC Hint = − L q ⎩ 2
⎫ + ⎬ g2 AODS,i q AODS,i q + ⎭ 2
(8.61)
i=1,2,3
où AODS,1 q = AODS,z q AODS,2 = AODS,+ q + AODS,3 q = AODS,− q = b−kF +k−q↓ akF +k↑ k
Mais l’hamiltonien d’interaction peut encore s’écrire : ⎫ ⎧ 1 ⎨ g1 + g2 + g2 − g1 i + i ⎬ Ast q Ast q Ass q Ass q + Hint = ⎭ L q ⎩ 2 2 i=1,2,3
avec Ast1 =
√
2Ast,Sz =1 , Ast2 =
√
2Ast,Sz =−1 et Ast3 = Ast,Sz =0
(8.62)
Dans ces expressions, Hint est quadratique par rapport aux différents opérateurs A + et A, ce qui traduit simplement le fait qu’il s’agit d’interactions à deux corps. Nous allons effectuer une approximation de champ moyen, c’est à dire que nous allons effectuer une linéarisation de ces termes quadratiques en écrivant des approximations du type : Ai+ q Ai q Ai+ q Ai q + Ai+ q Ai q Cette linéarisation nous permet de décrire, de façon approchée, l’effet des interactions entre électrons : celui-ci se présente comme un champ moyen, qui est non nul si la valeur moyenne de l’opérateur Ai ou Ai+ est non nulle, c’est-à-dire si la symétrie correspondante a été brisée. Pour chaque brisure de symétrie, l’hamiltonien approché s’écrira : (8.63) HCM H0 + λi Ai+ q Ai q + Ai+ q Ai q où
348
8. Au-delá du liquide de Fermi
g2 − 2g1 π vF g2 = 2π vF g1 + g2 =− 2π vF g2 − g1 =− 2π vF
λODC =
(8.64)
λODS
(8.65)
λSS λST
(8.66) (8.67)
correspondent, respectivement, aux instabilités « Onde de Densité de Charge », « Onde de Densité de Spin », « Supraconductivité Singulet » et « Supraconductivité Triplet ». On notera la dégénérescence entre les cas des Onde de Densité de Spin hélicoïdale et sinusoïdale d’une part, et entre les cas des Supraconductivité Triplet de Sz = +1, Sz = 0, et Sz = −1 d’autre part. Ces dégénérescences résultent de propriétés de symétrie de l’hamiltonien de g-ologie. Elles sont préservées dans la phase normale symétrique (quand les paramètres d’ordre sont nuls) et restent valables tant qu’on recherche les critères d’instabilités de cette phase normale. Par ailleurs, nous savons que les fonctions de réponse du gaz d’électrons, décrit par l’hamiltonien sans interaction H0 , divergent logarithmiquement dans le cas unidimensionnel. L’équation (8.48) se généralise de la façon suivante : max vF q − qi , ω, kB T 1 0 ∼ χ q, ω, T = ln (8.68) π vF E0 où qi = 0 pour les instabilités supraconductrices et qi = 2kF pour les instabilités « Onde de Densité ». Dans le cadre de l’approximation de champ moyen, on en déduit très simplement la fonction de réponse du système décrit par l’hamiltonien linéarisé. On recherche la condition d’apparition d’une instabilité caractérisée par une valeur moyenne non nulle d’un opérateur < Ai+ > en écrivant la réponse d’électrons indépendants, puisque décrits dans l’approximation du champ moyen par un hamiltonien linéarisé, à une perturbation extérieure Vext sous la forme < Ai+ >= χ 0 q, ω, T Vext + λi χ 0 q, ω, T < Ai+ > où le deuxième terme représente l’effet du champ moyen. Les différentes fonctions de réponse du système s’écrivent donc, dans l’approximation du champ moyen χi0 χiCM = 1 − λi χi0 On obtient ainsi les conditions d’instabilités pour les quatre phases 1 − λi χi0 q, T = 0
349
Physique de la matière condensée
C’est-à-dire kB Tci =
2γ 1 EF exp − π λi
(8.69)
où γ est la constante d’Euler, EF est l’énergie de Fermi et λi est la constante de champ moyen définie plus haut pour les quatre phases. Nous supposerons que la phase la plus stable correspond à la plus haute température critique Tci , ce qui est très généralement vérifié. On obtient ainsi le diagramme (figure 8.13) dans le plan (g1 , g2 ) qui définit la phase la plus stable à T = 0 en fonction des valeurs des constantes de couplage g1 et g2 .
Fig. 8.13 Diagramme de phase du gaz d’électrons unidimensionnel dans le modèle de g-ologie, dans l’approximation du champ moyen.
En réalité cette théorie de champ moyen pour un système unidimensionnel souffre d’une tare rédhibitoire : elle néglige les fluctuations par rapport à la moyenne qui, à 1D, sont essentielles. En particulier, elle conduit à prévoir un ordre à longue distance à température finie, alors qu’un théorème général de mécanique statistique exclut cette possibilité à une dimension. En fait, cette approximation revient à sommer une série géométrique (les diagrammes « en échelle ») pour chaque type d’instabilité, comme si toutes ces instabilités étaient indépendantes. Par exemple, pour la phase « Onde de Densité de Spin » 0 2 0 3 CM 0 = χODS + λ χODS + λ2 χODS + ··· χODS =
0 χODS 0 1 − λχODS
(8.70) (8.71)
Cette approximation, qui est qualitativement valable à trois dimensions, ne l’est plus du tout à une dimension. La raison est due à un couplage entre les fluctuations divergentes correspondant à deux canaux différents. Par exemple, à divergents 0 0 qui est aussi divergent que le l’ordre deux, il existe un terme λODS χODS λss χSS 0 terme (λODS χODS )2 . La sommation des diagrammes en échelle, qui traite de façon indépendante les différentes instabilités, n’est donc plus licite et conduit à des résultats
350
8. Au-delá du liquide de Fermi
qualitativement faux. En particulier, comme nous allons le montrer, le comportement correct des fonctions de réponse, tel qu’il découle d’un calcul de renormalisation, est le suivant : àT =0K
− αi χi q, ω, T = 0 ∼ ω2 − vF q 2 2
pour T → 0, à ω = 0 et q = 0 : χi q = 0, ω = 0, T ∼ T −αi
(8.72)
(8.73)
Il n’y a donc pas, en réalité, de divergence à température finie, comme on le trouve de façon incorrecte en champ moyen.
8.2.4 Renormalisation à une dimension Afin de corriger ces résultats qualitativement incorrects obtenus en champ moyen, nous devons utiliser une méthode plus élaborée, qui ne néglige pas totalement les fluctuations, comme le fait le champ moyen, ce qui n’est pas du tout acceptable à une dimension. Dans ce paragraphe, nous allons décrire comment une méthode de renormalisation perturbative permet de prendre en compte les fluctuations unidimensionnelles et corrige des résultats qualitativement faux du champ moyen.
8.2.4.1 Développement en perturbation Commençons par effectuer un traitement en perturbation de l’interaction électronélectron décrite par l’hamiltonien de g-ologie. On s’intéresse en particulier au calcul en perturbation des différentes fonctions de réponse. Un simple calcul au premier ordre en perturbation par rapport aux différents termes de Hint donne le résultat suivant : Pour q = 2kF 1 ω ω 2g1 − g2 χODC (ω) = Ln Ln + · · · 1+ π vF E0 2π vF E0 g2 1 ω ω 1− χODS (ω) = Ln Ln + · · · π vF E0 2πvF E0
(8.74) (8.75)
Pour q = 0 1 ω 1+ Ln π vF E0 1 ω Ln 1+ χST (ω) = − π vF E0 χSS (ω) = −
g1 + g2 ω Ln + · · · 2πvF E0 ω g2 − g1 Ln + · · · 2πvF E0
(8.76) (8.77)
351
Physique de la matière condensée
Le premier terme de chacune des équations (8.74−77) correspond à l’approximation des électrons libres et le deuxième à l’effet des interactions traitées au premier ordre. On peut, de même, calculer un développement perturbatif pour les interactions effectives entre électrons : le calcul perturbatif conduit à corriger les couplages « nus », c’est-à-dire les termes en g1 et g2 : on cherche comment les effets d’interactions modifient ces constantes de couplage. On est amené à les remplacer par des couplages effectifs appelés vertex et notés . Il devient alors important de distinguer, dans l’hamiltonien de g-ologie, les interactions de type g1 selon qu’elles concernent des électrons de spin parallèles, g1// , ou antiparallèles g1⊥ . Dans ce modèle un peu plus riche, le développement perturbatif de 1// , par exemple, est donné par les diagrammes de la figure 8.14. Celui de 2 est donné par les diagrammes 8.15.
Fig. 8.14 Développement en perturbation au deuxième ordre du vertex 1 qui permute deux électrons de spins parallèles de part et d’autre de la surface de Fermi.
Chaque diagramme représente un terme de la série de perturbation. Ainsi : 1// = g1// +
352
(g1⊥ )2 ω Ln + · · · 2π vF E0
(8.78)
8. Au-delá du liquide de Fermi
Fig. 8.15 Développement perturbatif du vertex à deux particules 2 , (a) au premier ordre ; (b) au deuxieme ordre.
g1⊥ g1// ω Ln + · · · 2π vF E0 (g1⊥ )2 ω Ln + · · · 2 = g2 + 2π vF E0
1⊥ = g1⊥ +
(8.79) (8.80)
Pour les termes de diffusion vers l’avant, il est inutile de distinguer les interactions entre spins parallèles et entre spins perpendiculaires. Ces fonctions de réponse contiennent des termes logarithmiques à tous les ordres de perturbation. Cette divergence infrarouge (c’est-à-dire pour ω → 0) est caractéristique des systèmes de basse dimensionnalité qui présente une symétrie continue.Pour résoudre ces problèmes perturbatifs, deux méthodes peuvent être envisagées : soit une sommation partielle des diagrammes, soit la méthode du groupe de renormalisation. Il est important de souligner que les différents termes perturbatifs font intervenir deux types de contributions. Certains décrivent la création d’une paire d’électrons dans l’état intermédiaire, et les autres la création d’une paire électron-trou. Aux ordres supérieurs, les diagrammes contiennent un mélange des contributions électronélectron et électron-trou. Cette interférence des deux types de canaux est caractéristique du gaz d’électrons unidimensionnel. Elle est à l’origine de l’absence d’ordre à longue distance. À trois dimensions, la divergence électron-trou est affectée par le couplage entre chaînes : en effet, la fonction de réponse de type électron-trou de vecteur d’onde Q = 2kF + q, Q⊥ , qui divergeait pour q = 0 et Q⊥ = 0 à une dimension, ne diverge plus pour le même vecteur d’onde à 3 dimensions à cause du couplage tridimensionnel entre chaînes, alors que la fonction de réponse supraconductrice, elle, diverge toujours pour q = 0, aussi bien à trois dimensions qu’à une dimension. Les deux canaux se trouvent donc découplés par le couplage tridimensionnel.
353
Physique de la matière condensée
8.2.4.2 Sommation partielle de diagrammes L’approximation RPA consiste à éliminer tous les diagrammes contenant des mélanges de canaux. On re-somme séparément les diagrammes de chacun des deux canaux. Par exemple, la re-sommation du canal électron-électron sélectionne les diagrammes en échelle de la figure 8.16, RPA = gi + gi2 Ln
ω ω gi + gin+1 (Ln )n + · · · = E0 E0 1 − gi Ln Eω0
(8.81)
où i = 1 ou 2.
Fig. 8.16 Diagrammes en échelle ressommés dans l’approximation de la RPA.
Lorsque gi est négatif, ce vertex devient singulier à une fréquence ou à une température finie, donnée par la relation de champ moyen kB Tc = E0 exp −
1 |gi |
Cette instabilité est le signe d’une transition de phase à température finie, ce qui est évidemment incorrect à une dimension. On peut aller au-delà de la RPA, en étendant la sommation partielle à une classe plus large de diagrammes. C’est le cas, par exemple, de la méthode « parquet » [15, 16, 17]. Mais elle se heurte également à la difficulté d’une transition à température finie.
8.2.4.3 Le groupe de renormalisation Le développement en perturbation diverge si Eω0 tend vers 0, c’est-à-dire, à une fréquence donnée, pour une grande largeur de bande. L’idée de la méthode de renormalisation est de trouver une correspondance entre des systèmes de largeurs de bande de plus en plus petites. L’idée est donc de réduire la largeur de bande, c’est-à -dire le nombre de degrés de liberté, pour décrire ainsi d’autres problèmes où les termes perturbatifs sont de moins en moins divergents. Le prix à payer est qu’il faut corriger cette réduction du nombre de degrés de liberté par la modification des couplages gi . Il est évidemment nécessaire d’adopter la procédure de renormalisation de façon pertinente. L’objectif est de réduire la largeur de bande, tout en laissant les propriétés physiques du système inchangées. Il est à première vue tentant d’effectuer
354
8. Au-delá du liquide de Fermi
la renormalisation de telle façon que les couplages effectifs i restent inchangés : d i =0 dE0
(8.82)
On construit ainsi un ensemble de systèmes de plus en plus simples, mais qui doivent avoir les mêmes propriétés physiques. Si un de ces systèmes peut être résolu exactement, alors on en déduit une solution pour le système original. À partir des développements en perturbation des i , peuvent être dérivées des équations différentielles qui décrivent l’évolution des couplages gi en fonction de la largeur de bande : on établit ainsi une correspondance entre systèmes d’énergie de coupure différentes : ⎧ E0 → E ⎨ (8.83) ⎩ g (E ) → g (E ) i 0 i de façon à laisser invariantes les propriétés physiques. Mais cette méthode contient une part d’arbitraire : comment choisir la propriété qui doit rester invariante dans la transformation ? Si on choisit les interactions effectives i , on peut montrer que la méthode est équivalente à une sommation « parquet » et donne donc, de façon incorrecte, une instabilité à température finie. C’est ce qu’on appelle « la renormalisation du pauvre » (poor man’s scaling) [18]. Pour obtenir un calcul de renormalisation correct, il faut considérer comme invariant de la renormalisation les propriétés de diffusion à deux électrons [19], c’est-à-dire la matrice de diffusion T (ω, E ) et non pas seulement l’interaction effective (ω). L’invariant est schématisé sur la figure 8.17.
Fig. 8.17 Représentation diagrammatique de la matrice de diffusion T(q, omega), invariante du processus de renormalisation. Gamma est l’interaction effective et les traits gras représentent des propagateurs renormalisés.
Sur la figure 8.17 les traits gras représentent des propagateurs d’électrons eux-aussi renormalisés par les interactions. C’est cette invariance qui détermine l’évolution des couplages en fonction de la coupure E , de façon que les propriétés physiques restent inchangées. Notons E0 la largeur de bande initiale. T [ Eω , g ( EE0 )] doit rester invariant dans la transformation. Soit E et E deux valeurs différentes de la largeur de bande : ω E E ω T [ , g ( )] = T [ , g ( )] E E0 E E0
(8.84)
355
Physique de la matière condensée
Écrivons que cette équation est vérifiée pour ω = E : ω E E T [ , g ( )] = T [1, g ( )] = g E E0 E0
E E0
(8.85)
puisque pour ω = E , tous les termes logarithmiques sont nuls. Lorsque E = E E T [1, g ( )] = g E0 Posons x =
E E0
(8.86)
E E0
soit
E −1 E
E − E E
E dg ∂ E = − T y, g (x ) ∂y E0 E0 dx y=1
d’où l’équation différentielle
E − E dg ∂ = T y, g (x ) ∂y E0 dx y=1
dg ∂ =x T y, g (x ) ∂y dx y=1
(8.87)
(8.88)
(8.89)
Cette équation est importante parce qu’elle relie les variations de g (x ) pour x quelconque (et pas nécessairement petit ) à la dérivée de la fonction T au voisinage de ω = E , c’est-à-dire pour des valeurs de ω où le calcul de perturbation est valable. On peut donc trouver les équations différentielles vérifiées par les gi (x ) à partir d’un simple calcul de perturbation. Si on pose l = Lnx , on trouve, au second ordre en perturbation : 2 dg1// = g1⊥ dl dg1⊥ = g1⊥ g1// dl d g1// − 2g2 =0 dl
(8.90) (8.91) (8.92)
Ceci permet de trouver deux invariants de la renormalisation. En effet, à partir des deux premières équations de renormalisation, on trouve : 2 2 d g1// − g1⊥ =0 (8.93) dl
356
8. Au-delá du liquide de Fermi
2 2 Les quantités g1// − g1⊥ et g1// −2g2 restent invariantes dans la transformation. Les trajectoires décrites par le système (figure 8.18), dans le plan (g1// , g1⊥ ) sont des hyperboles d’équations 2 2 g1// − g1⊥ = Constante
(8.94)
Le type de trajectoire dépend des valeurs des constantes de couplages « nues » (c’està-dire non renormalisées) g1// et g1⊥ .
Fig. 8.18 Trajectoires de renormalisation dans le plan (g// , g⊥ ).
1er cas : point fixe de Tomonaga-Luttinger Si g1// > g1⊥ , les couplages diminuent le long des trajectoires qui convergent vers la ligne g1⊥ = 0 quand E /E0 → 0. 2 2 On sait que la quantité g1// − g1⊥ est un invariant de la renormalisation. ∗ = 0, on appelera (g ∗ )2 la valeur Comme la valeur au point fixe de g1⊥ (x ) est g1⊥ 1// ∗ est la valeur au point fixe de g de cet invariant, où g1// 1// (x ). ∗ 2 2 ) = g1// ( (g1//
E 2 E ) − g1⊥ ( ) E0 E0
(8.95)
2 ( E ) en fonction du couplage nu et de g ∗ On peut calculer facilement g1// 1// E0
1+ E ∗ g1// ( ) = g1// E0 1−
∗ g1// −g1// ∗ g1// −g1// ∗ g1// −g1// ∗ g1// −g1//
∗
E E0
2g1// πvF ∗
E E0
2g1//
(8.96)
πvF
Tous les problèmes pour lesquels les constantes de couplage appartiennent à cette région sont équivalents aux problèmes définis sur la ligne g1⊥ = 0, qui se trouvent
357
Physique de la matière condensée
avoir une solution exacte, dite solution de Tomonoga [20]. Il suffit donc d’utiliser la solution de Tomonoga à condition de remplacer la constante de couplage « nue » ∗ . Par ailleurs, la théorie de perturbation est une par la constante renormalisée g1// bonne approximation dans cette région puisque, si les couplages initiaux gi /πvF sont faibles, ils le restent constamment au cours de la renormalisation.
2ème cas : point fixe de Luther-Emery Si g1// < |g1⊥ |, les trajectoires de renormalisation (figure 8.18) divergent vers des valeurs infinies des couplages. La théorie de perturbation devient fausse, car les trajectoires de renormalisation évoluent vers une région de couplage fort. En fait, les couplages tendent vers des valeurs infinies pour une valeur finie de EE0 , ce qui est un artefact du calcul perturbatif. Il est néanmoins possible d’avoir une idée correcte de g 6 ce régime, car les trajectoires de renormalisation coupent la ligne π1// vF = − 5 pour laquelle il se trouve que nous connaissons une solution exacte du problème, trouvée par Luther et Emery [21]. À partir de cette solution exacte, il est possible de déduire les propriétés de tous les systèmes se trouvant sur la même trajectoire. Nous avons vu comment évoluent les couplages avec l’énergie de coupure E . Faisons de même pour les fonctions de réponse. Les quantités R (ω) = ∂Lnχ ∂Lnw présentent la propriété multiplicative : R(
ω E E ω , g ) = R [ , g ( )]f ( ) E0 E0 E0 E0
(8.97)
d’où, en fait, l’équation différentielle dérivée plus haut pour les couplages. On peut donc de la même façon, démontrer qu’au cours de la renormalisation, l’évolution des fonctions de réponse est donnée par : ∂ ∂ (8.98) x LnR (x, g ) = LnR [y, g (x )] ∂x ∂y y=1 Ainsi, la dépendance des fonctions de réponse en fonction de la fréquence ω et des couplages « nus » s’obtient à l’aide des couplages renormalisés déduits de la première équation différentielle. Le comportement à basse fréquence ω → 0 est donc donné par les valeurs des couplages aux points fixes gi∗ = gi (x = 0). Les fonctions de réponse varient algébriquement : pour
ω E0
→0
χi (ω) ∼ Ri (ω) ∼
358
ω E0
αi (8.99)
8. Au-delá du liquide de Fermi
avec ∗ ∂ y =1 αi = Lnχi y, g ∂y
(8.100)
Ces coefficients se déduisent immédiatement du développement en perturbation. On en déduit le « diagramme de phase » en fonction des valeurs renormalisées des couplages gi∗ au point fixe. Le terme « diagramme de phase » est bien entendu abusif, puisque dans ce traitement, il n’existe pas d’ordre à longue distance à température finie comme on en trouve en champ moyen. Nous trouvons que pour T → 0, les fonctions de réponse ont un comportement en lois de puissance, si bien que le point T = 0 peut être considéré comme un point critique. Notre « diagramme de phase » indique en fait quelle est la fonction de réponse la plus divergente quand T → 0. ∗ − 2g ∗ = 0 sépare les fluctuations supraconductrices dominantes des La ligne g1// 2 ∗ = g ∗ sépare les fluctuations fluctuations Onde de Densité dominantes. La ligne g1// 1⊥ longitudinales (Onde de Densité de Charge, Onde de Densité de Spin longitudinale, Supraconductivité Singulet, Supraconductivité Triplet de Sz = 0) des fluctuations transverses (Onde de Densité de Spin transversale, Supraconductivité Triplet de Sz = ±1).
Dans la figure 8.19, nous montrons le diagramme de phase obtenu dans le cas ∗ = g ∗ . Ce « diagramme de phase » à température nulle particulier simple où g1// 1⊥ montre en fait les fluctuations les plus divergentes dans le plan (g1 , g2 ). Les phases indiquées entre parenthèses montrent une divergence logarithmiquement plus faible.
Fig. 8.19 Diagramme de phase à température nulle montrant les fluctuations les plus divergentes dans le plan (g1 , g2 ).
359
Physique de la matière condensée
8.2.4.4 Conducteurs quasi-1D Ce que nous avons décrit dans le paragraphe précédent n’est pas réellement un diagramme de phase. Nous avons simplement déterminé les régions de l’espace des couplages dans lesquelles les fluctuations de tel ou tel paramètre d’ordre (Supraconductivité Singulet, Supraconductivité Triplet, Onde de Densité de Charge, Onde de Densité de Spin) sont dominantes. À cause des fluctuations quantiques et thermiques, il ne peut pas s’établir d’ordre à longue distance dans le gaz de Fermi strictement unidimensionnel. Le problème se pose maintenant de la généralisation à des modèles plus proches de la réalité expérimentale, qui décrivent le gaz d’électrons quasi-unidimensionnel et pour lequel l’aspect strictement 1D décrit par le modèle de g-ologie reste un cadre qualitatif. À cause d’un couplage entre chaînes dans la direction perpendiculaire aux chaînes t⊥ , la relation de dispersion des électrons en l’absence d’interaction s’écrit maintenant : ε0 (k) = vF (|kx | − kF ) − 2t⊥ ( cos ky b + cos kz c)
(8.101)
où les chaînes unidimensionnelles sont supposées orientées selon x et faiblement couplées entre elles dans les deux directions perpendiculaires y et z . La structure cristalline est supposée, pour simplifier, orthorombique. Dans un tel modèle, les températures d’ordre à grande distance sont ramenées à des valeurs non nulles : c’est le couplage tridimensionnel qui stabilise les phases correspondant aux fonctions de réponse les plus divergentes. Plus précisément, avec un couplage interchaînes t⊥ , il existe une température Tx de cross over 1D - 3D, au-dessus de laquelle le cristal peut être considéré comme une collection de chaînes 1D indépendantes décrites correctement par le modèle unidimensionnel que nous avons discuté. En-dessous de Tx , les contributions électronélectron et électron-trou sont découplées à cause du couplage transverse t⊥ , ce qui a pour conséquence de bloquer le processus de renormalisation 1D à l’échelle d’énergie Tx . Ceci conduit à des températures d’ordre finies et restaure l’ordre à grande distance à basse température. La méthode est schématisée de la façon suivante : Prigodin et Firsov, puis Emery, Brunsma et Barisic ont ainsi décrit le gaz d’électrons quasi-1D, par les équations de renormalisation du gaz d’électrons 1D jusqu’à une
RPA avec paramètres renormalisées
Ordre à grande distance TC
Renormalisation 1D Fluctuations 1D TX
T
Fig. 8.20 Schéma de la procédure de renormalisation avec coupure franche pour les conducteurs quasi-unidimensionnels.
360
8. Au-delá du liquide de Fermi
fréquence kB Tx (figure 8.20). Ils obtiennent ainsi des constantes de couplage renormalisées gi∗ ( Eω0 ∼ kBET0 x ). À des fréquences inférieures à kB Tx , les diagrammes couplés électron-trou et électron-électron ne divergent plus, à cause du terme en tb dans ε(k). Au lieu de diverger en (Ln Eω0 )n , ils se comportent en (Ln Etb0 )n , ce qui conduit à les négliger dans l’évaluation des équations de renormalisation. De fait, si on néglige ces termes de couplage, qui sont non divergents, pour ω < kB Tx , les équations de renormalisation deviennent également découplées et sont complètement équivalentes à une sommation de diagrammes RPA. Toutefois, la première étape 1D de la renormalisation pour ω > kB Tx , a remplacé l’énergie de coupure E0 par kB Tx et ces constantes de couplage « nues » par les constantes de couplage renormalisées gi∗ ( Eω0 ∼ kBET0 x ). Ainsi pour ω < kB Tx , les équations de renormalisation s’écrivent : dgα (8.102) = −gα dl où les gα sont données par gODC gODS gSS gST
= g1// + g1⊥ − g2 = g1// − g1⊥ − g2 = g1⊥ + g2 = g1// − g2
qui s’intègrent avec, pour conditions initiales x = c’est-à-dire
soit :
kB Tx E0
(8.103) (8.104) (8.105) (8.106) et gα = gα ( kBET0 x )
1 kB Tx 1 − Ln = kB Tx ∗ gα (x ) E0 gα ( E0 )
(8.107)
gα∗ ( kBET0 x ) x gα ( ), = E0 1 − gα∗ ( kBET0 x )Ln kBET0 x
(8.108)
Il y a maintenant instabilité (dans les couplages, mais également les fonctions de réponse) à une température finie donnée par : kB Tcα = kB Tx exp −
1 gα∗ ( kBET0 x
)
L’instabilité qui se produit physiquement correspond à la plus grande de ces quatre températures Tcα .
361
Physique de la matière condensée
8.3 Fermions corrélés à une dimension 8.3.1 Introduction La théorie des fermions en interactions à une dimension a progressé selon deux directions indépendantes : (i) des calculs du groupe de renormalisation perturbatifs ont montré que différentes fonctions de corrélations se comportent à longue portée selon une loi de puissance, avec des exposants qui dépendent des interactions [47]. Ces exposants, à leur tour, déterminent de nombreuses propriétés physiques, telles que les temps de relaxation observés en RMN, les intensités de difusion de rayons X, les effets d’impuretés, ou de possibles états ordonnés à basse température dans les systèmes de chaînes couplées. (ii) des modèles spécifiques, tels que le modèle de Hubbard, ainsi que ses généralisations ont été étudiés, soit par des solutions exactes, soit numériquement, pour obtenir les fonctions de corrélation ainsi que les niveaux d’énergie du fondamental et des états excités. Dans ce paragraphe, nous allons montrer que les résultats démontrés à l’origine dans la limite du couplage faible restent valables dans le cas d’une force d’interaction arbitrairement forte et permettent d’obtenir des informations précises sur les propriétés thermodynamiques à basse température et les propriétés de transport, ainsi que les exposants des fonctions de corrélation, sans qu’il soit nécessaire de calculer explicitement ces fonctions de corrélation. Dans le paragraphe ci-dessous, la méthode de la Bosonisation sera expliquée, les propriétés particulières des systèmes unidimensionnels (le « liquide de Luttinger ») seront discutées et on montrera que les propriétés physiques à basse énergie sont déterminées par seulement 3 paramètres : les vitesses des excitations collectives de charge et de spin, ainsi qu’un coefficient K qui détermine la décroissance à longue distance des fonctions de corrélation. Nous utiliserons une généralisation des arguments de Haldane dans le cas de spin 1/2 [23]. Puis, nous discuterons le calcul de ces paramètres pour certains modèles spécifiques. Nous illustrerons la méthode en utilisant le modèle de Hubbard, où les énergies exactes peuvent être obtenues à la limite thermodynamique. Dans ce cas, les calculs sont si compliqués qu’il est très difficile d’obtenir le comportement des fonctions de corrélation même pour de très petits systèmes. On discutera également la stabilité du liquide de Luttinger dans le cas de systèmes quasi-unidimensionnels.
8.3.2 Bosonisation et liquide de Luttinger 8.3.2.1 Formalisme de la Bosonisation Un des résultats importants de la théorie des systèmes unidimensionnels de fermions en interaction est que les opérateurs champs de fermions peuvent être exprimés en terme d’opérateurs de bosons. Cette équivalence peut alors être utilisée pour exprimer
362
8. Au-delá du liquide de Fermi
l’hamiltonien de fermions sous une forme particulièrement simple, en terme de champs de bosons uniquement. Considérons d’abord le cas de fermions sans spin, et définissons un champ de bosons φ(x ) par ∂φ ∂x = πρ(x ), où ρ est la déviation par rapport à la densité moyenne. Créer une particule au site x signifie introduire une marche de hauteur π dans φ, c’est-à-dire qu’en des points situés à gauche de x , φ doit être déplacé de π . Les opérateurs de déplacement sont des exponentielles des opérateurs d’impulsion, et par conséquent, on peut d’abord arguer que ! x (8.109) x dx ψ + (x ) ≈ exp i π −∞
où est l’opérateur densité de moment conjugué de φ, qui vérifie [φ(x ), y ] = i δ x − y . Cependant, cet opérateur commute avec lui même, au lieu de satisfaire les relations de commutation canoniques. L’anticommutation est réalisée en multipliant par un opérateur agissant au site x, qui change le signe à chaque fois qu’une particule passe à travers x. Un tel opérateur s’écrit exp ±i φ(x ) . Le résultat final est alors
+ ψ± (x )
= lim √ α→0
1 2πα
! exp ±ikF x ± −i φ(x ) + i π
x
−∞
x dx
(8.110)
où les signes supérieurs ou inférieurs se réfèrent au cas où les électrons sont proches de kF et −kF respectivement. Une dérivation détaillée de cette importante relation est donnée dans la littérature [24, 25]. Il faut aussi noter que cette relation est valable strictement dans le cas d’une relation de dispersion linéaire. Il est possible de considérer, de la même façon, le cas d’électrons dotés d’un spin. Il suffit simplement d’introduire un champ de boson pour chaque orientation de spin. En introduisant la charge et le spin à travers φρ,σ = (φi√±φl ) , on trouve alors que le comportement à 2 basse énergie et à grande distance d’un système de fermions unidimensionnel, avec interactions indépendantes du spin est décrit par l’hamiltonien donné ci-dessous : 2g1 H = Hρ + Hσ + 2 2πα
! dx cos
√
8φσ
(8.111)
Ici, α est une coupure à courte distance, g1 est appelé l’amplitude de « diffusion vers l’arrière », et en posant ν = ρ, σ
! Hν =
dx
2 uν π uν Kν 2 ∂x φν ν + 2 2πKν
(8.112)
363
Physique de la matière condensée
les champs de phase sont
φν (x ) = −
iπ 1 −αpx πx exp ( ) − ipx ν+ p + ν− p − Nν , (8.113) L p 2 L p =0
ν (x ) =
1 −αpx exp ( ) − ipx ν+ p − ν− p + Jν /L L 2
(8.114)
p =0
Dans cette expression, ρr (p) σr (p) sont les composantes de Fourier des opérateurs de charge (respectivement de spin) pour des fermions allant vers la droite (r = +) ou vers la gauche (r = −). En introduisant les opérateurs nombre totaux (mesurés par rapport au fondamental) pour les particules allant vers la droite et allant vers la gauche (r = ±), où les signes supérieurs et inférieurs se rapportent respectivement à la charge et au spin, les opérateurs nombre et courants (de charge et de spin) sont Nν = Jν =
N+↑ + N−↑
√ / 2
√ N+↑ − N−↑ ± N+↓ − N−↑ / 2
(8.115) (8.116)
où + ou – les signes se réfèrent à la charge et au spin respectivement. Les opérateurs φν et ν écrits à des relations de commutation de ci-dessus obéissent type bosons : φν (x ), μ y = i δν,μ δ x − y , et par conséquent, au moins pour g1 = 0, l’hamiltonien décrit des oscillations indépendantes de la densité de charge et de la densité de spin de grande longueur d’onde, avec une relation de dispersion linéaire ων k = uν |k, et le système est conducteur. Le seul effet non trivial des interactions vient du terme en cosinus. Cependant, pour des interactions répulsives g1 > 0 , ce terme est renormalisé à zéro dans la limite des grandes longueurs d’onde et au point fixe, on a Kσ∗ = 1. Les trois paramètres restant dans l’hamiltonien déterminent alors complètement les propriétés à longue distance et à basse énergie du système.
8.3.2.2 Séparation spin–charge Une des conséquences les plus spectaculaire de l’hamiltonien (8.111) est la complète séparation de la dynamique des degrés de liberté de spin et de charge. Par exemple, en général, on a uσ = uρ . Pour rendre plus transparente la signification de ce fait, créons une particule en excès dans le fondamental, au temps t = 0 et à la coordonnée d’espace x0 . Les densités de charge et de spin sont alors facilement trouvées en utilisant : "√ # 2 ∂φρ /∂x ρ(x ) = − (8.117) π
364
8. Au-delá du liquide de Fermi
et
"√ # 2 ∂φσ /∂x σz (x ) = − π
(8.118)
Il faut noter que ρ(x ) est la déviation de la densité par rapport à sa valeur moyenne + < 0 | ψ+ x0 ρ(x )ψ+ x0 | 0 >= δ x − x0 (8.119) + x0 | 0 >= δ x − x0 < 0 | ψ+ x0 σz (x )ψ+
(8.120)
Considérons maintenant le développement en temps des distributions de charge et de spin. La dépendance en temps des opérateurs de densité de charge et de spin est obtenue facilement à partir de (8.111), en utilisant la valeur du point fixe g1 = 0. On obtient : + (8.121) x0 | 0 >= δ x − x0 − uρ t < 0 | ψ+ x0 ρ(x, t )ψ+ + x0 | 0 >= δ(x − x0 − uσ t ) < 0 | ψ+ x0 σz (x, t )ψ+
(8.122)
Comme, en général uσ = uρ , au bout d’un certain temps, la charge et le spin seront localisés en des points de l’espace complètement différents, ce qui montre que la charge et le spin ont été compètement séparés.
8.3.2.3 Liquide de Luttinger La forme simple de l’hamiltonien (8.111) au point fixe g1∗ = 0 rend le calcul des propriétés physiques très simple. Notons d’abord que les phonons acoustiques à une dimension donnent une contribution linéaire à la chaleur spécifique. Par conséquent, la chaleur spécifique de fermions en interaction à basse température sera en C T = γ T , avec γ /γ0 = 12 vF /uρ + vF /uσ , où γ0 est le coefficient de chaleur spécifique pour des électrons sans interaction de vitesse de Fermi vF . La susceptibilité de spin et la compressibilité sont également faciles à obtenir. Notons que dans (8.111), le coefficient uσ /Kσ détermine l’énergie nécessaire pour créer une polarisation de spin non nulle et que uρ /Kρ fixe l énergie nécessaire pour changer la densité de particules. Étant donné que, au point fixe Kσ∗ = 1, on trouve vF χ = , χ0 uσ
vF Kρ κ = κ0 uρ
(8.123)
où χ0 et κ0 sont la susceptibilité et la compressibilité du cas sans interaction.
365
Physique de la matière condensée
Le rapport de Wilson s’écrit : RW =
χ γ0 2uρ = γ χ0 uρ + uσ
(8.124)
La quantité ρ (x ) est proportionnelle à la densité de courant. De façon évidente, l’hamiltonien commute avec le courant total et, par conséquent la conductivité dépendant de la fréquence est une fonction delta à fréquence nulle. En utilisant la formule de Kubo, on trouve σ (ω) = 2Kρ uρ δ(ω)
(8.125)
Le produit Kρ uρ détermine la hauteur du pic donc de la conductivité. Les propriétés que nous venons d’obtenir sont celles d’un liquide de Fermi ordinaire. Considérons la fonction de Green à une particule qui peut être calculée en utilisant la représentation d’opérateurs de fermions. On trouve alors la fonction de distribution des impulsions au voisinage de kF : nk ≈ nkF − β signe k − kF | k − kF |α (8.126) et pour la densité d’états à une particule : N (ω) ≈| ω |α
(8.127) avec α = Kρ + 1/Kρ − 2 /4 et où β est une constante qui dépend du modèle. Notons que pour tout Kρ = 1, c’est-à-dire pour toute interaction non nulle, la fonction de distribution des impulsions et la densité d’états présentent des singularités en lois de puissance au niveau de Fermi, avec une densité d’états à une particule tendant vers 0 au niveau de Fermi. Ce comportement est évidemment complètement différent de celui d’un liquide de Fermi standard, pour lequel la densité d’états serait finie, avec une singularité de type saut dans nk. C’est ce type de comportement inhabituel qu’Haldane a dénommé « liquide de Luttinger » [23].
8.3.3 Conclusions Nous avons donc obtenu que la représentation bosonique de fermions unidimensionnels peut être combinée avec la solution exacte de Lieb et Wu du Modèle de Hubbard unidimensionnel pour obtenir des résultats exacts sur les corrélations dans le fondamental et la thermodynamique de basse température. En particulier, le comportement au voisinage de la transition métal-isolant peut être étudié en détail. Il semble utile de comparer la transition métal-isolant du modèle de Hubbard unidimensionnel avec d’autres scenarios pour des systèmes de fermions fortement corrélés pour des systèmes de fermions de dimension plus élevée. Dans la limite « presque
366
8. Au-delá du liquide de Fermi
localisée », les effets de masse effective prédominent et renforcent à la fois la chaleur spécifique et la susceptibilité de spin. En conséquence, le rapport de Wilson reste non nul quand on approche la transition métal-isolant. Au contraire, dans la limite « presque ferromagnétique », seule la susceptibilité de spin est augmentée de façon significative, et par conséquent, le rapport de Wilson peut être beaucoup plus grand que 1. Le comportement observé dans le cas unidimensionnel est très différent de ces scenarios : généralement, RW < 2, et à l’approche de la transition métal-isolant, RW tend vers zéro. Ceci se produit parce que généralement le renforcement de masse n’a aucune influence sur les degrés de liberté de spin. Ceci peut être compris de façon très simple en terme de découplage spin-charge [26] : les excitations de charge et de spin se déplacent de façon indépendante les unes des autres et, en particulier, la dynamique de spin est déterminée par l’échange entre premiers voisins. Cet échange est antiferromagnétique, qu’il y ait un trou entre les deux spins ou non et, par conséquent, la dynamique de spin de basse énergie est toujours celle d’une chaîne antiferromagnétique de spins localisés. En particulier, la susceptibilité de spin reste finie, même quand la masse du porteur de charge tend vers l’infini. Anderson a discuté le fait que des systèmes de fermions corrélés bidimensionnels pourraient montrer une propriété de séparation spin-charge très similaire au cas du liquide de Luttinger unidimensionnel. Notons simplement que les deux scenarios discutés auraient des conséquences très différentes en deux dimensions : dans le premier cas, la masse effective m ∗ tend vers l’infini et la densité d’électrons n se comporte comme une constante, on s’attend alors à ce que γ tende vers l’infini, alors que dans le second cas, les bords de bande bidimensionnels restent finis, de sorte que γ tend vers une constante. Il faut noter que ces résultats placent quelques contraintes sur la façon dont il faut modéliser les résultats expérimentaux. Par exemple, dans le système organique quasiunidimensionnel TTF − TCNQ , on observe une diffusion diffuse très forte à 4kF , ce qui nous amènerait à conclure que Kρ < 1/2 et par conséquent, le modèle de Hubbard seul n’est pas suffisant pour décrire les effets de corrélation dans ce composé.
Bibliographie 1. N.F. Mott, Proc. Phys. Soc. A 62, 416 (1949) 2. N.F. Mott, Can. J. Phys. 34, 1356 (1956) 3. N.F. Mott, Phil. Mag. 6, 287 (1961) 4. N.F. Mott, Metal Insulator Transitions (Taylor and Francis, 1990) 5. D.B. McWhan, A. Menth, J.P. Remeika, W.F. Brinkmann et T.M. Rice, Phys. Rev. B 7, 1920 (1973) 6. S.A. Carter, T.F. Rosenbaum, J.M. Honig et J. Spałek, Phys. Rev. Lett. 67, 3440 (1992) ; S.A. Carter, T. F. Rosenbaum, P. Metcalf, J.M. Honig et J. Spałek, Phys. Rev. B 48, 16841 (1993) 7. J. Hubbard, Proc. Roy. Soc (London) A 281, 401 (1964)
367
Physique de la matière condensée
8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26.
368
M.C. Gutzwiller, Phys. Rev. Lett. 10, 159 (1963) Phys. Rev. 134, A923 (1964) Phys. Rev. 137, A1726 (1965) E.H. Lieb et F. Y. Wu, Phys. Rev. Lett. 20, 1445 (1968) W.F. Brinkmann et T.M. Rice, Phys. Rev. B. 2, 4302 (1970) P. Nozières, Cours au Collège de France, (1986), non publié Pour une revue sur cette méthode, voir A. Georges, G. Kotliar, W. Krauth et M. Rozenberg, Rev. Mod. Physics, 68, 13 (1996) Y.A. Bychkov, L.P. Gor’kov et I.E. Dzyaloshinskii, J.E.T.P. 23, 489 (1966) B. Roulet, J. Gavoret et P. Nozières, Phys. Rev. 178, 1072 (1969) P. Nozières, J. Gavoret et B. Roulet, Phys. Rev. 178, 1084 (1969) P.W. Anderson, J. Phys. C 3, 2346 (1970) N. Menyhard et J. Solyom, J. Low Temp. Phys. 12, 529 (1973) S. Tomonaga, Prog. Theor. Phys. 5, 349 (1950) A. Luther et V.J. Emery, Phys. Rev. Lett. 33, 589 (1974) J. Solyom, Adv. Phys. 28, 209 (1979) F.D.M. Haldane, J. Phys. C, 14, 2585 (1981) D.C. Matt, J Math. Phys. 15, 6089 (1974) R. Heidenreich, R Sailer et D.A. Uhlen Brod, J. Stat. Phys, 22, 27 (1980) H.J. Schulz, Phys. Rev. Letters 64, 2831 (1990)
Introduction au magnétisme localisé 9.1 Introduction – Énergie d’échange Le but de ce chapitre est de discuter, dans le cadre de l’hamiltonien d’Heisenberg, les propriétés magnétiques et les phénomènes d’ordre magnétique dans les solides isolants. Sont exclus de ce chapitre, l’étude du paramagnétisme de Pauli, du diamagnétisme de Landau, du paramagnétisme de Van Vleck et l’étude de l’ordre magnétique pour des électrons itinérants, qui fera l’objet du chapitre 10. Dans l’étude de la molécule H2 par la méthode des orbitales atomiques, on peut écrire l’énergie des deux atomes A et B à la distance R l’un de l’autre sous la forme E = E0 − 2J (R )SA · SB où J (R ) est l’intégrale d’échange, énergie d’origine coulombienne, conséquence directe de l’antisymétrisation des fonctions d’onde des électrons. L’intéraction de Coulomb e 2 /r12 entre les électrons 1 et 2 conduit aux énergies de corrélation dans les deux états singulet et triplet : ETriplet =< T |e 2 /r12 |T >= −Jkl Esingulet =< S |e 2 /r12 |S >= +Jkl
369
Physique de la matière condensée
|S > et |T > sont les fonctions d’onde de l’état singulet et de l’état triplet telles qu’elles sont écrites dans l’approximation Hartree-Fock. Le terme d’échange peut s’écrire, à des constantes près, en fonction des variables de spin : Vchange = −2J S1 · S2 L’intéraction d’échange J entre ces deux électrons dépend évidemment de la distance R qui sépare les atomes autour desquels ils gravitent. Mais J (R ) est à courte portée et décroît exponentiellement. Tant que l’on considère le sous-espace où les électrons occupent uniquement les états orbitaux 1s de chaque atome, on peut regarder cette formule comme un hamiltonien de spin en attachant à chaque atome des spins SA et SB (SA = SB = 1/2). D’un système de fermions en interaction, on est donc passé à un système de spins en interaction. Dans le cas de la molécule H2, on diagonalise facilement cet hamliltonien à 2 spins. Avant de discuter de l’échange dans les solides, résumons les principales propriétés des atomes et ions magnétiques dans les cristaux.
9.1.1 Atomes et ions magnétiques On ne peut évidemment former de moments magnétiques qu’à partir de couches atomiques incomplètes. Les électrons des couches les plus externes participent aux liaisons entre atomes dans les isolants (dans un métal, ils sont délocalisés dans une bande d’énergie, ce qui abaisse leur énergie cinétique : c’est la liaison métallique). Les moments magnétiques sont formés à partir des couches incomplètes d ou f . Notons que selon la théorie des bandes, ces couches incomplètes devraient donner lieu à des bandes partiellement remplies, donc à des propriétés métalliques. Nous verrons qu’en réalité le caractère isolant est dû à la localisation de ces électrons par les corrélations coulombiennes. Il n’y à pas d’exemple d’ordre magnétique créé par des couches p ou s incomplètes. Dans le sous-espace correspondant à une configuration d n ou f n donnée entrent en compétition trois termes d’énergie : 1) L’interaction coulombienne à l’intérieur de la configuration. 2) Le couplage spin-orbite. 3) Le champ cristallin. Les ordres de grandeur de ces trois termes sont très différents selon qu’il s’agit d’ions de Terres Rares ou d’ions de transition dans les isolants. Dans les Terres Rares, les couches f sont très concentrées autour des noyaux : l’effet du champ cristallin est petit et peut être considéré comme une perturbation faible. Les termes (L, S ) sont ceux de l’atome libre et la règle de Hund donne le terme de plus basse énergie : c’est celui de S maximum, puis de L maximum. Le moment angulaire total est J = |L − S | dans la première moitié de la série et J = L + S dans la deuxième moitié.
370
9. Introduction au magnétisme localisé
Pour les ions de transition dans les isolants, la situation est très différente. Les couches 3d s’étendent plus loin du noyau : l’influence du champ cristallin est très importante et il faut en tenir compte dès le début. On définit des états à un électron à partir des orbitales d , états propres du champ cristallin dans lesquels < L >= 0. Le magnétisme orbital disparaît complètement. On dit qu’il y a blocage du moment orbital. Les ions de configuration 3d n sont déterminés, dans l’état fondamental par la règle de Hund (S maximum) appliqués aux nouveaux états à un électron. Pour les atomes de transition dans les métaux, il y a un recouvrement important des orbitales d de deux atomes voisins. Il y a compétition entre les corrélations électroniques qui tendent à localiser les électrons et énergie cinétique de bande qui tend à les délocaliser. Si ce dernier effet est le plus important, on est dans le cas d’un conducteur (métal de transition). Il faut tenir compte dès le début de la délocalisation électronique ; c’est une description de bandes d qui est appropriée à ces solides.
9.1.2 Mécanismes d’échange Dans le sous espace où les configurations de chaque ion sont données et où les moments de spin Si sont donnés, on peut écrire l’hamiltonien du système comme un hamiltonien de spin, en généralisant le résultat de la molécule d’hydrogène. En présence d’un champ magnétique extérieur h0 H =−
i,j Ji,j Si
· Sj − g μ B
i
h 0 · Si
c’est l’hamiltonien d’Heisenberg. Bien que la généralisation de ce résultat ne soit pas évidente pour des spins quelconques, on l’admet, en fait, car il décrit très bien les résultats expérimentaux. Les intégrales d’échange Jij = J (|Rij |) ne dépendent en général que de |Ri − Rj |. Quelle est leur origine ? L’échange observé dans la molécule H2, qu’on appelle échange direct est toujours trop faible pour être le mécanisme dominant dans les solides magnétiques : la distance entre ions magnétiques est trop grande et le recouvrement entre orbitales centrées sur les 2 ions trop faible, car décroissant exponentiellement avec |Rij |. Le mécanisme dominant est donc toujours un échange indirect. Dans les isolants, l’échange indirect à lieu par l’intermédiaire des ions non magnétiques : par exemple dans NiO, les ions Ni 2+ interagissent grâce à la présence entre eux d’ions O 2− . C’est le superéchange d’Anderson : il s’agit d’un effet cinétique. Les électrons d peuvent en général mieux se délocaliser sur les ligands voisins si leurs spins sont antiparallèles, car il n’y à pas alors de condition d’orthogonalisation imposée par le principe de Pauli. Un schéma très simplifié est donne sur la figure 9.1. Dans la plupart des cas, les intégrales d’échange sont donc négatives et rapidement décroissantes avec la distance, très souvent négligeables dans la pratique au-delà des
371
Physique de la matière condensée
Fig. 9.1 Étoile de vecteurs équivalents pour qà l’intérieur de la zone de Brillouin (A. Blandin, communication privée).
premiers voisins. Il y a des exceptions où l’échange est ferromagnétique (EuO par exemple). Dans les métaux ou alliages de Terres Rares, chaque ion est caractérisé par un moment cinétique total J qui remplace le spin total dans l’hamiltonien d’Heisenberg. Les couches f donnent naissance à des moments magnétiques localisés. Ceux-ci interagissent par échange avec les électrons de conduction 5s (intégrale d’échangeJsf ). Les électrons de conduction servent d’intermédiaire entre les ions de Terres Rares et on a finalement une interaction indirecte par l’intermédiaire des électrons de conduction J (R ) qui se comporte à grande distance comme Jsf2 cos 2k R F EF (2kF R )3
où kF et EF sont le vecteur d’onde et l’énergie de Fermi des électrons de conduction. C’est l’interaction Ruderman-Kittel-Kasuya-Yosida (RKKY) ; elle est à longue distance et de signe variable. Le couplage entre noyaux par électrons de conduction oscille dans l’espace comme les perturbations magnétiques dues á chaque noyau. Cette extension des terres Rares (RKKY), date de la même époque que l’étude de P.G. de Gennes sur le même sujet. Dans les métaux de transition, les électrons d, responsables du magnétisme, sont itinérants et forment des bandes d incomplètes. L’hamiltonien d’Heisenberg n’est plus adapté. On a affaire à un magnétisme de bandes que nous discuterons dans le chapitre suivant.
9.2 État d’équilibre stable – État fondamental Dans ce paragraphe, nous étudierons l’état d’équilibre (ou le fondamental) d’un système de spins, couplés par échange d’Heisenberg, localisés aux noeuds d’un réseau parfait. Nous ferons soit une approximation de type classique (les spins Si sont considérés comme des vecteurs classiques), soit, pour des spins quantiques, une approximation de champ moyen. Nous considérons des spins identiques, avec un seul spin par maille élémentaire. Le couplage d’échange J (Rij ) est supposé invariant par translation simultanée de Ri et Rj .
372
9. Introduction au magnétisme localisé
9.2.1 État d’équilibre stable de spins classiques – Structures magnétiques L’énergie des spins classiques s’écrit : E = − i,j J Ri,j Si · Sj Les directions des vecteurs Si doivent rendre l’énergie minimum avec les contraintes S2i = S 2 pour chaque spin i. Au lieu d’utiliser un multiplicateur de Lagrange par spin (ce problème serait insoluble), on se limite à un seul, en écrivant : δ E + λ i S2i = 0 puis, on écartera les solutions parasites pour lesquelles on n’a pas S2i = S 2 pour chaque spin i. On obtient : −2 i,j Ji,j Sj δSi + 2λ i Si · δSi = 0 La condition d’extrêmisation devient : λSi = j J Ri,j Sj Par transformation de Fourier : −iq·R iS S q = e i i
−iq·R iJ R J q = e i i
Si =
1 N
J (Ri ) =
q 1 N
e iq·Ri S(q)
q
e iq·Ri J (q)
Les valeurs de q sont limitées à la première zone de Brillouin. Si chaque site magnétique est un centre de symétrie, nous obtenons la propriété : S ∗ (q) = S( − q) et J (q) = J ( − q) L’équation de minimisation de l’énergie devient alors : λS(q) = J (q)S(q) et l’énergie s’écrit : E = − N1
q
J q S q · S∗ q
L’équation de minimisation est satisfaite si S(q) = 0 sauf pour un ensemble de valeurs qo pour lesquelles J prend la même valeur. Alors, le multiplicateur de Lagrange est déterminé par λ = J (qi ). Si λ = J (qo ), alors λ = J (qi ) où qi = T (qo ) désigne l’ensemble des vecteurs équivalents obtenus par les transformations de symétrie T qui laissent invariant le réseau réciproque. L’ensemble est appelé étoile de vecteurs équivalents.
373
Physique de la matière condensée
Par exemple, dans le cas d’un réseau carré à deux dimensions : – si q est à l’intérieur de la 1ère zone de Brillouin voir la figure 9.2. – si q est sur la surface de la zone de Brillouin voir figure 9.3.
Fig. 9.2 Étoile de vecteurs équivalents, si q est à l’intérieur de la zone de Brillouin (A. Blandin, communication privée).
Fig. 9.3 Étoile de vecteurs équivalents si q est sur la surface de la zone de Brillouin (A. Blandin, communication privée).
Discutons les différents cas possibles : 1) Si qo = 0, alors E = −NS 2 J (0) l’arrangement est ferromagnétique 2) Si qo = 0 seuls interviennent alors qo et −qo si on veut satisfaire S2i = S 2 . On pose : S (qo ) = (a − i b)NS /2 Pour que Si 2 = S 2 il faut que (a, b) soient orthonormés. On a alors une configuration hélimagnétique droite ou gauche selon que le trièdre (a, b, qo ) est direct ou non. Un cas particulier de l’hélimagnétisme est l’antiferromagnétisme : tous les spins sont parallèles ou antiparallèles : qo · Ri = nπ. Le réseau se décompose en deux sousréseaux (cas cubique simple et cubique centré) ou plus de deux sous-réseaux (4 dans le cas d’un réseau cfc). L’énergie est dans tous les cas E = −NS 2 J (qo ) La configuration d’énergie minimum est obtenue pour la valeur qm qui rend J (q) maximum. Dans toute cette discussion la direction de l’aimantation (ferromagnétique), de l’aimantation alternée (antiferromagnétisme), ou de a et b (hélimagnétisme) n’est pas déterminée. L’énergie est invariante par rotation globale de l’espace des spins,
374
9. Introduction au magnétisme localisé
distinct de l’espace réel. Ces deux espaces sont découplés. Il n’y a couplage que si on prend en compte les mécanismes d’anisotropie. Ce sont eux qui fixent la direction de l’aimantation par rapport à l’espace réel.
9.2.2 État fondamental pour des spins quantiques Les spins quantiques sont décrits par l’hamiltonien d’Heisenberg : H =− Jij Si · Sj i,j
où les différentes composantes de Si ne commutent pas entre elles. Ceci introduit, par rapport au cas classique, une difficulté importante, qui fait qu’on ne connait pas, en général, le fondamental exact. Le spin total est une constante du mouvement. En effet, pour l’hamiltonien d’Heisenberg : [H, S(0)] = 0 2 Les états propres de H sont donc des états propres de S(0) et de Sz (0). L’état |O > = i |Siz = S >, où tous les spins dont dans l’état de composante suivant z maximum est un état propre de H . Il a pour énergie : Eo = −NS 2 J (0) Si J (R ) est toujours positif, l’état |O > est l’état fondamental. Si J (0) est la valeur maximum de J (q), alors l’état |O > est stable par rapport aux excitations élémentaires, les magnons, et il y a tout lieu de penser que c’est l’état fondamental. Par contre, dans le cas à deux sous-réseaux A et B et J < 0 entre premiers voisins, l’état stable qu’on avait trouvé dans le cas classique pourrait correspondre quantitativement à |N´e el >= ij |Siz = S, Sjz = −S > où i appartient au sous-réseau A et j au sousréseau B. Or cet état est fonction propre de Sz (0) avec la valeur propre 0, mais ni de S (0)2 , ni de H. En pratique, on se limitera à chercher un état fondamental approché par la méthode du champ moléculaire. Soit < Si > la valeur moyenne de l’opérateur Si dans l’état fondamental. La méthode consiste à remplacer dans l’hamiltonien Si par : < Si > + Si − < Si > et à négliger dans les produits Si · Sj les termes Si − < Si > Si − < Sj > Alors l’hamiltonien peut s’écrire HCM = i Hi où Hi est un hamiltonien à un spin : Hi = −2 j J Rij < Sj > Si
375
Physique de la matière condensée
On peut poser : him = him
2 g μB
j Jij
< Sj >
est le champ moléculaire, champ moyen créé par les autres spins au site i .
cette direction de Soit ui le vecteur unitaire le long de him et Sui la composante dans l’opérateur Si . L’état fondamental de Hi est l’état où Sui = S soit |Sui = S >. La valeur moyenne de Si s’écrit alors : < Si >= Sui et on obtient l’énergie d’un spin dans le champ moyen des autres spins < Hi >. Il est important de noter que l’énergie totale n’est pas la somme des énergies à un spin, mais en fait la demi-somme, car il faut éviter de compter deux fois les énergies d’interaction des paires (Si , Sj ) : Pour trouver les directions des vecteurs ui , il suffit alors de minimiser E. Le problème est alors exactement le même que pour des spins classiques : L’état fondamental approché à pour énergie : E0 = −NS 2 J (qm ) où qm est le vecteur d’onde qui rend J (qm ) maximum. L’état fondamental approché est : |OM >= |Sui = S > où ui = ux ( cos qm Ri ) + uy ( sin qm Ri ) ux et uy étant des vecteurs orthonormés. Si qm = 0, on retrouve le cas ferromagnétique et |OM > est l’état propre |O > exact de l’hamiltonien d’Heisenberg. Il faut bien souligner que, dans le cas antiferromagnétique, on ne connaît pas le fondamental exact. On ne connaît qu’un état approché obtenu en négligeant les fluctuations quantiques. Cette approximation devient particulièrement hasardeuse dans le cas de spins 1/2 et celui de basses dimensionnalités. Actuellement, le point de savoir si le fondamental pour des spins 1/2 à deux dimensions est un état antiferromagnétique ou un état de liquide de paires singulets, stabilisé par les fluctuations quantiques, est débattu dans le cadre de la théorie des supraconducteurs à haute température critique. Un premier état fondamental possible est l’état de Néel, c’est-à-dire l’état prévu dans l’approximation du champ moyen ou l’approximation classique, mais où le paramètre d’ordre antiferromagnétique serait fortement réduit par les fluctuations quantiques de point zéro, qui réduisent l’aimantation des deux sous-réseaux. C’est cet état qui correspond à l’énergie d’échange la plus basse. Un deuxième état fondamental possible serait l’état dit « à liaisons de valence résonnantes », suggéré par P. W. Anderson. Cet état est formé par la superposition
376
9. Introduction au magnétisme localisé
cohérente d’états | α > : | ψRVB > =
α cα
| ψα >
où les états | ψα > sont des états où les spins du réseaux sont tous appariés deux à deux en paires d’états singulets de spin nul. Ce type d’états forme toute une classe d’états où les coefficients complexes cα , avec leurs amplitudes e4 leurs phases, peuvent être considérés comme des cœfficients variationnels. Les états « RVB » ont une énergie d’échange plus élevée que l’état de Néel. Toutefois, ces états ont une énergie quantique de point zéro plus basse, même si on tient compte des ondes de spin de point zéro qui réduisent l’amplitude du paramètre d’ordre de l’état de Néel. Il y a donc compétition entre l’énergie d’échange qui favorise l’état de Néel, et l’énergie de point zéro, qui favorise les états « RVB ». Les études les plus récentes semblent montrer que les meilleurs états « RVB » sont très proches en énergie de l’état de Néel (où l’on tient compte des ondes de spin de point zéro), mais que ce dernier est bien l’état fondamental. Le fait que les états « RVB » soient très proches de l’état fondamental pourrait être important pour la théorie de la supraconductivité à haute température.
9.3 Champ moléculaire à température finie À température finie, il y a plus de résultat exact, même pour des spins classiques. Il faut utiliser des approximations. La plus simple est celle du champ moléculaire, qui est une méthode de champ moyen statique self-consistente. On remplace le problème de spins en interaction par un problème à un spin dans le champ moyen créé par les autres spins. Comme ce champ moyen, qui détermine l’état des spins, dépend évidemment de cet état qu’on cherche, il y a un problème de cohérence interne du calcul, qui exige de résoudre une équation dite de self-consistence.
9.3.1 Méthode du champ moléculaire statique – Cas uniforme Supposons que chaque spin, classique ou quantique, est soumis à un champ extérieur hiext . L’hamiltonien du système s’écrit : H = − i,j J Rij Si · Sj − g μB i Si · hiext L’interaction du spin i avec les autres spins peut s’écrire : −g μB Si hi où hi = g μ2 B j J Rij Sj L’approximation du champ moléculaire consiste à remplacer hi par sa valeur moyenne, le champ moléculaire him = g μ2 B j J Rij < Sj >
377
Physique de la matière condensée
la valeur moyenne étant la valeur moyenne statistique prise à la température considérée. Chaque spin Si est alors soumis à un champ effectif hiext + him , et décrit par l’hamiltonien : Hi = −g μB Si · hi eff . On est donc ramené à un problème à un corps, et on doit résoudre une série d’équations de self-consistence : < Si >= f ({< Sj >}) L’énergie interne < E > du système n’est pas égale à : deux fois chaque interaction entre spins i et j ). On a : < E >mol = −
i,j
i
< Hi > (on compterait
J Rij < Si >< Sj > −g μB i < Si > ·hiext
Nous avons déjà vu (chapitre 4) la justification variationnelle de cette méthode. On peut aussi la considérer comme une méthode de linéarisation de l’hamiltonien. On écrit : Si =< Si > +(Si − < Si > ) En supposant que les fluctuations sont petites et en négligeant les termes quadratiques en fluctuations, on aboutit à l’hamiltonien de champ moyen, somme de termes à un spin. Supposons que le champ moléculaire soit uniforme. On cherche donc une solution de la forme : hiext = ho uz < Si >= < Sz > uz Le champ moléculaire est le long de l’axe z . L’équation de self-consistence s’écrit : < Sz >= SBs
g μB h eff S kB T
où la fonction Bs (x ) est la fonction de Brillouin. Pour S = 1/2, B1/2(x ) = thx. Pour un spin classique B∞ (x ) = cothx − 1/x. < Sz > est le paramètre d’ordre. Si le champ extérieur est nul, cette équation peut être discutée graphiquement (voir chapitre 4). On cherche l’intersection de la courbe y = SBs (x ) avec la droite T (figure 9.4) : y = 2JkB(0)S . Il n’existe de point d’intersection M différent de 0 que si T < Tc avec : Tc = 2J (0)S (S +1) . 3kB Tc est la température critique, ou température de Curie. Pour T < Tc , le comportement de l’aimantation se déduit de l’équation de selfconsistence.
378
9. Introduction au magnétisme localisé
Fig. 9.4 La solution graphique de l’équation de self-consistence est à l’intersection des deux courbes (A. Blandin, communication privée).
Au voisinage de Tc < Sz >∼ (Tc − T )1/2 On retrouve évidemment la valeur de champ moyen de l’exposant critique β = 1/2. Pour T Tc : 2J (0)S k ∼ B < Sz > (T ) = S 1 − e Ce comportement activé se comprend aisément. À basse température, les seuls états excités s’obtiennent par renversement d’un spin dans le champ moyen des autres spins, dans le cadre de l’approximation discutée ici, ce qui requiert l’énergie finie 2J (0)S. Si ce comportement est correct pour des spins d’Ising, il ne l’est pas pour des spins d’Heisenberg. La différence entre ces deux systèmes tient à la nature de la symétrie brisée par l’apparition d’une aimantation spontanée pour des spins d’Ising, il s’agit de l’invariance par le renversement global des spins ; c’est une symétrie discrète. Pour des spins d’Heisenberg, il s’agit de l’invariance par rotation globale des spins ; c’est une symétrie continue, qui implique l’existence d’un mode d’excitation d’énergie nulle (voir, plus loin, le théorème de Goldstone) et d’une aimantation non activée à basse température. Pour T > Tc , en présence d’un champ magnétique ho petit, on obtient : g μB S (S + 1) 2J (0) h0 + < Sz > (T ) < Sz > (T ) = 3kB T g μB On retrouve encore, évidemment, l’exposant de champ moyen γ = 1 pour la fonction de réponse au champ couplé au paramètre d’ordre. Ici, le paramètre d’ordre est l’aimantation < Sz > ou < S (0) > ; le champ couplé au paramètre d’ordre est le champ magnétique uniforme (figure 9.5).
379
Physique de la matière condensée
Fig. 9.5 Aimantation moyenne en fonction de la température (A. Blandin, communication privée).
On peut aussi calculer la chaleur spécifique par spin en champ nul : Cvmol =
1 d < E >mol d < Sz > (T ) = −2J (0) < Sz > (T ) N dT dT
Comme pour l’aimantation, on trouve un comportement activé exponentiellement à basse température. Ce comportement est lié à l’existence d’un gap d’énergie pour les excitations individuelles du système de spins, retournement d’un spin dans le champ moyen des autres spins. En effet, l’approximation discutée ici ne décrit pas les excitations collectives, ondes de spin qui se quantifient en magnons. Notons que dans le cadre de l’approximation utilisée ici, l’énergie libre, au voisinage de Tc , se développe en puissances de < Sz > (T ) = m. On retrouve un développement de l’énergie libre en fonction du paramètre d’ordre, développement « à la Landau ». Il n’existe, ici, que des termes de puissances paires de m. Ceci est lié à l’invariance de l’hamiltonien par renversement du temps (qui change S en − S).
9.3.2 Champ moléculaire non uniforme Supposons que l’on puisse appliquer un champ tournant hi = h ui où le vecteur unitaire ui est donné par ui = ux (cosq · Ri ) + uy (sinq · Ri) On pose < Si >= mui Le champ moléculaire him est alors : him =
2J (q) mui g μB
et on obtient la relation de self-consistence : m = SBS
380
g μB h eff S kB T
.
9. Introduction au magnétisme localisé
En l’absence de champ extérieur, la discussion est tout à fait analogue au cas uniforme. Il suffit de remplacer J (0) par J (q). Il existe une température critique Tc (q) en dessous de laquelle apparaît un ordre hélimagnétique ou antiferromagnétique : Tc (q) =
2J q S (S +1) 3kB
Pour une interaction J (R) donnée, l’ordre magnétique s’établit pour une valeur de q, qm qui rend Tc (q) et donc J (q) maximum. C’est la même valeur de q qui définit la solution à T = 0. On peut également définir la fonction de réponse à un champ couplé au paramètre d’ordre. Ici le paramètre d’ordre est < S(q) > et le champ couplé à cette composante de Fourier de vecteur d’onde q de l’aimantation est un champ magnétique sinusoïdal de vecteur d’onde q. On obtient en champ moyen : m q = χ 0 q h ext q + J q m q χ0 q (S +1) χ q = 1−J q χ 0 q = 3k 2S T −T q B
c
C’est bien cette quantité (et non évidemment la susceptibilité de vecteur d’onde q = 0, réponse à un champ uniforme) qui à un comportement critique quand χ (R) fonction de réponse T −→ Tc (q). On peut en déduirela susceptibilité iq·R locale à un champ localisé à l’origine : χ R = N1 χ q e . q Dans le cas ferromagnétique, pour T voisin de Tc et pour q petit on a : J (q) ∼ = J (0) − αq 2 On obtient :
avec λ =
√1 α
χ q =
3kB 2S (S +1)
1/2 1/2 . T − Tc
1 α q 2 +λ2
En transformation de Fourier, on obtient le comportement de χ (R ) pour R −λR grand : χ R ≈ e R (formule d’Ornstein-Zernike). χ (R ) donne le comportement de la fonction de corrélation (figure 9.6).
Fig. 9.6 Variations avec la distance de la fonction de corrélation (A. Blandin, communication privée).
381
Physique de la matière condensée
De manière générale, on retrouve tous les indices critiques de champ moyen : Chaleur spécifique Cv
α=0
Aimantation en champ nul m
β = 1/2
Aimantation à T = Tc m h, Tc δ = 3 Susceptibilité χ
γ =1
Fonction de corrélation (R )
η=0
Longueur de corrélation ξ
ν = 1/2
9.3.3 Structures magnétiques Nous discutons dans ce paragraphe les différentes structures magnétiques stables qui peuvent apparaître, en étendant cette discussion au cas de plusieurs atomes par maille cristalline. Les différents cas qui peuvent se produire sont présentés ci-dessous. a) Ferromagnétisme C’est le cas le plus simple. Pour des isolants, on le trouve pour le Gadolinium et quelques Terres Rares (où le caractère métallique ne provient pas des électrons f , responsables du magnétisme) et dans quelques isolants comme EuO par exemple. Le cas des métaux de transition (Fe, Co, Ni) n’est pas correctement traité par cette étude qui néglige le caractère itinérant des électrons d de ces métaux (voir chapitre 10). b) Antiferromagnétisme Dans les isolants magnétiques, l’interaction d’échange dominante est dans la plupart des cas le super-échange cinétique d’Anderson. Dans la très grande majorité des cas, c’est une interaction limitée aux proches voisins et de type antiferromagnétique. L’antiferromagnétisme est donc l’état magnétique ordonné usuel des isolants à un seul type d’ions magnétiques. Cette structure ne constitue qu’un cas particulier de l’hélimagnétisme (nous verrons que pour obtenir un qm n’appartenant pas au réseau réciproque, il faut des conditions particulières sur l’intégrale d’échange J (Rij )). Considérons d’abord le cas simple où le réseau d’ions peut se décomposer en deux sous-réseaux. C’est le cas du réseau cubique simple : il y a trois types d’antiferromagnétisme possibles définis par les vecteurs qm : α) qm = (0, 0, π/a) : les spins de tout plan [001] sont parallèles entre eux ; ils alternent de direction d’un plan à son voisin. La maille magnétique est doublée dans la direction z . Le réseau magnétique est quadratique (figure 9.7).
382
9. Introduction au magnétisme localisé
Fig. 9.7 Maille magnétique pour q = (0, 0, π/α) (A. Blandin, communication privée).
Fig. 9.8 Maille magnétique pour q = (π/a, π/a, 0) (A. Blandin, communication privée).
β) qm = (π/a, π/a, 0) : On peut encore définir une alternance de plans ferromagnétiques, alternativement = et 0, les plans [110] ; la maille élémentaire à pour base un carré de côté a/2 et de hauteur a. Le réseau magnétique est quadratique (figure 9.8). γ ) qm = (π /a, π /a, π /a) : la discussion est analogue avec les plans [111]. Dans ce cas le réseau magnétique est hexagonal. Un réseau cubique centré ou tétragonal centré se décompose aussi en deux sousréseaux. C’est un cas fréquent (MnF2 par exemple). Par contre, un réseau où les premiers voisins d’un site donné peuvent être premiers voisins entre eux ne peut pas se décomposer en deux sous-réseaux. C’est le cas du réseau cubique à faces centrées qui se décompose en quatre sous-réseaux. C’est un cas fréquent (MnO par exemple). Dans ce qui suit, on se limite au cas à deux sous-réseaux A et B. Le traitement est alors tout à fait identique au cas ferromagnétique. La décomposition en deux sous-réseaux est caractérisée par un vecteur qm . La température de transition, ou température de Néel TN , est donnée par : TN =
2J (qm )S (S + 1) 3kB
383
Physique de la matière condensée
Pour T > TN , la susceptibilité uniforme χ (q = 0) suit une loi de Curie-Weiss (voir figure 9.9) : S (S + 1) χ (q = 0) = 3kB (T − θ) ou θ =
2J (0)S (S +1) 3kB
est la température de Curie-Weiss.
Fig. 9.9 Susceptibilité réduite : loi de Curie-Weiss (A. Blandin, communication privée).
θ est en général différent de −TN , sauf dans le cas d’une interaction limitée aux premiers voisins ; alors θ = −TN . Remarquons que χ (q = 0) se comporte alors comme (T + TN )−1 , alors que χ (qm ) se comporte comme (T − TN )−1 . Pour T < TN , l’aimantation de chaque sous-réseau varie de manière identique à l’aimantation totale dans le cas ferromagnétique. Dans l’approximation que nous considérons ici, l’anisotropie est strictement nulle (voir plus loin). Les aimantations des deux sous-réseaux dans la phase ordonnée adoptent en présence d’un champ magnétique uniforme la configuration de la figure 9.10.
Fig. 9.10 Configuration oblique (A. Blandin, communication privée).
Dans ce cas, un calcul simple montre que la susceptibilité est indépendante de la température. Il s’agit de la susceptibilité transverse χ⊥ , (car ho est ⊥ aux aimantations MA et MB ). Nous verrons que la susceptibilité longitudinale χ (ho parallèle à MA
384
9. Introduction au magnétisme localisé
ou MB , situation qui ne peut se réaliser qu’en présence d’anisotropie) est nulle à T = 0 et égale à χ⊥ (TN ) à T = TN (figure 9.11).
Fig. 9.11 Susceptibilité d’un cristal antiferromagnétique en champ faible (A. Blandin, communication privée).
On peut étudier le diagramme de phase en présence d’un champ magnétique uniforme appliqué. Toujours dans le cas où l’anisotropie est négligée, il ne peut s’agir que du cas où le champ extérieur est perpendiculaire à MA et MB, puisque la direction des deux aimantations est fixée de façon que l’énergie – 1/2 χhO2 soit minimum, c’est-à-dire χ maximum (figure 9.12).
Fig. 9.12 Dans le domaine oblique les deux sous réseaux ont la configuration dénommée « oblique ». Les aimantations sont parallèles au champ de extérieur h0 et de même sens. La transition est du deuxième ordre (A. Blandin, communication privée).
385
Physique de la matière condensée
Dans le domaine oblique, les aimantations des deux sous-réseaux ont la configuration oblique de la figure 9.10. Dans le domaine , les aimantations sont parallèles au champ extérieur ho et de même sens. La transition est du deuxième ordre. c) Hélimagnétisme : L’hélimagnétisme a été observé pour la premiére fois á Saclay par diffraction de neutrons et, en même temps, au Japon dans les années 50. Villain en a donné l’analyse correcte dans une conférence sur le magnétisme á Oxford. Les structures hélimagnétiques se rencontrent dans les métaux de Terres Rares ou les composés métalliques ordonnés de métaux de transition. En effet, pour que qm soit différent d’un vecteur du réseau réciproque, il faut avoir une interaction d’échange à plus longue portée que premiers (et même souvent deuxièmes) voisins et de signe variable : les mécanismes d’échange indirect dans les métaux ont ces caractéristiques. Les Terres Rares fournissent une très grande variété de structures hélimagnétiques. d) Ferrimagnétisme : Il s’agit d’une structure magnétique où existent deux ou plusieurs sous-réseaux aux sites desquels se trouvent des spins de longueurs différentes. Dans ce cas, l’état ordonné présente toujours une aimantation globale non nulle. Considérons le cas à deux sous-réseaux A et B et où MA et MB sont antiparallèles. Si on suppose des interactions d’échange non négligeables seulement entre un atome A et un atome B premiers voisins JAB , la susceptibilité uniforme est donnée par : χ 0 +χ 0 T 2 +2zJ χ 0 χ 0 T 2 χ q = 0 = A B T 2 −T 2AB A B c
où la température critique Tc est donnée par : Tc = JAB χA0 χB0 z est le nombre de premiers voisins, χA0 et χB0 sont les susceptibilités sans interaction. La susceptibilité à donc un comportement non linéaire en (T − Tc )−1 , avec une courbure caractéristique des ferrimagnétiques. Soit Ni (i = A ou B) le nombre de sites du sous-réseau i . Près de 1/2 NA SA SA + 1 − NB SB SB + 1 Tc : M ≈ Tc − T Si NA SA SA + 1 < NB SB SB + 1 alors l’aimantation totale est dirigée vers MB . Si NA SA > NB SB , à T Tc , l’aimantation totale M ∼ NA SA − NB SB est dirigée suivant MA . Dans ce cas, il existe entre 0 et Tc une température où l’aimantation totale s’annule : on dit qu’il y a un point de compensation. Parmi les cristaux ferrimagnétiques, on trouve les ferrites, de structure spinelle (par exemple Fe3 O4 ) et les grenats. Les grenats de Fer ont pour formule T3 Fe5 O12 où T est un ion trivalent. Le grenat de gadolinium donne un exemple de point de compensation (figures 9.13 and 9.14).
386
9. Introduction au magnétisme localisé
Fig. 9.13 Aimantation du grenat de Gadolinium (A. Blandin, communication privée).
Fig. 9.14 Contributions des ions Gd3+ et Fe3+ (A. Blandin, communication privée).
L’intérêt pratique des ferrimagnétiques isolants réside dans leur caractère isolant, associé à une aimantation globale non nulle à des températures ordinaires (Tc ∼ 300 ◦ C pour les grenats, 800 ◦ C pour les ferrites).
9.3.4 Couplages moments magnétiques – Réseau Jusqu’à présent, nous avons considéré le cas où l’espace réel et l’espace des spins étaient totalement découplés. L’hamiltonien d’Heisenberg (ou l’énergie d’échange) était invariant dans toute rotation globale de l’ensemble des spins. Il s’agit d’une très bonne approximation. Cependant, si on se place à une échelle d’énergie beaucoup plus petite que l’énergie d’échange, il existe un terme de couplage entre le réseau et les spins. En effet, il existe un couplage entre la direction du moment angulaire orbital, qui fixe l’anisotropie des fonctions d’onde électroniques et le champ cristallin, qui est déterminé par l’anisotropie du réseau d’ions du cristal. Or le moment angulaire orbital est aussi couplé au moment de spin par l’intermédiaire du couplage spinorbite. L’association de l’effet du champ cristallin et du couplage spin-orbite résulte en un effet de couplage de la direction des spins au réseau. C’est un effet à un ion,
387
Physique de la matière condensée
qui est important si le moment orbital L est différent de zéro : c’est le cas des Terres Rares (sauf Gd 3+ et Eu 2+ qui sont dans un état S ). Les effets sont plus faibles pour les ions S et pour les ions de transition dont le moment orbital est bloqué par le champ cristallin (< L >= 0). On se limitera dans la suite au cas de spins classiques. a) Énergie et champ d’anisotropie – Cas ferromagnétique L’interaction spin-réseau peut se traduire par une énergie d’anisotropie qui dépend de la symétrie du réseau. Par exemple, pour un cristal hexagonal, on a l’énergie d’anisotropie par unité de volume : Ea = K1 sin 2 θ + K2 sin 4 θ où θ est l’angle de l’aimantation avec l’axe hexagonal. En général K1 K2 et les constantes peuvent varier fortement avec la température. Pour le Cobalt à 300 K, K1 ≈ 4 × 106 ergs/cm3, K2 ≈ 106 ergs/cm3 . L’aimantation est donc dirigée suivant l’axe hexagonal. Dans un cristal cubique, l’énergie s’écrit en fonction des cosinus directeurs de l’aimantation. La symétrie cubique impose que les termes de plus bas ordre soient du 4ème ordre : Ea = K1 (α12 α22 + α22 α32 + α32 α12 ) + K2 α12 α22 α32 K1 est supérieur à K2 . Pour le Fer à 300 K : K1 ≈ 4 × 105 ergs/cm3, K2 ≈ 1, 5 × 105 ergs/cm3 . L’aimantation est donc dirigée suivant les axes du cubes ([100] ou équivalents). Pour le Nickel K1 est < 0, l’aimantation est donc dirigée suivant l’axe [111] (ou les axes équivalents) (figure 9.15). Quand l’angle de l’aimantation avec l’axe d’équilibre est petit, on peut faire un développement de l’énergie d’anisotropie. Par exemple, dans le cas hexagonal, et K1 > 0 : Ea ≈ K1 q 2 ≈ 2K1 (1 − cosθ) ≈ 2K1 − M · ha
Fig. 9.15 Courbe d’aimantation d’un monocristal de Cobalt (A. Blandin, communication privée).
388
9. Introduction au magnétisme localisé
ce qui définit le champ d’anisotropie ha : ha = 2K1 /M M étant l’aimantation par unité de volume. En principe, la notion de champ d’anisotropie n’est valable qu’au voisinage de l’axe d’équilibre, qu’on appelle axe de facile aimantation. Dans un monocristal où l’aimantation serait uniforme (monodomaine), les courbes d’aimantation sont différentes selon que le champ est parallèle ou perpendiculaire à cet axe de facile aimantation. b) Influence de l’anisotropie sur les cristaux antiferromagnétiques L’existence de l’énergie d’anisotropie à des effets importants sur les cristaux antiferromagnétiques. Maintenant que l’espace des spins et l’espace réel sont couplés, il faut distinguer le cas où le champ magnétique extérieur est parallèle ou perpendiculaire au champ d’anisotropie. Considérons d’abord le cas des champs faibles |ho | |ha | et calculons la réponse linéaire de vecteur d’onde q = 0 (aimantation uniforme). Pour le cas où ho est perpendiculaire à ha , on retrouve pratiquement les résultats obtenus pour ha = 0 (car ha he ). χ⊥ (T ) = constante pour T < TN Pour le cas parallèle, à T = 0, il est impossible d’obtenir une aimantation uniforme en champ faible ; il faudrait pour cela retourner l’aimantation d’un sous-réseau. χ (T = 0) = 0 Quand T croît < MA > et < MB > ne sont pas saturées ; il est alors possible de créer une aimantation induite non nulle < MA >H − < MB >H =0. La susceptibilité croît et tend vers χ⊥ (TN ) quand T −→ TN , puisqu’alors la susceptibilité doit devenir isotrope (voir figure 9.11). Dans les échantillons polycristallins, il faut faire la moyenne sur toutes les orientations : χpolycristal = 2/3χ⊥ + 1/3χ Le résultat est un point anguleux de χpolycristal (T ) à T = TN (figure 9.12). Quand ho devient comparable ou plus grand que le champ d’anisotropie ou que le champ d’échange, on sort du cadre de la réponse linéaire. Il faut distinguer à nouveau le cas où le champ extérieur est perpendiculaire à ha et celui où il est parallèle à ha . Dans le cas perpendiculaire, on peut avoir les deux configurations oblique ou parallèle et le diagramme de phase est comparable au cas ha = 0. Dans le cas où h0 est parallèle à ha , on peut avoir en plus la configuration strictement antiparallèle : c’est celle qui est obtenue en champ faible puisque χ (T = 0) = 0 (figure 9.16).
389
Physique de la matière condensée
Fig. 9.16 Configuration antiferromagnétique (A. Blandin, communication privée).
Quand le champ augmente, il arrive, pour une valeur critique, que les deux sousréseaux se retournent pour se présenter dans la configuration perpendiculaire au champ de façon à maximiser la susceptibilité. On obtient alors la configuration oblique (figure 9.10). Cette transition appelée spin-flop est du premier ordre. En champ croissant, on finit par obtenir la configuration parallèle. Le diagramme de phase, dans le plan h0 /|hm |, ha /|hm | est celui de la figure 9.17.
Fig. 9.17 Diagramme de phase dans le plan h0 /hm , ha /hm (A. Blandin, communication privée).
390
9. Introduction au magnétisme localisé
Si ha est plus grand que |hm | la phase spin-flop disparaît. Dans le cas ha < |hm |, ce qui est le cas usuel, on en déduit le diagramme de phase, champ magnétique-température (figure 9.18).
Fig. 9.18 Diagramme de phase champ magnétique-température dans Le cas ha < |hm | (A. Blandin, communication privée).
9.3.5 Parois et domaines Jusqu’à présent nous avons considéré le cas d’un cristal infini. Si le volume de l’échantillon reste fini, il faut tenir compte de sa forme et de l’influence du champ démagnétisant. Le champ démagnétisant est dû aux pôles magnétiques qui apparaissent en surface. On supposera que la forme de l’échantillon est telle que ce champ soit uniforme. Considérons un monocristal. S’il est aimanté uniformément, le champ démagnétisant HD est uniforme. Il existe des pôles magnétiques Nord et Sud et l’énergie magnétique est importante. On peut diminuer ce terme d’énergie en divisant le monocristal en 2, 3,... N domaines (figure 9.19). Ceci diminue l’énergie magnétique due au champ démagnétisant. En créant des domaines, on crée des parois séparant des domaines, c’est-à-dire qu’on crée des singularités du paramètre d’ordre qui s’opposent au phénomène de rigidité généralisée. Cela demande de l’énergie, car lors du changement de direction de l’aimantation quand on passe d’un domaine à l’autre, on augmente l’énergie d’échange et l’énergie d’anisotropie. L’épaisseur et la forme de la paroi sont déterminées par la minimisation de l’énergie de paroi par unité de surface.
391
Physique de la matière condensée
Fig. 9.19 Formation de domaines (A. Blandin, communication privée).
La structure en parois et domaines de l’aimantation correspond à la solution qui minimise l’énergie totale, somme de trois termes : échange, anisotropie et énergie du champ magnétostatique. Si, en outre, on ajoute un champ magnétique extérieur ho , on va modifier la structure des domaines par déplacement ou déformation des parois, de sorte que les domaines d’aimantation parallèle au champ augmentent de volume au détriment des domaines d’aimantation opposée au champ appliqué. Les courbes d’aimantation correspondent essentiellement à ces déplacements ou déformations de parois. Ces déplacements peuvent être réversibles (on reste toujours dans un état d’équilibre) ou irréversibles ; il y a alors hysteresis. Considérons le cas très simple d’une paroi de Bloch (figure 9.20) : l’aimantation reste toujours dans le plan x 0z mais tourne progressivement de la direction +0z à la direction −0z .
Fig. 9.20 Considérons le cas très simple d’une paroi de Bloch (A. Blandin, communication privée).
392
9. Introduction au magnétisme localisé
L’énergie d’échange à tendance à augmenter l’épaisseur L de la paroi, de façon à minimiser θi+1 − θi . Au contraire, l’anisotropie à tendance à la diminuer, de façon à avoir peu de spins hors de la direction de facile aimantation. On supposera que L = na est beaucoup plus grand que a, distance entre spins premiers voisins, ce qui est en général le cas des ferromagnétiques usuels. Soit a 2 l’aire par spin dans le plan x 0z . L’augmentation de l’énergie d’échange entre premiers voisins par unité de surface est : 2 2 Eech ≈ JSa 2 πn En supposant une énergie d’anisotropie K sin2 θ, l’augmentation d’énergie d’anisotropie par unité de surface de paroi est : Ea ≈ anK < sin 2 θ > D’où l’énergie de paroi par unité de surface : E =
π JS 2 na 2
+
Ka 2 n
En minimisant par rapport à n, on obtient :
2 2 1/2 n0 = 2πKaJS3 ce qui donne une épaisseur de paroi L = no a, typiquement de l’ordre de 1000 Å et une énergie de paroi par unité de surface : √ Ep ≈ 2π S JKa typiquement de l’ordre de l’erg/cm2 . Il existe d’autres formes de parois où l’aimantation tourne de π/2 (dans les cristaux cubiques par exemple). Dans les lames minces, il existe des cas où l’aimantation tourne en restant dans le plan perpendiculaire à la paroi (parois de Néel). La structure en domaine s’organise de façon à minimiser la somme de l’énergie de paroi (qui tend à réduire le nombre de domaines) et de l’énergie magnétostatique (qui tend à augmenter le nombre de domaines). Les dimensions typiques de domaines, qui dépendent de la forme du cristal, vont de quelques microns à quelques millimètres. Il existe de nombreuses configurations possibles et l’étude détaillée est complexe. Par exemple : – dans le cas des domaines de fermeture, il n’y a pas de masse magnétique en surface (figure 9.21), l’énergie magnétostatique est nulle ; – dans le cas de spins d’Ising (très forte anisotropie) et d’une lame ferromagnétique, on peut obtenir en augmentant l’épaisseur de la lame, des structures de domaines branchées, dont la configuration détaillée dépend de l’épaisseur, de la température, du champ magnétique appliqué. D’une façon générale, quand on applique un champ magnétique à une structure en domaine, on déplace les parois pour augmenter le volume des domaines parallèles au champ.
393
Physique de la matière condensée
Fig. 9.21 Dans le cas des domaines de fermeture, il n’y a pas de masse magnétique en surface ; l’énergie magnétostatique est nulle (A. Blandin, communication privée).
Ce déplacement des parois est d’abord libre. Il se fait de façon réversible. Puis, les parois viennent s’accrocher sur des défauts du cristal (impuretés, dislocations, etc.). Il y a alors déformation de la paroi, qui reste fixée sur ces points d’ancrage. Cette phase est encore réversible. Puis, lorsque cette déformation coûte trop d’énergie, il y a décrochage de la paroi, qui vient se fixer sur de nouveaux points d’ancrage. Cette phase est irréversible. Puis, lorsque ne subsiste plus qu’un seul domaine, il y a rotation de l’aimantation. Le résultat de ces irréversibilités est la formation d’une hysteresis. Même dans le cas d’un échantillon monodomaine, le phénomène d’hysteresis existe. Il est dû au fait qu’il existe deux minimums relatifs de l’énergie libre, un correspondant à l’équilibre stable (minimum absolu) et l’autre à un état métastable, séparés par une barrière de potentiel. Par exemple, en champ décroissant, on peut obtenir les comportements successifs schématisés sur la figure 9.22 pour l’énergie libre. On obtient dans ce cas le cycle d’hysteresis maximum.
9.4 Ondes de spin et magnons De même qu’on peut d’abord étudier les structures cristallines stables, puis les petites oscillations harmoniques au voisinage de l’équilibre, c’est-à-dire les ondes de vibrations qui se quantifie en phonons, de même nous avons commencé à étudier les structures magnétiques stables, puis, dans ce paragraphe, nous discuterons les oscillations des spins au voisinage de l’équilibre, les ondes de spin qui se quantifient en magnons.
9.4.1 Ondes de spin dans un cristal ferromagnétique Soit (ux , uy , uz ) un trièdre orthonormé direct. À l’équilibre les spins sont suivant uz . Au voisinage de l’équilibre : Si = Suz + δSx ux + δSy uy
394
9. Introduction au magnétisme localisé
Fig. 9.22 Comportements successifs de l’énergie libre (A. Blandin, communication privée).
395
Physique de la matière condensée
δSi est transverse de manière à conserver la longueur de Si au plus bas ordre. L’équation du mouvement d’un spin indépendant dans un champ extérieur ho s’écrit : dS dt
= g μB S ∧ h 0
En posant δS− (q) = δSx (q) − i δSy (q) = Nsq e iωt on peut obtenir la relation de dispersion des ondes de spin : ω(q) = 2S [J (0) − J (q)] En revenant aux déviations de spins δSi , on a : δSi = Sq [ux cos (qRi + ω(q)t ) + uy sin (qRi + ω(q)t )] ce qui décrit une onde progressive. Les spins décrivent des cônes, de même angle au sommet, déphasés quand on passe d’un site au site voisin. On peut aussi superposer les solutions de vecteurs d’onde +q et −q, ce qui donne l’onde stationnaire : δSi = 2Sq cos qRi [ux cos (ω(q)t ) + uy sin (ω(q)t ) ] Les spins décrivent en phase des cônes dont l’angle au sommet varie en cos qRi . La relation de dispersion montre que ω(q = 0) = 0. Ce résultat est lié à l’invariance par rotation du système de spins. Pour de petites valeurs de q, ω est quadratique en fonction des composantes de q. Pour un réseau cubique : ω ≈ Dq 2 où la constante D s’appelle le coefficient de rigidité. Dans un cas antiferromagnétique, on peut montrer, par une méthode tout à fait analogue, que les ondes de spin ont pour relation de dispersion : ω = 2S [J 2 (0) − J 2 (q)]1/2 Pour de petites valeurs de q, la relation de dispersion devient linéaire. Pour un cristal cubique : ω ≈ A|q|. Ce résultat reste valable dans le cas hélimagnétique.
9.4.2 Magnons Considérons maintenant le cas de spins quantiques. Nous considérons à nouveau le cas ferromagnétique. Dans ce cas, nous connaissons l’état fondamental exact du système décrit par l’hamiltonien d’Heisenberg. Ses énergies sont E0 + E (q), où E0 est l’énergie du fondamental |F > et où E (q) = 2S [J (0) − J (q)]
396
9. Introduction au magnétisme localisé
Pour de petites valeurs de q, E (q) est quadratique et pour un cristal cubique : E (q) ≈ Dq 2 Les magnons décrits par les opérateurs de création S − (q) peuvent être considérés approximativement comme des bosons. Considérons les opérateurs bq = √ 1 S + −q bq+ = √ 1 S − q 2NS 2NS + 1 i q−q Ri Siz Calculons le commutateur : bq , bq = NS i e Les bq ne vérifient donc pas rigoureusement les règles de commutation des opérateurs de bosons. Mais si on se restreint au sous-espace d’états à un seul magnon, en appliquant cette relation au fondamental |F >, on obtient : + [bq , bq ]|F >= δqq |F >
De même, si on applique la relation de commutation à un état |q1, q2, ... > comportant un nombre fini de magnons, on a : + [bq , bq ]|q1 , q2 , ... >= δqq |q1 , q2 , ... > +0(1/N )
On peut donc considérer les opérateurs bq+ et bq comme des opérateurs de création et d’anihilation de bosons tant que le nombre d’excitations présentes est d’ordre 1/N . L’existence d’excitations de basse énergie ω(q −→ 0) −→ 0 influence les propriétés magnétiques à basse température. Discutons le cas ferromagnétique : chaque magnon correspond à la diminution d’une unité de la composante Sz (0) du spin total. On peut donc en déduire à basse température (où le nombre de magnons est faible, et où on peut les assimiler à des bosons) les propriétés d’équilibre du système. 1 L’aimantation par atome s’écrit à 3 dimensions :< S z T >= S − N1 q e βE (q) −1 On est amené à calculer l’intégrale : 1 B
d 3q e βE (q) −1
À basse température, les termes importants proviennent des petites valeurs de q. On pose : x2 =
Dq 2 kB T
Au plus bas ordre en température, on peut remplacer la borne supérieure de l’intégrale par + ∞ et on obtient :
3/2 BT < S z T > ≈ S − 0, 117A khD Cette loi en T 3/2 est bien vérifiée pour les ferromagnétiques. On peut de même calculer la contribution des magnons à la chaleur spécifique. Ces lois en T 3/2 dépendent uniquement de l’existence d’excitations de type bosons avec une relation de dispersion en q 2 et de la dimensionnalité d’espace. Dans le cas
397
Physique de la matière condensée
d’une dimensionnalité d’espace d ≤ 2, la somme : qc d d q 1 1 q e βE (q) −1 = B 0 e βE (q) −1
diverge à cause de la borne q −→ 0. Ceci signifie qu’il ne peut exister à température non nulle d’aimantation non nulle. Les ondes de spin de vecteurs d’onde q −→ 0 détruisent l’ordre à grande distance pour des spins d’Heisenberg et pour des dimensionnalités d’espace d ≤ 2. Remarquons que ceci n’est pas vrai pour des spins d’Ising : il existe un ordre à grande distance pour d = 2 (voir chapitre 2). Ceci est dû à l’absence d’excitations de basse énergie ω (q −→ 0) −→ 0 parce que la symétrie brisée pour des spins d’Ising est une symétrie discrète (et non continue comme dans le cas des spins d’Heisenberg). Le cas des spins X − Y est marginal à deux dimensions et ne sera pas discuté ici. Pour un antiferromagnétique, la loi de dispersion est linéaire en q et la chaleur spécifique doit varier en T 3 , comme pour les phonons, alors que l’aimantation de chaque sous-réseau varie en T 2 . Pour des spins classiques, l’existence d’un mode q = 0 statique (ω = 0) est une conséquence de l’invariance de l’énergie par rotation globale des spins. Le mode q = 0 correspond à δSi = Cte , donc à une rotation uniforme de tous les spins. Dans ce cas, le spin total est une constante du mouvement. De même, pour des spins quantiques, l’hamiltonien d’Heisenberg est invariant par rotation. L’état fondamental |F > n’est pas invariant par rotation, à cause de la symétrie brisée. Il est fonction propre de S (0)2 et de Sz (0) avec les valeurs propres NS (S + 1) et NS respectivement. On doit donc avoir un ensemble d’états de même valeur propre de S (0)2 , mais dont les valeurs propres de Sz (0) sont NS , NS − 1,... −NS . √ L’opérateur (1/ N )S − (0) décrit l’excitation d’un magnon de vecteur d’onde q = 0. Nous voyons que l’invariance de l’hamiltonien par rotation, se traduit par : [H, S 2 (0)] = 0
[H, Sz (0)] = 0 nous pouvons déduire que Eq=0 = 0
Le magnon q = 0 est donc très particulier et n’interagit pas avec les magnons q = 0. C’est ce qu’on appelle un boson de Goldstone. Ceci constitue un cas particulier d’un résultat général de la théorie des transitions de phase. Étant donné un hamiltonien possédant un groupe de symétrie continu (invariance par translation, invariance par rotation, invariance de jauge…), il peut exister à T = 0 des solutions qui ne possèdent pas toute la symétrie de l’hamiltonien et qui sont caractérisées par un paramètre d’ordre macroscopique qui brise la symétrie du système ; elles ont une dégénérescence infinie : l’ensemble des solutions de même énergie est obtenu les opérateurs de symétrie sur le paramètre d’ordre √ en appliquant − (par exemple (1/ N )S (0) est l’opérateur de rotation des spins). Ces solutions ont la propriété suivante : il existe une branche d’excitations élémentaires appelée boson de Goldstone (magnon, phonon, ...) telle que E (q = 0) = 0. Le mode q = 0 fait passer d’une solution à une autre au sein de l’ensemble des solutions dégénérées :
398
9. Introduction au magnétisme localisé
ceci ne coûte aucune énergie. Ce résultat n’est valable que pour des forces à courte portée (nous verrons que pour les plasmons, oscillations de la densité de charge d’un gaz d’électrons, l’interaction coulombienne à longue portée est la cause d’une valeur non nulle pour ω(q = 0), alors que pour le zéro son d’un liquide de Fermi neutre ω(q = 0) = 0).
399
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Le magnétisme itinérant 10.1 Introdution au magnétisme itinérant Dans le chapitre 9, nous avons étudié les propriétés magnétiques des isolants (structures magnétiques stables, excitations magnétiques, diagramme de phase) en supposant que sur chaque atome était localisé un moment magnétique. Ces moments magnétiques localisés sont couplés entre eux par une interaction d’échange (échange indirect, super-échange, etc ...) responsable de l’ordre magnétique à basse température. Ces moments localisés atomiques trouvent nécessairement leur origine dans les électrons des couches atomiques incomplètes, en pratique les couches d ou f . En raison des interactions entre atomes, ces couches incomplètes devraient en principe donner naissance, à l’état solide, à des bandes d’énergie partiellement remplies, c’est-à-dire à un état conducteur où les électrons d ou f responsables de la formation des moments magnétiques sont délocalisés dans tout le solide, contrairement à l’hypothèse de moments localisés. En fait, nous avons déjà vu au chapitre 7 (§ 6) l’explication de ce paradoxe. Le modèle de bandes néglige les corrélations entre électrons. Ces corrélations tendent à localiser les électrons sur les sites atomiques et quand cet effet l’emporte sur l’énergie cinétique de bande, on obtient un isolant de Mott où les électrons localisés sont susceptibles de former des moments magnétiques capables de
401
Physique de la matière condensée
s’ordonner à basse température. En pratique, cette localisation de Mott ne se produit en général que dans les couches d ou f, qui sont suffisamment étroites. On peut cependant se demander quelles sont les propriétés magnétiques des électrons d du côté métallique de la transition de Mott, quand la largeur de bande est suffisante pour délocaliser les électrons, mais pas assez grande pour qu’on puisse complètement négliger les effets de corrélations entre électrons. La description du chapitre 9 en termes de moments magnétiques localisés n’est plus adéquate, mais on peut se demander si les effets de corrélation coulombienne ne sont pas susceptibles d’induire un état magnétique ordonné où l’aimantation (uniforme dans le cas ferromagnétique, la composante de Fourier de vecteur d’onde q = 0 dans le cas hélimagnétique) serait due à des électrons délocalisés. Pour comprendre la motivation de cette étude, voyons comment on peut classer les différents métaux qu’on peut rencontrer. Les métaux simples : Ce sont ceux des deux extrémités du tableau périodique (figure 10.1).
Fig. 10.1 Tableau périodique des éléments : les métaux simples sont indiqués en caractère gras. Ils ne montrent aucun effet de corrélations magnétiques.
Les bandes de valence sont formées d’électrons s ou p. Les autres bandes sont des bandes d’électrons presque libres. Dans ces bandes, les corrélations entre électrons sont pratiquement négligeables. Il n’y a aucune tendance au magnétisme. Leurs propriétés sont bien décrites par un modèle d’électrons presque libres. En particulier la susceptibilité magnétique présente un comportement de Pauli. Les métaux de transition : Il est important de noter que la conduction par la bande d apparaît déjà en 1939 dans l’exposé de Mott, avec l’idée que les deux directions de spin dans les métaux ferromagnétiques comme Ni ou Co, ajoutent des courants aux caractéristiques différentes. Ces idées ont certainement inspiré les travaux de I. Campbell, qui a notamment orienté A. Fert pour sa thèse sur la résistivité des alliages ternaires de métaux de transition NiTT, en se concentrant sur la résistivité résonante sds de la demi-bande conductrice du Ni par des solutés très à gauche de Ni déviant très fortement de la courbe enveloppe de Slater Pauling du moment magnétique moyen par atome en fonction du nombre d’électrons par atome. Ces trois séries correspondent à la partie centrale du tableau, de couches d incomplètes (figure 10.2).
402
10. Le magnétisme itinérant
Fig. 10.2 Tableau périodique des éléments : les métaux de transition sont indiqués en caractères gras.
Parmi ceux-ci, le Fer, le Cobalt et le Nickel sont ferromagnétiques, le Chrome et le Manganèse sont antiferromagnétiques, le Palladium et le Platine sont « presque ferromagnétiques » et le deviennent par alliage avec le Nickel ou le Cobalt. Les métaux nobles : Cu, Ag, Au ont leurs bandes 3d presque complètes mais le niveau de Fermi étant proche, les électrons d contribuent aux propriétés de cohésion ou aux propriétés optiques. Les terres rares : Ils correspondent à deux séries ; les lanthanides où la couche 4f se remplit progressivement de 1 à 14 électrons : Ce, Pr, Nd, Pm, Sm, Eu, Gd, Tb, Dy, Ho, Er, Tm, Ub, Lu ; les actinides où on remplit progressivement la couche 5f : Th, Pa, U, Np, Pu, Am, Cm, etc. Dans la série des lanthanides, les électrons 5d et 6s sont délocalisés et forment la bande de conduction ; les électrons 4f, au contraire, restent parfaitement localisés sur les atomes avec un recouvrement très faible avec les atomes voisins. Ce sont ces électrons 4f qui confèrent aux métaux de terres rares leurs propriétés magnétiques, conduisant, à haute température à une susceptibilité de type Curie ; pour ces métaux, le moment de spin S et le moment orbital L sont couplés, conduisant à un moment cinétique total J, en accord avec les règles de Hund pour les ions. Les effets de champ cristallins sont faibles. La structure de bandes peut être représentée schématiquement par la figure 10.3. Ce schéma représente le cas des terres rares normales. Il faut distinguer le cas de trois métaux : Cérium, Europium et Ytterbium où le niveau 4f se trouve très près du niveau de Fermi. Ceci conduit à des propriétés particulières importantes que nous ne discuterons pas ici. La couche f ne commence à se remplir qu’à partir du Pu, comme montré par C. Herring [1] par rayons X. Les états f et d ont tendance à se mélanger pour faire des phases covalentes sans centre de symétrie et jusqu’au Pu. La similitude aux terres Rares ne commence qu’à l’Am avec comme pour le Ce, un état lié virtuel de forte largeur avec mélange avec les états délocalisés spd . Comme nous l’avons vu au chapitre 8, l’origine du magnétisme des métaux ou alliages de Terres Rares n’est pas l’échange direct, beaucoup trop faible, mais l’interaction
403
Physique de la matière condensée
n(E)
états 4 f
Fig. 10.3 Densité d’états schématique des métaux de Terres rares : des états localisés, responsables du magnétisme, coexistent avec une bande de conduction large, responsable des propriétés de transport.
indirecte par l’intermédiaire des électrons de conduction (RKKY). Dans ce cas, la présence d’électrons de conduction délocalisés est importante puisqu’elle assure le mécanisme d’échange dominant entre moments localisés. Mais il s’agit toujours d’un magnétisme de moments localisés, susceptible du traitement du chapitre 8. Le cas des métaux de transition est tout à fait différent. Les électrons 3d, qui sont responsables des propriétés magnétiques, sont réellement délocalisés et forment des bandes d’énergie, dont la largeur est certes plus faible que celle des électrons 4s, mais pas du tout négligeable. Le schéma de bandes peut être grossièrement représenté par la figure 10.4. n(E)
quelques eV
bande 3d Bande de conduction 4s
EF
E
Fig. 10.4 Densité d’états schématique de métaux de transition : il existe deux bandes d’états itinérants : une bande large, principalement de caractère s et une bande d , plus étroite, qui participe à la fois aux propriétés de magnétisme itinérant et aux propriétés de transport.
En réalité, il existe un couplage important entre électrons s et électrons d , dont il faudrait tenir compte, car il donne lieu à des effets non triviaux mais qui ne sera pas discuté ici.
404
10. Le magnétisme itinérant
Voyons quelles sont les principales propriétés des métaux de transition. Certaines sont celles qui seraient prévues dans le cadre d’un modèle d’Heisenberg : – Dans le domaine paramagnétique, la susceptibilité magnétique varie comme (T − θ)−1 pour le Fer ou le Cobalt par exemple. – A` basse température, la loi de dispersion des ondes de spin suit la loi de Bloch ω = Dq 2 – Près de Tc , les propriétés critiques sont comparables à celles d’un système d’Heisenberg : la susceptibilité varie comme (T − Tc )−γ
avec γ 4/3
La section efficace de diffusion des neutrons se comporte comme : 1 dσ ∼ 2 dω q + κ2
α γ o`u κ T − Tc , avec α 2
– Pour le fer et le cobalt, la résistivité électrique présente un comportement très analogue à celle des Terres Rares : ceci suggère que la partie magnétique de la résistivité, au voisinage du point critique, a la même origine, c’est-à-dire la diffusion des porteurs de charge par les fluctuations critiques magnétiques. D’autres propriétés sont des propriétés non seulement des métaux magnétiques, mais de tous les métaux de transition. Ceci suggère que la structure électronique des métaux magnétiques doit être expliquée dans le même cadre que celle des métaux non magnétiques, en y incluant la présence des bandes d : – les moments à saturation par atome sont respectivement 2, 22 , 1, 7 et 0, 6 magnétons de Bohr pour le Fer, le Cobalt et le Nickel, c’est-à-dire des nombres certainements non entiers ; – la constante de Curie de la susceptibilité ne donne pas des valeurs demi-entières pour S et il n’y a aucune corrélation avec les moments à saturation. Dans certains cas, la loi de Curie est très mal suivie ; – la diffraction inélastique de neutrons au-dessus de Tc révèle des comportements différents : le Fer suit le modèle d’Heisenberg. Pour le Chrome, au contraire, il n’y a pas d’effets observables de fluctuations de spins ; – l’entropie magnétique par atome tirée des mesures de chaleur spécifique devrait être égale à kB Ln(2S +1) dans un modèle de moments magnétiques localisés. Pour le Fer, la valeur du spin qui rendrait compte de l’entropie, suivant cette formule, serait S 1. Pour le Chrome, l’entropie est très petite, beaucoup plus petite que le moment à saturation ne le laisserait prévoir. D’autres propriétés indiquent qu’en dehors de la bande de conduction, d’autres bandes incomplètement remplies existent. Ceci est vrai pour tous les métaux de transition, y compris ceux des deuxième et troisième séries : le terme de chaleur spécifique électronique linéaire en température γ T est de 5 à 10 fois plus large que
405
Physique de la matière condensée
dans les métaux normaux. Ceci indique une très grande densité d’états au niveau de Fermi. L’effet de Haas Van Alphen a été observé pour de nombreux métaux de transition, y compris des métaux magnétiques. Les mesures indiquent très clairement l’existence d’une surface de Fermi pour les électron d et permettent de connaître sa forme. Enfin, les propriétés de transport des métaux de transition montrent que les électrons d participent au mécanisme de la conduction. En particulier, les propriétés galvanomagnétiques de Fe, Co et Ni ne peuvent s’expliquer que par la présence d’électrons « magnétiques » itinérants [1]. Les propriétés des métaux de transition ne peuvent donc s’interpréter que dans le cadre d’une théorie où les électrons d sont délocalisés dans une bande d’énergie partiellement remplie. De plus, nous devons comprendre pourquoi certains métaux sont ferromagnétiques (Fe, Co, Ni ), antiferromagnétiques (Cr, Mn, γ − Fe ) ou non magnétiques (Sc, Ti, V et les métaux de la deuxième et de la troisième série). Nous devons aussi expliquer pourquoi certaines propriétés des métaux magnétiques sont très semblables à celles qu’on peut déduire du modèle d’Heisenberg, d’autres très différentes. Nous voulons décrire les propriétés des électrons d, dont le recouvrement des fonctions d’onde est beaucoup plus faible que celui des fonctions s. Dans ce cas, la méthode LCAO, qui décrit les fonctions d’onde comme des Combinaisons Linéaires d’Orbitales Atomiques, est une bonne approximation pour décrire les bandes. Dans ce cadre, une première approximation est de construire ces fonctions d’onde à partir des orbitales d uniquement. C’est la méthode des liaisons fortes. Nous avons deux types de bandes : la bande de conduction 4s, de largeur ∼ 10 eV, et les bandes d, de largeur ∼ quelques eV. En première approximation, on considère ces bandes comme indépendantes en négligeant le couplage s − d. L’hamiltonien de bandes s’écrit donc : + tijmm cimσ cjm σ H0 = i,j,σ
(10.1)
m,m
Les indices i et j labellent des sites du réseau atomique et les indices de bandes m et m décrivent la dégénérescence orbitale (5 pour des états d, mais celle-ci peut être partiellement levée par des effets de champ cristallin) tijmm est un élément de matrice de l’hamiltonien à un électron entre deux orbitales différentes : p2 tijmm =< φim r − Ri | + V (r) | φjm r − Rj > 2m p2
(10.2)
où 2m est l’énergie cinétique de l’électron et V (r) le potentiel du réseau périodique auquel il est soumis.
406
10. Le magnétisme itinérant
Cet hamiltonien peut être diagonalisé et s’écrit, dans la base propre : + H0 = εkμ ckμσ ckμσ
(10.3)
k,μ,σ
où μ est un indice de bande et k le vecteur d’onde. Ce qui distingue les propriétés des électrons d que nous voulons discuter, ce sont les effets d’interaction entre électrons, que nous devons donc introduire. L’approximation la plus simple consiste à ne conserver que l’interaction intra-atomique. L’hamiltonien intra-atomique de Hartree-Fock pour l’atome i est : Hi =
1 2
Umm nimσ nim σ − Jmm nimσ nim σ
(10.4)
m,m ,σ ,σ
où Umm et Jmm sont les intégrales de Coulomb et d’échange atomiques : Umm =
2 e 2 φm r2 − Ri 2 d 3 r1 d 3 r2 φm r1 − Ri r12
(10.5)
∗ e2 ∗ d 3 r1 d 3 r2 φm φm r1 − Ri φm r2 − Ri r1 − Ri φm r2 − Ri r12 (10.6) On peut adopter la notation : Jmm =
Umm =< im, im |
e2 | im, im > r12
(10.7)
Jmm =< im, im |
e2 | im , im > r12
(10.8)
Les valeurs typiques de U et de J sont de l’ordre de 10 eV et de quelques eV, respectivement. Cette approximation néglige tous les autres termes du type : < im1 , jm2 |
e2 | km3 , lm4 > r12
(10.9)
De plus, dans la suite, nous nous limiterons au cas le plus simple d’une bande sans dégénérescence orbitale, ce qui correspond à une bande s ou à une bande d où la dégénérescence orbitale aurait été entièrement levée. Il s’agit évidemment d’une limitation du modèle, car dans la plupart des métaux magnétiques, les bandes concernées sont des bandes d. Il subsiste généralement une dégénérescence orbitale, non entièrement levée par les effets de champ cristallin. Ceci peut conduire à des effets non triviaux, qui ne seront pas discutés ici. Dans notre modèle simple, tous les indices de bande sont alors égaux. Le terme d’interaction intra-atomique, pour l’atome i se réduit à : Hi = Uni↑ ni↓
(10.10)
407
Physique de la matière condensée
L’hamiltonien total pour la bande s’écrit alors : + tij ciσ cj σ + U ni↑ ni↓ H = i,j,σ
(10.11)
i
En se plaçant dans la base des états qui diagonalisent le premier terme, H se réécrit : H =
+ εk ckσ ckσ +
k,σ
U + ck+q↑ ck↑ ck+ −q↓ ck ↓ N
(10.12)
k,k q
1 ciσ exp i k · Ri avec ckσ = √ N i
et εk =
tij exp i k · Ri −R j
j
Ceci constitue l’hamiltonien de Hubbard [2]. C’est le modèle le plus simple qui permette de discuter les effets de compétition entre corrélations électroniques et énergie cinétique de bande.
10.2 La théorie de Stoner Nous nous intéressons, dans ce paragraphe, aux propriétés magnétiques des électrons des bandes étroites, décrits par l’hamiltonien de Hubbard. Nous utiliserons une approximation de champ moyen de cet hamiltonien, dont la solution self-consistente décrit un état fondamental magnétique. Nous discuterons d’abord le cas du ferromagnétisme. L’hamiltonien de Hartree-Fock s’écrit : HHF =
εk nkσ +
k,σ
=
U < nk ↑ > nk↓ + < nk ↓ > nk↑ N
(10.13)
k,k
Ek,σ nkσ
(10.14)
k,σ
Dans l’expression (10.13), les Ek,σ sont les énergies à un électron de Hartree-Fock : Ek,σ = εk +
U < nk −σ > N k
que nous pouvons réécrire : Ek,σ = εk +
1 U 1 − δσ ,σ < nk −σ > N k
408
(10.15)
10. Le magnétisme itinérant
Cette forme permet de mettre en évidence le terme de Coulomb U et le terme d’échange U δσ ,σ qui compense complètement le terme de Coulomb (U = J ) pour des spins parallèles. Les fonctions d’onde à un électron sont les mêmes que pour des électrons sans interactions. Posons : 1 < nkσ > (10.16) nσ = N k
Le nombre moyen d’électrons par atome s’écrit : n = n↑ + n↓
(10.17)
et l’aimantation moyenne par atome, en unité de magnéton de Bohr, m = n↑ − n↓
(10.18)
Les énergies à un électron de Hartree-Fock s’écrivent : Ek,σ = εk + Un−σ et l’énergie totale par atome : E =
(10.19)
1 εk nkσ + Un↑ n↓ N k,σ
Discutons maintenant la stabilité comparée des états non magnétique et magnétique. Solution non magnétique à T = 0 Une solution de Hartree-Fock possible à T = 0 est la solution non magnétique ⎧ si Ek,σ < EF ⎨ < nkσ >= 1 ⎩ < n >= 0 kσ
si Ek,σ > EF
où l’énergie de Fermi EF est déterminée par la densité d’électrons n. Dans ce cas, la densité d’états est la même pour les deux directions de spin (figure 10.5). Comparons l’énergie de cette solution non magnétique à celle d’une solution magnétique, où n↑ et n↓ sont différents.
Fig. 10.5 Densité d’états pour les deux directions de spin dans l’état non magnétique.
409
Physique de la matière condensée
ρ(E)
a)
ρ(E)
EF
b)
E
E
dE
Fig. 10.6 Transfert d’électrons entre les deux sous-bandes pour former un état magnétique.
Solution magnétique à T = 0 Pour former cette solution magnétique, on part de la solution non magnétique (figure 10.6a) où n↑ = n↓ = n/2 et on transfère des électrons de la bande ↓ vers la bande ↑ sur une tranche d’énergie de largeur δE , avec δE EF (figure 10.6b). le nombre d’électrons dont l’énerSi ρ EF est la densité d’états au niveau de Fermi, gie de bande est augmentée de δE est ρ EF δE. Ceci coûte une énergie cinétique de bande : 2 (10.20) Ecin = ρ EF δE δE = ρ EF δE En contre partie, l’énergie d’interaction est modifiée, puisque : ⎧ ⎨ n↑ = n2 + ρ EF δE ⎩
n↓ =
n 2
− ρ EF δE
(10.21)
le sont : n2 n n Eint = U n↑ = + ρ EF δE n↓ = − ρ EF δE − (10.22) 2 2 4 2 (10.23) = −U ρ EF δE Cette modification de l’énergie d’interaction se traduit, évidemment, dans les énergies de Hartree-Fock, qui deviennent :
410
Ek↑ = εk + Un↓
(10.24)
Ek↓ = εk + Un↑
(10.25)
10. Le magnétisme itinérant
ρ(E)
E 2dE
Fig. 10.7 Densité d’états pour les deux directions de spin dans un état ferromagnétique.
ce qui correspond à une translation des bandes ↑ et ↓ (figure 10.7), dont il a été tenu compte, évidemment, dans le calcul simple ci-dessus. La solution magnétique sera stable par rapport à la solution non magnétique, si :
c’est à dire, si :
Ecin + Eint < 0
(10.26)
2 1 − U ρ EF ρ EF δE
(10.27)
Ceci constitue le critère de Stoner d’instabilité ferromagnétique à T = 0. 1 − U ρ(EF ) < 0
(10.28)
On voit que le rôle de l’interaction de Coulomb entre électrons est de favoriser l’alignement ferromagnétique des spins, car les électrons de spins parallèles interagissent moins entre eux. Quand le critère de Stoner n’est pas vérifié, c’est-à-dire quand U ρ (EF ) < 1, c’est l’état non magnétique qui est stable. On peut calculer la susceptibilité magnétique de cet état, en introduisant un champ extérieur h0 , qui induit une aimantation n↑ − n↓ . Les énergies de Hartree-Fock, en présence du champ extérieur et de cette aimantation, s’écrivent : 1 (10.29) Ek↑ = εk + Un↓ − g μB h0 2 1 (10.30) Ek↓ = εk + Un↑ + g μB h0 2 Les bandes ↑ et ↓ sont déplacées de ± δE (figure 10.7) 2δE = Ek↓ − Ek↑ = U (n↑ − n↓ ) + g μB h0
(10.31)
411
Physique de la matière condensée
mais aussi :
n↑ − n↓ = 2ρ(EF )δE
(10.32)
1 g μB h0 2 1 − U ρ(EF )
(10.33)
d’où : δE = ce qui donne une aimantation :
2 g μB n ↑ − n ↓ = g μB
h0 ρ(EF ) 1 − U ρ(EF )
(10.34)
Par conséquent, la susceptibilité réduite par atome s’écrit : χ HF =
ρ(EF ) 1 − U ρ(EF )
(10.35)
Dans cette expression, ρ(EF ) peut être interprétée comme la susceptibilité réduite de Pauli χ 0 du système sans interaction. L’effet des interactions est d’augmenter χ 0 par le facteur de Stoner S =
1 1 − U ρ(EF )
(10.36)
Ce facteur d’augmentation devient, bien sûr, infini quand le critère d’instabilité est satisfait. Si le critère de Stoner est satisfait, c’est-à-dire quand la densité d’états au niveau de Fermi ou l’interaction intra-atomique U sont assez fortes pour que U ρ(EF ) > 1, la solution non magnétique devient instable. On a alors, à température nulle, un état ferromagnétique total ou partiel selon la valeur de ρ(E ) et de n (figure 10.8). ρ(E)
ρ(E)
Fig. 10.8 Le ferromagnétisme peut être partiel, quand les deux directions de spin sont peuplées à température nulle, ou totale quand la différence d’énergie entre les deux directions de spin est telle qu’une seule direction reste peuplée à T = 0.
412
10. Le magnétisme itinérant
Dans le cas magnétique, à température non nulle, le paramètre d’ordre, c’est-à-dire l’aimantation par atome m = n↑ − n↓ doit vérifier une équation de self-consistence : m = n↑ − n↓ =
1 fFD Ek↑ − fFD Ek↓ N
(10.37)
k
où fFD (ε) est la fonction de distribution de Fermi. Évidemment, les énergies de Hartree-Fock, qui déterminent m par l’intermédiaire de cette équation, dépendent elles-mêmes de m. Il est donc nécessaire d’imposer cette contrainte, pour assurer que le calcul reste cohérent. La solution détaillée de cette équation dépend de la structure de bande, mais on peut donner les résultats généraux suivants : À basse température, dans le cas du ferromagnétisme total : m T = m 0 1 − λ exp − kB T où est l’énergie pour transférer un électron de la bande ↑ à la bande ↓ . Dans le cas du ferromagnétisme partiel : m(T ) = m(0)[1 − βT 2 ]
(10.38)
Dans les deux cas, on ne retrouve pas la loi vérifiée expérimentalement, c’est-à-dire la loi de Bloch en T 3/2 , car les ondes de spin ne sont pas prises en compte dans le cadre de l’approximation : la méthode de Hartree-Fock ne décrit que les excitations individuelles. Réécrivons l’équation de self-consistence sous la forme (figure 10.9)
Fig. 10.9 Variations de l’aimantation uniforme avec la température dans une transition ferromagnétique. La transition est généralement du second ordre, comme l’autorise la symétrie.
413
Physique de la matière condensée
m = F (m) où F (m) =
1 fFD Ek↑ − fFD Ek↓ (10.39) N k n+m n−m 1 − fFD εk + U fFD εk + U = N 2 2 k
(10.40) La solution de cette équation peut être interprétée comme l’intersection du graphe de F (m) avec la droite y = m. Le point critique est déterminé par le fait que m Tc s’annule. Alors, le graphe de F (m) est tangent à la droite y = m à l’origine. Pour déterminer la température de Curie, nous écrivons donc que la pente à l’origine de F (m) vaut 1 pour T = Tc : dfFD Ek↓ 1 dfFD Ek↑ =1 (10.41) − N dm dm k
soit,
m=0
U dfFD Ek 1=− N dEk k
(10.42)
m=0
Nous obtenons ainsi la condition qui définit la température critique d’instabilité magnétique : dfFD dE = −1 (10.43) U ρ E dE Cette équation détermine Tc , qui tend vers 0 quand U ρ(EF ) = 1. En effet, pour T = 0, df /dE = −δ(E − EF ), ce qui redonne bien le critère de Stoner à T = 0. Si on définit :
ρ T =−
dfFD ρ E dE dE
(10.44)
sorte de « densité d’état effective » à la température T , cette densité d’états n’est rien d’autre que la susceptibilité de Pauli réduite χ 0 (T ) du système sans interaction à la température T . La température de Curie vérifie donc : 1−U χ 0 (Tc ) = 0
(10.45)
En introduisant un champ extérieur h0 , on peut calculer facilement la susceptibilité de la phase paramagnétique et montrer qu’elle s’écrit : χ0 T (10.46) χ T = 1 − U χ0 T
414
10. Le magnétisme itinérant
10.3 Ondes de Densité de Spin Dans le paragraphe précédent, nous avons étudié la stabilité d’une phase ferromagnétique dans l’approximation de Hartree-Fock : on suppose qu’il existe un paramètre d’ordre ferromagnétique non nul : m =< n↑ > − < n↓ > On montre que celui-ci agit comme un champ moléculaire qui stabilise l’état ferromagnétique, c’est-à-dire une valeur non nulle de m, déterminée par une relation de self-consistence m = F (m). Cette méthode peut se généraliser à la recherche d’états magnétiques ordonnés où le paramètre d’ordre ne serait pas l’aimantation uniforme, comme dans le cas ferromagnétique, mais une composante de Fourier de vecteur d’onde quelconque q de l’aimantation. L’expression consacrée par l’usage pour désigner cet état magnétique dans la littérature est le terme «Onde de Densité de Spin » [41]. En réalité ce phénomène n’est pas ondulatoire dans le temps : il est ondulatoire dans l’espace, ce qui n’est pas choquant pour des gens qui ne raisonnent pas seulement dans l’espace réciproque.
10.3.1 Critère d’instabilité Nous commençons par étudier la condition d’instabilité de la phase non magnétique en recherchant la condition de divergence de la susceptibilité de la phase non magnétique. On considère l’effet d’un champ magnétique extérieur statique, parallèle à Oz et dont la valeur au site i est : hq exp i q · Ri Ce champ est couplé avec les électrons de la bande par l’hamiltonien d’interaction :
où mqz = g μB Sqz =
z Hp = −hq m−q
(10.47)
g μB + + ck↑ ck+q↑ − ck↓ ck+q↓ 2
(10.48)
k
La réponse linéaire à ce champ donnera une valeur moyenne de mqz différente de 0. L’hamiltonien de Hubbard pour une bande s peut s’écrire H = H0 + U ni↑ ni↓
(10.49)
i
2 U U ni↑ − ni↓ + ni↑ + ni↓ = H0 + 2 2 i
(10.50)
i
415
Physique de la matière condensée
2 =n ) (nous avons utilisé ici la propriété vérifiée par des opérateurs de fermions niσ iσ
H = H0 −
2U z z nNU σq σ−q + N 2
(10.51)
q
Dans l’approximation de Hartree-Fock, on linéarise le terme z σqz σ−q q
Les seuls termes < σqz > non nuls correspondent à q = 0 ou q = q H + Hp = H0 − où
2U z z − hq m−q < σqz > S−q N
H0 =
(10.52)
Ek nkσ
(10.53)
k
est l’hamitonien Hartree-Fock du système non magnétique, et les Ek sont les énergies Hartree-Fock à un électron de ce système non magnétique. Les deux derniers termes peuvent se réécrire : 2U z z −m−q hq + 2 < mq > N g μB Le terme :
(10.54)
2U z 2 < mq > N g μB
(10.55)
agit comme un champ moléculaire. La susceptibilité de vecteur d’onde q est définie par la réponse linéaire au champ hq : (10.56) < mqz >= χ q, ω = 0 hq Dans l’approximation de Hartree-Fock, l’aimantation induite < mqz > est la réponse d’électrons indépendants (dont la fonction de réponse est donc χ 0 q, 0 ) à un champ effectif où s’ajoute le champ extérieur hq et le champ moléculaire 2U 2 N g μB
< mqz >. D’où : 0
2U z < mqz >= χ q, 0 hq + 2 < mq > N g μB 2U = χ 0 q, 0 1 + 2 χ q, 0 hq N g μB
416
(10.57) (10.58)
10. Le magnétisme itinérant
D’où
0 χ q, ω = 0 = χ q, 0 1 +
2U 2 χ q, 0 N g μB
(10.59)
2 En passant aux susceptibilités réduites par atome, définies par χ = 2χ /N g μB : χ 0 q, 0 HF q, 0 = (10.60) χ 1− χ 0 q, 0 où on a posé
< nk+q > − < nk > χ 0 q, 0 = Ek − Ek+q
(10.61)
k
susceptibilité réduite par atome du système de particules indépendantes décrites par H0 . Il y aura instabilité de l’état non magnétique si χ (q, 0) peut devenir infinie à une température Tc (q) telle que : 1−U χ 0 (q, 0) = 0
(10.62)
C’est le critère d’instabilité qui généralise le critère de Stoner du paragraphe précédent. Si cette condition n’est jamais satisfaite à aucune température, le système reste non magnétique à toute température. Si ce critère est satisfait pour diverses valeurs de q, donc diverses valeurs de Tc (q), le système est non magnétique à haute température et s’ordonne magnétiquement à la température Tc (q0 ) = max[Tc (q)]. Le vecteur d’onde q0 de la modulation magnétique est celui qui maximise Tc (q). – Si q0 = 0 on obtient un ordre ferromagnétique. – Si q0 est commensurable à un vecteur du réseau réciproque, on obtient un ordre antiferromagnétique. Le cas le plus simple correspond au vecteur d’onde q0 = π/a, 0, 0 pour un réseau cubique simple. Mais on peut obtenir un ordre antiferromagnétique plus compliqué, notamment pour des réseaux différents de cubique simple. – Si q0 est un vecteur quelconque, on obtient une Onde de Densité de Spin, qui peut être hélicoïdale ou sinusoïdale. Le critère d’instabilité montre bien que l’ordre magnétique qui apparaît est déterminé par le maximum de χ 0 (q, 0). Ce maximum, pour des électrons libres à trois dimensions, correspond à q = 0, c’est-à-dire au ferromagnétisme. Toutefois, dans la réalité, la forme détaillée de χ 0 (q, 0) dépend beaucoup de la structure de bandes déterminée par le potentiel périodique du réseau cristallin. En pratique, les instabilités magnétiques sont favorisées par des fortes valeurs de χ 0 (q, 0), ce qui correspond, dans la plupart des cas, à des anomalies de Kohn liées à la géométrie de la surface de Fermi, comme dans le cas de l’instabilité de Peierls.
417
Physique de la matière condensée
Énergie (eV)
On peut donc prévoir que les instabilités de type Onde de Densité de Spin se produiront, soit dans les systèmes très anisotropes (quasi-1D), tels que les sels de Bechgaard [4] (TMTSF )2 X, où TMTSF désigne une molécule organique presque plane qui forme des empilements quasi-1D (tétra-méthyl-tétra-séléna-fulvalène) et X est un anion monovalent inorganique, soit, plus généralement, chaque fois que la surface de Fermi présentera des propriétés suffisantes de « nesting ».
(a)
(b) Fig. 10.10 a) Structure de bande du sel de Bechgaard (TMTSF)2PF6 b) Section de la surface de Fermi dans un plan (ka ,kb ).
Nous avons déjà rencontré cette notion de nesting dans le chapitre 6, dans le paragraphe sur l’instabilité de Peierls. Rappelons qu’on dit qu’il y a « nesting » quand deux parties de la surface de Fermi s’emboîtent l’une dans l’autre après translation de l’une d’elles par un vecteur d’onde q. Le nesting sera parfait si, quel que soit le vecteur d’onde k : εk+q − μ = −(εk − μ)
418
(10.63)
10. Le magnétisme itinérant
Dans ce cas, χ 0 (q, 0) diverge logarithmiquement quand T → 0 en LnT /εF . À température suffisamment basse, le critère de Stoner sera satisfait pour une valeur arbitrairement faible de U. Il y a nesting imparfait si, pour un grand nombre de valeurs de k εk+q − μ −(εk − μ)
(10.64)
Dans ce cas le maximum de χ 0 (q, 0) reste fini quand T → 0. Il existe alors une valeur critique Uc de U en dessous de laquelle il n’y a pas d’instabilité magnétique. La figure 10.10 montre les propriétés de nesting de la surface de Fermi de (TMTSF )2 PF6 , un conducteur organique quasi-unidimensionnel [5]. Le cas du Chrome est différent. Le Chrome est un métal tout à fait tri-dimensionnel. Sa structure n’est pas fortement anisotrope. Cependant, sa surface de Fermi [6], possède une propriété particulière : certaines parties de cette surface de Fermi sont constituées de poches de trous, qui s’emboîtent presque parfaitement avec d’autres poches de cette surface, des poches d’électrons celles-là, après translation d’un certain vecteur d’onde Q. Ce vecteur d’onde est proche d’un vecteur du réseau réciproque, mais est, cependant incommensurable à ce dernier. La figure 10.11 montre schématiquement ces propriétés d’emboîtement. Ce sont ces propriétés de certaines parties de la surface de Fermi qui sont responsables de l’anomalie de Kohn et de l’instabilité de la phase non-magnètique vis-à-vis de la formation d’une phase Onde de Densité de Spin incommensurable dans le Chrome. Cette dernière a été observée expérimentalement [7] bien avant les phases « Onde de Densité de Spin » des conducteurs organiques quasi-unidimensionnels (Sels de Bechgaard) [8] (figure 10.11).
Fig. 10.11 Section de la surface de Fermi du Chrome dans le plan (1,0,0) dans la phase non magnétique, au-dessus de la température critique pour la formation de la phase Onde de Densité de Spin. Le vecteur q indique sur la figure correspond au vecteur de nesting : une translation de ce vecteur de la poche de trous la rend tangente à une poche d’électrons, ce qui induit une anomalie de kohn dans la susceptibilité. Ce vecteur d’onde est presque commensurable au réseau. Il détermine les oscillations de la densité de spin dans la phase magnétique ordonnée, en-dessous de la température critique.
419
Physique de la matière condensée
10.3.2 Théorie de la phase ordonnée Nous discutons, dans ce paragraphe, la théorie Hartree-Fock de la phase ordonnée Onde de Densité de Spin. Si q0 est une valeur quelconque non nulle, on peut avoir deux types d’ordre, l’axe Oz étant arbitraire tant qu’on ne prend en compte aucun couplage magnétocristallin : – une Onde de Densité de Spin sinusoïdale la polarisation de l’onde est alors rectiligne m z (Ri ) = m cos q0 · Ri
(10.65)
– une Onde de Densité de Spin hélicoïdale la polarisation de l’onde est circulaire, droite ou gauche : ⎧ ⎨ m x (Ri ) = m cos q0 · Ri ⎩ m y (R ) = ±m sin q · R i 0 i
(10.66)
Le choix + et le choix − correspondent aux deux sens de rotation possibles de l’aimantation quand q0 · Ri croît, c’est-à-dire à une polarisation circulaire droite ou gauche. À partir de l’onde sinusoïdale et des deux ondes hélicoïdales, on peut construire une Onde de Densité de Spin de polarisation quelconque. À Tc , une des trois ondes se construit avec une amplitude infinitésimale. Alors que le critère de Stoner ne dépend pas de la nature de l’onde (hélicoïdale ou sinusoïdale), la théorie de Hartree-Fock de l’état ordonné en dépend. Ceci résulte des propriétés de symétrie différentes des phases non magnétique et magnétique. En effet, dans notre modèle, la phase non magnétique est invariante par rotation globale des spins. Par conséquent, la fonction de réponse magnétique ne dépend pas de la polarisation de l’aimantation induite par un champ extérieur. Le critère de Stoner d’instabilité de la phase non magnétique ne dépend donc pas de cette polarisation. Ce résultat ne dépend pas des approximations faites pour obtenir ce critère d’instabilité. Il découle nécessairement des propriétés de symétrie et garde donc un caractère très général, qui va, évidemment, bien au delà de l’approximation de Hartree-Fock. En revanche, cette dégénérescence des 3 polarisations n’est plus vérifiée dans la phase magnétique ordonnée, puisque justement la transition de phase a spontanément brisée cette propriété d’invariance par rotation globale des spins. La théorie de la phase ordonnée doit se faire en tenant compte de la présence d’un paramètre d’ordre qui brise cette symétrie. Par conséquent, contrairement au critère d’instabilité de la phase non magnétique, la théorie de la phase ordonnée dépendra de la polarisation de l’onde étudiée.
420
10. Le magnétisme itinérant
Nous allons d’abord discuter le cas de l’Onde de Densité de Spin hélicoïdale, qui est plus simple. Nous discuterons la théorie de la phase ordonnée dans le cadre de l’hamiltonien de Hubbard. Il existe de nombreuses façons, évidemment équivalentes, d’écrire cet hamiltonien sous différentes formes. La forme que nous choisirons ici est destinée à mettre en évidence que le terme d’interaction de Hubbard est le moteur de la transition de phase étudiée. La phase ordonnée sera définie par le fait qu’un paramètre d’ordre d’une certaine symétrie sera non nul. C’est-à-dire qu’un certain opérateur aura une valeur moyenne nulle dans l’état non magnétique et non nulle dans l’état ordonné. Pour une phase Onde de Densité de Spin hélicoïdale, l’opérateur pertinent est : + ck↑ ck+q↓ σq+ = k
Nous chercherons donc à écrire le terme d’interaction de Hubbard à l’aide de cet opérateur. C’est pourquoi nous écrirons l’hamiltonien, à l’aide d’une transformée de Fourier de niσ , sous la forme : + − H = H0 − σ−q (10.67) σq q
Il apparaît ainsi évident que l’interaction va favoriser la formation d’une phase où la valeur moyenne de σq+ est non nulle. On linéarise le terme d’interaction, qui comprend des produits de 4 opérateurs de fermions, en prenant la moyenne de deux d’entre eux dans l’état fondamental de Hartree-Fock. Outre les termes Hartree-Fock de la solution non magnétique, il faut considérer les termes qui correspondent à la symétrie brisée par le paramètre d’ordre . On définit ce dernier par : =
U U + >∗ < σq− >= < σ−q N N
(10.68)
L’hamiltonien linéarisé de Hartree-Fock s’écrit, à l’aide du paramètre d’ordre : + + Ek nkσ − ck+q↑ ck↓ − ck−q↓ ck↑ (10.69) HHF = k,σ
k
k
où Ek représente l’énergie de Hartree-Fock de la solution non magnétique. Pour un vecteur d’onde q donné, il faut résoudre ce problème à un électron et ensuite calculer le vecteur d’onde q = q0 qui minimise l’énergie totale. Dans le cas présent, on a affaire à un problème très simple, car seul l’état |k − q, ↓> est couplé à l’état |k, ↑> et réciproquement. Pour chaque état |k, σ >, il suffit donc de diagonaliser une matrice 2 × 2.
421
Physique de la matière condensée
L’équation aux valeurs propres s’écrit : E − Ek ∗ E − Ek+q = 0 c’est-à-dire :
(10.70)
E 2 − E Ek + Ek+q + Ek Ek+q − | |2 = 0
(10.71)
Cette équation admet les solutions : E± =
Ek + Ek+q 2
± signe Ek − Ek+q
Ek − E+˛q 2
2 + | |2
(10.72)
Les fonctions d’onde correspondantes sont : ⎧ | +k >= cos θ2k | k, ↑> + sin θ2k | k + q, ↓> ⎪ ⎪ ⎨ ⎪ ⎪ ⎩
(10.73) |
−k+q
>= − sin
θk 2
| k, ↑> + cos
avec tan θk =
θk 2
| k + q, ↓>
2 (Ek+q − E k)
(10.74)
On part des solutions non magnétiques où les fonctions d’onde sont séparées d’espace et de spin et dégénérées, dont la relation de dispersion est schématisée sur la figure 10.12.
Fig. 10.12 Relation de dispersion à un électron dans le cas non magnétique.
Le paramètre d’ordre introduit un couplage entre les deux directions de spin : dans l’état ordonné on ne peut plus parler que d’un vecteur d’onde dominant et d’un spin dominant. Pour θk petit, | +k > représente un état de vecteur d’onde dominant k − > un état de vecteur d’onde dominant k + q et de et de spin dominant ↑ et | k+q
422
10. Le magnétisme itinérant
spin dominant ↓. Quand θk croît, on passe continûment à la situation symétrique où les rôles de | +k > et | −k+q > sont échangés, pour θk = π. L’ordre magnétique introduit des discontinuités dans les relations de dispersion E ± (figure 10.13), d’amplitude 2| |, pour les vecteurs d’onde tels que Ek = Ek+q . Ces discontinuités sont associées aux levées de dégénérescence de l’état non magnétique par le paramètre d’ordre magnétique. Elles peuvent être interprétées comme l’effet des nouvelles réflexions de Bragg résultant de la périodicité magnétique. Elles sont dues à la formation de paires électron-trou de vecteur d’onde q, d’énergie de liaison .
Fig. 10.13 Relation de dispersion à un électron dans l’état magnétique.
Le paramètre d’ordre qui décrit cette phase Onde de Densité de Spin doit être déterminé de façon self-consistente par la résolution de l’équation : =
U U + >∗ < σq− >= < σ−q N N
(10.75)
Cette équation est simplement la relation de définition du paramètre d’ordre, mais la valeur moyenne qui apparaît dépend évidemment de l’état fondamental correspondant à ce paramètre d’ordre. La relation de self-consistence s’écrit donc : U fFD E + − fFD E − 1= 2N Ek −Ek+q 2 k + | |2 2
(10.76)
où fFD E ) est la fonction de distribution de Fermi-Dirac. Cette équation est la généralisation, pour une amplitude finie du paramètre d’ordre, de la relation de Stoner 1 − U χ 0 (q, 0) = 0, valable pour T = Tc , c’est-à-dire pour = 0. On retrouve bien cette limite quand on fait tendre vers 0. Cette relation de selfconsistence permet de calculer le paramètre d’ordre q (T ) et l’énergie libre totale. On obtient le vecteur d’onde q0 de l’Onde de Densité de Spin en minimisant cette énergie libre par rapport à q. La surface de Fermi comporte deux nappes correspondant aux états | + > et | − >.
423
Physique de la matière condensée
ky
ky
k
kx
x
états | y+ >
états | y - >
Fig. 10.14 Surfaces de Fermi correspondant aux deux types d’états propres dans la phase ordonnée.
La figure 10.14 montre, schématiquement, les surfaces de Fermi pour une Onde de Densité de Spin de vecteur d’onde q parallèle à la direction Ox . Il faut également considérer le cas d’une Onde de Densité de Spin sinusoïdale, qui est moins simple mais important. Dans ce cas, la forme pertinente de l’hamiltonien de Hubbard est celle de l’équation (10.51), car elle fait apparaître le fait que le terme d’interaction peut être aussi, cette fois-ci, le moteur de la formation d’une phase Onde de Densité de Spin sinusoïdale. On définit le paramètre d’ordre correspondant à la symétrie de la phase qu’on cherche à décrire : U (10.77) < σ zq > = N avec 1 + + ck↑ ck+q↑ − ck↓ (10.78) σ zq = ck+q↓ 2 k
L’hamiltonien de champ moyen s’écrit HCM =
Ek nkσ −
k,σ
2U z > σ zq + < σ zq > σ z−q < σ−q N
(10.79)
où le premier terme est l’hamiltonien de Hartree-Fock de la phase non magnétique (qui inclut les corrections de champ moyen non liées à la brisure de symétrie), alors que les autres termes sont les termes de champ moyen non nuls en raison de la brisure de symétrie. HCM s’écrit :
+ + HCM = (10.80) Ek nkσ − εσ ck+qσ ckσ + ck−qσ ckσ k,σ
k,σ
où εσ = +1 pour les spins ↑ et −1 pour les spins ↓ . L’hamiltonien HCM dépend du spin, mais contrairement au cas hélicoïdal, les fonctions propres sont séparées d’espace et de spin. Le paramètre d’ordre couple
424
10. Le magnétisme itinérant
l’état |k, σ > aux états |k + q, σ > et |k − q, σ >, eux-mêmes couplés aux états |k ± 2q, σ >, etc. Il faut donc diagonaliser une matrice de dimension infinie, et non plus seulement une matrice 2 × 2 comme dans le cas hélicoïdal. Cependant, si le paramètre d’ordre est petit devant l’énergie de Fermi, on peut le traiter en perturbation. L’effet le plus important de cette perturbation se produit au voisinage des dégénérescences de l’état non magnétique. Le résultat principal est la formation, dans la relation de dispersion à un électron, de discontinuités d’amplitude 2| | sur les surfaces de dégénérescence εk = εk±q . La figure 10.15 montre l’allure de la relation de dispersion en fonction de kx pour un vecteur d’onde dirigé suivant Ox . Le fait que le niveau de Fermi tombe dans une bande interdite pour kx = +q/2, mais aussi pour kx = −q/2 contribue à abaisser l’énergie électronique de façon plus importante que dans le cas hélicoïdal. Ceci tend à favoriser l’Onde de Densité de Spin sinusoïdale. C’est notamment le cas du Chrome. Cependant, nous n’avons pas discuté, dans ce modèle très simple, les effets d’énergie d’anisotropie, qui jouent évidemment un rôle important dans la détermination de la polarisation de l’Onde de Densité de Spin la plus stable.
Fig. 10.15 Spectre électronique dans la phase ordonnée, dans le cas d’une Onde de Densité de Spin sinusoïdale.
Cas du Nesting Parfait Les calculs se simplifient beaucoup quand la surface de Fermi présente la propriété de « Nesting Parfait », c’est-à-dire quand, quel que soit k, les énergies étant repérées par rapport au niveau de Fermi : εk+q = −εk Dans ce cas, l’équation (10.72) donnant la relation de dispersion à une particule de la phase ordonnée se réduit à : (10.81) E ± = ∓ Ek2 + | |2 Ceci montre qu’il existe un gap pour les excitations, puisque la discontinuité 2 existe quel que soit k. La phase ordonnée a un caractère isolant puisque le niveau de Fermi se trouve dans une bande interdite.
425
Physique de la matière condensée
La relation de self-consistence donnant la valeur du paramètre d’ordre s’écrit alors : β U 1 tanh Ek2 + | |2 (10.82) 1= 2N 2 2 2 Ek + | | k Quand T → 0 l’équation (10.82) se réduit à : EF ρ E dE U 1 =U 1= 2N 0 E 2 + | |2 Ek2 + | |2 k
(10.83)
Si on suppose EF et si on linéarise la relation de dispersion du métal non magnétique au voisinage du niveau de Fermi, on trouve pour T → 0 0 = 2EF exp −
1
U ρ EF
(10.84)
où ρ EF est la densité d’états au niveau de Fermi. Dans la limite opposée, T → Tc , le paramètre s’annule et on trouve :
EF
1=U 0
dE βE ρ E tanh E 2
(10.85)
Dans les mêmes conditions d’approximations ( EF , relation de dispersion linéarisée), on trouve ∞ 1 Lnx EF = Ln dx (10.86) − 2kB Tc U ρ EF cosh2 x 0 L’intégrale définie vaut −Ln 4γ /π , où γ est la constante d’Euler. Ce qui donne pour la température critique : kB Tc =
2γ 1 1 1, 13EF exp − EF exp − π U ρ EF U ρ EF
(10.87)
En particulier, on obtient une relation universelle entre la valeur du gap à température nulle et la température critique : 0 π = 1, 76 (10.88) kB Tc γ Il faut cependant remarquer que cette relation n’a pu être obtenue, ici, que dans le cadre d’hypothèses assez restrictives et d’approximations importantes. Nous retrouverons exactement la même relation dans l’étude en champ moyen de la phase supraconductrice, mais avec des approximations qui seront, alors, mieux justifiées.
426
10. Le magnétisme itinérant
L’équation (10.87) montre une propriété importante liée au nesting parfait : aussi petit soit U ρ(EF ), Tc reste finie (c’est-à-dire non nulle) à cause de la divergence T → 0. Rappelons que cette propriété de de la fonction de réponse χ 0 q quand divergence logarithmique de χ 0 q n’est vérifiée que dans le cas de nesting parfait. La relation de self-consistence (10.83) permet de déterminer le comportement du paramètre d’ordre à basse température : 1/2 0 pour T Tc (10.89) exp − T 0 − 2π 0 kB T kB T Ce comportement activé correspond à l’existence d’un gap dans le spectre des excitations. Près du point critique : T πkB Tc
8 t 7ζ 3
1/2 pour t =
Tc − T
1 Tc
(10.90)
en accord avec l’indice critique de champ moyen, β = 1/2. On peut calculer numériquement la fonction (T ) dans tout l’intervalle 0 T Tc . L’allure des variations en température est schématisée sur la figure 10.16.
Fig. 10.16 Variations du paramètre d’ordre avec la température.
En réalité le nesting de la surface de Fermi n’est jamais parfait. Les relations que nous venons de dériver sont donc seulement approchées, parfois très grossièrement. Il faut distinguer deux cas : le premier, qui correspond aux conducteurs quasi-unidimensionnels, est celui où l’ensemble de la surface de Fermi est concerné par le nesting. Dans ce cas, si le paramètre d’ordre est plus grand que l’énergie qui caractérise l’écart au nesting parfait, max [Ek+q + Ek ], l’ordre magnétique ouvrira un gap dans toutes les directions de l’espace réciproque. La formation de paires électron-trou détruira tous les états itinérants à la surface de Fermi. L’état ordonné magnétique sera isolant [9].
427
Physique de la matière condensée
Par contre si < max[Ek+q + Ek ], il pourra subsister dans la phase magnétique des états itinérants au niveau de Fermi, mais la plus grande partie de la surface de Fermi sera détruite. La taille maximum des poches d’états itinérants sera donnée par l’écart au nesting parfait. Ces poches résiduelles peuvent être très petites devant la surface de Fermi du conducteur dans sa phase non magnétique (c’est-à-dire pour T > Tc ). L’état magnétique est alors dit « semi-métallique » [10]. Le deuxième cas est celui d’un métal comme le Chrome où le nesting sur une partie de la surface de Fermi est très bon, mais ne concerne qu’une partie de la surface de Fermi. Les portions non concernées subsistent évidemment dans la phase magnétique, qui reste par conséquent métallique. Par contre, l’appariement électron-trou supprime des états à la surface de Fermi sur les portions concernées par le nesting. Il y a diminution de la densité d’états au niveau de Fermi. On mesure cette dernière par le coefficient du terme linéaire en température de la chaleur spécifique, γ . La mesure de γ dans les alliages de Chrome en fonction du nombre d’électrons par atome montre une nette diminution dans la région où on observe une structure magnétique sinusoïdale. Cet effet montre bien que la densité d’états itinérants au niveau de Fermi ρ EF est réduite par la formation de l’ordre magnétique. Cette réduction vient de gaps partiels au niveau de Fermi, qui détruisent partiellement cette surface. Comme les propriétés de nesting ne concernent qu’une partie de la surface de Fermi, la densité d’états mesurée par le coefficient γ n’est que partiellement affectée. En formant des alliages de Chrome avec le Vanadium, qui n’est pas isoélectronique, on modifie le nombre d’électrons par atome n. Ceci modifie donc l’énergie de Fermi et, par conséquent la géométrie de la surface de Fermi. Les propriétésde nesting de cette surface sont donc affectées. C’est pourquoi la diminution de ρ EF par la formation de la phase Onde de Densité de Spin dépend fortement de n, comme observé expérimentalement (figure 10.17).
Fig. 10.17 Allure des variations du coefficient gamma du terme linéaire en température de la chaleur spécifique d’alliages à base de Chrome, en fonction du nombre d’électrons par atome.
428
10. Le magnétisme itinérant
10.3.3 Onde de Densité de Charge Nous avons discuté la formation d’un état Onde de Densité de Spin dans lequel l’aimantation était modulée spatialement mais où la densité d’électrons restait uniforme. Il est également possible d’envisager un état où la densité de charge est modulée spatialement [11]. Le paramètre d’ordre de cet état Onde de Densité de Charge sera défini par 1 + + c = (10.91) < ck↑ ck+q↑ + ck↓ ck+q↓ > N k
Dans l’approximation que nous avons considérée ici, le traitement Hartree-Fock de l’instabilité Onde de Densité de Charge est le même que celui de l’Onde de Densité de Spin sinusoïdale. Dans les deux cas, il s’agit d’une instabilité d’appariement électrontrou. On retrouve donc les mêmes conditions pour l’instabilité. Elle se produira dans les systèmes où existe une forte singularité de Kohn, c’est-à-dire, essentiellement dans les conducteurs quasi-unidimensionnels. Il y a alors une très forte analogie entre le traitement de l’instabilité de la phase métallique conduisant à la formation d’une Onde de Densité de Charge et celle conduisant à une Onde de Densité de Spin. Il est donc possible de reprendre, pour l’essentiel, la théorie de champ moyen du paragraphe précédent, aussi bien pour ce qui concerne le critère d’instabilité que pour la description de la phase ordonnée. Il existe cependant une différence physique essentielle entre les deux types d’Onde de Densité. En effet, l’origine physique du champ moléculaire qui induit une instabilité de type Onde de Densité de Charge est différente. Dans le cas de l’Onde de Densité de Spin, il s’agit de l’interaction d’échange, c’est-à-dire U dans le cas d’une bande de Hubbard non dégénérée, car dans ce cas seuls les électrons de spins antiparallèles sont sensibles à U. Le champ moléculaire dans le cas de l’Onde de Densité de Charge est dû à un mécanisme différent : il s’agit en général de l’interaction électron-phonon. Dans ce cas, le phénomène qui conduit à la formation d’une Onde de Densité de Charge est celui de l’instabilité de Peierls, déjà discutée dans le chapitre 6. Cette instabilité concerne le système couplé formé par le gaz d’électrons et le réseau, qui subissent tous deux une modulation et donc conduit à la formation d’une Onde de Densité de Charge. Nous avons discuté au chapitre 6 le cas du conducteur organique quasi-unidimensionnel TTF-TCNQ. Mais il existe aussi de nombreux exemples de conducteurs quasi-1D inorganiques où une phase Onde de Densité de Charge a été observée. On peut ainsi citer les chalcogénures de métaux de transition, tels que NbSe3 ou TaS3 , où des atomes de métal de transition M s’associe avec le Sélénium ou le Soufre pour former des chaînes linéaires de prismes MX6 ( X = S ou Se ). Les bronzes de métaux de transition forment une autre famille, également très étudiée. Il s’agit de phases d’oxydes de métaux de transition, où se forment des empilements d’octaèdres MO6 , où M est un métal de transition, séparés par des cations. Les
429
Physique de la matière condensée
Fig. 10.18 Structure cristalline de NbSe3 . Les atomes de Niobium sont représentés en noir et ceux de Sélénium en blanc. L’axe des chaînes unidimensionnelles est vertical.
Fig. 10.19 Structure cristalline de K0, 3 MoO3 . On observe des empilements linéaires d’octaèdres MoO6 , séparés par des cations de Potassium.
figures 10.18 et 10.19 montrent les structures quasi-unidimensionnelles de NbSe3 et K0,3 MoO3 , dont les phases Onde de Densité de Charge ont fait l’objet de nombreuses études. La formation de l’Onde de Densité de Charge peut être observée par diffraction de rayons X, beaucoup plus facilement que dans le cas d’une Onde de Densité de Spin, car les rayons X testent la densité de charge et non de spin. La distorsion périodique du réseau au vecteur d’onde 2kF peut donc être mise en évidence par diffraction de rayons X. Le principe de cette méthode est d’observer les tâches de diffraction de rayons X renvoyés par la structure. Les ondes réfléchies par les plans cristallins successifs sont en phase lorsqu’est réalisée la condition d’interférence constructive : 2a sin θ = nλ
430
10. Le magnétisme itinérant
Intensité normalisée
où λ est la longueur d’onde du rayonnement, θ l’angle d’incidence et a la distance interatomique. L’observation des tâches de diffraction donne ainsi accès à la périodicite du réseau. En présence d’une distorsion périodique du réseau, de nouvelles réflexions de Bragg apparaissent, correspondant à la périodicité de la nouvelle distorsion. Aux pics de Bragg du réseau non distordu, vont être associées de nouvelles raies satellites, introduites par la distorsion périodique de l’Onde de Densité de Charge. La position des nouvelles tâches donne accès au vecteur d’onde de l’Onde de Densité. L’intensité de ces tâches est proportionnelle au carré de l’amplitude de la modulation (figure 10.20).
Fig. 10.20 L’amplitude des satellites des pics de Bragg, observés dans la phase Onde de Densité de Charge, permet de mesurer l’amplitude du paramètre d’ordre. Cette figure compare la dépendance en température des valeurs expérimentales mesurées dans divers composés inorganiques et celle de la prédiction théorique obtenue dans ce chapitre.
La modulation de charge de l’Onde de Densité de Charge modifie l’environnement électrique vu par les noyaux. Cette modification de l’environnement peut être détectée par Résonance Magnétique Nucléaire (RMN). On a ainsi accès directement à la variation en température de l’amplitude de la modulation de charge, qui est proportionnelle à T (figure 10.21). Dans certains composés, on a pu mettre en évidence directement la modulation de charge par microscopie à effet tunnel. Comme dans le cas de l’Onde de Densité de Spin, la nouvelle périodicité induite par le paramètre d’ordre ouvre un gap dans la relation de dispersion des électrons, qui se traduit par une forte augmentation de la résistivité électrique à la transition.
431
Physique de la matière condensée
Rb0,3Mo03
Fig. 10.21 Dépendance en température du paramètre d’ordre de l’Onde de Densité de Charge du bronze de molybdène Rb0,3 MoO3 , mesuré par Résonance Magnétique Nucléaire. La courbe pointillée correspond à la prédiction théorique du calcul de champ moyen effectué dans ce chapitre.
D’autre part, la formation d’une Onde de Densité de Charge correspond à l’apparition d’une composante de Fourier non nulle de la densité de charge. Il en résulte des effets Coulombiens importants qui n’ont pas leur équivalent dans le cas de l’instabilité magnétique, mais que nous ne discuterons pas ici. Remarquons que l’état Onde de Densité de Spin sinusoïdale, de paramètre d’ordre s =
1 + + < ck↑ ck+q↑ − ck↓ ck+q↓ > N
(10.92)
k
peut être considéré comme la superposition d’une Onde de Densité de Charge pour les spins ↑ et d’une Onde de Densité de Charge pour les spins ↓, de même vecteur d’onde et déphasée d’une demi-longueur d’onde, de façon que la densité d’électrons reste uniforme. Si le déphasage entre les deux Ondes de Densité de Charge est différent de π, on pourra obtenir un état où le spin et la charge sont tous deux modulés. Un tel état avait été prévu par Overhauser et a été récemment observé récemment dans (TMTSF )2 PF6 [13].
10.3.4 Conduction de Fröhlich C’est Monceau qui a observé le premier la conductibilité de Fröhlich sur un composé de C. Schlenker (mesure faite aux USA à l’invitation de Bardeen, et thèse soutenue à Grenoble). L’Onde de Densité de Charge est caractérisée par l’amplitude et par la phase du paramètre d’ordre. Or, le bilan énergétique conduisant à la stabilité de l’Onde de
432
10. Le magnétisme itinérant
Densité de Charge (ODC) ne fait pas apparaître la phase de l’ODC. Autrement dit, l’énergie de l’ODC ne dépend pas de sa phase, du moins tant que le vecteur d’onde de la modulation n’est pas commensurable avec le réseau réciproque. Il s’agit d’une propriété d’invariance de jauge du système. Or changer la phase du paramètre d’ordre revient à effectuer une translation de l’onde par rapport au réseau. En effet, si le paramètre d’ordre est | | exp i ϕ, l’amplitude de la modulation de vecteur d’onde 2kF est donnée par 2 | | u(x ) = (10.93) cos 2kF x + ϕ ω2kF g Changer la phase du paramètre d’ordre est donc bien équivalent à changer la phase de l’ODC. La propriété d’invariance de jauge nous indique donc qu’il est possible de déplacer la charge électronique associée à l’onde sans coût d’énergie. On sait que dans une phase Onde de Densité de Charge (ou de Spin) la relation de dispersion des électrons devient celle d’un isolant, si l’écart au nesting parfait est suffisamment faible (si tb T = 0 ) : à ±2kF , un gap d’énergie 2 s’ouvre sur toute la surface de Fermi, déterminé par le paramètre d’ordre de la phase ODC (ou ODS). Cependant, il convient de noter que la structure modulée n’est pas nécessairement statique. Autrement dit, la modulation électronique périodique n’est pas fixée au réseau, du moins quand kF a/π , où a est le paramètre du réseau dans la direction des chaînes, n’est pas un nombre rationnel. Par conséquent, si un champ électrique E est appliqué au système électronique modulé, les électrons seront accélérés ensemble, en même temps que la modulation du réseau à 2kF . Si on appelle ε k l’énergie à un électron en champ électrique nul, l’énergie résultant du mouvement des électrons sous l’effet du champ E deviendra ε k + h¯ kvc , où vc est la vitesse du mouvement collectif des électrons. Tant que hk ¯ F vc < , et s’ il n’y a pas d’autres obstacles, tels que des impuretés ou d’autres défauts cristallins, les électrons continueront à se déplacer collectivement, ce qui causera un courant électrique. Quand hk ¯ F vc excède , les électrons individuels sont excités dans la bande supérieure et le mouvement collectif des électrons est détruit. Mais tant que hk ¯ F vc < , le déplacement de cette entité devrait pouvoir engendrer un courant sans coût d’énergie. Dans l’état Onde de Densité de Charge, il est par conséquent possible de créer un mouvement cohérent des paires électron-trou en faisant glisser l’Onde de Densité de Charge incommensurable par rapport au réseau. Ce mécanisme de conductivité a été proposé par Fröhlich [12], qui pensait même que ce processus pouvait conduire à la supraconductivité. Cependant, dans le cas de l’Onde de Densité de Charge, le paramètre d’ordre est défini dans l’espace réel. Pour cette raison, il est fortement couplé aux défauts du réseau, en particulier aux impuretés chargées. Ceci provoque l’accrochage de l’Onde de Densité de Charge sur les défauts. Celle-ci ne peut plus glisser librement. Cet accrochage piège l’onde, même pour des concentrations très faibles d’impuretés.
433
Physique de la matière condensée
Si l’onde de densité est piégée par des impuretés, elle ne pourra se déplacer sous l’effet d’un champ faible, comme l’avait imaginé Fröhlich. Le champ électrique sera incapable de créer ce mouvement collectif. Il faudrait pour cela un champ suffisamment fort pour pouvoir décrocher l’onde. Par contre, si le champ est, en effet, suffisamment fort pour dépièger l’onde, alors la conduction croîtra rapidement avec le champ. C’est ce phénomène qui explique la conductivité non linéaire des systèmes à Onde de Densité de Charge ou de Spin, observé expérimenalement pour la première fois dans NbSe3 . À champ électrique faible, à cause du piègeage de l’onde par les impuretés, le comportement de la conductivité est celui d’un isolant, ou d’un semiconducteur si le gap induit par l’ordre Onde de Densité est suffisamment faible. En effet, tant que l’ODC reste piègé par le potentiel dû aux impuretés Vpi e` geage , le seul mécanisme de transport de charge sera un mécanisme à une particule, associé au transport de porteurs de charge excité thermiquement au dessus du gap à une particule. Dans ce domaine de champ, la caractéristique courant-tension I (V ) montrera un comportement linéaire, dont la pente sera donnée par la conductance, faible et thermiquement activée à cause du gap de la phase ODC. Mais dès que le champ électrique dépasse un champ seuil ET , alors l’onde est dépiègée, si bien que le mécanisme de conduction de Fröhlich peut se produire. Le mécanisme est schématisé de façon très simpliste dans la figure 10.22. Dans cette figure, on a supposé, pour les commodité du dessin, que le potentiel de piègeage était périodique, ce qui n’est évidemment pas du tout le cas, puisque le piègeage est dû aux interactions de l’ODC avec des impuretés localisées de façon aléatoire. Cependant, le mécanisme de la figure 10.23 nous fait comprendre que le dépiègeage se produit de la même façon quand Vpi e` geage n’est pas périodique. L’ODC est soumise à un potentiel total qui est la somme de Vpi e` geage et du potentiel électrique Vtotal = Vpi e` geage − Ex Quand le champ électrique croît, la pente de Vtotal devient de plus en plus négative, si bien que, au delà d’un champ seuil ET , les maximums de Vpi e` geage ne sont plus
Fig. 10.22 (a) Ouverture d’un gap d’énergie 2 à +kF et −kF dû à la modulation de l’onde de densité. (b) Bande d’énergie dans le cas d’un mouvement collectif d’électrons de vitesse vc et d’impulsion ke .
434
10. Le magnétisme itinérant
Fig. 10.23 Dépiégeage d’une Onde de Densité de Charge par un champ électrique : en champ nul, l’Onde de Densité de Charge reste accrochée par les impuretés, responsables d’un potentiel V(φ ) qui dépend de la phase φ de l’Onde (mais qui n’est pas périodique, comme schématisé sur cette figure). Le champ électrique introduit un potentiel additionnel variant linéairement. Au-delà d’un champ seuil ET ,l’onde est dépiégée.
suffisants pour pièger l’ODC. Cette dernière peut alors se déplacer sous l’effet du champ. Il y a alors un transport cohérent d’électrons, qui s’ajoute au transport à une particule. La conductivité croît fortement avec le champ électrique et ne suit donc plus du tout une loi d’Ohm linéaire. Dans la caractéristique courant-tension, ce phénomène se traduit par une rupture de pente de la caractéristique à la tension seuil. La figure 10.24 montre le cas de la phase ODC obsevée dans TaS3.
Fig. 10.24 Conductivité non linéaire et caractéristique courant-tension dans la phase Onde de Densité. ET est le champ seuil qui permet de piéger l’Onde de Densite de Charge.
435
Physique de la matière condensée
10.3.5 Ondes de Densité de Spin induites par un champ magnétique Le phénomène expérimental Parmi la très grande diversité de phénomènes physiques originaux mis en évidence dans les conducteurs organiques quasi-unidimensionnels, l’un des plus spectaculaires est peut-être la cascade quantique de transitions de phase Ondes de Densité de Spin induites par un champ magnétique. Ce phénomène très original a été observé dans les sels de Bechgaard, de formule chimique (TMTSF )2 X, ces conducteurs organiques quasi-unidimensionnels très anisotropes, dont nous avons déjà parlé au chapitre 8. Rappelons que ces derniers sont formés de chaînes de molécules organiques planes, les molécules de tétra-séléna-fulvalène, empilées dant la direction a, et faiblement couplées entre elles dans les directions transverses. La structure cristalline du sel (TMTSF )2 PF6 est schématisée dans la figure 10.25.
Fig. 10.25 Structure cristalline des sels de Bechgaard. La figure montre ici le plan (a,b) qui contient les chaînes conductrices.
La conduction dans la direction a se fait d’une part grâce au fort recouvrement des orbitales π perpendiculaires au plan de la molécule, d’autre part grâce au fait que la bande d’énergie qui en résulte est partiellement remplie en raison du transfert de charge entre la molécule TMTSF et les anions inorganiques X = PF6− , ClO4− , ReO4− , etc. Les intégrales de transfert électroniques suivant les trois axes cristallins présentent la hiérarchie : ta tb tc
(10.94)
Un trou par anion est transféré vers deux molécules TMTSF , ce qui conduit à une bande au trois-quart remplie, mais en raison de la dimérisation de la chaîne selon a, la bande est séparée en deux, ce qui donne une bande de conduction à moitié remplie. La structure de bande et la surface de Fermi de (TMTSF )2 PF6 sont schématisée dans la figure 10.10. Cette surface de Fermi est ouverte dans les directions kb et kc et montre une propriété de nesting presque parfait.
436
10. Le magnétisme itinérant
Quand une pression suffisante est appliquée, la phase stable des sels de Bechgaard est conductrice, comme le montrent les figures 10.25 et 10.26. C’est le cas de (TMTSF )2 PF6 au dessus de 11 kbars. En fait, à cette pression, l’état fondamental est supraconducteur avec une température critique de l’ordre du Kelvin. C’est même le cas à pression ambiante dans le sel perchlorate (TMTSF )2 ClO4 . Dans ce dernier composé, il apparaît un ordre supraconducteur pour T < 0, 9 K, qui disparait sous un champ magnétique appliqué perpendiculairement au plan (a, b) supérieur au champ critique Hc2 ∼ 1 kG. C’est l’effet bien connu de destruction de l’ordre supraconducteur par un champ magnétique, liée à l’énergie diamagnétique qui croît comme le carré du champ. Nous étudierons ce phénomène bien connu au chapitre suivant.
Fig. 10.26 Structure cristalline des sels de Bechgaard : la figure montre ici le plan perpendiculaire à l’axe des chaïnes faiblement couplées.
Mais le phénomène original qui nous intéresse dans ce paragraphe, unique dans la physique de la matière condensée, apparaît pour des champs plus élevés : quand le champ magnétique appliqué devient supérieur à un champ seuil de l’ordre de 4 Teslas, l’état métallique devient instable et cède la place à une phase Onde de Densité de Spin. La transition de phase induite par le champ est du second ordre. Elle a été observée (figure 10.27) par différentes méthodes expérimentales : chaleur spécifique [14], résistivité [15–17], effet Hall [15–17], RMN [21], aimantation [20]. Puis quand le champ continue à croître, on observe une succession, en cascade, de transitions de phase faiblement du premier ordre entre différentes phases Ondes de Densité de Spin. De plus, dans chacune de ces phases (figure 10.28), il apparaît des plateaux d’effet Hall. Dans chacune des phases Ondes de Densité de Spin, la conductivité de Hall par plan conducteur (figure 10.29), à température nulle, σxy est quantifiée :
437
TEMPERATURE (Kelvin)
Physique de la matière condensée
CHAMP MAGNETIQUE (Tesla)
Fig. 10.27 Diagramme de phase déduit des mesures de chaleur spécifique.
Résistance de hall
Fig. 10.28 Diagramme de phase déduit des mesures de magnétoresistance.
Champ Magnétique
Fig. 10.29 Effet Hall quantifié observe expérimentalement.
438
10. Le magnétisme itinérant
σxy = n
e2 h
(10.95)
2
où eh est le quantum de conductance et n un nombre quantique entier, qui caractérise la phase Onde de Densité de Spin.
L’interprétation semi-classique On peut esquisser une interprétation qualitative du phénomène sur la base d’un argument semi-classique simple [22, 23]. Considérons le mouvement semi-classique d’un paquet d’ondes à la surface de Fermi, quand un champ magnétique H est appliqué perpendiculairement au plan conducteur (a, b) [24]. Le paquet d’ondes de vecteur d’onde k, de vitesse v, est soumis à l’équation semi-classique du mouvement : ev ∧ H d r eH dk = = ∧ dt c dt c
(10.96)
La force de Lorentz étant perpendiculaire à la vitesse, l’énergie du paquet d’onde reste égale à l’énergie de Fermi et le module de la vitesse reste égal à vF . Le point représentatif du paquet d’ondes dans le plan (ka , kb ) se déplace le long de la surface de Fermi et suit donc, dans l’espace des k, une trajectoire parallèle à l’axe ka (figure 10.30, mais qui présente des oscillations dans la direction kb d’amplitude 4tb /vF . Or, dans l’équation semi-classique du mouvement, k et r jouent des rôles symétriques. La trajectoire dans l’espace réel se déduit de celle dans l’espace des k par une rotation de π/2 et une homothétie de rapport eH /c. Cette trajectoire dans l’espace réel s’effectue donc parallèlement à l’axe a, avec des oscillations dans la direction b d’amplitude 4t /vF b eH /c
(10.97)
Fig. 10.30 Trajectoire du paquet d’ondes sous champ magnétique dans l’espace des k.
439
Physique de la matière condensée
Le mouvement du paquet d’ondes sous champ a donc une extension d’amplitude limitée dans la direction b, d’autant plus limitée que le champ magnétique est plus fort, alors qu’en champ nul la fonction d’onde de Bloch est délocalisée dans tout le plan. L’effet orbital du champ magnétique a rendu le mouvement de l’électron unidimensionnel, alors qu’il était bidimensionnel en l’absence de champ. Ce mouvement est périodique. Le paquet d’onde décrit l’intervalle de vecteur d’onde δky = 2π/b en 2π c un temps Tc = bev . On peut donc définir une fréquence cyclotron FH ωc =
2π evF bH = Tc c
Comme l’effet orbital du champ a rendu le système unidimensionnel, on prévoit que l’application du champ rendra la phase métallique instable vis à vis de la formation d’une phase de type Onde de Densité : c’est une instabilité de même nature que l’instabilité de Peierls. Dans l’état de Peierls, la surface de Fermi est détruite. Il ne subsiste plus que des poches de porteurs de charge liées à l’écart de la surface de Fermi au nesting parfait. En effet, la surface de Fermi translatée d’un vecteur d’onde Q ne se superpose pas exactement avec elle-même. L’aire entre ces deux surfaces constitue ces poches de porteurs de charge non appariés. Dans l’état Onde de Densité induit par le champ, les orbites électroniques sont fermées. Il y a alors quantification du spectre électronique en niveaux de Landau, ou plutôt en « bandes de Landau », car les niveaux de Landau discrets sont élargis en bandes par l’effet tunnel tb entre chaînes voisines. Le spectre des niveaux électroniques ne présente donc pas un seul gap, comme dans l’état de Peierls, mais une infinité de gaps, séparés entre eux par l’énergie hω ¯ c : ce sont les « gaps de Landau » entre « bandes de Landau ». La condition de Peierls sur le vecteur d’onde de l’instabilité est que le gap s’ouvre exactement au niveau de Fermi : à une dimension, cette condition est remplie si Q = 2kF . Mais ici, la transition induite par le champ ouvre une infinité de gaps, également espacés en énergie de la quantité hω ¯ c . Il y a donc une infinité de vecteurs d’onde assurant la condition qu’un gap s’ouvre exactement au niveau de Fermi. Il suffit pour cela que la composante du vecteur d’onde dans la direction ka vérifie la relation de quantification Q = 2kF + n
hω ¯ c vF
(10.98)
Cette condition assure que le niveau de Fermi se trouve dans un gap de Landau, c’està-dire que n niveaux de Landau soient complètements remplis, ou bien, de façon équivalente, que la poche de porteurs non appariés, comprise entre la surface de Fermi translatée de Q et elle-même, comprenne n niveau de Landau complètement remplis. Chacun de ces vecteurs d’onde quantifiés définit une phase Onde de Densité de Spin. On prévoit donc que dans cette phase repérée par le nombre quantique n, l’effet Hall soit lui aussi quantifié.
440
10. Le magnétisme itinérant
La théorie quantique En fait, tous ces arguments semi-classiques, qui paraissent a priori critiquables, car on ne peut plus vraiment définir de surface de Fermi sous champ, puisque le vecteur d’onde n’est plus un bon nombre quantique, se trouvent, en fait, entièrement justifiés et confirmés par des calculs rigoureux entièrement quantiques [22, 25–28]. Précisons d’abord le modèle théorique utilisé pour dériver ces résultats. Nous commencerons par supposer que la structure cristalline est cubique, afin de simplifier les calculs, en discutant une situation géométrique plus simple. Les paramètres de maille dans les trois directions de l’espace sont a, b, et c. Nous savons que cette structure cubique ne représente pas de façon exacte le cas des sels de Bechgaard, dont la maille réelle est, en fait, triclinique. Mais cette simplification n’introduit pas de modification qualitative importante du phénomène étudié. Si l’on écrit la relation de dispersion des électrons dans l’approximation des liaisons fortes, avec transfert seulement entre sites premier voisins, on obtient : (10.99) ε 0 k = −2ta cos kx a − 2tb cos ky b − 2tc cos kz c − μ où μ est le potentiel chimique des électrons. Cette relation de dispersion présente la propriété de nesting parfait, c’est-à-dire qu’il existe un vecteur d’onde Q tel que, quel que soit k : 0 εk0 − μ = −(εk+Q − μ) (10.100) Il est facile en effet de vérifier que cette propriété est vérifiée pour : π π π Q =( , , ) a b c
(10.101)
Lorsqu’un conducteur présente la propriété de nesting parfait, alors la fonction de 0 (Q , T ) diverge pour T → 0. Il réponse magnétique au vecteur d’onde Q , χODS existe donc toujours une température d’instabilité finie pour la phase Onde de Densité de Spin de vecteur d’onde Q . Or nous voulons décrire un matériau présentant une phase métallique stable. Il est donc essentiel d’introduire, dans le modèle, un terme d’énergie qui viole la condition de nesting parfait. Nous écrirons donc la relation de dispersion sous la forme ε k = ε0 (k) − 2tb cos2ky b Bien sûr, dans les composés réels la condition de nesting parfait n’est effectivement vérifiée qu’approximativement. Il existe un écart au nesting parfait, dont nous avons rendu compte dans notre modèle par le terme supplémentaire dans la relation de dispersion, proportionnel à tb . Les ordres de grandeur observés dans les sels de Bechgaard sont ta ∼ 3000 K, tb ∼ 250 K, tc ∼ 10 K et tb ∼ 10 K (figure 10.31). 0 (Q , T ) tb mesure donc l’écart au nesting parfait et coupe la divergence de χODS 0 quand T tend vers zéro. χODS (Q , T ) se comporte maintenant à basse température
441
Physique de la matière condensée
Fig. 10.31 Susceptibilité sans interaction à température nulle pour un nesting imparfait de la surface de Fermi. L’écart au nesting empêche la susceptibilité de diverger à T = 0 et préserve la stabilité de la phase métallique.
comme ln (tb /E0 ). Ainsi, si tb est suffisamment grand, il se peut que le critère de Stoner pour l’instabilité Onde de Densité de Spin 0 (Q , T ) ≤ 0 1 − λODS χODS
(10.102)
ne soit jamais vérifié à aucune température. Nous supposerons que c’est bien le cas ici et que ceci explique la stabilité de la phase métallique (ou supraconductrice en champ nul et à basse température). Dans l’étude théorique du phénomène, il est possible de simplifier la relation de dispersion ε k de deux façons : on peut, dans un premier temps, ignorer la direction c de plus faible couplage et considérer un conducteur bidimensionnel très anisotrope. Par ailleurs, comme ta est très grand devant tb et que les seuls états électroniques importants sont situés au voisinage immédiat du niveau de Fermi, il est possible de linéariser la relation de dispersion dans la direction ka , de sorte que ε k s’écrit simplement : ε(k) = vF (|kx | − kF ) − 2tb cos ky b − 2tb cos 2ky b
(10.103)
tb assure la stabilité de l’état métallique. Formellement, tb pourrait représenter le terme de transfert entre sites deuxièmes voisins. En réalité, ce terme serait toujours extrêmement faible. Il est plus réaliste de considérer que tb peut résulter de plusieurs effets et, en particulier, de la courbure de la relation de dispersion dans la direction ka , négligée par l’approximation linéaire. Cet effet conduit à une valeur de tb de l’ordre de tb2 /ta tb .
442
10. Le magnétisme itinérant
La transition induite par un champ magnétique résulte d’un effet orbital du champ magnétique dans le régime tridimensionnel, à des températures bien inférieures à la température de cross over dimensionnel Tx . Dans ce régime de validité de la théorie de Landau des liquides de Fermi, on peut légitimement appliquer une théorie de champ moyen. On suppose que χ 0 (Q ) et χ RPA (Q ) restent finies à toute température. On applique alors un champ magnétique perpendiculairement au plan (a, b). L’effet orbital de ce champ magnétique est décrit par la substitution de Peierls. Soit A = (0, Hx ) le potentiel vecteur décrivant le champ magnétique uniforme perpendiculaire au plan (a, b) ; on effectue la substitution k −→ k − c’est-à-dire
eA c
eHx , ky ε k −→ ε kx − c
(10.104)
(10.105)
Pour cette raison, nous allons travailler dans la représentation mixte espace directespace réciproque, en définissant des opérateurs champs : ck exp i kx x + ky y (10.106) ψ x, y, ky = kx
+ ψ + x, y, ky = ck exp −i kx x + ky y
(10.107)
kx
où ck et ck+ sont les opérateurs d’annihilation et de création d’un électron dans un état de Bloch de vecteur d’onde k = kx , ky Dans cette représentation mixte, l’hamiltonien à un électron s’écrit en champ nul : 1 ∂ − kF + ε⊥ ky ψ x, y, ky (10.108) H0± = dx ψ + x, y, ky vF ± i ∂x où les signes + et − correspondent aux deux feuillets de la surface de Fermi et où : ε⊥ ky = −2tb cos ky b − 2tb cos 2ky b (10.109) En champ appliqué, nous supposerons qu’il suffit d’effectuer la substitution de Peierls pour obtenir l’expression de l’hamiltonien en présence du champ, ce qui est justifié tant que l’énergie diamagnétique du champ reste faible devant l’énergie de Fermi. Cette condition est très facilement vérifiée pour des champs de l’ordre de quelques Teslas et des énergie de Fermi de l’ordre de l’électron-volt. L’hamiltonien d’électrons
443
Physique de la matière condensée
sans interaction en présence du champ magnétique appliqué s’écrit alors simplement 1 ∂ eHbx ± + ψ x, y, ky − kF + ε⊥ ky − H0 = dx ψ x, y, ky vF ± i ∂x c (10.110) Les deux signes + et − correspondent aux deux feuillets de la surface de Fermi. L’équation du mouvement de l’opérateur champ ψ(±) x, y, ky,t correspondant à chacun des feuillets de la surface de Fermi s’écrit i
∂ ψ(±) x, y, ky,t = H0± , ψ(±) x, y, ky,t ∂t
(10.111)
Cette équation du mouvement admet une solution de la forme ix0 x 0 ψ(+) x, y, ky,t = ψ(+) x, y, ky,t exp (10.112) T⊥ p − − T⊥ p vF x0 où T⊥ p =
p
0
p = ky b
ε⊥ p dp et
x0 =
(10.113) c eHb
(10.114)
0 x, y, ky,t est l’opérateur champ d’un système en l’absence de champ maet où ψ(+) gnétique et strictement unidimensionnel, de relation de dispersion ε0 (kx ) = vF (|kx | − kF )
(10.115)
La quantité vF /x0 qui apparaît est, en fait, la fréquence cyclotron ωc du mouvement semi-classique d’un paquet d’onde à la surface de Fermi. ψ(−) x, y, ky,t vérifie une équation analogue à celle de ψ(+) x, y, ky,t , où vF est remplacé par −vF . On voit que le facteur de phase de ψ(+) x, y, ky,t contient la fonction T⊥ (p − x /x0) qui est périodique de période 2π/x0 . ψ(+) (x, y, ky ) est donc aussi périodique, et peut être développé en série de Fourier : n x (10.116) γn ky ck0 exp i kx − ψ(+) (x, y, ky ) = x0 kx ,n
où ck0 est l’opérateur de fermion strictement unidimensionnel et sans champ, de relation de dispersion ε0 kx . On obtient donc un résultat rigoureux particulièrement important : on a ramené le problème d’électrons de surface de Fermi bidimensionnelle,
444
10. Le magnétisme itinérant
sous champ magnétique, à un problème d’électrons à une dimension et sans champ magnétique, mais où la relation de dispersion est constituée de de la superposition
feuillets unidimensionnels, situés aux vecteurs d’onde ± kF + nombre entier, espacés entre eux de δ kF = 1/x0 .
n x0
, où n est un
Cette équivalence permet d’ailleurs de décrire le spectre de quasiparticules. Ce spectre est un spectre unidimensionnel constitué de bandes espacées par des gaps équidistants, séparés en énergie de hv ¯ F (10.117) hω ¯ c = x0 Ce système doit donc présenter des instabilités unidimensionnelles de la fonction de réponse pour tous les vecteurs d’onde de la forme Q = 2kF +
N x0
(10.118)
où N est un entier relatif.
+ En effet, si on cherche la réponse linéaire ρQ des électrons à un potentiel extérieur de vecteur d’onde Q , proportionnel à la composante de Fourier de la densité Vext Q = + VQ ρQ + (10.119) ρQ = χ 0 Q Vext Q un simple calcul de perturbation au premier ordre nous montre, à partir de l’équation 10.114 que la fonction de réponse densité-densité sous champ sera de la forme : N fFD ε0 k − fFD ε0 k + Q − x0 χ0 Q = (10.120) IN2 0 k + Q − N − ε0 k ε N k x0 où
IN2 =
∗ γn ky γ−n−N ky + Qy
n,ky
En fait, on peut montrer, par un calcul simple, à partir des équations 10.120, que les coefficients IN sont des fonctions oscillantes du champ magnétique, données par : +∞
IN =
Jm (z )JN −2m (z )
(10.121)
m=−∞
avec z=
Qy b 4tb cos , eHvF b 2
z =
2tb cos Qy b eHvF b
(10.122)
445
Physique de la matière condensée
Les Jm sont les fonctions de Bessel de première espèce d’indice m. La susceptibilité des électrons sans interaction (figure 10.32), χ 0 Q , présente donc des divergences logarithmiques quand T → 0 pour une infinité de valeurs quantifiées de Q [29].
q⊥ en unités πb
q⊥ en unités πb q// en unités tb v
q// en unités tb v
q⊥ en unités πb q// en unités tb v
Fig. 10.32 Susceptibilité sans interaction en présence du champ. L’effet orbital rend le mouvement des électrons unidimensionnel. La susceptibilité présente une série de maximums, qui divergent à basse température, pour des valeurs quantifiées de q . Le nombre quantique n0 qui correspond au maximum absolu décroît quand le champ croît. Nous avons représenté ici les cas n0 (h) = 3, 2, 1.
Cette quantification de Q peut également s’interpréter comme une quantification de l’aire comprise entre la surface de Fermi et cette même surface translatée de Q , ou, si l’on veut, du flux du champ magnétique à travers cette aire. Ce flux s’écrit : = N 0 où 0 =
446
hc e
est le quantum de flux magnétique [22].
(10.123)
10. Le magnétisme itinérant
Dans tout ce paragraphe, nous avons considéré, jusqu’à présent, des électrons sans interaction. Si maintenant on traite les interactions entre électrons dans l’approximation du champ moyen, ce qui est justifié puisque T Tx , la condition d’instabilité Onde de Densité de Spin se traduira par le critère de Stoner ∗ χ 0 (Q , T ) = 0 1 − gSDW
(10.124)
∗ où gSDW est le paramètre d’interaction renormalisé, qui doit être utilisé dans le régime de liquide de Landau-Fermi. Puisque χ 0 (Q , T ) est une somme de termes qui divergent logarithmiquement à basse température pour des valeurs quantifiées de Q , le critère de Stoner sera évidemment vérifié pour toutes ces valeurs de Q . Une instabilité, analogue à l’instabilité de Peierls, se produira pour le vecteur d’onde Q = 2kF + N x0 correspondant à la valeur de N qui maximise IN.
En champ croissant, la valeur de N qui maximise IN décroît par sauts entiers. On s’attend donc à ce que le diagramme de phase montre une succession de phases Onde de Densité de Spin de vecteurs d’onde Q dont la composante Q = 2kF +
N x0
est quantifiée. Chaque phase Onde de Densité de Spin est indicée par le nombre quantique N , qui décroît par saut entier quand le champ croît. On s’attend, en champ croissant, à une cascade de transitions de phase du premier ordre entre phases Onde de Densité de Spin quantifiées (figure 10.33) [27, 28]. La condition de quantification de Q est simplement la condition pour que le niveau de Fermi soit au milieu du gap de Peierls. Il existe une infinité de tels gaps repérés
,
,
,
,
,
,
,
Fig. 10.33 Diagramme de phase calculée pour un gaz d’électrons anisotropes (tc tb ta ) avec surface de Fermi ouverte, lorsqu’un champ magnétique est appliqué perpendiculairement au plan (a,b). La ligne pleine représente une transition du second ordre entre la phase métallique et les phases ODS. Les lignes pointillées représentent des transitions du premier ordre entre phases ODS quantifiées.
447
Physique de la matière condensée
par un nombre entier N, qui sont l’équivalent des gaps d’énergie entre niveaux de Landau, élargis ici en bandes par l’effet tunnel des électrons. Comme la quantification du vecteur d’onde assure que le gap s’ouvre au niveau de Fermi, la quantification de l’effet Hall dans chacune des phases est automatiquement assurée. On peut écrire rigoureusement [30] que la conductivité de Hall par plan (a, b) s’écrit bien e2 σxy = n (10.125) h La quantification de l’effet Hall est due au fait que le vecteur d’onde de la phase magnétique s’ajuste de façon self-consistente pour que le niveau de Fermi tombe dans un gap de Landau, ce qui minimise l’énergie. Du même coup, cet ajustement du vecteur d’onde de la surstructure magnétique assure que N niveaux de Landau soient exactement remplis. Cette quantification de l’effet Hall résulte donc d’un effet coopératif à N électrons [30]. Ceci est différent du cas de l’effet Hall quantifié usuel, observé dans les hétérostructures de semiconducteurs. Dans ce dernier cas, ce qui assure que le niveau de Fermi soit fixé dans un gap de Landau est la présence de niveaux localisés dus au désordre, c’est-à-dire un effet à un électron. Il y a donc une différence de nature entre les deux mécanismes de quantification de l’effet Hall (figures 10.34 and 10.35).
Fig. 10.34 L’aire A, comprise entre une nappe de la surface de Fermi et l’autre nappe translatée de Q est quantifiée et croît linéairement avec le champ : A= n e H / h. Le vecteur de nesting Q(H) varie pour autoriser cette augmentation (a-b). Quand le nesting devient trop mauvais, n chute d’une unité pour revenir à un meilleur nesting (c).
10.4 Magnons Nous revenons dans ce paragraphe au cas d’une phase magnétique ordonnée de type ferromagnétique, où le paramètre d’ordre est l’aimantation uniforme. Le traitement Hartree-Fock du paragraphe précédent ne décrit que les excitations magnétiques individuelles. Cette approximation d’électrons indépendants est
448
10. Le magnétisme itinérant
Fig. 10.35 Variations de la composante longitudinale du vecteur d’onde q en fonction du champ et du nombre de porteurs non apparies N - Variations correspondantes de l’effet Hall, rigoureusement quantifie à température nulle.
incapable de décrire des excitations collectives. Les excitations individuelles dont il s’agit ici sont des créations de paire électron-trou de vecteur d’onde q avec abaissement + + = ck+q↓ ck↑ . du spin d’une unité bkq L’énergie d’excitation correspondante est, pour q petit : Ek+q↓ − Ek↑ U n↑ − n↓
(10.126)
10.4.1 Excitations collectives Nous allons chercher à décrire les excitations collectives, comme dans le cas des plasmons au chapitre 6, dans le cadre de la RPA. La méthode est de partir de la base des excitations individuelles de l’approximation de Hartree-Fock, et de décrire l’excitation collective comme une combinaison linéaire des excitations individuelles : + αk bkq (10.127) k
C’est évidemment une approximation, car les vrais magnons doivent comporter également des termes correspondant à des création de paires électron-trou de même spin, par exemple du type : + + ck+q ck↑ ck +q"σ ck σ ↓
(10.128)
449
Physique de la matière condensée
Ce type de termes sera négligé. On fait une approximation de champ moyen dépendant du temps, c’est-à-dire qu’on + en supposant ici commence par écrire l’équation du mouvement de l’opérateur bkq que les électrons sont soumis à un hamiltonien de Hubbard, avec une relation de dispersion à un électron εk et une interaction intra-atomique U . + + = ck+q↓ ck↑ s’écrit, de façon exacte L’équation du mouvement de l’opérateur bkq dans le cadre du modèle de Hubbard :
+ U + d + + = H, bkq − c c c + ck ↓ i bkq = εk+q − εk bkq dt N k+q↓ k−q ↑ k −q ↓
U + − ck↑ ck+ +q ↑ ck ↑ ck+q−q ↓ N
k ,q
(10.129)
k ,q
Dans la RPA, on linéarise les équations du mouvement : les termes à quatre opérateurs de fermions sont remplacés par le produit de deux de ces opérateurs par la valeur moyenne des deux autres (valeur moyenne dans l’état fondamental à T = 0, valeur moyenne thermodynamique à T non nulle). La façon de réaliser cette procédure dépend de la symétrie qu’on souhaite imposer à la phase recherchée. En effet, on choisit quels sont les produits de deux opérateurs de fermions dont la valeur moyenne sera non nulle dans la phase ordonnée. Ici la phase ordonnée est uniforme et correspond à une aimantation de vecteur d’onde nul. Dans la linéarisation de l’équation du mouvement, on fera donc apparaître les opérateurs nombre nkσ et on les remplacera par leurs valeurs moyennes. Selon cette procédure, le second terme du membre de droite de l’équation (10.129) donne : U U + + < nk ↓ > bkq − < nk+q↓ > ck−q ↑ ck+q−q (10.130) − ↓ N N k
q
Le troisième terme donne : U U + < nk ↑ > bkq + < nk↑ > ck ↑ c + k +q↓ N N k
(10.131)
k
L’équation linéarisée devient : i
+ U + d + bkq = Ek+q↓ − Ek↑ bkq − < nk↑ > − < nk+q↓ > b (10.132) dt N kq k
où les Ekσ sont les énergies à un électron dans l’approximation de Hartree-Fock. Avant de résoudre cette équation, remarquons que nous bénéficions de deux avantages
450
10. Le magnétisme itinérant
qui nous permettent une résolution simple : l’invariance par translation implique un vecteur d’onde q défini par les excitations : il n’y a couplage qu’entre les paires + bkq et bk+ q , et non pas bk+ q . D’autre part, l’interaction intra-atomique, de portée
nulle, conduit à un terme simple U bk+ q . Avec une interaction de portée finie, on obtiendrait un terme k U k − k bk+ q , ce qui compliquerait notablement la solution analytique. Pour diagonaliser ce système d’équations on cherche la solution sous la forme + αk bkq bq+ = k
de façon que :
[H, bq+ ] = Ebq+
Ceci définit un opérateur de création d’excitation d’énergie E . On obtient l’équation aux valeurs propres E : k
+ U αk E − Ek+q↓ − Ek↑ bkq = αk < nk+q↓ > − < nk↑ > bk+ q N k,k
+ Les opérateurs bkq étant linéairement indépendants :
U αk E − Ek+q↓ − Ek↑ = αk < nk +q↓ > − < nk ↑ > N
(10.133)
(10.134)
k
Le second membre est une constante A indépendante de k : αk =
A E − Ek+q↓ − Ek↑
(10.135)
En reportant dans l’équation ci-dessus et en éliminant A, on obtient l’équation aux valeurs propres (figure 10.36) : 1=
U < nk+q↓ > − < nk↑ > N E − Ek+q↓ − Ek↑
(10.136)
k
La discussion est analogue à celle que nous avons déjà rencontrée au chapitre 6 dans le cas des plasmons. Considérons le cas T = 0 pour un état ferromagnétique. Soit F (E ) la fonction représentée par le deuxième membre de l’équation (10.135). F (E ) présente des pôles pour E = Ei q = Ek+q↓ − Ek↑ , c’est-à-dire pour les énergies d’excitations individuelles dans l’approximation de Hartree-Fock. Les
451
Physique de la matière condensée
Fig. 10.36 Discussion graphique de l’équation aux valeurs propres déterminant l’énergie des excitations de la phase ferromagnétique.
valeurs Ei q sont bornées par Emin q et Emax q . Les racines de l’équation aux valeurs propres correspondent à l’intersection avec la droite d’ordonnée 1. AuxM excitations de Hartree-Fock, correspondent M − 1 racines très proches des Ei q dans la limite N et donc M → ∞, qui forment des excitations individuelles. Ces excitations individuelles peuvent être considérées comme des états de diffusion particule-trou. Mais il existe une racine inférieure à Emin q , qui peut être bien séparée du pseudo-continuum des excitations individuelles. Il s’agit d’une excitation collective, un magnon, état lié du trou de spin ↑ et de la particule de spin ↓. L’énergie du magnon est donnée par : < nk+q↓ > − < nk↑ > 3 U d k 1 = 3 E − Ek+q↓ − Ek↑ 2π On peut étendre très simplement cette théorie des magnons à température finie. Il suffit de remplacer les valeurs moyennes des opérateurs nombres dans l’état fondamental de Hartree-Fock par les moyennes thermiques à température finie.
10.4.2 Mode de Goldstone Quand q → 0, l’énergie du magnon tend vers 0 à cause de l’invariance par rotation globale des spins de l’hamiltonien. En effet, la phase non magnétique est caractérisée par cette propriété d’invariance par rotation globale des spins. Il s’agit d’une symétrie continue. Au contraire, dans la phase ferromagnétique, cette symétrie continue a été spontanément brisée par l’apparition de l’ordre. Il apparaît une aimantation spontanée dont l’axe de quantification est arbitraire. Cette orientation arbitraire de l’aimantation brise la symétrie qui existait dans l’état non magnétique. En fait, il existe une infinité d’états fondamentaux dégénérés qui se déduisent les uns des autres par une rotation globale des spins. Le magnon de vecteur d’onde q = 0 peut
452
10. Le magnétisme itinérant
effectivement être décrit comme une rotation globale de l’ensemble des spins, sans déphasage entre spins, qui fait passer d’un fondamental ferromagnétique à un autre fondamental dégénéré, sans modification d’énergie. Comme les interactions sont à courte portée, il s’agit bien du mode de Goldstone associé à cette brisure de la symétrie continue. Par un développement limité, on montre que pour q petit : E (q → 0) Dq 2
(10.137)
Le spectre des excitations magnétiques est donné sur la figure 10.37.
Fig. 10.37 Spectre des excitations magnétiques d’un système d’électrons itinérants décrit par un modèle de Hubbard. En RPA, il s’ajoute au continuum d’excitations individuelles, obtenues dans l’approximation de Hartree-Fock un mode collectif de magnon, mode de Goldstone associé à la symétrie de rotation globale des spins.
Les magnons peuvent être considérés approximativement comme des bosons. On peut le voir en calculant le commutateur d’opérateurs de création et d’annihilation :
+ ∗ [bq , bq+ ] = αkq αk q ck↑ ck+q↓ , ck+ +q ↓ ck ↑ k,k
=
k,k
+ ∗ αkq αk q ck↑ ck ↑ δk+q,k +q − ck+ +q ↓ ck+q↓ δk,k
= δq,q
(10.138)
On ne trouve donc pas la relation habituelle de commutation des bosons. Par contre si on projette cette relation sur l’état fondamental ferromagnétique | F >, on trouve : [bq , bq+ ] | F >= δq,q | F >
(10.139)
453
Physique de la matière condensée
Si on se restreint à des états à un seul magnon, on trouve, en effet, que les opérateurs de création et d’annihilation de magnon vérifient bien les relations de commutation des opérateurs de bosons. Si, au lieu de considérer le fondamental, on considère un état excité qui contient déjà un magnon, le résultat sera approché à 1/N près. À basse température, quand le nombre de magnons excités reste faible, on pourra appliquer la statistique de Bose-Einstein. L’existence de ce mode, dont l’énergie tend vers 0 quand q → 0, a un effet très important sur toutes les propriétés thermodynamiques à basse température. Par exemple, l’excitation de magnons est l’effet dominant dans la variation de l’aimantation à basse température. L’excitation d’un magnon abaisse la projection selon Oz du spin total d’une unité. L’excitation thermique de magnon va donc réduire l’aimantation totale du système. Pour une dimension d’espace d : m T −m 0 ∼
0
qc
q d −1 dq exp βDq 2 − 1
(10.140)
À basse température, l’intégrale est dominée par la contribution des petits vecteurs d’onde. Pour d = 3, en posant x = βDq 2 , on trouve, comme dans le modèle d’Heisenberg, la loi de Bloch : m(T ) m(0)(1 − αT 3/2 )
(10.141)
Par contre, l’intégrale sur les vecteurs d’onde de l’équation (10.142) devient divergente pour les petits vecteurs d’onde pour une dimension d’espace d ≤ 2. Pour ces dimensions d’espace là, l’excitation thermique du mode de Goldstone annule l’amplitude du paramètre d’ordre : les fluctuations détruisent toute possibilité d’ordre à grande distance (ou en tout cas, toute valeur non nulle de l’aimantation moyenne). Ceci est une conséquence du caractère continu de la symétrie brisée.
Bibliographie 1. Pour une discussion complète, voir C. Herring, Magnetism, Vol. 4, p.118 (G.T. Rado and H. Suhl editors) et les références mentionnées 2. J. Hubbard, Proc. Roy. Soc. A 243, 336 (1963) 3. Ce concept a été introduit en premier par A.W. Overhauser, Phys. Rev. 128, 1437 (1962) 4. K. Bechgaard et al., Solid State Commun. 33, 1119 (1980) 5. P.M. Grant, J. Phys. C 44, 847 (1983) 6. L.F. Mattheis, Phys. Rev. 139, A 1893 (1963) 7. G. Shirane et W.J. Takei, J. Phys. Soc. Japan, 17, 35 (1962) 8. K. Mortensen et al., Phys. Rev. B 25, 3319 (1982) 9. J. Creuzet et al., J. Physique Lett. 46, L1079 (1985) 10. J.R. Cooper, W. Kang, P. Auban, G. Montambaux, D. Jérome et K. Bechgaard., Phys. Rev. Letters 63, 1984 (1989) 11. Voir, par exemple, D. Jérome et H.J. Schulz, Adv. Phys. 31, 299 (1982)
454
10. Le magnétisme itinérant
12. H. Fröhlich, Proc. Roy. Soc. (London) A 223, 296 (1954) 13. J.-P. Pouget et S. Ravy, J. Physique I, 6, 1501 (1996) 14. F. Pesty, P. Garoche et K. Bechgaard, Phys. Rev. Letters, 55, 2495 (1985) ; P. Garoche et F. Pesty, J. Magn. Magn. Mat. 54, 1418 (1986) 15. J.F. Kwak, J.E. Shirber, P.M. Chaikin, J.M. Williams, H.H. Wang, et L.Y. Chiang, Phys. Rev. Letters 56, 972 (1986) 16. H. Bando, K. Oshima, M. Suzuki, H. Kobayashi et G. Saito, J. Phys. Soc. Japan 51, 2711 (1982) 17. K. Kajimura, H. Tokumoto, M. Takumoto, K. Murata, T. Ukachi, H. Anzai, T. Ishiguro, et G ; Saito, J. Physique 44, C-3 1059 (1983) 18. M. Ribault, D. Jérome, J. Tuchendler, C. Weyl et K. Bechgaard, J. Physique Lett. 44, 953 (1983) ; M. Ribault, Mol. Cryst. Liq. Cryst. 119, 91 (1985) 19. P.M. Chaikin, M.Y. Choi, J.F. Kwak, J.S. Brooks, K.P. Martin, M.J. Naughton, E.M. Engler et R.L. Greene, Phys. Rev. Lett. 51, 2333 (1983) 20. M.J. Naughton, J.S. Brooks, L.Y. Chiang, R.V. Chamberlain et P.M. Chaikin, Phys. Rev. Lett. 55, 969 (1985) 21. T. Takahashi, D. Jérome et K. Bechgaard, J. Physique 45, 945 (1984) 22. M. Héritier, G. Montambaux et P. Lederer, J. Physique Lett. 45, 943 (1984) 23. P.M. Chaikin, Phys. Rev. B 31, 4470 (1985) ; P.M. Chaikin et R.L. Greene, Phys. Today 39, 24 (1986) 24. C. Kittel, in Introduction to Solid State Physics, 8e édition (John Wiley and Sons, 2004) 25. L.P. Gorkov et A. Lebef, J. Phys. Lett. 45, 433 (1984) 26. K. Yamaji, Mol. Cryst. Liq. Cryst. 119, 105 (1985) ; J. Phys. Soc. Japan, 54, 1034 (1985) ; Synth. Met. 13, 29 (1986) 27. A. Virostek, L. Chen et K. Maki, Phys. Rev. B34, 3371 (1986) 28. D. Poilblanc, M. Héritier, G. Montambaux et P. Lederer, J. Phys. C, 19, L321 (1986) ; L. Chen et K. Maki, Phys. Rev. B35, 8462 (1987) 29. G. Montambaux, M. Héritier et P. Lederer, Phys. Rev. Lett. 55, 2078 (1985) 30. D. Poilblanc, G. Montambaux, M. Héritier et P. Lederer, Phys. Rev. Lett. 58, 270 (1987)
455
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Supraconductivité conventionnelle 11.1 Principaux faits expérimentaux Ce chapitre est dédié à l’étude de la supraconductivité, ce phénomène si spectaculaire conduisant, entre autres propriétés remarquables, à un état de résistivité nulle, où les charges électriques peuvent se déplacer librement sans aucune dissipation. Ce phénomène a été observé dès le début du vingtième siècle [1], mais son interprétation fut très longue à élaborer. Ce n’est que dans les années cinquante, plus de quarante ans après la découverte expérimentale qu’une description théorique adéquate, d’abord phénoménologique, grâce à Ginzburg et Landau [20], puis microscopique, grâce à Bardeen, Cooper et Schrieffer [24] (BCS), a pu être proposée. Mais le succès de ces théories de champ moyen fut considérable. Toutes les propriétés expérimentales des supraconducteurs ont été interprétées avec une grande précision. La théorie microscopique avait conduit à prévoir, pour la température critique de supraconductivité, un plafond qui ne pourrait pas être dépassé. Même cette dernière prédiction théorique semblait vérifiée : malgré la très grande diversité des matériaux étudiés, les températures critiques observées ne dépassaient jamais ce plafond d’une vingtaine de degrés Kelvin que la théorie microscopique semblait imposer. La supraconductivité semblait très bien comprise dans le cadre de la théorie BCS et les applications potentielles fortement limitées par ce plafond, qui confinait le phénomène dans le domaine
457
Physique de la matière condensée
des très basses températures. C’est pourquoi les recherches sur la supraconductivité s’étaient très fortement ralenties. Puis, vint la découverte de la supraconductivité à haute température critique par Bednorz et Muller [4], en 1986, qui tout d’un coup brisa les plafonds prétendument imposés par la théorie. Du même coup, le domaine de recherche sur la supraconductivité explosa littéralement et devint, sans doute, l’un des plus étudiés scientifiquement, sur le plan expérimental comme sur le plan théorique. Dans ce chapitre, nous nous limiterons à la supraconductivité conventionnelle, celle qui était connue et si bien comprise avant 1986, qu’il est de toute façon nécessaire de comprendre avant d’envisager l’étude de la supraconductivité non conventionnelle. Ce n’est que dans le chapitre suivant que nous aborderons la cas de la supraconductivité non conventionnelle. La résistivité électrique de nombreux métaux et alliages tombe soudainement à zéro quand l’échantillon est refroidi à une température suffisamment basse. Ce phénomène a d’abord été observé par Kamerlingh Onnes en 1911 sur le mercure [1]. À la température critique Tc , il se produit une transition de phase d’un état de résistivité électrique normale vers un état supraconducteur (figure 11.1). Comme la transition n’est accompagnée d’aucun changement de structure, ni d’aucune modification des propriétés du réseau cristallin, on l’interprète comme une transition de phase électronique, dans laquelle les électrons de conduction s’arrangent dans un état ordonné. Après la découverte de K. Onnes dans le mercure, le phénomène de la supraconductivité a été recherché et étudié dans un grand nombre de matériaux. De fait, la supraconductivité a bien été observée dans de nombreux éléments métalliques du tableau périodique, ainsi que dans de nombreux alliages, composés intermétalliques, mais aussi, également, dans des semiconducteurs. Les éléments simples du tableau 1
R(T)/R(4,5K)
3,75
0,5
0,75
Température (K) 0
1
2
3
4
Fig. 11.1 Comportement de la résistivité dans un transition supraconductrice.
458
11. Supraconductivité conventionnelle
Fig. 11.2 Températures critiques de supraconductivité observées dans les éléments simples du tableau périodique.
périodique, connus pour être supraconducteurs, sont indiqués sur la figure 11.2, avec leur températures critiques en degrés K [2]. On voit donc que la supraconductivité est un phénomène assez communément répandu. Par contre, aucun métal monovalent n’est connu pour être supraconducteur. De même, aucun des métaux ferromagnétiques ou antiferromagnétiques, et aucun des éléments « Terres Rares » non plus, à l’exception du Lanthane qui a une couche 4f entièrement vide, ne devient supraconducteur, du moins dans le domaine de température où le phénomène a été recherché. C’est également en vain qu’on a recherché la supraconductivité dans les métaux alcalins Li , Na et K jusqu’à 0,08 K, 0,09 K et 0,08 K respectivement, où ils restent des conducteurs normaux. De même, les métaux nobles Cu, Ag et Au sont encore dans l’état normal à 0,05 K, 0,35 K et 0,05 K respectivement. Depuis la découverte de la supraconductivité dans le mercure en 1911, la recherche de composés de température critique plus élevée avait progressé lentement (figure 11.3). Jusqu’à fin 1986, la température critique la plus élevée était celle, observée dès 1973, des couches minces de NbP3 Ge , supraconductrices à 23,2 K [3]. Mais, depuis fin 1986, des progrès rapides ont été effectués dans ce domaine, dans des oxydes de Cuivre, de structure de type pérovskite (d’abord Tc ∼ 40 K dans La2−x Srx CuO4 [4], puis Tc ∼ 95 K dans YBa2 Cu3 O7−δ [5]. À la date d’avril 2013, la température critique la plus élevée a été observée dans HgBa2 Ca2 Cu3 O9 sous pression de 250 kbars, où Tc ∼ 155 K [6]. Ces résultats suscitent un intérêt considérable, car la température critique atteinte, à un facteur 2 près, devient du même ordre que la température ambiante. Certains indices pourraient laisser espérer des températures d’ordre encore plus élevées, ce qui ouvrirait des perspectives d’applications considérables. Ces composés sont donc actuellement l’objet de très nombreuses recherches pour obtenir des Tc et des courants plus élevées, mais aussi pour comprendre leurs propriétés et l’origine du mécanisme de la supraconductivité à haute température. En effet, le
459
Physique de la matière condensée
Année
Fig. 11.3 Évolution des températures critiques atteintes dans les métaux et alliages métalliques (point noir), les céramiques (carrés) et les organiques (triangles). L’échelle des températures critiques est logarithmique.
problème de la supraconductivité à haute température pose également des questions fondamentales de la plus grande importance. Il s’agit de comprendre un domaine à peu près neuf de la physique de la matière condensée : comment décrire la physique statistique de fermions fortement corrélés, quand les corrélations entre électrons sont tellement fortes que la théorie de Landau des liquides de Fermi normaux ne peut plus s’appliquer. Cette théorie des liquides de Landau-Fermi a été la base théorique essentielle de la théorie quantique des électrons dans les solides. Il semble bien que dans un certain nombre de cas expérimentaux actuellement fortement étudiés, cette base théorique n’est plus justifiée. Le problème théorique posé est donc d’une importance conceptuelle considérable. La question de savoir si la supraconductivité à haute température critique résulte d’un mécanisme « conventionnel » dans une situation très favorable (basse dimensionalité, anomalies de la densité d’états, très fort couplage électron-phonon) ou d’un mécanisme entièrement nouveau n’est pas absolument tranchée. Dans la suite de ce chapitre, il ne sera question que de la supraconductivité « conventionnelle ». Ce n’est que dans le chapitre suivant que nous esquisserons quelques données et quelques idées récentes sur les supraconducteurs non conventionnels, et particulièrement sur les supraconducteurs à haute température critique. Le fait que la résistivité s’annule dans l’état supraconducteur est une propriété spectaculaire qui a donné son nom à cette phase, mais elle ne suffit pas pour la caractériser convenablement. Cette phase montre, en effet, un ensemble de propriétés thermodynamiques bien particulières. Les principales caractéristiques sont présentées dans les paragraphes ci-dessous.
460
11. Supraconductivité conventionnelle
11.1.1 Conductivité infinie Dans l’état supraconducteur, la résistivité électrique de fréquence nulle est rigoureusement nulle, ou du moins, si proche de zéro que des courants persistants ont été observés dans des anneaux supraconducteurs pendant plus d’un an sans qu’aucune atténuation mesurable ait pu être décelée. La mesure de l’atténuation du courant n’est pas simple, car le simple fait de mesurer cette atténuation contribue, précisément à introduire une cause d’amortissement qui n’existerait pas en l’absence de la mesure. Cependant, des méthodes très précises de Résonance Magnétique Nucléaire ont permis d’estimer une limite inférieure du temps d’amortissement des supercourants dans un solénoïde de Nb0,75 Zr0,25 d’au moins 100 000 ans [7]. La combinaison de la loi d’Ohm : j = σE
(11.1)
et de l’équation de Maxwell : rot E = −
1 ∂B c ∂t
implique que la densité de flux magnétique B reste constante dans tout milieu de conductivité infinie, parce que le champ électrique E s’annule à l’intérieur du milieu conducteur. En particulier, considérons un supraconducteur qu’on refroidit audessous de Tc en champ magnétique nul. La propriété ci-dessus montre que le champ magnétique B reste nul à l’intérieur du supraconducteur, même si un champ est appliqué par la suite.
11.1.2 Effet Meissner Bien que la conductivité infinie soit la caractéristique la plus évidente, la vraie nature de l’état supraconducteur est révélée plus clairement par ses propriétés magnétiques. Considérons un métal normal dans un champ magnétique uniforme. Quand l’échantillon est refroidi et devient supraconducteur, les expériences de Meissner et Ochsenfeld [8] démontrent que tout le flux magnétique est repoussé en dehors de l’échantillon. On appelle ce phénomène l’effet Meissner (figure 11.4). Il montre qu’un échantillon supraconducteur en volume se comporte, dans un champ magnétique extérieur appliqué Ha , comme si, à l’intérieur de l’échantillon, on avait : B = Ha + 4π M = 0 c’est-à-dire χ = −1/4π : le supraconducteur montre un diamagnétisme parfait. Ce résultat très important ne découle pas simplement du fait que la conductivité soit infinie. Nous avons vu que cette propriété entraîne que ∂B/∂t = 0. Elle semble donc impliquer que le flux à travers le métal ne peut pas changer quand on abaisse
461
Physique de la matière condensée
échantillon refroidi en champ nul puis soumis à un champ appliqué
métal normal (T> Tc) sous champ magnétique uniformé
puis refroidi en dessous de Tc (H)
Fig. 11.4 Comportement du flux magnétique dans un supraconducteur.
la température au-dessous de la transition. En réalité, l’effet Meissner indique que la valeur constante du flux est nulle dans l’état supraconducteur, mais ce résultat n’a aucune raison de rester valable au-dessus de Tc dans l’état normal. La courbe d’aimantation qu’on attend pour un supraconducteur dans les conditions de l’expérience de Meissner-Ochsenfeld est schématisée dans la figure 11.5.
Fig. 11.5 Diamagnétisme des supraconducteurs de type I.
Ceci s’applique de façon quantitative pour des échantillons en forme de cylindres allongés, placés dans un champ magnétique longitudinal. Les échantillons purs de
462
11. Supraconductivité conventionnelle
nombreux matériaux montrent ce comportement. On les appelle des supraconducteurs de type I. Les valeurs des champs critiques Hc sont, pour le type I, toujours trop faibles pour des applications techniques où un champ appliqué est nécessaire. D’autres matériaux montrent une courbe d’aimantation d’un type différent, schématisée dans la figure 11.6. En champ faible, la courbe d’aimantation montre un diamagnétisme parfait, comme dans les supraconducteurs de type I, mais seulement jusqu’à un premier champ critique Hc1 . Au-dessus de ce champ critique, les propriétés supraconductrices persistent, mais le diamagnétisme est désormais partiel. Enfin, il existe un deuxième champ critique Hc2 , au dessus duquel tout diamagnétisme et tout caractère supraconducteur disparaît.
M état supra
état mixte HC
1
— HC/4P
diamagnétisme parfait
HC
état normal HC
2
H
diamagnétisme partiel
Fig. 11.6 Propriétes diamagnétiques des supraconducteurs de type II.
On appelle les matériaux correspondant à ces cas des supraconducteurs de type II. C’est le cas, en général, des alliages, ou des métaux de transition de résistivité électrique élevée dans l’état normal (ce qui correspond à un libre parcours moyen électronique court dans l’état normal). Dans les supraconducteurs de type II, les propriétés électriques supraconductrices restent observées jusqu’au champ Hc2 , appelé champ critique supérieur. La valeur de Hc2 peut être, typiquement, 100 fois celle qu’on attendrait pour Hc , à partir de considérations purement thermodynamiques, pour une phase supraconductrice homogène. D’une façon générale, le comportement de type I correspond à des métaux purs de libre parcours moyen électronique élevé dans la phase normale. Au contraire, le comportement de type II est celui de métaux ou alliages de libre parcours moyen faible. Il est même possible, en partant d’un métal pur supraconducteur de type I, d’obtenir par alliage un supraconducteur de type II dont le champ critique supérieur Hc2 croît à mesure que le libre parcours moyen diminue. La figure 11.7 ci-dessous montre le cas du Plomb pur (A) et d’alliages de Plomb avec 2,08% d’Indium (B), 8,23 % d’Indium (C) et 20,04 % d’Indium (D) respectivement [9].
463
Physique de la matière condensée
Fig. 11.7 Effet Meissner dans quatre métaux ou alliages : (A) Plomb pur - (B) alliage de Plomb avec 2,08% d’Indium - (C) alliage de Plomb avec 8,23 % d’Indium- (D) alliage de Plomb avec 20,04 % d’Indium.
11.1.3 Courants persistants et quantification du flux Considérons un anneau de métal normal placé dans un champ magnétique perpendiculaire à son plan. Quand on abaisse la température au-dessous de Tc , le métal devient supraconducteur et repousse le flux. Supposons qu’alors le champ magnétique appliqué soit supprimé. Aucun flux ne peut passer à travers le métal supraconducteur et le flux piégé total doit rester constant : il est en fait maintenu par des courants persistants circulant dans l’anneau lui-même. De plus, le flux piégé (figure 11.8) est quantifié en unités de quantum de flux [10] : φ0 =
hc 2,07 × 10−7 gauss/cm2 2e
(11.2)
Fig. 11.8 Piégeage du flux dans un anneau supraconducteur : a) T>Tc ; b) T Tc , cet effet tunnel causera le passage d’un courant à travers la barrière, même pour une tension appliquée aux bornes de la diode tunnel tendant vers zéro. Par contre, pour T Tc , le passage d’un courant nécessitera de fournir aux électrons injectés dans la région supraconductrice une énergie supérieure ou égale au gap eV ≥ [16]. D’où la forme de la caractéristique courant-tension, schématisée en figure 11.13.
467
Physique de la matière condensée
Fig. 11.13 Allure schématique de la caractéristique courant-tension très en-desous de la température critique de supraconductivité.
11.1.6 Effets Josephson Ces effets doivent leurs noms au physicien qui les a prédits théoriquement [17] avant leurs observations expérimentales. Dans les expériences d’effet tunnel décrites au paragraphe précédent, il s’agit d’un effet tunnel à une particule traversant la barrière constituée par la couche d’oxyde isolant. Dans ce type d’expérience, la barrière isolante est suffisamment épaisse pour que les paramètres d’ordre supraconducteurs de chaque côté de la barrière (quand les deux métaux de la jonction tunnel sont supraconducteurs) ne puissent pas se chevaucher de façon non négligeable. Toutefois, quand l’épaisseur de barrière devient si fine que ce recouvrement n’est plus négligeable, de nouveaux effets, appelés génériquement « effets Josephson », apparaissent. La conséquence la plus simple de ce recouvrement des paramètres d’ordre supraconducteurs (des « fonctions d’onde supraconductrices ») de part et d’autre de la barrière est l’existence d’un petit supercourant continu en l’absence de tension appliquée aux bornes de la jonction, dû à l’effet tunnel entre les deux supraconducteurs, non de quasiparticules, mais de paires d’électrons liés. Cet effet fut important pour prouver qu’il fallait associer à l’état supraconducteur un paramètre d’ordre possédant une phase cohérente. En effet, le supercourant prédit par Josephson est lié à la cohérence des paramètres d’ordre ψ1 et ψ2 de part et d’autre de la jonction et s’exprime en fonction de la différence de phase ϕ entre eux : J = J0 sin ϕ
(11.3)
De plus, si une tension est appliquée aux bornes de la jonction, il se produit un glissement de phase entre les deux côtés ; ce glissement de phase peut être synchronisé avec un champ alternatif appliqué, ce qui peut produire de nombreux « effets alternatifs » intéressants.
468
11. Supraconductivité conventionnelle
11.1.7 Effet isotopique Les mesures des températures critiques montrent que celles-ci dépendent de la masse isotopique. Dans une série donnée d’isotopes, les résultats peuvent être mis sous la forme [18] : M α Tc = Constante avec α 0,5 Voici quelques valeurs de l’exposant α mesuré dans divers corps simples ou composés : Substance
Exposant α
Zn Cd Sn Hg Pb Tl Ru Os Mo Nb3 Sn Mo3 Ir Zr
0, 45 ± 0, 05 0, 51 ± 0, 10 0, 47 ± 0, 02 0, 50 ± 0, 03 0, 49 ± 0, 02 0, 61 ± 0, 10 0, 00 ± 0, 05 0, 15 ± 0, 05 0, 33 ± 0, 10 0, 08 ± 0, 02 0, 33 ± 0, 03 0, 00 ± 0, 05
La plupart des supraconducteurs usuels vérifient assez bien la propriété α 0, 5. Nous avons cependant volontairement cité, dans ce tableau, des exceptions notables à cette règle. L’absence d’effet isotopique dans Ru et Zr , et la faible valeur de α dans Os, trois éléments de transition, ont été interprétées par des effets de polarisation de la couche d . La faible valeur de α dans Nb3 Sn est sans doute due à une anomalie de la densité d’états au niveau de Fermi dans ce composé, appelée singularité de Van Hove, liée au caractère quasi-unidimensionnel de ce composé [19]. Malgré ces exceptions, l’effet isotopique observé dans la majorité des supraconducteurs montre que les vibrations du réseau, et par conséquent l’interaction électronphonon, jouent un rôle important dans la supraconductivité. On ne voit pas autrement comment la masse isotopique pourrait s’introduire dans la température critique de transition de phase du gaz d’électrons.
11.2 Théorie phénoménologique de Ginzburg-Landau 11.2.1 Les équations de Ginzburg-Landau Ginzburg et Landau ont proposé une théorie phénoménologique de la supraconductivité permettant de décrire les principales données expérimentales et d’en prévoir
469
Physique de la matière condensée
d’autres, bien avant que les mécanismes microscopiques mis en jeu aient été compris [20, 28]. Cette théorie rentre dans le cadre général de la théorie de Landau des transitions de phase exposée au chapitre 3. La transition de phase à Tc signale l’apparition d’un état ordonné dans lequel les électrons sont partiellement condensés dans un fluide sans friction. Ginzburg et Landau décrivent ce condensat par un paramètre d’ordre complexe ψ(r), sorte de « fonction d’onde macroscopique décrivant les électrons supraconducteurs ». ψ(r) possède une amplitude et une phase ϕ(r). Nous verrons que cette propriété de cohérence de phase dans le volume supraconducteur est essentielle pour expliquer les caractéristiques de l’état supraconducteur. Le fait expérimental que la transition soit du second ordre implique que ψ s’annule pour T ≥ Tc et que son amplitude augmente quant Tc − T > 0 croît. Près de Tc , la quantité |ψ| est petite et la densité d’énergie libre de l’état supraconducteur en champ nul peut s’écrire selon le développement : Fs0 = Fn0 + a |ψ|2 +
b |ψ|4 + · · · 2
(11.4)
où Fn0 est la densité d’énergie libre de l’état normal en champ nul. Dans cette expression, a et b sont des constantes phénoménologiques qui dépendent de la température. Puisque le paramètre d’ordre est uniforme en l’absence de champ extérieur, Ginzburg et Landau ajoutent un terme c|∇ψ|2 tendant à supprimer les variations spatiales de ψ. C’est ce terme qui traduit la propriété de rigidité généralisée discutée au chapitre 3. Pour souligner l’analogie avec une équation de Schrödinger effective, on écrit ce terme : 1 |−i h¯ ∇ψ|2 (11.5) 2m ∗ Le paramètre d’ordre ψ(r) décrit alors une sorte de « fonction d’onde macroscopique » des électrons supraconducteurs. m ∗ est la masse effective des particules décrites par cette « fonction d’onde ». Dans la théorie de Landau des transitions de phase (voir chapitre 3), la fonctionnelle de l’énergie libre doit être invariante par les opérations de symétrie de la phase désordonnée. Elle doit donc posséder la propriété d’invariance de jauge. En présence d’un champ magnétique B(r) décrit par un potentiel vecteur A(r) : B(r) = rotA(r)
(11.6)
il faut donc se poser la question de la transformation du paramètre d’ordre ψ(r) dans une transformation de jauge définie par : A(r) −→ B(r) + gradf (r)
(11.7)
Ginzburg et Landau supposent alors qu’on peut poursuivre l’analogie de ψ avec une fonction d’onde décrivant une particule de masse m ∗ et de charge effective e ∗ , si
470
11. Supraconductivité conventionnelle
bien que la transformation de jauge pour ψ s’écrit : ψ(r) −→ ψ(r) exp −i
e∗ f (r) hc ¯
(11.8)
En fait e ∗ et m ∗ doivent être considérées comme des paramètres phénoménologiques. L’expérience [21], comme la théorie microscopique, conduit à supposer que e ∗ = 2e et m ∗ = 2m (l’interprétation microscopique de ce facteur 2 vient du fait que ψ décrit en fait des paires d’électrons). Les deux premiers termes de la fonctionnelle (11.4), qui ne dépendent que du module de ψ sont bien invariants dans un changement de jauge. Il n’en est pas de même du terme en gradient. L’invariance de jauge de la fonctionnelle de Landau impose alors d’écrire le terme de rigidité : 2 e ∗A 1 −i h∇ + ψ ¯ 2m ∗ c
(11.9)
La densité d’énergie libre totale en présence d’un champ magnétique s’écrit alors : 2 2 e ∗A b 1 4 + B −i h∇ + ψ Fs = Fn0 + a |ψ| + |ψ| + ¯ 2 2m ∗ c 8π 2
(11.10)
où le dernier terme représente la densité d’énergie du champ magnétique. On voit que la transition supraconductrice brise la symétrie d’invariance de jauge puisque dans l’état ordonné, le paramètre d’ordre ψ = |ψ| exp i ϕ choisira une phase particulière. Par convention, on choisit une normalisation pour ψ : |ψ|2 = ns∗
(11.11)
où ns∗ définit une densité effective de « super électrons ». Ce choix fixe le rapport a/b. L’énergie libre de l’échantillon est obtenue en intégrant Fs dans le volume total . Dans un champ uniforme extérieur H, le potentiel thermodynamique pertinent est la fonction de Gibbs ; il faut considérer Gs , définie par 1 3 Gs = d r Fs − d 3 r Gs (11.12) B·H = 4π où Gs est la densité de fonction de Gibbs microscopique. Cette intégrale, à l’équilibre thermodynamique doit être stationnaire par rapport aux variations du paramètre d’ordre et du potentiel vecteur soumis à la contrainte : rotA(r) = B(r)
(11.13)
471
Physique de la matière condensée
Gs est une intégrale qui comprend deux fonctions ψ(r) et A(r). Il nous faut donc minimiser Gs , non par rapport aux variations d’une variable, mais par rapport aux variations de ces deux fonctions. On doit utiliser les équations d’Euler-Lagrange. Puisque ψ est une fonction complexe, on peut minimiser par rapport à ψ ou ψ ∗ . La minimisation par rapport à ψ ∗ donne l’équation : ∂ ∂Gs ∂Gs
=0 − ∗ ∂ψ ∂xj ∂ ∇j ψ ∗ j
(11.14)
où ∇j ψ ∗ est la composante du gradient dans la direction j . On écrit souvent cette équation : δGs =0 (11.15) δψ ∗ δGs où δψ ∗ désigne la dérivée fonctionnelle. Cette condition s’écrit, si on utilise la jauge divA = 0 : e ∗A 2 1 −i h∇ + ψ + aψ + b |ψ|2 ψ = 0 (11.16) ¯ 2m ∗ c
Ceci est la première équation de Ginzburg-Landau. Si nous avions minimisé par rapport à ψ plutôt que par rapport à ψ ∗ , nous aurions obtenu l’équation complexe conjuguée. Nous avons donc obtenu une équation différentielle qui nous donnera les variations du paramètre d’ordre dans tout l’échantillon, une fois connu le potentiel vecteur A. Comme toujours, nous devons associer à l’équation différentielle des conditions aux limites appropriées pour ψ à la surface de l’échantillon. L’expression complète des variations de Gs quand ψ ∗ varie de δψ ∗ comprend d’abord le terme correspondant à l’intégrale de volume de ∂Gs/∂ψ ∗ multipliée par δψ ∗ , mais aussi l’intégrale de surface : ∂Gs
· ndS Is = δψ ∗ (11.17) ∂ ∇ψ ∗ où n est le vecteur unitaire normal à la surface. Dans la formulation habituelle des calculs variationnels, ce terme est habituellement omis car on impose généralement la condition aux limites ψ ∗ = 0, et par conséquent δψ ∗ = 0 sur la surface. Dans le cas d’un supraconducteur, cette condition aux limites n’est pas physiquement acceptable. En fait, on choisit la condition : ∂Gs
· ndS = 0 δψ ∗ ∂ ∇ψ ∗ qui annule également Is . Ecrite explicitement, cette condition donne : e ∗A ψ =0 n · −i h¯ ∇ + c
472
(11.18)
(11.19)
11. Supraconductivité conventionnelle
La dérivation à partir de la théorie microscopique montre que cette condition est correcte pour l’interface entre un supraconducteur et un isolant. Nous devons également minimiser Gs par rapport aux variations du potentiel vecteur A. L’équation d’Euler-Lagrange appropriée s’écrit : ∂Gs ∂Gs ∂
=0 − ∂Ai ∂xj ∂ ∂Ai /∂xj j
(11.20)
où Ai est la composante de A dans la direction i . Le second terme de cette équation donne (c/4π)rot rot A, c’est-à-dire (c/4π)rot B. D’où : ∗ 2
e e ∗ h¯ ∗ ∗ (11.21) (c/4π) rot B = − ∗ ψ ∇ψ − ψ∇ψ − ∗ |ψ|2 A 2m i m c À nouveau nous imposons une condition aux limites qui annule le terme de surface : n × (B − H) = 0
(11.22)
En fait, pour écrire l’équation (11.22), nous avons tenu compte du fait que rot H = 0 dans le volume supraconducteur, ce qui annule le terme venant de la différenciation de H · B dans Gs . On voit que ψ(r) est solution d’une équation de Schrödinger effective non linéaire, tandis que le champ magnétique est déterminé par le supercourant : ∗ 2
e e ∗ h¯ ∗ ∗ j = − ∗ ψ ∇ψ − ψ∇ψ − ∗ |ψ|2 A 2m i m c
(11.23)
Cette expression est exactement l’expression de mécanique quantique du courant de particules décrites par une fonction d’onde ψ. L’équation (11.16) permet de calculer le paramètre d’ordre ψ(r) pour une distribution de potentiel vecteur A(r ) donnée, tandis que l’équation (11. 21) ou (11.23) donne la réponse diamagnétique du supraconducteur ; elle rend compte de l’existence d’un supercourant dans l’état ordonné décrit par un paramètre d’ordre avec sa phase, de l’effet Meissner pour les deux types de supraconducteurs, de la quantification du flux, et de tous les effets quantiques macroscopiques. La cohérence de la phase du paramètre d’ordre est ici tout à fait essentielle.
11.2.2 Solutions dans des cas simples – Longueurs caractéristiques La solution de ces équations dans des cas limites simples importants va nous permettre de mettre en évidence des aspects qualitatifs fondamentaux.
473
Physique de la matière condensée
Solution uniforme En l’absence de champ magnétique, A = 0, on obtient les solutions uniformes spatialement : a soit ψ(r) = 0, soit |ψ|2 = − (11.24) b La première solution représente l’état normal puisque alors Fs ≡ Fn0 . La seconde solution n’est physiquement acceptable que si a/b est négatif. Elle représente l’état supraconducteur de densité d’énergie libre : Fs0 = Fn0 −
a2 2b
(11.25)
Cet état ne sera stable que si b est positif. On suppose que b est indépendant de la température, tandis que : a(T ) = a (T − Tc )
(11.26)
a(T ) est négatif pour T < Tc et varie linéairement près de Tc . Ceci implique que ns∗ (T ) ∼ (Tc − T )
(11.27)
Longueur de cohérence Le second cas simple que nous considérerons est celui d’une géométrie unidimensionnelle, où ψ varie mais B est nul : −
h¯ 2 d 2 ψ + aψ + b |ψ|2 ψ = 0 2m ∗ dz 2
(11.28)
On suppose ψ réel et on introduit un paramètre d’ordre sans dimension : f (z ) = où
ψ∞ =
ψ(z ) ψ∞ |a| b
1 2
est l’amplitude du paramètre d’ordre en profondeur dans l’échantillon, dans une région où le champ magnétique est nul (ψ∞ est la solution du cas précédent). f (z ) est solution de l’équation : −
474
h¯ 2 d 2 f −f +f 2m ∗ |a| dz 2
3
=0
(11.29)
11. Supraconductivité conventionnelle
ce qui définit une échelle naturelle de longueur pour les variations spatiales du paramètre d’ordre : 1 2
h¯ 2 h¯ ξ T = = (11.30)
∗ 2m a T 2m ∗a T − T c
On appelle cette longueur la longueur de cohérence de Ginzburg-Landau. Elle diverge quand T → Tc . Dans certaines situations physiques, ψ s’annule à la limite de la région supraconductrice (z = 0). L’équation (11.29) permet de déterminer le comportement asymptotique de f (z ) : On obtient l’intégrale première ξ2
df dz
2 =
2 1 1−f 2 2
(11.31)
où la valeur de la constante d’intégration est choisie de façon à assurer que f → 0 quand f 2 tend vers 1. Si f est une fonction croissante de z , on doit prendre la racine carrée positive : 1−f 2 df =+ √ dz ξ 2 dont l’intégration donne :
(11.32)
z f (z ) = tanh √ ξ 2
La variation spatiale de f est confinée dans une région |z | ∼ ξ , parce que 1 − f s’annule exponentiellement pour |z | ξ .
Longueur de pénétration Considérons maintenant le cas d’un champ magnétique appliqué où le paramètre d’ordre est essentiellement uniforme ψ(r) = ψ∞ . Le supercourant donné par (11.23) se réduit alors à : ∗ 2 ∗ ns e A(r ) j(r ) = − ∗ m c
(11.33)
On en déduit la longueur de pénétration du champ magnétique en utilisant : (4π/c)j = rot B = rot rot A.
(11.34)
475
Physique de la matière condensée
Cette longueur de pénétration est appelée longueur de London :
λ T =
m ∗c 2 2
4π e ∗ ns∗ T
1 2
=
m ∗c 2 b 2
4π e ∗ a Tc − T
1 2
(11.35)
Cette longueur diverge à Tc comme (Tc − T )−1/2 mais le rapport de GinzburgLandau
λ T κ=
(11.36) ξ T est constant près de Tc : m ∗c κ= he ¯ ∗
b 2π
1 2
(11.37)
À basse température, quand le paramètre d’ordre prend sa valeur maximum, le comportement de ξ(T ), c’est-à-dire la plus courte distance sur laquelle ψ(r) peut s’annuler, est déterminé par la portée de l’état lié des paires d’électrons. Microscopiquement, cette portée est déterminée de la façon suivante : à l’énergie de condensation par électron 0 (c’est-à-dire l’énergie de liaison d’une paire de Cooper) on peut faire correspondre le temps caractéristique τ = h/π ¯ 0 . La portée de l’appariement responsable de l’état supraconducteur est ξ0 = τ vF si le libre parcours moyen l des électrons est très grand devant ξ0 . Dans cette limite des supraconducteurs purs :
ξ T = ξ0
Tc Tc − T
1 2
si
ξ0 =
hv ¯ F l π0
(11.38)
Dans la limite opposée des supraconducteurs impurs où l ξ0 , le mouvement des électrons est diffusif, contrôlé par une constante de diffusion : D=
lvF 3
Dans cette limite, la portée de l’état lié devient, à température nulle : √ ξ 0 Dτ = l ξ0 ce qui correspond à ξ T = l ξ0
476
Tc Tc − T
1 2
si
ξ0 l
(11.39)
11. Supraconductivité conventionnelle
Critère de Ginzburg Il existe une autre longueur, ξG , que nous avons discutée au Chapitre 3, qui s’introduit dans le critère de validité de l’approximation gaussienne. Nous avons vu que cette approximation restait correcte, c’est-à-dire qu’on pouvait négliger les termes d’ordre 4, tant que : 2
h¯ 2 1 ξ T < ξG = (11.40) 2m ∗ bkB Tc Les arguments phénoménologiques ne nous permettent pas de déterminer la valeur de ξG . Toutefois b peut être estimé soit à partir des données expérimentales, soit à partir de la théorie microscopique. Nous verrons que cette dernière aboutit à :
2 6π 2 kB Tc
b= 7ζ 3 εF n
(11.41)
où εF est le niveau de Fermi du métal normal et n = 1/ d’électrons du métal normal, ce qui correspond à : ξG = rs
h¯ 2 2m ∗ rs2
2
εF
3 ∼ kB Tc
εF kB Tc
4π 3 3 rs
est la densité
3 (11.42)
tandis que la valeur microscopique de a :
2 6π 2 kB Tc Tc − T
a =− Tc 7ζ 3 εF correspond à : 1 ξG = rs rs
h¯ 2 2m ∗ |a |
1 2
∼
εF kB Tc
(11.43)
(11.44)
Par conséquent :
εF 2 ξG ∼ ξ0 kB Tc est toujours très grand devant 1. Il faut se placer extrêmement près de Tc pour que l’approximation gaussienne cesse d’être valable. La largeur de la région critique peut être estimée par la condition ξG /ξ(T ) ∼ 1, soit : T ∼ Tc
kB Tc εF
4
< 10−8
(11.45)
477
Physique de la matière condensée
En pratique, les phénomènes critiques ne seront pas observables dans les supraconducteurs habituels. Ceci pourrait ne pas être vrai dans les supraconducteurs à haute température critique. En effet, alors qu’une valeur typique ξ0 ∼ 1000 nm est couramment observée dans les supraconducteurs usuels, des estimations de ξ0 ∼ 2 nm ont été rapportées dans La2−x Srx CuO4 . Ceci pourrait remettre en cause la validité du champ moyen dans ces supraconducteurs. Le succès considérable de la théorie de champ moyen dans les supraconducteurs conventionnels trouve son origine dans cette valeur élevée du rapport ξG /ξ0 . Ce rapport n’est pas autre chose que le nombre de paires de Cooper dans un volume ξ03 , où ξ0 est la dimension des paires de Cooper. Si ce nombre est grand devant 1, l’approximation de champ moyen est justifiée.
11.2.3 Quantification du fluxoïde Écrivons le paramètre d’ordre sous la forme ψ = |ψ| exp i ϕ, où |ψ| et ϕ sont des nombres réels. L’expression du supercourant (11.23) donne : ∗2
|ψ|2 A e e ∗ h¯ 2 j = − ∗ |ψ| ∇ϕ − (11.46) m m ∗c c’est-à-dire :
j m ∗c h¯ c A + 2 = − ∗ ∇ϕ e e ∗ |ψ|2
(11.47)
Intégrons cette équation sur un chemin fermé tout entier contenu dans le supraconducteur : m ∗c hc j ·dl ¯ A · d l + 2 = − ∇ϕ · d l (11.48) 2 e∗ |ψ| e∗ On peut réécrire le premier terme en utilisant le théorème de Stokes. D’autre part, on doit supposer que ψ, qui est un paramètre d’ordre, est une fonction univaluée (c’està-dire que cette fonction reprend la même valeur après un tour complet sur le circuit , puisqu’on retourne au même point). En effet, le paramètre d’ordre décrivant la phase ordonnée ne peut pas prendre deux valeurs différentes au même point. Alors, l’intégrale qui apparaît au membre de droite doit être un multiple de 2π : m ∗c hc j · dl B · d s + 2 = ±n ∗ (11.49) 2 e S |ψ| e∗
478
11. Supraconductivité conventionnelle
où S est la surface délimitée par le contour et n est un nombre entier. On voit donc que le fluxoïde défini par m ∗c j · dl (11.50) = B · ds + 2 S ns∗ e ∗ doit être égal à un nombre entier de quantums de flux hc e∗
(11.51)
= nφ0
(11.52)
φ0 =
Le deuxième terme dans l’expression du fluxoïde est une contribution additionnelle au flux du champ magnétique à travers la surface S, qui provient du supercourant induit. Si le contour est suffisamment éloigné des interfaces, alors j est exponentiellement petit et le fluxoïde se réduit au flux du champ magnétique S B · d s.
11.2.4 Les deux types de supraconducteurs Les données expérimentales sur l’effet Meissner, que nous avons présentées dans l’introduction, montrent deux types de comportements bien différents d’un supraconducteur sous champ. Dans le premier type, l’effet Meissner est total jusqu’à un champ critique faible Hc , où le supraconductivité disparaît complètement. Ce type de comportement est observé dans certains métaux purs où le libre parcours moyen électronique dans la phase normale est élevé, tels que l’Aluminium, l’Indium ou le Plomb. Dans le deuxième type, l’effet Meissner est total jusqu’à un champ Hc1 faible, puis audessus de Hc1 , on observe une phase mixte supraconducteur-métal normal, jusqu’au champ critique Hc2 , où tout le volume est devenu normal. Il n’y a pas de différence de mécanisme de la supraconductivité entre supraconducteurs de type I et de type II. Dans les deux cas, le mécanisme est celui d’une condensation de paires d’électrons formées par l’interaction attractive entre électrons induite par l’interaction électron-phonon. Les propriétés thermiques à la transition supraconducteur-normal sont les mêmes en champ nul. La différence entre les deux types est liée aux propriétés de pénétration du champ magnétique dans le métal supraconducteur [22], plus précisément à la valeur comparée de la longueur de pénétration λ et de la longueur de cohérence ξ . √ Si ξ ≥ λ 2, le supraconducteur sera de type I (figure 11.14). √ Si ξ < λ 2, le supraconducteur sera de type II (figure 11.15).
479
Physique de la matière condensée
B λ
Supraconducteur
Métal normal
Z
ξ ψ
Fig. 11.14 Variations du champ magnétique et du paramètre d’ordre à l’interface supraconducteurnormal pour un supraconducteur de type I. B λ
Z Supraconducteur
Métal normal
ξ ψ
Fig. 11.15 Variations du champ magnétique B et du paramètre d’ordre à l’interface supraconducteur-normal pour un supraconducteur de type II.
Diagramme de phase d’un supraconducteur de type I √ Dans le cas du type I, puisque ξ > λ 2, le paramètre d’ordre ne peut pas s’annuler sur la longueur de pénétration du champ. Donc celui-ci ne pénétrera pas en volume. Nous cherchons donc une solution de l’équation de Ginzburg-Landau pour laquelle ψ soit uniforme. Si les dimensions de l’échantillon sont grandes devant λ, nous avons B = 0 à l’intérieur de l’échantillon. Nous avons également ψ constant, solution qui minimise l’énergie libre à cause du terme de rigidité en |∇ψ|2 dans la fonctionnelle de Landau. On obtient alors la valeur uniforme du paramètre d’ordre : ψ = 0 ou 2 ψ = − a b
480
(11.53) (11.54) (11.55)
11. Supraconductivité conventionnelle
Puisque cette solution correspond à ∇ψ = 0, le courant, d’après l’équation (11.46) est donné par : ∗ 2 e |a| A (11.56) j=− ∗ m c b Ceci donne pour la profondeur de pénétration :
λ T =
m ∗c 2 2
4π e ∗ ns∗ T
1 2
=
m ∗c 2 b 2
4π e ∗ a Tc − T
1 2
La dépendance en température de λ, dans le cadre de l’approximation de Landau est de la forme (11.57) λ ∼ |t |−1/2 ce qui, près de Tc , est en accord avec la loi empirique de Gorter-Casimir [23] −1/2 T λ ∼ 1 − ( )4 Tc
(11.58)
(qui rend bien compte de l’expérience). La phase supraconductrice reste stable jusqu’à un champ critique Hc . Le champ Hc est celui où le coût d’énergie diamagnétique pour annuler B dans le volume supraconducteur compense le gain d’énergie libre associé à la formation de la phase supraconductrice. Les fonctions de Gibbs des phases normale et supraconductrice sont respectivement : |a|2 Ha2 (11.59) Gs = Fn − + 2b 8π Gn = Fn (11.60) où est le volume de l’échantillon et Ha le champ magnétique appliqué. Pour obtenir ce résultat, on écrit que dans une transformation isotherme, les variations de la fonction de Gibbs G = U − TS − H · M sont données par
dG = −SdT − M · d H
(11.61)
d’où, à température constante :
G H =G H =0 −
0
H
M · d H
481
Physique de la matière condensée
Dans la phase supraconductrice homogène, nous avons M = −H/4π . D’où : Gs (H ) = Gs (0) +
H2 8π
(11.62)
alors que dans la phase normale, l’aimantation est nulle (ou négligeable) Gn (H ) Gn (0)
(11.63)
Le champ critique est donné par : Gn − Gs =
Hc2 a2 = 8π 2b
(11.64)
La dépendance en température près de Tc , Hc ∼ (Tc − T ) est en accord avec la forme de Gorter-Casimir. La transition de phase à Hc est du premier ordre, avec une énergie de condensation donnée par l’énergie du champ. En fonction du champ, ψ garde la valeur constante ( |a| /b)1/2 jusqu’à Hc , puis tombe à 0 de façon discontinue, d’où le caractère premier ordre de la transition au sens de Landau. Le diagramme de phase est schématisé sur la figure 11.16.
Fig. 11.16 Diagramme de phase d’un supraconducteur de type I sous champ magnétique.
Il existe une différence d’entropie entre les deux phases S et donc une chaleur latente associée T S . La phase supraconductrice étant la plus ordonnée, elle a l’entropie la plus basse. Si l’expérience est faite de façon isotherme, l’échantillon absorbe de l’extérieur une certaine quantité de chaleur en passant de la phase supraconductrice à la phase normale. L’entropie de chacune des deux phases est donnée par S = −(∂G /∂T )H , ce qui donne : Ss = Sn + (
482
Hc ∂Hc )( ), 4π ∂T
soit S ∼
T Tc
(11.65)
11. Supraconductivité conventionnelle
À T 0, Hc pour des matériaux de type I vaut typiquement 100 − 1000 gauss. Hc est appelé le champ critique thermodynamique.
Diagramme de phase d’un supraconducteur de type II √ Dans le cas du type II, puisque ξ < λ 2, le paramètre d’ordre peut s’annuler sur une longueur de pénétration du champ. On est donc amené à supposer qu’il peut donc y avoir inclusion d’un volume de phase normale dans la phase supraconductrice. Nous allons d’abord nous poser la question simplifiée de la stabilité de cet état mixte en supposant qu’il existe, près du champ critique Hc1 une seule inclusion cylindrique de phase normale dans le volume supraconducteur. L’axe de ce cylindre est parallèle au champ appliqué. Cette inclusion de phase normale fait intervenir deux contributions à l’énergie : H2 (11.66) 1) G1 c πξ 2 8π Cette première contribution représente l’énergie de formation d’un cylindre normal inclus dans la phase supraconductrice, de rayon ξ . Ce terme représente le coût d’énergie de formation de la phase normale, en supposant que le paramètre d’ordre s’annule totalement à l’intérieur du cylindre et soit égal à la valeur de la phase uniforme en l’absence de champ, à l’extérieur du cylindre 2)
G2 −
Ha2 2 πλ 8π
(11.67)
Cette seconde contribution à l’énergie vient de la pénétration du champ appliqué dans le supraconducteur, sur une distance de l’ordre de λ. Ici encore, on a supposé que le champ s’annulait totalement à l’extérieur d’un cylindre de rayon λ et qu’il restait égal à Ha à l’intérieur du cylindre. L’énergie du supraconducteur est donc abaissée de la quantité G2 par rapport au supraconducteur sans inclusion normale, placé dans le même champ appliqué Ha . En effet, dans ce volume, on n’a pas à fournir l’énergie diamagnétique nécessaire pour annuler le champ appliqué. On peut mettre G1 + G2 sous la forme : G = GN + GS
(11.68)
où GN = πξ 2 (Hc2 − Ha2 )/8π est la contribution de la région normale et GS = −π Ha2 (λ2 − ξ 2 )/8π est la contribution de la région supraconductrice, ce qui correspond à une énergie libre de paroi. Dans un supraconducteur de type I, l’énergie libre de paroi GS est positive, mais dans un supraconducteur de type II, elle est négative : GS < 0.
483
Physique de la matière condensée
Estimation de Hc1 Le potentiel thermodynamique de l’état mixte comprenant un seul cylindre de phase normale est :
π 2 2 GMixte = ξ Hc − λHa2 8π par unité de longueur. La formation du volume cylindrique normal devient favorable quand GMixte devient négatif (l’origine des énergies est l’état supraconducteur homogène soumis au champ appliqué Ha ). Le champ seuil qui commence à stabiliser la phase mixte est noté Hc1 ξ Hc1 = Hc (11.69) λ Donc le champ Hc1 est toujours inférieur à Hc pour un supraconducteur de type II.
Étude d’un vortex isolé à Hc1 Cette estimation de Hc1 est très satisfaisante en ordre de grandeur. On peut souhaiter, cependant, une dérivation moins approchée. Pour l’étude détaillée du volume de phase normale (qu’on appelle un vortex) et pour une détermination plus précise du champ critique Hc1 , il faut retourner aux équations de Ginzburg-Landau. On considère le problème de l’inclusion d’un seul volume de phase normale à symétrie axiale dans le volume supraconducteur (état à un seul vortex). À cause de la symétrie axiale ψ(r) et B(r) ne dépendent que de la variable r , distance à l’axe des coordonnées cylindriques. On cherche à calculer ε1 , énergie libre excédentaire par unité de longueur (selon l’axe du cylindre) de vortex. Ceci détermine Hc1 de la façon suivante : par définition, quand H = Hc1 , l’énergie libre de Gibbs doit avoir la même valeur, que le vortex soit présent dans l’échantillon ou non. Gs (Hc1 ) = GMixte (Hc1 )
(11.70)
où GMixte est la fonction de Gibbs de la phase mixte à un seul vortex. Or, puisque H G =F − (11.71) Bd 3 r 4π
Bd 3 r 4π Hc1 φ0 L = Fs + ε1 L − 4π
Fs = Fs + ε1 L −
Hc1
(11.72) (11.73)
où L est la longueur de la ligne de vortex dans l’échantillon et Fs est l’énergie libre de la phase supraconductrice homogène. Nous avons admis dans le calcul de l’expression ci-dessus que l’inclusion du premier vortex au champ critique Hc1 correspondait au plus petit flux réalisable dans l’échantillon qui soit compatible avec la quantification
484
11. Supraconductivité conventionnelle
du flux, soit un quantum de flux φ0 = hc/2e . D’où : Hc1 =
4πε1 φ0
(11.74)
Étant donné la symétrie axiale, on recherche une fonction d’onde de vortex de la forme (11.75) ψ = ψ∞ f (r ) exp i θ Cette forme particulière assure de plus que la phase de ψ varie de 2π après un circuit complet autour de l’axe du vortex, ce qui correspond à un seul quantum de flux associé au vortex (d’après les équations 11.48 et 11.49). Ce choix de phase pour ψ fixe le choix de jauge pour A : A = A(r )uθ (11.76) avec
r
1 r h r dr
A(r ) = r 0
(11.77)
Près du centre du vortex, ceci devient : A(r ) = h(0)
r 2
(11.78)
φ0 2π r
(11.79)
tandis que loin du centre d’un vortex isolé : A(r ) = A∞ =
puisque le flux total contenu est A · d s = 2πrA∞ = φ0
(11.80)
Après substitution dans l’équation de Ginzburg-Landau, on trouve que f doit satisfaire l’équation : df 1d 1 2πA 2 3 2 r f −f −ξ f − − =0 (11.81) r φ0 r dr dr tandis que le courant n’a de composante que selon uθ : c d 1d
c dh(r ) = rA j =− 4π dr 4π dr r dr ∗ e h 2 2 1 2πA f = ∗ ψ∞ − m r φ0
(11.82) (11.83)
485
Physique de la matière condensée
Le calcul de ψ, B et ε1 pour une valeur arbitraire de κ = λ/ξ requiert une solution numérique des équations de Ginzburg-Landau, mais on peut obtenir simplement le comportement dans certains cas limites. Ainsi, d’après le comportement pour r → 0 et r → ∞, on peut montrer que : f tanh
r ξ
(11.84)
est une approximation raisonnable pour tout r . Un cas particulièrement simple est celui des supraconducteurs de type II extrême où λ ξ . Alors, en dehors d’une région de coeur de rayon ≈ ξ , on peut traiter f comme une constante ≈ 1. Donc, en dehors du coeur (d’après 11.33) : 4πλ2 rot j + B = 0 (11.85) c Si cette relation était valable partout, le fluxoïde serait nul pour tout contour. Nous corrigeons ceci en insérant un terme qui prenne en compte la présence du coeur, si bien que : 4πλ2 (11.86) rot j + B = φ0 δ2 (r )uz c où δ2 (r ) est une fonction delta bidimensionnelle et uz un vecteur unitaire selon l’axe du vortex. Ceci combiné avec l’équation de Maxwell donne : λ2 rot rot B + B = φ0 δ2 (r )uz
(11.87)
ce qui avec divB = 0, peut être écrit : ∇ 2B −
B φ0 = − 2 δ2 (r )uz λ2 λ
(11.88)
r φ0 K 0 2πλ2 λ
(11.89)
Cette équation a la solution exacte : B(r ) =
Les comportements asymptotiques de h(r ) sont les suivants : φ0 B(r ) → 2πλ2 B(r )
486
πλ 2r
1 2
r λ
exp −
λ φ0 ln + 0, 12 2 2πλ r
pour r → ∞
(11.90)
pour ξ r λ
(11.91)
11. Supraconductivité conventionnelle
Cherchons maintenant l’énergie libre par unité de longueur de vortex ε1 . En négligeant le coeur, nous ne conservons que les contributions provenant de l’énergie du champ et de l’énergie cinétique des courants :
2 1 ε1 = (11.92) B + λ2 |rotB|2 ds 8π Ceci peut être transformé à l’aide d’une identité vectorielle :
1 λ2 2 ε1 = B + λ rot rot B · Bds + B × rot B · d s 8π 8π 2
λ 1 |B| φ0 δ2 (r )ds + B × rot B · d s (11.93) = 8π 8π où les intégrales de contour sont prises suivant les périmètres intérieur et extérieur de la surface d’intégration. Puisque l’intégration exclut le coeur, la contribution du premier terme est nulle. Le second terme donne zéro à l’infini, mais sa contribution est finie pour un contour entourant le coeur : λ2 dB ε1 = (11.94) B 2πr 8π dr ξ avec dB/dr = φ0 /2πλ2 r : ε1 =
φ0
φ0
B ξ B 0 8π 8π
(11.95)
où B(ξ ) ≈ B(0) parce que f → 0 et donc j → 0 dans le coeur. À cause de la dépendance seulement logarithmique en fonction de la taille du coeur, le résultat est fiable malgré le traitement grossier du coeur. Cette expression de ε1 permet de calculer Hc1 . La structure d’un vortex est schématisée dans les figures 11.17 et 11.18.
Fig. 11.17 Structure d’un vortex isolé : le paramètre d’ordre supraconducteur s’annule dans le coeur du vortex, volume de symétrie axiale dont le rayon est la longueur de cohérence. Le champ magnétique s’étend sur une région dont le rayon est donné par la longueur de pénétration de London.
487
Physique de la matière condensée
Fig. 11.18 Distribution de courant dans un vortex isolé.
Le coeur de la ligne de vortex, de taille ∼ ξ , est dans l’état normal et contient la plus grande partie du flux, mais le champ s’étend dans la région supraconductrice sur une distance ∼ λ. J est la densité de courant, ns la densité d’électrons supraconducteurs. Chaque ligne de vortex contient un quantum de flux hc/e ∗ . L’ensemble possède la symétrie de révolution autour de H.
Estimation de Hc2 Près du champ critique supérieur, les cylindres normaux forment un réseau compact, de symétrie triangulaire. Cette structure a pu être observée, d’abord par diffraction de neutrons, puis par différentes techniques d’imagerie. Le champ appliqué s’infiltre dans le spécimen de façon presque uniforme, avec de petites ondulations à l’échelle du réseau de cylindres normaux. Pour calculer Hc2 , nous devons résoudre les équations de Ginzburg-Landau. La difficulté provient du fait qu’il s’agit d’équations différentielles non-linéaires couplées. Nous pouvons simplifier le problème en le traitant dans le cadre d’une théorie de Landau-Ginzburg linéarisée. Tout d’abord nous allons négliger le terme non-linéaire b |ψ|2 ψ. Cette omission ne sera justifiée que si |ψ|2 |ψ∞ |2 = −a/b, car quand ψ ∼ ψ∞ le terme en b est du même ordre que le terme en a que nous gardons. Par conséquent, cette théorie linéarisée ne sera appropriée que lorsque le champ aura réduit ψ à une valeur très petite devant ψ∞ . En utilisant la relation entre a et ξ , on peut écrire la forme linéarisée de l’équation différentielle :
2π A ∇ − i φ0
2 ψ =−
2m ∗ a h¯
2
ψ=
ξ2
ψ
T
(11.96)
Une simplification supplémentaire essentielle vient du fait que dans l’équation cidessus A = Aext , car tous les effets d’écran dûs aux supercourants sont proportionnels à |ψ|2 , et par conséquent conduisent à des termes d’ordre supérieur qu’on peut négliger dans notre théorie linéarisée. Donc, dans cette approximation, la seconde équation de Ginzburg-Landau, donnant le courant, est découplée de la première, qui donne ψ, d’où une grande simplification mathématique.
488
11. Supraconductivité conventionnelle
Notons que l’équation linéarisée est identique à l’équation de Schrödinger d’une particule libre de masse m ∗ et de charge e ∗ dans un champ magnétique B = rot A, où −a = |a| joue le rôle de valeur propre de l’énergie. Cette analogie nous permet d’appliquer des méthodes ou des solutions familières de la mécanique quantique directement à la théorie de la supraconductivité. En particulier, on peut déterminer les champs pour lesquels des solutions de l’équation de Ginzburg-Landau existent, et par conséquent les champs pour lesquels des solutions des équations non-linéaires complètes de Ginzburg-Landau sont possibles avec une amplitude infinitésimale, simplement en égalant 1/ξ 2 (T ) avec les valeur propres dépendant du champ de l’opérateur (∇/i − 2πA/ϕ0 )2 . Les valeurs du champ déterminées de cette façon correspondent aux champs critiques pour des transitions de phase du second ordre, ou si la transition est du premier ordre, au champ de nucléation qui correspond à la limite de métastabilité. Nous allons appliquer cette méthode au problème de la nucléation de la supraconductivité en volume en présence d’un champ H aligné le long de z . Nous utilisons la jauge A = (0, Hx, 0). L’équation de Ginzburg-Landau linéarisée s’écrit : 2 4i π ∂ 1 2π H Hx x2 ψ = 2 ψ (11.97) + −∇ 2 + φ0 ∂y φ0 ξ Puisque le potentiel effectif ne dépend que de x , il est raisonnable de chercher une solution de la forme (11.98) y = f (x ) exp i (ky y + kz z ) En substituant dans l’équation, on trouve : −f "(x ) +
2πH φ0
2
x − x0
2
f =
1 2 − kz f ξ2
(11.99)
où x0 = ky φ0 /2π H . On voit que le terme de phase exp iky y déplace seulement la position du minimum du potentiel effectif, ce qui, dans un échantillon infini ne joue aucun rôle. On obtient tout de suite la solution de l’équation ci-dessus en notant (après multiplication par h¯ 2 /2m ∗ ) qu’elle est identique à une équation de Schrödinger pour une particule de masse m ∗ dans un potentiel d’oscillateur harmonique de constante de force (2π h¯ H /φ0 )2 /m ∗ . Le problème est formellement équivalent à la recherche des états propres quantiques d’une particule normale chargée dans un champ magnétique. Ceci conduit aux niveaux de Landau séparés par l’énergie cyclotron hω ¯ c . Les valeurs propres correspondantes sont : ∗ e H 1 1 h¯ ωc = n + h¯ ∗ εn = n + (11.100) 2 2 m c
489
Physique de la matière condensée
Ceci doit être égalé à (h¯ 2 /2m ∗ )(ξ −2 − kz2 ). On obtient donc : φ0 1 2
− kz H = 2 ξ 2π 2n + 1
(11.101)
La valeur la plus élevée possible, qui correspond évidemment à kz = 0 et n = 0, définit le champ critique Hc2 : Hc2 =
φ0
2πξ 2 T
(11.102)
C’est le champ le plus élevé auquel la phase supraconductrice peut être nucléée dans le volume d’un grand échantillon dans un champ extérieur décroissant. La fonction propre correspondante est :
(x − x0 )2 f (x ) = exp − 2ξ 2
(11.103)
On peut relier cette expression de Hc2 au champ critique thermodynamique : Hc2 =
√ φ0 4πλ2 Hc2 = = κ 2Hc φ0 2πξ 2 T
(11.104)
√ Cette équation montre bien que la valeur κ = 1/ 2 sépare les matériaux pour lesquels Hc2 > Hc , c’est-à-dire les supraconducteurs de type II, de ceux pour lesquels Hc2 < Hc , c’est-à-dire les supraconducteurs de type I. Comme la signification de Hc2 est celle d’un champ de nucléation, ces inégalités impliquent que dans un champ décroissant, les supraconducteurs de type II deviennent supraconducteurs selon une transition de phase du second ordre avec |ψ|2 croissant continûment à partir de zéro) avec Hc2 > Hc . Au contraire, dans le cas des supraconducteurs de type I, la solution obtenue ici correspond à un état normal métastable maintenu jusqu’à la limite de métastabilité Hc2 < Hc . En ce point, la nucléation se produit avec un saut irréversible de |ψ|2 à la valeur |ψ∞ |2 . Le diagramme de phase d’un supraconducteur de type II sous champ magnétique est schématisé dans la figure 11.19. Les deux lignes de transition sont du second ordre. Pour H < Hc1 (T ), l’effet Meissner est total : le champ ne pénêtre pas en volume dans la région supraconductrice. Pour Hc1 (T ) < H < Hc2 (T ), il y a effet Meissner partiel ; il y a formation de lignes de vortex dont le coeur est normal et qui permettent au champ de pénétrer. Pour H > Hc2 (T ), on retrouve la phase normale de conductivité finie.
490
11. Supraconductivité conventionnelle
Fig. 11.19 Diagramme de phase d’un supraconducteur de type II sous champ magnétique.
11.3 La théorie de Bardeen-Cooper-Schrieffer 11.3.1 Introduction Nous avons vu au paragraphe précédent comment la théorie phénoménologique permettait d’interpréter les effets quantiques macroscopiques observés dans l’état supraconducteur. Cette théorie est tout entière fondée sur l’hypothèse de Ginzburg et Landau que l’ordre supraconducteur peut être décrit par un paramètre d’ordre complexe |ψ| exp i ϕ(r) avec son amplitude, mais aussi sa phase bien définie. C’est cette cohérence de la phase, qui brise l’invariance de jauge, qui caractérise les propriétés quantiques de l’état supraconducteur. Il suffit alors d’appliquer les méthodes générales de la théorie de Landau des transitions de phase. Quels que soient les succès de cette théorie phénoménologique, elle ne nous renseigne évidemment pas sur les mécanismes microscopiques mis en jeu. C’est la théorie microscopique de Bardeen-Cooper-Schrieffer [24] qui le fera. Cette dernière explique remarquablement bien toutes les propriétés microscopiques et thermodynamiques. Le succès de cette théorie, comme celui de l’approche de Ginzburg-Landau, est lié à la validité de l’approximation de champ moyen. Rappelons que le critère de cette validité est ξG ξ(T ) (voir chapitre 3). La détermination microscopique de ces deux longueurs montre que cette inégalité reste vraie jusqu’à des températures très proches du point critique. L’idée de base est que le fondamental dans l’état normal (tous les états électroniques occupés à l’intérieur de la surface de Fermi, vides à l’extérieur) devient instable, en présence d’une interaction attractive entre électrons, vis-à-vis de l’appariement d’électrons en paires (k ↑, −k ↓). L’énergie de liaison qui en résulte sépare les états excités du fondamental par un gap d’énergie. Le champ critique, les propriétés thermiques et la plupart des propriétés électromagnétiques sont des conséquences de ce gap.
491
Physique de la matière condensée
L’origine de la supraconductivité repose donc, de façon essentielle, sur l’existence d’une interaction effective entre électrons, qui, dans certaines conditions ou dans certaines parties de l’espace des phases, devient attractive. L’idée, initialement, est due à Fröhlich, qui, en premier, en a proposé le mécanisme [25]. L’effet isotopique a joué sur ce point, historiquement, un rôle important. En effet, expérimentalement, la supraconductivité apparaissait comme une transition de phase du second ordre concernant le gaz d’électrons : il se produisait, à la température critique, une condensation d’une fraction de la densité électronique en un fluide parfait de viscosité nulle, sans qu’apparemment les degrés de liberté du réseau soient concernés. Ce que montrait l’effet isotopique, c’était que la masse ionique, c’est-à-dire les fréquences de phonons jouait un rôle dans cette transition électronique. L’idée de Fröhlich fut de penser que les phonons intervenaient, par l’intermédiaire de l’interaction électronphonon, dans l’interaction effective entre électrons. C’est bien, en effet l’interaction électron-phonon qui est responsable de l’interaction attractive entre électrons induisant l’instabilité supraconductrice. Très grossièrement, le mécanisme est le suivant : un électron interagit avec le réseau et le déforme, laissant un « sillage » de charges positives derrière lui. Grâce à l’inertie des ions, un deuxième électron sera sensible au réseau déformé et à cette accumulation de charges positives et s’ajustera de façon à bénéficier de la déformation du réseau et à abaisser ainsi son énergie. On comprend que l’interaction électron-phonon permette d’induire une interaction attractive indirecte entre électrons, par l’intermédiaire du champ de déformation du réseau, c’est-à-dire du champ de phonons. Il est important de noter que, dans cet effet, l’inertie des ions joue un rôle essentiel. C’est parce que le réseau réagit avec retard à l’effet du premier électron qu’un deuxième électron pourra bénéficier de l’accumulation de charges positives. Pour que l’effet soit important, il est nécessaire que le rapport entre les énergies typiques de phonons, c’està-dire hω ¯ D , où ωD est la fréquence de Debye et les énergies typiques des électrons, c’est-à-dire l’énergie de Fermi εF , soit suffisamment faible. Cette question a été étudié, notamment par Mygdal. Quand ce rapport devient trop grand, la température critique tendra à diminuer, parce que les électrons ne se comporteront plus de façon adiabatique vis à vis des vibrations du réseau. Cette interaction effective entre électrons peut rester importante jusqu’à très basse température, car la présence de phonons excités thermiquement n’est pas nécessaire. Elle est même en réalité défavorable. On peut décrire le processus de la façon suivante : le premier électron émet un phonon virtuel qui est réabsorbé par le deuxième électron. Cet échange de phonon virtuel subsiste jusqu’à température nulle (figure 11.20). Nous ne donnerons ici qu’une discussion très simplifiée de cette interaction. La transformée de Fourier de l’interaction de Coulomb électron-phonon doit être écrantée par la constante diélectrique. Ceci a pour effet de remplacer l’interaction nue 4πe 2 /q 2 par : 4π e 2 4π e 2 = (11.105) εel q 2 q 2 + q02
492
11. Supraconductivité conventionnelle
Fig. 11.20 Diagramme schématisant le processus conduisant à l’interaction attractive entre électrons par échange de phonon virtuel.
où εel est la constante diélectrique du gaz d’électrons et q0 le vecteur d’onde de Thomas-Fermi. Cette expression représente l’effet d’écran des autres électrons sur l’interaction entre deux électrons donnés. Mais il faut tenir compte également de l’effet d’écran dû aux ions, c’est-à-dire qu’il ne suffit pas d’utiliser la constante diélectrique électronique, mais la constante diélectrique totale. Si on se place dans le modèle du Jellium, par exemple, pour décrire le système d’électrons et d’ions, l’interaction effective écrantée entre électrons s’écrit [26] : 4πe 2 ωph (q)2 4π e 2 = 2 1+ 2 (11.106) Veff q = εT q 2 ω − ωph (q)2 q + q02 où εT est la constante diélectrique totale du jellium et ωph (q) est la fréquence de phonon. Le facteur entre crochets décrit la correction due au mouvement des ions. Ce facteur dépend à la fois de la fréquence et du vecteur d’onde. Cette dépendance en fréquence traduit le fait que l’interaction n’est pas instantanée, mais retardée, limitée par la vitesse de propagation des ondes élastiques, petite devant la vitesse de Fermi des électrons vF . Étant donné deux électrons de vecteurs d’onde k et k et d’énergies εk et εk leur énergie d’interaction effective s’écrit :
ωph (q)2 4π e 2
1+ 2 (11.107) Veff k, k = 2 ω − ωph (q)2 q + q02 avec q = k − k et hω ¯ = (εk −εk ). Cette interaction présente deux caractéristiques qualitatives importantes : – La fréquence des phonons ωph (q) est au plus de l’ordre de la fréquence de Debye ωD . Donc quand les énergies des deux électrons diffèrent de plus de h¯ ωD , la correction apportée par les phonons sera faible. Comme εF / h¯ ωD ∼ 102 − 103 , où εF est l’énergie de Fermi des électrons, typiquement, seuls les électrons d’énergie très voisines seront sensiblement affectés.
493
Physique de la matière condensée
– Cependant, quand la différence entre les énergies des électrons est inférieure hω ¯ D, la contribution des phonons a le signe opposé de celui de l’interaction de Coulomb écrantée par les électrons et est plus grande en module : le signe de l’interaction effective est inversé. La dépendance en fréquence de Veff (q, ω) est illustrée schématiquement sur la figure 11.21.
Fig. 11.21 Allure schématique de la dépendance en fréquence de l’interaction effective entre électrons.
Un résultat tout à fait analogue peut être obtenu dans un modèle moins simpliste que celui du jellium, où l’on traite le réseau par un hamiltonien d’oscillateurs harmoniques représentant les modes normaux de phonons, couplés aux électrons par un hamiltonien d’interaction électron-phonon : + + (11.108) gq ck+q ck aq − a−q Hep = i k,q
où les opérateurs c et c + sont des opérateurs de fermions et les opérateurs a et a + sont des opérateurs de bosons. gq est une constante de couplage complexe, que nous supposerons, pour simplifier, réelle et indépendante de q. Au premier ordre, Hep introduit une diffusion des états électroniques et contribue à la résistivité électrique. Au second ordre, Hep modifie les énergies propres des électrons et conduit à un couplage entre électrons. Ce couplage est une interaction indirecte à travers le champ de phonon. Un électron polarise le réseau ; l’autre électron interagit avec cette polarisation. L’hamiltonien total décrivant les électrons et le réseau couplés s’écrit : H = H0 + Hep + + = εk ck+ ck + ωq aq+ aq + i gq ck+q ck aq − a−q (11.109) k
494
q
k,q
11. Supraconductivité conventionnelle
Nous opérons maintenant une transformation canonique pour trouver un nouvel hamiltonien :
(11.110) H = exp −S H exp S qui ne contienne plus de termes non-diagonaux du premier ordre en g . Pour cela, les éléments de matrice de S doivent vérifier : n| S |m =
n| H |m Em − En
(11.111)
Pour obtenir le couplage électron-électron effectif, il convient de prendre l’élément de matrice sur les opérateurs de phonons, mais en gardant explicitement la dépendance en opérateurs d’électrons. Nous considérons ici que le système de phonons est au zéro absolu, de sorte que soit l’état |n soit l’état |m ci-dessus se rapporte à l’état vide de phonon ; en fait l’extension du calcul à température finie est immédiate et montre que le résultat final est en réalité indépendant de l’excitation de phonons. Les éléments de matrice de S qui interviennent sont alors :
+ ck−q ck nq = 1 S nq = 0 = −ig k
1 εk − εk−q − ωq
nq = 0 S nq = 1 = +ig ck+ +q ck
k
1 ε + ωq − εk +q k
(11.112) (11.113)
Le développement des exponentielles dans l’expression de H conduit, après un calcul de récurrence à : 1 H = H0 + [H S ] + O(g 3 ) (11.114) 2 d’où, à l’ordre 2 en g : 1 + 1 1 +
H = H0 + ck +q ck ck−q ck − 2 εk − εk−q − ωq εk − εk +q + ωq
q,k,k
(11.115) Nous regroupons les termes correspondant à des vecteurs d’onde de phonons +q et −q dans l’état intermédiaire. Le terme en −q donne une contribution de la forme, en utilisant ωq = ω−q : 1 1 + + (11.116) ck −q ck ck+q ck − εk − εk+q − ωq εk − εk −q + ωq
k,k
495
Physique de la matière condensée
En interchangeant k et k et en réordonnant les opérateurs, la somme du terme q et du terme −q donne : 4ωq 1 2 + + ck +q ck ck−q ck g
2 4 − ε − ωq2 ε
k k−q q,k,k
(11.117)
si bien que l’interaction électron-électron peut être écrite : H" = g2
ωq + ck+ +q ck ck−q ck
2 εk − εk−q − ωq2 q,k,k
(11.118)
La dépendance en fréquence est importante. Elle montre qu’il s’agit d’une interaction retardée, où l’inertie des ions joue un rôle capital. L’interaction électron-électron est attractive pour des énergies d’excitations εk±q − εk < ωq . Sinon, elle est répulsive. Même dans la région attractive, l’interaction entre en compétition avec la répulsion coulombienne écrantée, mais pour une valeur suffisamment élevée de la constante de couplage g , l’interaction induite par les phonons est dominante. Notons qu’on pourrait également envisager une interaction effective attractive entre électrons qui ne serait pas due à l’émission puis la réabsorption d’un phonon, mais plus généralement à l’échange entre électrons d’un boson (ou d’un « quasi-boson ») qui ne serait plus un phonon, mais par exemple un magnon ou un « paramagnon », un plasmon, un exciton, etc. Deux électrons peuvent former un état lié en construisant une fonction d’onde qui utilise sélectivement la partie attractive du potentiel d’interaction. Dans un premier temps, au lieu d’utiliser la forme complète de Veff (q, ω) et de sommer sur tous les modes de phonons (ce qui doit être fait, en principe, pour des comparaisons quantitatives avec les métaux réels) on peut se contenter, comme BCS, d’utiliser une forme-modèle approchée :
V V q, ω = − 2 =0
si εF − hω ¯ D < εk et εk±q < εF + h¯ ωD sinon.
(11.119)
On considère que l’interaction de deux électrons est attractive et d’amplitude constante si les vecteurs d’onde k et k ± q se trouvent dans une coquille de l’espace des k de largeur en énergie 2hω ¯ D εF . En effet, il faut que, tout en conservant l’énergie, l’émission ou l’absorption de phonon soit accompagnée d’une transition électronique permise par le principe de Pauli, donc entre un état occupé et un état vide. Ceci conduit à un hamiltonien simplifié qui s’écrit, dans l’ensemble grand-canonique : HBCS = H − μN =
k,σ
496
+ ξk ckσ ckσ
V + − c ck,σ ck+ −q,σ ck ,σ (11.120) 2 k+q,σ k,k ,q σ ,σ
11. Supraconductivité conventionnelle
N est le nombre d’électrons, μ le potentiel chimique, le volume du système.
signifie que la sommation doit être effectué sur l’espace des phases Le symbole représentées sur la figure 11.22, où l’interaction attractive entre électrons est supposée non nulle et égale à V /2. Les ξk sont les énergies à un électron repérées par rapport au niveau de Fermi μ.
Fig. 11.22 Dans un modèle simplifié, on considère que les électrons interagissent entre eux par une interaction attractive constante et limitée à une petite région de l’espace des phases autour de la surface de Fermi.
11.3.2 L’appariement des électrons – Les paires de Cooper L’idée très qualitative pour expliquer la supraconductivité est de considérer que l’interaction attractive entre électrons conduit à la formation d’états liés, c’est-à-dire de paires électron-électron qui se comportent comme des bosons et présentent, à suffisamment basse température, le phénomène de condensation de Bose-Einstein. Cette condensation conduit à une cohérence de phase (voir chapitre 3), cet ingrédient qui est à la base de la théorie de Ginzburg-Landau. Nous verrons dans le paragraphe suivant que cette vision est beaucoup trop simplifiée, car les paires d’électrons interagissent fortement entre elles et il faut prendre en compte l’aspect coopératif du phénomène. Toutefois, l’appariement des électrons en paires de Cooper [27] constitue bien la clé qui permet de décrire l’état ordonné cohérent. Pour illustrer simplement, nous discuterons, à la suite de Cooper, le problème, extrêmement simplifié, de deux électrons interagissant par l’intermédiaire de l’interaction attractive, en présence de la mer de Fermi de tous les autres électrons, supposés sans interaction.
497
Physique de la matière condensée
Nous avons donc affaire à un problème à deux corps, où les forces ne dépendent pas du spin. Le système étant invariant par translation, la quantité de mouvement du centre de masse hq ¯ est une constante du mouvement.
2 Soit s le spin total, ρ = r1 − r2 la coordonnée relative, R = r1 +r 2 celle du centre de masse. On écrit la fonction d’onde à deux électrons sous la forme :
ψ(r1 , r2 ) = ϕ(ρ) exp i q · R |s >
(11.121)
Nous allons chercher les états de la paire où : q = 0, s = 0 ak exp i k · ρ = ak exp i k · r1 exp −i k · r2 ϕ ρ = k>kF
(11.122)
k
que nous écrirons sous la forme : |ϕ =
ak0 ϕk0
(11.123)
k0
avec
ϕk = √1 c + c + − c + c + 0 k0 ↓ −k0 ↑ |F 2 k0 ↑ −k0 ↓
(11.124)
où |F représente l’état des N électrons sans interaction qui occupent la mer de Fermi. L’équation de Schrödinger s’écrit : E |ϕ >= HBCS |ϕ >= (H0 + Hint )|ϕ > + ? Quelle est l’action de HBCS sur ck+0 ↑ c−k 0↓
Les termes
non orthogonaux à ϕk0 proviennent de : k,
σ ≡ k0 , ↑ et k , σ ≡ −k0 , ↓ et de l’autre choix inversé, c’est-à-dire k, σ ≡ −k0 , ↓ et k , σ ≡ k0 , ↑
+ |F HBCS ck+0 ↑ c−k 0↓
=
+ |F − 2ξk0 ck+0 ↑ c−k 0↓
V
k1 =k0 +q
+ |F ck+1 ↑ c−k 1↓
+termes orthogonaux
(11.125)
ce qui donne : HBCS |ϕ =
k
V 2ξk ak |ϕk − ak |ϕk = E |ϕ
k,k
+termes orthogonaux
498
(11.126)
11. Supraconductivité conventionnelle
En intervertissant k et k dans le deuxième terme, on écrit que les fonctions |ϕk sont linéairement indépendantes :
V ak
Eak = 2ξk −
(11.127)
k
où la somme sur k ,
est restreinte à : k > kF et ξk < h¯ ωD
Si on pose
ak = A
(11.128)
1 AV E − 2ξk
(11.129)
k
on peut écrire : ak = Sommons sur k :
k
c’est-à-dire :
V A ak = − E − 2ξk
(11.130)
k
V 1 1=− E − 2ξk
(11.131)
k
On remplace la somme discrète sur le quasi-continuum par une intégrale :
hω ¯ D n ξ dξ 1=V (11.132) 2ξ − E o où la densité d’états en énergie n(ξ ) peut être remplacée par une constante n(EF ) sur l’intervalle d’énergie de largeur hω ¯ D EF : 1=
−E + 2hω V ¯ D
n(EF ) ln 2 −E
soit : E =−
hω ¯ D 2 exp Vn(E −1 F)
(11.133)
(11.134)
Dans la limite de couplage faible, c’est-à-dire pour Vn(EF ) 1 : E = −2hω ¯ D exp −
2 Vn(EF )
(11.135)
499
Physique de la matière condensée
Il existe donc un état lié d’énergie négative. Ceci signifie que l’état normal est instable. En effet, deux électrons à la surface de Fermi forment spontanément un état lié, même pour une interaction attractive arbitrairement faible. Ce phénomène conduit donc à une instabilité de la surface de Fermi. Il faut comprendre que l’existence de la mer de Fermi joue un rôle capital dans le problème de Cooper, à cause du Principe de Pauli qui interdit l’occupation des états de la mer de Fermi par deux électrons. L’instabilité pour une interaction arbitrairement faible n’existerait pas pour deux électrons isolés, comme nous le verrons plus loin.
Remarques importantes : – Nous avons regardé le problème de la formation de paires dans un état s (L = 0, S = 0). Rien n’interdit, en principe, la formation de paires L = 1, 2, ... [32, 33]. Il semble cependant que, en général, dans les métaux usuels, l’énergie de liaison la plus forte corresponde à des paires dans un état singulet. Certains ont suggéré que la supraconductivité de certains conducteurs organiques quasi-unidimensionnels ou de certains fermions lourds puissent être de type triplet, mais il n’existe à ce jour aucune évidence expérimentale dans les métaux. Le seul cas certain d’appariement triplet est celui de 3 He superfluide [30]. Par contre, nous savons maintenant de façon certaine que les paires de Cooper des supraconducteurs à haute température critique sont dans un état singulet (S = 0), mais de symétrie d (L = 2) [35, 36]. – L’expression ci-dessus pour l’énergie de liaison d’une paire de Cooper n’est pas développable en puissances de V. Ceci montre qu’une approche par un calcul de perturbation n’est pas possible. C’est bien cette difficulté qui a rendu le problème de la supraconductivité difficile à résoudre. – Il existe une énergie de liaison négative, c’est-à-dire une instabilité de l’état normal à T = 0 pour une valeur arbitrairement faible de l’interaction attractive. Ceci est lié au principe de Pauli, c’est-à-dire à l’existence d’une surface de Fermi. Si la restriction k > kF n’existait pas, il existerait une valeur seuil de V pour obtenir un état lié. Il s’agit donc d’un effet quantique lié au principe de Pauli. – L’expression de l’énergie de liaison de la paire de Cooper est la même que celle du gap d’Onde de Densité de Charge ou de Spin dans le cas du Nesting parfait. Ceci est dû au fait que, dans les deux cas, nous avons affaire à une divergence logarithmique de la fonction de réponse du gaz d’électrons sans interaction. Cette singularité est due à l’existence de la surface de Fermi. Dans le cas de l’appariement électronélectron, il s’agit d’une fonction de réponse électron-électron, alors que dans le cas de l’onde de densité de spin ou de charge, il s’agit d’une fonction de réponse électron-trou. Cette divergence est due à une propriété de« nesting parfait ». ξk = −ξk−q ξk = +ξ−k−q
pour q = 2kF (appariement électron-trou) pour q → 0 (appariement électron-électron)
Dans les deux cas, le « nesting parfait » détermine une singularité de Kohn logarithmique. Il existe, évidemment, une différence essentielle entre les deux cas. Le « nesting parfait » à q = 2kF correspond à une propriété géométrique très particulière de certaines surfaces de Fermi et ne peut être qu’approché dans les situations
500
11. Supraconductivité conventionnelle
réelles. Par contre, le « nesting parfait » à q = 0 est trivialement et exactement vérifié pour toute surface de Fermi, pourvu que le réseau présente un centre de symétrie. – L’extension spatiale d’une paire de Cooper est donné par : 2 3 2 2 ρ ϕ ρ d ρ k |∇k ak | = r = 3 2 ϕ ρ d ρ k |ak | ce qui donne :
d ξ 2 h¯ ωD da 2 n EF dk dξ dξ 2 ξ =0 0 r = hω n EF 0¯ D a 2 d ξ
(11.136)
(11.137)
Le rayon de la paire est donc
2 hv ¯ F = ξ0 r2 = √ 3 |E |
(11.138)
Si |E | ∼ kB Tc on trouve comme valeur typique, dans le cas des supraconducteurs usuels, un rayon moyen de l’ordre de 104 nm, c’est-à-dire une valeur très grande devant la distance moyenne entre paires. On ne peut pas considérer les paires comme des bosons individualisés qui subiraient une condensation de Bose-Einstein. Les paires se recouvrent très fortement et sont donc en forte interaction les unes avec les autres. C’est précisément cette propriété qui assure la validité de l’approximation de champ moyen, car elle entraîne ξG ξ(T ), sauf extrêmement près de Tc . À cause du grand nombre de paires dans un volume ξ03 , il est correct de parler du champ moyen des autres paires pour la paire considérée. – Nous avons discuté la formation d’une paire de vecteur d’onde total nul (+k, −k). Ceci est justifié, car dans la limite de couplage faible, l’instabilité ne se produit que pour des paires dont l’impulsion du centre de masse hq ¯ → 0. Ceci est une conséquence de principe d’exclusion. Pour le comprendre, considérons le problème à deux particules, en l’absence de la mer de Fermi. L’équation de Schrödinger s’écrit :
h¯ 2 2 2 (11.139) ∇1 + ∇2 + V (r1 − r2 ) − E ψ r1 , r2 = 0 − 2m Le problème se factorise en mouvement du centre de masse (celui d’une particule libre) et mouvement relatif, qui devient un problème à un corps : h¯ 2 2 ∇ + V (ρ) − ε ϕ(ρ) = 0 − 2m
501
Physique de la matière condensée
Quand des états liés apparaissent, ils ont une énergie négative dans le système relatif, c’est-à-dire ε < 0. Ce comportement est très différent de l’instabilité de Cooper, où le pôle se produit pour des énergies positives 2EF −E0 , où E0 EF dans la limite de couplage faible. Si le principe d’exclusion n’existait pas, deux électrons ne pourraient pas se lier à cette énergie puisque l’énergie totale est positive. L’instabilité est due à la discontinuité d’occupation de la surface de Fermi. On peut comprendre maintenant pourquoi les électrons doivent s’apparier avec des impulsions opposées : deux électrons de vecteurs d’onde arbitraires k1 et k2 interagissent en échangeant des phonons et cette interaction peut être attractive; toutefois, ceci ne conduit pas à une instabilité quand le mouvement du centre de masse a une impulsion finie, car l’origine des énergies du mouvement relatif ne coïncide pas avec l’emplacement de la discontinuité de la distribution des impulsions électroniques. En effet, dans le repère du centre de masse, la sphère de Fermi doit être translatée de −P = −(k1 + k2 ). Effectuons la transformation du centre de masse : ⎧ ⎨ P = (k1 + k2 ) (11.140) ⎩ 2) k = (k1 −k 2 ξk1 + ξk2 =
k2 P2 + − 2EF m 4m
(11.141)
L’équivalent de l’équation (11.140) donnant l’énergie de l’état lié s’écrit alors : 3 ξ 1 − f P −−k−q − fFD ξ P +k+q FD
d q 2 2 1= (11.142) 3 V q ξ + ξ − E k k+q 2π Le dénominateur fait bien intervenir la différence des énergies relatives, mais les discontinuités de la surface de Fermi ne sont pas à (k + q)2 /2m, mais à ( ± P/2 + k + q)2 /2m. Il n’y a plus de nesting parfait parce que les distributions de fermi ont été translatées. Les singularités sont brouillées quand on intègre sur les angles. L’état lié disparaît rapidement dès que hP ¯ ≥ 1/ξ0 . Autrement dit, l’instabilité est une conséquence du « nesting » parfait à P = 0. Cette propriété de « nesting » ne subsiste plus pour une impulsion finie du centre de masse.
11.3.3 Fondamental supraconducteur : méthode variationnelle Dans le paragraphe précédent, nous avons discuté un problème à deux électrons en présence de la mer de Fermi. Ceci nous permet d’imaginer quel est le mécanisme physique responsable de l’instabilité supraconductrice, mais les ordres de grandeur montrent qu’on ne peut pas négliger les interactions entre paires. Nous sommes donc
502
11. Supraconductivité conventionnelle
réellement confrontés à un problème à N corps. Dans ce paragraphe, nous présentons une solution de type variationnel, où le choix de la fonction d’onde d’essai est guidé par l’instabilité de Cooper du problème à deux électrons [24].
Fonction d’onde variationnelle Nous prendrons la forme approchée de BCS pour l’interaction attractive induite par le couplage électron-phonon. L’hamiltonien de BCS s’écrit : HBCS =
ξk ck+ ck −
k
V + c ck,σ ck+ −q,σ ck ,σ
k+q,σ
(11.143)
k,k ,q σ ,σ
Rappelons que les opérateurs de fermions c et c + anticommutent. Le terme d’interaction dans l’hamiltonien de BCS connecte un grand nombre de configurations presque dégénérées, définies par leurs nombres d’occupation {nkσ }. Si tous les termes donnent une contribution négative, on peut obtenir un état de basse énergie. Mais à cause des changements de signe liés à l’anticommutation, pour une configuration {nkσ } choisie au hasard, il y aura autant d’éléments de matrice de Hint positifs que négatifs. Il faut donc choisir la configuration du fondamental de façon à éviter cette réduction de l’effet global de l’interaction attractive. Le résultat obtenu pour la paire de Cooper suggère la façon de faire ce choix. On peut engendrer un état cohérent de basse énergie en se restreignant à un sous-ensemble de configurations entre lesquelles les éléments de matrice de l’interaction sont toujours négatifs. Cette propriété est vérifiée si les états de Bloch sont toujours occupés par paires : si un membre de la paire est occupé dans une configuration donnée, l’autre membre doit aussi être occupé. Étant donné que l’interaction conserve le vecteur d’onde, nous sommes concernés par des configurations où toutes les paires ont le même vecteur d’onde k + k = K, comme on peut le vérifier explicitement sur l’hamiltonien. Nous avons vu que, dans le cas de deux électrons, il est préférable de choisir K = 0. D’autre part, BCS ont choisi un appariement de type singulet parce que seul ce choix permettait d’interpréter les propriétés magnétiques des supraconducteurs connus. Pour discuter l’état fondamental, il sera donc suffisant de se restreindre au sous-espace des configurations où les états sont occupés seulement par paires (k ↑, −k ↓). On peut alors négliger les éléments de matrice qui couplent d’autres configurations et travailler avec l’hamiltonien BCS réduit : red = HBCS
k
ξk ck+ ck −
V + + c c c−k ↓ ck ↑ k↑ −k↓
(11.144)
k,k
On peut définir les opérateurs de création et d’annihilation de paires de Cooper
503
Physique de la matière condensée
bk = c−k↓ ck↑ + + bk+ = ck↑ c−k↓
(11.145) (11.146)
Les opérateurs bk et bk+ ne sont pas des opérateurs de bosons. En effet : [bk , bk+ ] = {1 − (nk↑ + n−k↓ )}δkk
(11.147)
[bk , bk ] = [bk+ , bk+ ] = 0
(11.148)
(bk+ )2 = (bk )2 = 0
(11.149)
On essaye de construire une fonction d’onde variationnelle où les états k ↑ et −k ↓ apparaissent par paires. On décrit une paire par la fonction d’onde à deux électrons
(11.150) gk exp ik · r1 − r2 |s ψ r1 , r2 = k
où |s est l’état singulet de spin. On cherchera donc à généraliser la fonction d’onde de Cooper sous la forme :
N = A ψ r1 , r2 , · · · , ψ rN −1 , rN (11.151) où A est un opérateur d’antisymétrisation par rapport à l’échange de deux électrons. + |0 (11.152) gk1 ···kN /2 ck+1 ↑ c−k1 ↓ · · · ck+N /2 ↑ c−k N = N /2 ↓ {ki }
où |0 est l’état vide de particule. La fonction N est fonction propre du nombre total d’électrons, mais elle n’est pas commode à utiliser. Considérons plutôt la fonction génératrice : ! + 1 + gk ck↑ (11.153) =C c−k↓ |0 "
k
où le produit k est étendu à tous les états d’onde plane et C est un facteur de normalisation. On voit qu’au facteur C près, N est la composante de qui comporte N opérateurs de création agissant sur |0 : c’est la composante de qui décrit un état à N particules. L’écriture de est beaucoup plus commode. À la limite thermodynamique, quand N → ∞, le fait que ne soit pas fonction propre du nombre de particules ne présente pas d’inconvénient. Écrivons le développement de : λN N (11.154) = N
504
11. Supraconductivité conventionnelle
avec la condition de normalisation :
|λN |2 = 1
(11.155)
N
Réécrivons la fonction d’onde (11.163) sous la forme : ! + + = uk + vk ck↑ c−k↓ |0
(11.156)
k
avec les conditions de normalisation uk2 + vk2 = 1
(11.157)
Il est facile de montrer que le nombre moyen de particules est donné par : N = |N | = 2 vk2 (11.158) k
alors que l’écart quadratique moyen est donné par :
2 uk2 vk2 < 4 uk2 = 2 N N = N 2 − N 2 = 4 k
(11.159)
k
Pour N grand, l’aspect de λN en fonction de N est celui représenté sur la figure 11.23.
Fig. 11.23 Distribution de λN en fonction du nombre d’électrons.
λN a un maximum très√prononcé pour N . La demi largeur de la courbe est une les fluctuations relatives de N quantité de l’ordre √ de N . Dans ces conditions, √ sont d’ordre 1/ N , donc très faibles. Par contre, N est tout de même grand devant 1 et les variations de λN sont négligeables quand N varie de quelques unités : λN +p λN
pour
p
N
(11.160)
505
Physique de la matière condensée
Voyons maintenant quelles sont les correspondances entre les éléments de matrice d’un opérateur quelconque F sur la base des N ou sur . |F | = (11.161) λ∗N λN N |F | N N,N
Supposons d’abord que F conserve le nombre de particules. Alors : |F | = |λN |2 N |F | N
(11.162)
N
de N et L’élément de matrice N |F | N est une fonction lentement variable nous pouvons le remplacer par sa valeur pour N ≡ N ∗ . Comme N |λN |2 = 1, |F | N |F | N
(11.163)
De la même façon si F ne conserve pas le nombre de particules, mais fait passer de N à N + p particules : |F | = λ∗N +p λN N +p |F | N (11.164) N,N
|λN |2 N +p |F | N
(11.165)
N
N +p |F | N
(11.166)
Donc en pratique nous donne la même information que N . La propriété fondamentale de est que deux états |k ↑ et |−k ↓ sont soit simultanément vides, soit simultanément occupés. Il nous faut maintenant déterminer les uk , c’est-à-dire l’amplitude de probabilité pour que la paire (k ↑, −k ↓) soit vide, et les vk , c’est-à-dire l’amplitude de probabilité pour que la paire (k ↑, −k ↓) soit occupée. Nous utiliserons une méthode variationnelle, c’est-à-dire que nous écrirons que l’énergie doit être minimale par rapport aux variations des uk et vk avec la contrainte que le nombre moyen d’électrons est N . Il est évidemment équivalent de se placer dans l’ensemble grand-canonique et de minimiser H − μN où le multiplicateur de Lagrange μ est le potentiel chimique, déterminé par la condition N = N ∗ . L’emploi de H − μN revient à repérer les énergies à un électron par rapport au niveau de Fermi, c’est-à-dire à utiliser ξk = εk − μ au lieu de εk .
Calcul de l’énergie Nous devons déterminer le meilleur choix possible pour les paramètres variationnels uk et vk , c’est-à-dire calculer la valeur moyenne de HBCS avec notre fonction d’onde
506
11. Supraconductivité conventionnelle
variationnelle et minimiser par rapport à uk et vk . En fait, si on utilise HBCS , les red . seuls termes qui vont intervenir sont ceux de l’hamiltonien réduit HBCS On pourrait penser naïvement que l’énergie de condensation de paires maximale qu’on puisse gagner est obtenue en occupant totalement les paires jusqu’au niveau de Fermi, c’est-à-dire pour |vk |2 = 1 pour |k| < kF . Ceci correspond au cas a) de la figure 11.24, c’est-à-dire en fait à la fonction de distribution de l’état normal : En réalité, cette idée n’est pas correcte : le terme −
V + + c c c−k ↓ ck ↑ k↑ −k↓
(11.167)
k,k
ne donnera de contributions non nulles que s’il existe dans le domaine de vecteurs d’onde de l’interaction attractive à la fois des états de paires occupés, donc |vk |2 = 0 et des états de paires vides, donc |vk |2 = 1. Ceci suppose le comportement de |vk |2 dans l’état supraconducteur, même à température nulle, schématisé dans la figure 11.24. b).
Vk
2
2
Vk
1
1
kF a) état normal
k
kF
k
b) état supraconducteur
Fig. 11.24 Amplitude de probabilité d’occupation de paires : a) dans l’état normal - b) dans l’état supraconducteur.
La distribution 11.25 b) abaisse l’énergie d’interaction par rapport à la distribution 11.25 a). Par contre elle augmente visiblement l’énergie cinétique. Il faut optimiser le choix de |vk |2 de façon que le bilan de ces deux effets soit le plus favorable. Énergie cinétique : Ecin e´ tique = |H0 | = 2
ξk |vk |2
(11.168)
k
507
Physique de la matière condensée
Énergie d’interaction : Eint = |Hint |
V + 0| uk + vk c−k↓ ck↑ uk + vk c−k ↓ ck ↑ ck+ ↑ c−k =−
↓ c−k↓ ck↑
k,k + + + (11.169) × uk + vk ck↑ c−k↓ uk + vk ck+ ↑ c−k
↓ |0 La condition de normalisation |uk |2 + |vk |2 = 1 nous permet de poser : uk = sin θk
vk = cos θk
(11.170)
L’énergie totale vaut : $ # red Etotale = HBCS =2
k
V sin 2θk sin 2θk
ξk cos θk −
4 2
(11.171)
k,k
Les équations de minimisation s’écrivent :
V ∂ # red $ HBCS = 2ξk sin 2θk − cos 2θk sin 2θk
∂θk
(11.172)
k
Posons :
V V sin 2θk = uk vk
= 2
k
Nous obtenons : tan 2θk = − ce qui, en posant Ek =
(11.173)
k
ξk
(11.174)
ξk2 + 2 , correspond à : ⎧ ⎪ ⎨ sin 2θk = 2uk vk =
Ek
⎪ ⎩ cos 2θk = v 2 − u 2 = − ξk E k k
(11.175)
k
Pour écrire ces égalités, il a été nécessaire de choisir le signe de cos 2θk de telle sorte que vk → 0 pour ξk → ∞. En effet la probabilité pour que les états de vecteurs
508
11. Supraconductivité conventionnelle
d’onde ±k soient occupés doit tendre vers 0 quand ξk tend vers l’infini. Le signe de cos 2θk étant déterminé, celui de sin 2θk est imposé. On est donc amené à résoudre une équation de self-consistence pour :
V V V
uk vk = = =−
2Ek 2 ξ 2 + 2 k k k k
(11.176)
Remarquons d’abord que cette équation admet toujours la solution triviale = 0, ce qui correspond à : 2uk vk = 0 ainsi que vk2 − uk2 = −
ξk |ξk |
Ce dernier résultat correspond à ⎧ ⎨ vk2 − uk2 = −1 pour ξk > 0, c’est-à-dire εk > μ ⎩
vk2 − uk2 = +1 pour ξk < 0, c’est-à-dire εk < μ
La fonction associée est simplement : ! + + ck↑ c−k↓ |0 n =
(11.177) (11.178)
(11.179)
(11.180)
k kF . Le produit uk vk est donc nul partout. Dans l’état supraconducteur, Fk est non nulle dans la zone de variations de la fonction de distribution, c’est-à-dire sur un intervalle étroit δk ∼ π/ξ0 autour de kF . La signification physique de Fk est l’amplitude de la probabilité de condensation de paires (k ↑, −k ↓ ). Les figures 11.26 ne respectent évidemment pas, pour des raisons de lisibilité les ordres de grandeurs respectif de δk et de kF . En effet, dans les supraconducteurs typiques, δk / kF ∼ 10−4 . U kV k
δk
1/2
kF
k
Fig. 11.26 Amplitude de condensation de paires dans l’état supraconducteur.
On peut se demander quelle est la phase de vk . En effet, nous avons jusqu’à présent implicitement supposé que les uk et les vk étaient réels, mais rien n’empêche de remplacer vk par vk exp i ϕk . On peut alors minimiser l’énergie par rapport à ϕk . On trouve en réalité que l’énergie est indépendante des ϕk . C’est une conséquence de l’invariance de jauge. En considérant une valeur fixée de la phase (à zéro par exemple), on obtient une fonction d’onde où le nombre de particules n’est pas déterminé, puisque la phase de la fonction d’onde et le nombre de particules sont des quantités conjuguées.
11.3.4 Fondamental supraconducteur : transformation de Bogoliubov Après l’approche variationnelle du paragraphe précédent, nous étudions ici une approche de champ moyen où on linéarise les équations du mouvement [33]. Nous verrons que les deux méthodes sont, en fait, complètement équivalentes.
513
Physique de la matière condensée
Méthode des équations du mouvement Nous utilisons à nouveau l’hamiltonien réduit de BCS red = HBCS
ξk ck+ ck −
k
V + + c c c−k ↓ ck ↑ k↑ −k↓ k,k
Pour alléger l’écriture, nous conviendrons de dénoter l’état |k, ↑ par k et l’état |−k, ↓ par −k. Écrivons les équations du mouvement pour les opérateurs ck+ et c−k :
V + + d c c
i ck+ = −ξk ck+ + c−k dt k −k
(11.199)
k
V d c−k ck
i c−k = ξk c−k + ck+ dt
(11.200)
k
Nous faisons sur ces équations une approximation de champ moyen, en remplaçant les termes comprenant trois opérateurs de fermions par un seul de ces opérateurs multiplié par la moyenne du produit de deux autres dans l’état fondamental recherché. Dans cette linéarisation, on fait ainsi apparaître deux types de termes : 1) ceux qui existent aussi bien dans l’état normal que dans l’état supraconducteur et que nous n’écrirons pas explicitement. On peut, en fait, prendre ces termes en compte en remplaçant les énergies à un électron des électrons libres ξk par les énergies de Hartree-Fock à un électron de l’état normal. Afin de ne pas alourdir l’écriture, nous garderons la notation ξk pour ces énergies de Hartree-Fock. 2) les termes qui n’existent pas dans l’état normal et qui sont induits par la brisure de symétrie du paramètre d’ordre supraconducteur. Ce paramètre d’ordre est défini par
V # + + $ c c = c−k ck
= k −k
où la somme sur k ,
(11.201)
k
k
, porte toujours sur l’intervalle défini par : |ξk | < hω ¯ D
Les équations linéarisées s’écrivent : ⎧ d + ⎨ i dt ck = −ξk ck+ + c−k ⎩
514
i dtd c−k = ξk c−k + ck+
(11.202)
11. Supraconductivité conventionnelle
On veut diagonaliser ce système d’équations, dont on cherche la solution sous la forme : (11.203) γ−k = uk c−k + vk c +k avec i
d γ−k = E γ−k dt
L’équation aux valeurs propres s’écrit : ξk − E =0 −ξk − E
(11.204)
(11.205)
qui admet pour solution : E 2 (k) = ξk2 + 2
(11.206)
Nous imposons la condition de normalisation :
et considérons la solution :
uk2 + vk2 = 1
(11.207)
E = − ξk2 + 2
(11.208)
Pour la valeur propre E = − ξk2 + 2 , on obtient la solution : γ−k = uk c−k + vk ck+
(11.209)
Pour la valeur propre E = + ξk2 + 2 , on obtient la solution : γk+ = uk ck+ − vk c−k
(11.210)
2 + 2 , on obtient De même, en changeant, k en −k : Pour la solution E = − ξ−k la solution : + (11.211) γk = uk ck − vk c−k
2 + 2 , on obtient la solution : : Pour la solution E = + ξ−k + + γ−k = uk c−k + vk ck
(11.212)
515
Physique de la matière condensée
Ces quatre relations constituent la transformation de Bogoliubov. En les inversant, on obtient : ⎧ + ck = uk γk + vk γ−k ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ c−k = uk γ−k − vk γk+ (11.213) ⎪ + + ⎪ c = u γ + v γ ⎪ k k −k ⎪ k k ⎪ ⎪ ⎪ ⎪ ⎩ + + c−k = uk γ−k − vk γk Les opérateurs γk et γk+ sont des combinaisons linéaires d’opérateurs de fermions. Ce sont donc aussi des opérateurs de fermions. On peut vérifier qu’ils vérifient bien les règles d’anticommutation + [γk , γk+ ]+ = uk uk [ck , ck+ ]+ + vk vk [c−k , c−k ]+ = δk,k
[γk , γk ]+ = [γk+ , γk+ ]+ = 0
(11.214)
(11.215)
Ces opérateurs décrivent les excitations élémentaires du système, qui suivent donc une statistique de Fermi-Dirac, mais ils ne correspondent pas à la création ou à l’annihilation de vraies particules. Nous les appellerons des quasi-particules, au sens de Landau (voir chapitre 8). Cherchons les vecteurs propres correspondant aux valeurs propres E (k). Nous pouvons écrire, si γk est proportionnel à exp −iEt : Euk = ξk uk + vk
(11.216)
En élevant au carré : E 2 uk2 = ξk2 uk2 + 2 vk2 + 2ξk uk vk = (ξk2 + 2 )uk2 d’où : En posant :
2 (uk2 − vk2 ) = 2ξk uk vk
(11.217) (11.218)
⎧ ⎨ uk = sin θk ⎩ v = cos θ k k
on obtient : tan 2θk = −
ξk
(11.219)
(11.220)
c’est à dire que les coefficients uk et vk de la méthode de Bogoliubov vérifient les mêmes équations que les coefficients variationnels de la méthode variationnelle de BCS.
516
11. Supraconductivité conventionnelle
De même, la relation de self-consistence pour le paramètre d’ordre s’écrit :
V # + + $ = ck c−k
(11.221)
k
où | dénote l’état fondamental supraconducteur selon la théorie de Bogoliubov, c’est-à-dire le vide de quasiparticules, défini par γk | = 0. À l’aide des relations (11.213) ci-dessus, en utilisant γk | = 0 et | γk+ = 0, on obtient
V V V
=− u k vk = =
2Ek 2 ξ 2 + 2 k k k k
(11.222)
c’est-à-dire la relation de self-consistence obtenue par la méthode variationnelle. Le paramètre d’ordre de la méthode de champ moyen de Bogoliubov est donc confondu avec celui de la méthode variationnelle.
Discussion L’état fondamental du système est le vide de quasi-particule que nous notons |. L’état | est précisément l’état | où est la fonction d’onde variationnelle de BCS. Considérons, en effet, l’état : ! !
+ |0 (11.223) γ−k γk |0 = −vk uk + vk ck+ c−k k
k
On peut écrire | =
! k
On en déduit immédiatement
1 − vk
γ−k γk |0
γk | = 0
(11.224)
(11.225)
ce qui montre bien que l’état de BCS, | est l’état vide de quasi-particule : | = |
(11.226)
dont on retrouve facilement l’énergie. Étudions maintenant les états excités à un fermion. Ceux-ci sont obtenus par application de l’opérateur de création de quasi-particule sur le fondamental | : !
+ + uk + vk ck+ c−k γk+ | = uk ck+ − vk c−k uk + vk ck+ c−k
|0 k =k
! + uk + vk ck+ c−k = uk2 ck+ + vk2 ck+
|0
(11.227)
k =k
517
Physique de la matière condensée
= ck+ =
! + uk + vk ck+ c−k
|0
(11.228)
k =k
1 + c | uk k
(11.229)
L’énergie de cet état excité est Es + E (k) où Es est l’énergie de l’état fondamental supraconducteur et où :
E (k) =
ξk2 + 2
(11.230)
E (k) est l’énergie d’une quasiparticule définie comme l’énergie qu’on fournit au système quand on ajoute un électron. Mais ajouter un électron k au système, dans la description qu’on a adoptée, c’est aussi bien enlever l’électron −k. L’énergie nécessaire dans les deux cas est E (k), que | k | soit plus grand ou plus petit que kF . Il faut bien comprendre que les états créés en ajoutant un électron (k ↑ ) à |N ou en retirant un électron ( − k, ↓ ) à l’état |N sont identiques dans l’approximation des paires, sauf que le nombre de paires a changé d’une unité. Si on travaille avec | + et c−k↓ sont identiques à un facteur de normalisation les états engendrés par ck,↑ près. Nous voyons que l’énergie de l’excitation à un fermion s’écrit
E (k) = ξk2 + 2 et qu’elle ne peut donc pas s’annuler. Il existe un gap dans le spectre d’excitations représenté sur la figure 11.27. Il est possible d’injecter une particule dans le système supraconducteur, par exemple dans une expérience d’effet tunnel, en utilisant une diode tunnel dont le schéma de principe est donné sur la figure 11.12. On peut de cette façon mesurer le gap d’énergie du spectre d’excitation en mesurant la densité d’états g E . Dans la figure 11.28, l’échelle d’énergie est très petite par
Fig. 11.27 Spectre d’excitation dans l’état supraconducteur.
518
11. Supraconductivité conventionnelle
rapport à EF .
g (E )dE = n(EF )d ξ
⇒ g (E ) = n(EF ) d ξ/dE
avec EdE = ξ d ξ . La densité d’états dans la diode tunnel sera schématiquement donnée par les figures 11.29 et 11.30.
Fig. 11.28 Densité d’états du supraconducteur.
Fig. 11.29 Densité d’états de la diode tunnel pour une tension appliquée nulle entre le supraconducteur et le métal normal.
Fig. 11.30 Densité d’états de la jonction tunnel pour une tension appliquée /e .
519
Physique de la matière condensée
Fig. 11.31 Caractéristique courant-tension d’une jonction tunnel pour différentes températures.
Considérons maintenant les états excités à deux fermions. Ces états sont obtenus par application successive de deux opérateurs de création de quasi-particules γk+ γk+ |
(11.231)
Si k = −k , il n’y a pas de commentaires particuliers à signaler. Si k = −k (ce qui, rappelons-le signifie, en fait k ↑ et −k ↓) on obtient : ! + + γk+ γk+ | = uk ck+ c−k uk + vk ck+ c−k (11.232) − vk
|0 k =k
Comme le fondamental, cet état excité est une superposition d’états de paires (k ↑, −k ↓ ) vides ou occupés, mais une superposition différente de celle du fondamental. Alors que les états excités à un fermion ne peuvent être obtenus qu’en injectant un électron supplémentaire au système, ces excitations à deux fermions représentent l’excitation d’une paire et constituent les vraies excitations du système, qui présente donc un gap 2.
11.3.5 Supraconducteur à température finie Jusqu’ici nous nous sommes limités à l’étude de l’état fondamental, par une méthode de champ moyen à température nulle. En fait, la méthode de Bogoliubov s’étend facilement à température non nulle. Cette extension est l’objet de ce paragraphe. Il nous permettra de discuter les propriétés thermodynamiques des supraconducteurs.
520
11. Supraconductivité conventionnelle
Gap à température finie et température critique Reprenons la méthode des équations du mouvement de Bogoliubov. On définit toujours la paramètre d’ordre par :
V c−k ck T =
(11.233)
k
Mais la moyenne · · · n’est plus une moyenne sur l’état fondamental, mais une moyenne thermodynamique à la température T. Les relations de Bogoliubov s’écrivent : ⎧ ⎨ c−k = uk γ−k − vk γk+ (11.234) ⎩ + ck = uk γk + vk γ−k ce qui donne : $ # + c−k ck = (uk γ−k − vk γk+ )(uk γk + vk γ−k ) = uk vk [1 − 2f (Ek )]
(11.235)
où f (Ek ) est la fonction de distribution de Fermi-Dirac pour les quasiparticules : f (Ek ) =
1 exp βEk + 1
Les équations de Bogoliubov donnent évidemment, comme à température nulle : uk vk =
2Ek
(11.236)
d’où l’équation pour le gap :
V = [1 − 2f (Ek )] 2Ek
(11.237)
k
c’est-à-dire :
1 = Vn EF
0
hω ¯ D
0
1 d ξ
1 − 2f E = Vn EF E
hω ¯ D
tanh 0
E dξ kB T E (11.238)
La résolution numérique de cette équation donne la variation du gap avec la température. La figure 11.32 montre la comparaison entre la courbe théorique obtenue
521
Physique de la matière condensée
Fig. 11.32 Variations du paramètre d’ordre supraconducteur en fonction de la température dans l’Étain, le Tantale et le Niobium, comparées aux prédictions de la théorie BCS.
à partir de l’équation (11.238) et des supraconducteurs typiques, tels que l’Étain, le Tantale et le Niobium. La température critique est déterminée en posant = 0 dans l’équation précédente :
1 = Vn EF
0
hω ¯ D
tanh
ξ dξ kB Tc ξ
En intégrant par parties on obtient : ⎫ ⎧ h¯ ωD hω ¯ D 3 ⎨2 kB Tc d tanh x ⎬ x k T ln x tanh ln x B c − 1 = Vn EF ⎭ ⎩ 2 x 0 0 Dans la limite des couplages faibles kB Tc hω ¯ D:
2γ hω ¯ D − ln 1 Vn EF ln kB Tc π
(11.239)
(11.240)
(11.241)
avec 2γ /π 1,13 où γ est la constante d’Euler. D’où : kB Tc
522
2γ 1 hω ¯ D exp −
π Vn EF
(11.242)
11. Supraconductivité conventionnelle
On peut également obtenir la valeur du gap à T = 0. Dans la limite du couplage faible :
1 0 2hω (11.243) ¯ D exp −
Vn EF
On obtient donc une relation universelle entre 0 et kB Tc :
0 π = 1, 76 kB Tc γ Cette relation est en général assez bien vérifiée. D’autre part la formule donnant la température critique montre bien l’effet isotopique puisque hω ¯ D est proportionnelle à M −1/2 et donc kB Tc doit l’être aussi.
Propriétés thermodynamiques On obtient l’entropie par unité de volume en utilisant l’expression habituelle pour des fermions indépendants, ce qui correspond bien à l’approximation de champ moyen utilisée : S =−
1 2kB 0 fk ln fk + 1 − fk ln (1 − fk ) k
est la fonction de distribution de Fermi-Dirac de la quasiparticule d’énergie où fk Ek = ξk2 + 2 . L’énergie interne peut être calculée de différentes manières, par exemple en réécrivant l’hamiltonien avec les opérateurs création et annihilation de quasiparticules et en faisant l’approximation de champ moyen sur l’hamiltonien : red HBCS
V + + = ξk ck ck + c−k c−k − c + c + c−k ck
k −k k k,k 2
+ = ξk uk γk+ + v−k γ−k uk γk + vk γ−k
k
3 + − vk γk uk γ−k − vk γk+ + uk γ−k
V + − vk γk uk γ−k − vk γk+
uk γk+ + vk γ−k uk γ−k −
k,k + × uk γk + vk γ−k (11.244)
523
Physique de la matière condensée
L’approximation de champ moyen consiste à remplacer :
γk+ γk par γk+ γk = f Ek δk,k
(11.245)
On obtient alors, l’énergie par unité de volume : Us =
1 V 0 1 2ξk uk2 fk + vk2 (1 − fk ) − uk vk (1 − 2fk )uk vk (1 − 2fk )
k
k,k
(11.246) ⎧ ⎪ ⎨ 2uk vk =
mais,
Ek
⎪ ⎩ u2 − v 2 = k k ce qui donne :
d’où
⎧ 2 ⎪ ⎪ ⎨ vk =
1 2
⎪ ⎪ ⎩ u2 = k
1 2
2
1−
2
1+
(11.247)
ξk Ek ξk Ek ξk Ek
3 3
ξk2 2 1 ξk + 2fk − 1 − Us = Ek V
(11.248)
(11.249)
k
On en déduit l’énergie libre de la phase supraconductrice : Fs = Us − TSs
(11.250)
qu’on peut donc calculer à partir des équations (11.256) et (11.257). On peut également calculer la chaleur spécifique
2kB 2 1 d 2 (11.251) fk 1 − fk Ek2 + β cv = 2kB T d β k
Il est possible d’obtenir des expressions simples dans la limite des basses températures et près du point critique. Dans la limite T → 0, l’énergie libre de basse température s’écrit, par unité de volume :
2 π2 1 Fs − Fn − n(EF )2 0 + n(EF ) kB T 2 3
524
(11.252)
11. Supraconductivité conventionnelle
Ceci permet d’écrire le champ critique thermodynamique à basse température (pour un supraconducteur de type I) : 2 1 0
1 T γ Hc T = 4πn(EF )2 0 2 1 − (11.253) 3 Tc où γ est la constante d’Euler. La densité d’états au niveau de Fermi détermine la chaleur spécifique électronique de la phase normale : 2π 2
cn (11.254) = n EF kB T 3 La quantité
cn Tc Tc γ2 = 0, 168 6π Hc2 0 est une constante universelle, indépendante du matériau. À basse température, la chaleur spécifique de la phase supraconductrice varie exponentiellement 1 cs 2n EF 0 kB 2π 2
3
0 2 0 exp − kB T kB T
(11.255)
Près du point critique, il est possible de faire un développement en puissances du paramètre d’ordre, qui tend vers 0 quand T → Tc . On peut écrire l’énergie libre au voisinage du point critique :
2 T 2 4 Fs − Fn 1− = − n EF π kB Tc Tc 7ζ 3
(11.256)
Ce qui permet à nouveau d’écrire le champ critique au voisinage de Tc pour un supraconducteuir de type I (figure 11.33) :
1 2 T 8
1− Tc 7ζ 3
T 1, 74Hc 0 1 − Tc
Hc T = Hc 0 γ
(11.257)
0 11 où Hc 0 = 4π n EF 20 2 . Le fait que ce comportement linéaire près de Tc , comme le montre la figure 11.34, soit bien observé expérimentalement montre la validité du champ moyen jusqu’à des températures très proches du point critique.
525
Physique de la matière condensée
Fig. 11.33 Diagramme de phase d’un supraconducteur de type I sous champ magnétique.
Fig. 11.34 Écart entre les variations avec T du champ critique thermodynamique et une loi en 1−(T/Tc)2 . La courbe en trait pointillé montre le comportement prévu par la théorie BCS en couplage faible. La courbe en trait plein montre le comportement expérimental dans l’Aluminium.
De même, l’excellent accord expérimental pour la courbe Hc (T ) à toute température (la figure 11.34 montre le cas de l’Aluminium [34]) nous confirme bien qu’il était justifié de ne pas prendre en compte, dans le calcul de Fs − Fn d’autres termes que ceux induits par la brisure de symétrie du paramètre d’ordre, les autres corrections de Hartree-Fock (ou d’ordre plus élevé) étant les mêmes dans les deux phases. Hc2 Fs − Fn = 8π est une mesure de cette différence d’énergie libre. Cette hypothèse était assez difficile à justifier a priori étant donné les ordres de grandeur respectifs de l’énergie de condensation (∼ 10−7 eV par électron) et de l’énergie Hartree-Fock (∼ 10 eV par électron). L’expression générale de la chaleur spécifique montre que cette dernière présente un saut à Tc puisque le paramètre d’ordre varie en ∼ (Tc − T )1/2 près du point
526
11. Supraconductivité conventionnelle
Propriétés thermodynamiques de supraconducteurs typiques T c (K) θ
(K) Vn (EF) Δ(θ)kTC Debye
Cd
HC(O) Cn (TC)T HC2 (0)
gauss
0,56
164
0,18
CS -Cn Cn
Al
1,2
375
0,18
1,3-2,
106
0,171
1,45
Sn
3,75
195
0,25
1,6
305
0,162
1,60
Pb
7,22
96
0,39
2,2
805
0,134
2,71
0,168
1,41
B.C.S
1,76
coupltaible
TC
0,177 1,324,40
C
Cs
Cn
T
Fig. 11.35 Propriétés thermodynamiques de plusieurs supraconducteurs.
critique. Ce saut se calcule immédiatement à partir de l’énergie libre (11.256) :
8 1 n EF π kB2 Tc cs − cn T = c 7ζ 3 Nous obtenons une nouvelle constante indépendante du matériau : c 12 cs − cn 1, 43 = = cn γ Tc 7ζ 3 Tc
(11.258)
(11.259)
L’accord avec l’expérience est raisonnable, comme on peut le voir sur la figure 11.35 [35].
Effets d’un champ magnétique Gorkov [36] a étendu la méthode de Boboliubov au cas où un champ magnétique était appliqué, décrit par un potentiel vecteur A(r), et à des situations où le gap (r) n’était pas uniforme mais pouvait varier spatialement. Son calcul suppose que le rapport /kB T reste petit devant 1 et que les variations de et du potentiel vecteur restent lentes à l’échelle de la longueur de cohérence à température nulle ξ0 . Ces deux conditions sont toujours remplies si on se place suffisamment près du point critique. Il est alors possible, en généralisant la méthode de Bogoliubov de linéarisation des équations du mouvement, d’écrire l’énergie libre de la phase supraconductrice sous
527
Physique de la matière condensée
la forme :
2e A(r) β 4 Fs − Fn = d r α |(r)| + |(r)| + γ −i h¯ ∇ + 2 c ⎤ 2 B2 (r) ⎦ (11.260) ( r) + 8π
3
2
Cette expression constitue la justification microscopique, dans l’approximation du
champ moyen et près du point critique Tc − T /Tc 1, du développement phénoménologique de Ginzburg- Landau (11.10). Pour retrouver ce développement, il suffit de faire la correspondance suivante entre gap (r) et paramètre d’ordre de Landau (r) : (r ) =
1 7ζ 3 2 (r ) 1 n2 8π 2 kB Tc
(11.261)
où n est la densité totale d’électrons. Ceci permet de déterminer, sur la base du calcul microscopique, les coefficients phénoménologiques de Ginzburg-Landau. ⎧ ⎨ m ∗ = 2m ⎩ e ∗ = 2e
(11.262)
L’origine du facteur 2 entre les masse et charge de l’électron et les quantités phénoménologiques vient de ce que ces quantités sont relatives à une paire de deux électrons.
2 6π 2 kB Tc T
(11.263) 1− a=− Tc 7ζ 3 EF n
2 6π 2 kB Tc
b= (11.264) 7ζ 3 EF n où EF est l’énergie de Fermi de la phase normale. Ceci permet le calcul microscopique de la longueur de cohérence près de Tc : 1
T −2 π 7ζ 3 1− ξ T = ξ0 (11.265) γ 48 Tc
où ξ0 = hv ¯ F / π0 .
528
11. Supraconductivité conventionnelle
ainsi que la longueur de pénétration du champ : 1
1
T −2 λ T = √ λ 0 1− Tc 2
1/2 . où λ 0 = mc 2 /4π ne 2
(11.266)
On peut ainsi retrouver les caractéristiques de la pénétration du champ magnétique dans un matériau supraconducteur, c’est-à-dire l’effet Meissner pour les supraconducteurs de types I et de type II. Cette justification microscopique de la fonctionnelle de Landau est importante, car elle permet une dérivation microscopique des deux équations de Ginzburg-Landau. Elle permet donc de justifier, de façon microscopique, les propriétés électrodynamiques trouvées à partir des équations de Ginzburg-Landau. Ceci a son importance, car montrer, par des calculs microscopiques, que la conductivité statique est infinie dans la phase supraconductrice n’est pas immédiat. En effet, on ne peut se contenter alors des propriétés thermodynamiques à l’équilibre. Il faut calculer, dans le cadre de la théorie de la réponse linéaire, c’est-à-dire à partir de la formule de Kubo, le courant induit, dans la phase supraconductrice, par un champ électrique alternatif de fréquence ω et montrer que limω→0 ωσ (ω) = 0. Cette dérivation ne sera pas exposée ici (voir par exemple Mahan [37]). On peut donner une image qualitative simple pour expliquer la présence de courants persistants dans l’état ordonné. Un courant persistant représente un mouvement cohérent des paires de Cooper dont les centres de masse ont tous l’impulsion hq. ¯ La densité de courant est alors j = n( − e )hq/m. La fonction de distribution des ¯ électrons est décalée de q dans l’espace réciproque. décalée de q Cette distribution
. ne peut relaxer vers la distribution d’équilibre si q < 2/ hv ¯ F Ceci résulte de la présence d’un gap dans le spectre des excitations élémentaires. En effet, un état électronique |k > de la distribution décalée ne peut relaxer vers un état |k > de la distribution d’équilibre en émettant une excitation de vecteur d’onde k − k et d’énergie E (k − k ). Si on veut conserver à la fois l’énergie et l’impulsion, il est nécessaire que q >2/ hv ¯ F . Dans cet argument, il faut prendre en compte la nature coopérative de l’ordre. Le courant ne peut pas s’amortir par des processus de diffusion, où un seul électron perdrait son impulsion par des collisions avec les impuretés, les phonons, les défauts, etc., comme dans les métaux normaux. Dans un supraconducteur, la stabilité d’une paire de Cooper dépend de façon essentielle de l’existence des autres paires et du fait qu’elles sont décrites par des fonctions d’onde identiques. On ne peut donc pas changer la fonction d’onde d’une paire de façon individuelle sans détruire l’état de paires de l’ensemble, ce qui exige une énergie libre énorme. Il faut détruire l’appariement sur une portion macroscopique de l’échantillon. De telles fluctuations sont toujours possibles, mais si improbables que la durée de vie du supercourant peut être considérée comme pratiquement infinie. Soulignons, néanmoins, que ce type
529
Physique de la matière condensée
d’argument qualitatif n’est pas réellement suffisant, puisqu’il ne permet pas de rendre compte de la résistivité nulle des supraconducteurs à gap nul [26].
Mécanisme de Fröhlich Les mêmes arguments peuvent être reproduits dans le cas de l’état Onde de Densité de Charge, qui présente lui aussi un gap dans le spectre des excitations individuelles. Dans ce cas, le supercourant est dû au mouvement cohérent des paires électrontrou c’est-à-dire au glissement de l’onde de densité de charge incommensurable. Ce mécanisme de supraconductivité avait été proposé par Fröhlich [38] avant que Bardeen, Cooper et Schrieffer proposent leur théorie. Dans une phase Onde de Densité de Charge (ou de Spin) la relation de dispersion des électrons devient celle
d’un isolant, si l’écart au nesting parfait est suffisamment faible (si tb T = 0 ) : à ±2kF , un gap d’énergie 2 s’ouvre sur toute la surface de Fermi (figure 11.36, déterminé par le paramètre d’ordre de la phase ODC (ou ODS).
Fig. 11.36 (a) Ouverture d’un gap d’énergie 2 à +kF et -kF dû à la modulation de l’onde de densité. (b) Bande d’énergie dans le cas d’un mouvement collectif d’électrons de vitesse vc et d’impulsion ke .
Cependant, il convient de noter que la structure modulée n’est pas nécessairement statique. Autrement dit, la modulation électronique périodique n’est pas fixée au réseau, parce que l’énergie du système électronique est indépendante de la position relative de la structure modulée par rapport au réseau sous-jacent. Par conséquent, si un champ électrique E est appliqué au système électronique modulé, les électrons seront accélérés ensemble, en même temps que la modulation du réseau à 2kF . Si on appelle ε k l’énergie à un électron en champ électrique nul, l’énergie résultant du mouvement des électrons sous l’effet du champ E deviendra ε k + h¯ kvc , où vc est la vitesse du mouvement collectif des électrons. Tant que hk ¯ F vc < , quand il n’y a pas d’autres obstacles, tels que des impuretés ou d’autres défauts cristallins, les électrons continueront à se déplacer collectivement, ce qui causera un courant électrique. Quand hk ¯ F vc excède , les électrons individuels sont excités dans la bande supérieure et le mouvement collectif des électrons est détruit. Ce processus a été mis
530
11. Supraconductivité conventionnelle
en exergue en premier par Fröhlich [38], qui l’a proposé comme une explication possible de la supraconductivité. Cependant, dans le cas de l’Onde de Densité de Charge, le paramètre d’ordre est défini dans l’espace réel. Pour cette raison, il est fortement couplé aux défauts du réseau, en particulier aux impuretés chargées. Ceci provoque l’accrochage de l’Onde de Densité de Charge sur les défauts. Celle-ci ne peut plus glisser librement. Cet accrochage détruit toute possibilité de supercourant pour des concentrations très faibles d’impuretés. Si l’Onde de Densité est piégée par des impuretés, elle ne pourra se déplacer sous l’effet d’un champ faible, comme l’avait imaginé Frölich. Il faudra un champ suffisamment fort pour pouvoir décrocher l’onde. Le comportement de la conductivité en champ faible est celui d’un isolant, ou d’un semiconducteur si le gap induit par l’ordre Onde de Densité est suffisamment faible. Dans le cas de la condensation de BCS, le paramètre d’ordre est défini dans l’espace réciproque. De ce fait, il n’est pas sensible aux défauts du réseau et aux impuretés non magnétiques. Ce type d’ordre, défini dans l’espace réciproque, est appelé ordre à longue distance non diagonal par opposition à l’ordre à longue distance diagonal, défini dans l’espace réel, pour rappeler la structure de la matrice densité qui représente chaque type d’ordre.
Analogies entre l’Onde de Densité de Spin et la supraconductivité Bien entendu, ces deux phénomènes ont des origines physiques totalement différentes. La phase Onde de Densité de Spin est due à une interaction d’échange, qui favorise un état magnétique. C’est la répulsion coulombienne qui agit pour favoriser, à travers le Principe de Pauli, une configuration de spin où les électrons interagiront moins. Au contraire, la phase supraconductrice est stabilisée par une interaction attractive entre électrons qui pourra induire un appariement entre électrons. Cependant, en dépit de leurs origines physiques radicalement différentes, la phase Onde de Densité de Spin et la phase supraconductrice présentent des analogies frappantes. Ces analogies, qui se traduisent par des équations rigoureusement identiques (dans l’approximation du nesting électron-trou parfait) ne sont pas seulement formelles. Elles traduisent également une similitude de certains aspects des deux types de transitions, qui toutefois présentent également des différences importantes. Dans les deux cas, un gap est ouvert dans le spectre des excitations individuelles. Ce gap représente le paramètre d’ordre. On peut l’associer à l’énergie de liaisons des paires formées dans la phase ordonnée. Il est donné par ODS =
U + < ck+Q ↑ ck↓ > N
(11.267)
k
531
Physique de la matière condensée
pour l’onde de densité de spin et par Supra =
U + + < ck↑ c−k↓ > N
(11.268)
k
pour la transition supraconductrice. ODS est l’énergie de liaison des électrons et trous appariés. Ces derniers ont un vecteur d’onde total de la paire électron-trou égal à Q et des spins opposés (pour l’onde de densité de charge, ils ont le même spin). Supra est l’énergie de liaison des électrons appariés. Dans ce cas, il s’agit d’un appariement électron-électron (et non plus électron-trou). Le vecteur d’onde total de la paire est nul et les deux électrons ont des spins opposés. Dans les deux cas, la divergence de la fonction de réponse qui cause l’instabilité de la phase « normale » (au sens de la théorie de Landau des liquides de Fermi normaux) est liée à une propriété de nesting de la surface de Fermi : – un nesting de type électron-trou dans le cas de l’Onde de Densité de Spin εk+Q = −εk
(11.269)
Ce nesting est toujours approché et résulte d’une propriété géométrique très particulière de la surface de Fermi. En fait, les phases Onde de Densité sont toujours induites par la présence d’une anomalie de Kohn. C’est pourquoi elles sont fréquemment observées dans les conducteurs quasi-unidimensionnels.
Théorie der Ondes de Densité de Spin
Nature du Nesting parfait
Champ moyen Nature des paires
Condensation des paires
Q fini ; ε k+Q = -ε k
Q = 0 ε k = +ε -k
Conducteurs de basse dimensionalité
Centre de symétrie
U > 0 échange
U < 0 Attraction induite par I interaction électron-phonon
Paires électron-trou de vecteur d onde Q
Paires
Occupation macroscopique des paires
Occupation macroscopique des paires
S < c+ k
Symétrie brisée
Théorie BCS Supraconductivité
k+Q
ck >
Invariance par renversement du temps
électron-électron de vecteur d onde total nul
S < c+ k
k
+ c-k >
Invariance de Jauge
Fig. 11.37 Comparaison des caractéristiques d’une Onde de Densité de Charge et d’un état supraconducteur.
532
11. Supraconductivité conventionnelle
– un « nesting » de type électron-électron dans le cas de la phase supraconductrice εk = +ε−k
(11.270)
Ici cette propriété de nesting est vérifiée exactement et résulte d’une propriété de symétrie très générale de la surface de Fermi. Elle ne suppose pas de propriétés géométriques particulières de la surface de Fermi. Quelques caractéristiques des deux transitions de phase sont résumés dans le tableau de la figure 11.37.
Notion d’ordre non diagonal à longue distance La différence essentielle entre l’onde de densité de spin et la supraconductivité est la nature de la symétrie brisée et de l’ordre à grande distance. Dans le cas de la supraconductivité, le paramètre d’ordre de la condensation de BCS est défini dans l’espace réciproque. La supraconductivité est caractérisée par un ordre à grande distance non diagonal dans l’espace réel, par opposition à l’ordre à grande distance diagonal défini, dans le cas d’une phase magnétique. Cette notion d’ordre non diagonal se réfère à la structure de la matrice densité. La notion d’ordre supraconducteur non diagonal dans l’espace réel explique pourquoi il n’est pas sensible aux impuretés non magnétiques, alors qu’au contraire, l’onde de densité est piégée par toute impureté, détruisant ainsi la possibilité d’une supraconductivité par glissement d’Onde de Densité (supraconductivité de Fröhlich). Prenons le cas de l’isotope 4 He de l’hélium, qui est un boson. Il forme à l’état liquide une phase superfluide à basse température, qui présente la même brisure de symétrie que celle de la supraconductivité, même si, dans ce cas, le liquide superfluide est neutre, car les atomes d’hélium ne portent pas de charge. Soit ρ la matrice densité. La valeur moyenne d’une observable A est donnée par < A >= Tr (ρA) Dans la représentation r , au dessus de Tc , ρ(r) est la densité de particules de spin σ au point r ρ(r) = ψ + (r)ψ(r) =
1 + ck1 σ ck2 σ exp i (k2 − k2 ) · r
(11.271)
k1 ,k2
+ où ψ + (r) = √1 k ckσ exp i k · r est l’opérateur de création d’un boson de vecteur d’onde k et de spin σ à la position r et est le volume du système. Les termes non diagonaux de la matrice densité sont donnés par : < r|ρ|r >= ρ(r, r ) =< ψ + (r)|r |ψ(r ) >=
1 exp i k · r < nk > (11.272) k
où < nk > est le nombre d’occupation moyen de l’état k. Considérons d’abord la phase normale (non superfluide), c’est-à-dire la phase stable pour T > Tc . L’état le
533
Physique de la matière condensée
plus peuplé est celui de plus basse énergie, la largeur de la distribution est de l’ordre de δk thermique qui correspond à l’énergie kB T ( (hδk) ¯ 2 /2m kB T ). ρ(r, r ) représente la fonction de corrélation dans l’espace réel : cette fonction tend vers zéro quand |r − r | tend vers l’infini. La phase normale ne présente donc pas d’ordre à grande distance. Considérons maintenant la phase superfluide. Pour toute température T < Tc , ρ(r, r ) est non nulle à l’infini. En effet, il y a maintenant, contrairement au cas de la phase normale, une occupation macroscopique de l’état de vecteur d’onde nul k = 0, car les particules suivent une statistique de Bose-Einstein. Cette caractéristique va conduire à une singularité de < nk=0 > : c’est le phénomène de la condensation de Bose. Cet état condensé est aussi caractérisé par une forte corrélation de phase entre les bosons, reliée à la brisure de la symétrie d’invariance de jauge. La fonction de corrélation ρ(r, r ) est donc égale à ρ(r, r ) =< r|ρ|r >=
1 < n0 > exp i k · r < nk > +
(11.273)
k =0
Le premier terme tend vers zéro à grande distance, comme dans la phase normale, mais le deuxième terme, associé à une occupation macroscopique de l’état k = 0 dans l’état superfluide, donne une contribution non nulle à longue distance. Cet ordre est appelé ordre à grande distance non diagonal car il correspond aux termes non diagonaux dans la représentation r de la matrice densité. Cet ordre, caractéristique de la condensation de Bose et de l’état superfluide, l’est aussi de l’état supraconducteur où les bosons sont les paires de Cooper formées de paires électron-électron (k ↑, −k ↓) dans la théorie BCS. La fonction de corrélation, quand la distance entre deux paires |r − r | tend vers l’infini, est approximativement donnée par la relation : < ψ + (r1 )ψ + (r2 )ψ(r1 )ψ(r2 ) >|r−r |→∞ < ψ + (r1 )ψ + (r2 ) >< ψ(r1 )ψ(r2 ) > = 0
(11.274)
Cette propriété est, là encore, caractéristique de l’ordre à longue distance non diagonal.
Densité de courant supraconducteur La conséquence la plus spectaculaire de cette ordre à longue distance est l’existence des courants permanents dans les supraconducteurs. Ce courant représente le mouvement cohérent des paires de Cooper, cohérence qui résulte de la brisure de symétrie de jauge. Pour mettre en lumière, de façon simple, l’origine physique de ce courant, nous allons utiliser un développement de l’énergie en fonction du paramètre d’ordre, qui est la fonction d’onde ψ décrivant une paire supraconductrice. La phase de cette fonction
534
11. Supraconductivité conventionnelle
est déterminée de façon unique : ψ = |ψ| exp i ϕ. La variable conjuguée de la phase est le nombre de particules : ⎧ [ϕ, N ] = i ⎪ ⎪ ⎪ ⎪ ⎨ ∂ N = i ∂ϕ (11.275) ⎪ ⎪ ⎪ ⎪ ⎩ ∂ ϕ = −i ∂N . La densité d’énergie libre U (ϕ) = U (ϕ1 − ϕ2 ) peut s’écrire comme un développement en fonction de ∇ϕ (et de |ψ|2 ). Si ϕ1 et ϕ2 sont les phases de deux régions cohérentes voisines, les opérateurs nombres correspondants vérifient les équations d’évolution suivantes : i h¯
∂N1 ∂H (ϕ1 − ϕ2 ) ∂N2 = [H, N1 ] = −i = −i h¯ ∂t ∂(ϕ1 − ϕ2 ) ∂t
(11.276)
Il existe donc un courant J de particules de la région 2 vers la région 1, associé à la dépendance de l’énergie en fonction de la différence de phase ϕ1 − ϕ2 J=
1 dU h¯ d ∇ϕ
(11.277)
L’énergie étant la valeur moyenne de l’hamiltonien, pour un superfluide neutre : U (ϕ) = U0 + α|∇ϕ|2
(11.278)
où U0 contient la dépendance en |ψ|2 , carré de l’amplitude du paramètre d’ordre. Pour un superfluide chargé, ce qui correspond au cas d’un supraconducteur : U (ϕ) = U0 + α|∇ϕ −
e ∗A 2 | c
(11.279)
où A est le potentiel vecteur. Le courant supraconducteur est défini par la relation ci-dessous, qui donne l’équation de London : 1 dU e ∗A e ∗ h¯ Js = = ∗ ||2 |∇ϕ − | (11.280) h¯ d ∇ϕ m c où e ∗ est la charge de la paire, c’est-à-dire 2e et m ∗ est la masse totale de la paire, soit 2m. Cette équation de London permet de dériver immédiatement des propriétés importantes de l’état supraconducteur, telles que la quantification du flux, l’existence de courants permanents, l’effet Meissner.
535
Physique de la matière condensée
11.3.6 Quelques effets quantiques importants dans les supraconducteurs L’effet Josephson Le modèle du champ de phase a été présenté et discuté de façon claire et pédagogique par Benoît Douçot dans ses notes de cours intitulées « une invitation à la supraconductivité». Nous ramènerons les lecteurs aux notes de Benoît Douçot [39], auxquelles il sera largement fait appel dans ce paragraphe. Ce modèle du champ de phase, dans sa version périodique, a reçu une confirmation expérimentale remarquable à travers l’effet Josephson, dont nous allons rappeler le principe ci-dessous. Considérons deux supraconducteurs mis en courant par une fine couche isolante. Schématiquement, nous pouvons présenter la géométrie d’une jonction Josephson comme dans la figure 11.12, mais ici des deux côtés de la jonction, nous avons placé des échantillons supraconducteurs notés « supra 1 » et « supra 2 », séparés par une fine couche isolante. Lorsque la température est supérieure à la température critique des supraconducteurs, nous avons deux métaux normaux. Si on applique une différence de potentiel entre les deux supraconducteurs, on observe un courant proportionnel à la différence de potentiel. Ce courant est interprété comme la résultante du passage par effet tunnel quantique des électrons à travers la jonction. Dans ce régime, une théorie due à Landauer permet de relier la conductance G de la jonction à la probabilité de transmission T d’un électron à travers la barrière de potentiel modélisant la couche isolante : G= VI =
e2 h¯ T
Le coefficient de transmission T est compris entre 0 et 1. Dans le régime de l’effet Tunnel, T 1. Que se passe-t-il lorsque les deux côtés de la jonction sont supraconducteurs ? Deux phénomènes remarquables ont été prédits par B. Josephson et observés expérimentalement ensuite : 1) Un courant peut passer à travers la jonction, même lorsque la tension appliquée est nulle. L’intensité maximale de ce courant sans dissipation est appelée courant critique de la jonction. Nous le noterons Ic . 2) Lorsque l’on applique une faible tension V indépendante, on observe un courant alternatif d’amplitude Ic et dont la fréquence ν est donnée par la relation de Josephson : ν = 2 eVh¯ Cette relation permet la détermination la plus précise du rapport he¯ . Par conséquent, l’effet Josephson est maintenant utilisé en métrologie pour la définition du Volt, en fixant la valeur de ν pour une tension appliquée de un Volt. Ces deux phénomènes se comprennent de façon naturelle dans le cadre du modèle de champ de phase [39]. Nous supposons que chaque côté de la jonction est décrit
536
11. Supraconductivité conventionnelle
par une phase 1 ou 2 pouvant dépendre du temps, mais homogène de part et d’autre de la jonction. Le système décrit ici est modélisé par l’hamiltonien simplifié :
HJ = peV1 1 + peV2 2 − EJ cos 1 − 2 Nous avons : i = où
1 ∂HJ h¯ ∂i
et i = −
1 d 1 = peV1 h¯ dt
EJ d 1 = − sin 1 − 2 h¯ dt
et
et
1 ∂HJ h¯ ∂i
(11.281)
d 1 2 = peV2 h¯ dt
EJ d sin 1 − 2 2 = h¯ dt
(11.282)
(11.283)
Ces équations ont le statut d’équations d’évolution des valeurs moyennes portant sur les opérateurs correspondants. Posons ≡ 1 − 2 .
Le courant I traversant la jonction est donné par I = dtd Q2 − Q1 , où Qi est la charge électrique totale du côté i de la jonction. Mais nous avons Qi = epi , donc, I =
pe EJ sin 1 − 2 = Ic sin h¯
avec Ic =
peEJ h¯
(11.284)
Nous obtenons donc la première prédiction de Josephson : Un courant passe à travers la jonction séparant deux supraconducteurs en l’absence de tension appliquée, dès qu’il existe une différence de phase à la traversée de la jonction. Ce courant est une fonction 2π−périodique de la différence de phase . Par ailleurs,
pe pe d V1 − V2 = V = h¯ h¯ dt
(11.285)
Ceci correspond à la deuxième prédiction de Josephson : En présence d’une tension appliquée V aux bornes de la jonction, la différence de phase aux bornes de la jonction présente une variation temporelle proportionnelle à V. En combinant les deux relations, nous voyons qu’une tension appliquée indépendante pe du temps donne naissance à un courant alternatif. En effet, (t ) = 0 + h¯ Vt, pe donc I (t ) = Ic sin 0 + h¯ Vt . La fréquence d’oscillation du courant est : ν=
peV h¯
537
Physique de la matière condensée
Ceci donne accès à la valeur de p. Expérimentalement, on trouve sans aucune ambiguïté : p=2 (11.286) Josephson était parti de la théorie microscopique de Bardeen, Cooper et Schrieffer, dans laquelle, par construction p = 2 (il s’agit de la formation des paires de Cooper). L’effet Josephson permet donc de tester un des aspects fondamentaux de la théorie microscopique de BCS. Par ailleurs,
pe pe d V1 − V2 = V = h¯ h¯ dt
(11.287)
Ceci correspond à la deuxième prédiction de Josephson. En présence d’une tension appliquée V aux bornes de la jonction, la différence de phase aux bornes de la jonction présente une variation temporelle proportionnelle àV.
Réflexions d’Andreev Dans ce paragraphe, nous reprenons rapidement les idées essentielles concernant un effet intéressant certes déjà connu depuis longtemps, mais qui fait encore actuellement l’objet de recherches actuelles originales, concernant certains aspects de la supraconductivité. Nous nous sommes essentiellement appuyés ici sur l’excellent livre, « Magnétisme et Supraconductivité », de Laurent–Patrick Lévy, dans la collection Savoirs Actuels, InterEditions/CNRS Editions. Lorsqu’un électron dont l’énergie est inférieure au gap est incident sur une interface entre un métal normal et un métal supraconducteur, il ne peut pénétrer le supraconducteur sous la forme d’une quasiparticule. On pourrait donc penser qu’il est réfléchi avec une probabilité unité ; en réalité il faut prendre en compte la possibilité de convertir l’électron en paire de Cooper, et de compenser la différence de charge et d’énergie par la réflexion d’un trou. Ce processus convertit un courant ohmique dans le métal normal en un courant supraconducteur dans le supraconducteur. On peut avoir une vision intuitive de ce phénomène, connu sous le nom de « réflexion d’Andreev », en considérant l’interface entre deux régions, normale et supraconductrice d’un supraconducteur de type I. Le paramètre d’ordre varie, dans ce cas, très lentement sur des distances de l’ordre de λF et il est possible d’utiliser l’approximation semi-classique. On peut ainsi représenter le spectre d’excitation en fonction de la distance à l’interface (voir figure 11.12). La vitesse de l’électron incident v=
∂ε(k) h¯ ∂k
(11.288)
diminue progressivement pour s’annuler au point A, puis change de signe lorsque la quasiparticule change de branche. La quasiparticule réfléchie a un vecteur d’onde
538
11. Supraconductivité conventionnelle
légèrement inférieur à kF et une vitesse opposée à celle de l’électron incident : c’est donc un trou. Le vecteur d’onde n’est que très légèrement affecté par la réflexion d’Andreev, en direction et en module, puisqu’on passe d’un état juste au dessus de εF à un état juste en dessous. Ce processus est partout le même autour de la surface de Fermi. Par conséquent, la réflexion d’Andreev n’est pas très sensible à la qualité de l’interface qui joue sur des distances très inférieures à ξ . La conversion d’un électron en trou est strictement interdite dans le métal normal à cause de la conservation de l’énergie et de la quantité de mouvement. Par contre, au voisinage d’un supraconducteur, les états propres sont des combinaison linéaires électron-trou et la conversion devient possible. Pour analyser la réflexion d’Andreev dans la limite propre (le ≥ ξ ), on suppose dans un premier temps que le paramètre d’ordre = 0 pour x ≤ 0 et = 0 pour x > 0, puis sa valeur recalculée de façon auto-cohérente. Les solutions des équations de Bogoliubov-de Gennes de part et d’autre de l’interface sont alors : 1 0 ik+ x −ik+ x ik− x −ik− x + Ce (11.289) + Be + De ψ< (x ) = Ae 0 1 1 1 iλ+ x −iλ− x ψ> (x ) = Ee + Fe (11.290) γ γ∗ où les ondes A et B décrivent un électron incident et réfléchi par l’interface, alors que les ondes C et D décrivent un trou dont la vitesse est dirigée soit selon −x C soit selon x D . Les vecteurs d’onde k+ et k− des et trou dépendent de états électron
leur énergie E ainsi que les composantes q = 0, qy , qz parallèlement à l’interface, 2
h¯ 2 k+ h¯ 2 q 2 =μ− + E = ξq + E = ξq 1 + q 2m 2m
(11.291)
2
h¯ 2 k− h¯ 2 q 2 (11.292) =μ− − E = ξq − E = ξq 1 − q 2m 2m où μ ≈ F est le potentiel chimique du métal et le rapport q = E /ξq une petite correction devant 1. Comme il n’existe aucun état dans le supraconducteur dont l’énergie | E | < , les solutions de l’équation de bogoliubov-de Gennes pour x > 0 sont évanescentes,
h¯ 2 λ2± √ (11.293) = ξq ± i 2 − E 2 = ξq 1 ± ηq ≈ γ = 2m E + i 2 − E 2 γ est de module 1 : pour ces états, le poids relatif des composante « électron » et « trou » est le même. Puis comme q est petit devant 1, k+ , k− , λ+ , et λ− sont tous voisins de kx . Plus précisément, ces vecteurs d’onde sont approximativement donnés par k ± = kx ±
E hv ¯ x
λ± = kx ± i
√ 2 −E 2 hv ¯ x
539
Physique de la matière condensée
où vx = h¯ kx /m. La mécanique quantique impose d’une part la continuité de la fonction d’onde à l’interface et d’autre part la conservation du flux, soit : C + D = Eγ + Fγ∗
A+B =E +F
k+ A − B = λ+ E − λ− F
k− C − D = λ+ γ E − λ− γ ∗ F
Ce système linéaire est simple à résoudre, ce qui permet de relier les amplitudes B ≈F D ≈ γ ∗E
A≈E C ≈ Eγ
Dans le cas où seul un électron est incident, la conversion en trou est totale. Inversement, lorsqu’un trou est incident, c’est un électron qui est intégralement réfléchi par l’interface. En pratique, l’interface n’est pas parfaite et un électron est toujours partiellement réfléchi par le désordre présent juste avant l’interface. Il est alors possible de paramétrer son effet par une matrice T de transmission qui en l’absence de champ magnétique doit avoir la forme −i β e r −i(α−β) e t t (11.294) T = r i(α−β) e iβ e t t pour les électrons, et T ∗ pour les trous. Ici, R = r 2 et T = t 2 sont respectivement les coefficients de réflexion et de transmission dans l’état normal. La matrice de transmission entre les amplitudes de l’électron incident (1) et réfléchi (ρ) et du trou « transmis » (τ ) s’obtient par simple multiplication des matrices de transmission associées aux électrons et aux trous de la matrice de réflexion d’Andreev : ∗−1 τ 1 γ O T∗ (11.295) = T −1 O γ −1 0 ρ ce qui permet de déterminer les coefficients de réflexion de l’électron et du trou,
4r 2 sin δ − α 2
R = ρ = 1 + 4r 4 − 2r 2 cos 2 δ − α T = 1−R =
t4
1 + 4r 4 − 2r 2 cos 2 δ − α
et l’angle δ paramètre l’énergie de l’électron relative au gap, E cos δ = Ces relations généralisent les facteurs d’impédance « BTK » [40], modèle où les impuretés sont décrites par un potentiel δ(r ) à l’interface.
540
11. Supraconductivité conventionnelle
Bibliographie 1. H. Kamerlingh Onnes, Leiden Comm. 120 b, 122 b, 124 c (1911) 2. B.T. Matthias, T.H. Geballe et V.B. Compton, Rev. Mod. Phys. 35, 1 (1963) 3. Hulm et Matthias dans Foner and Schwartz, Superconductor Material Science (1980) 4. J.G. Bednorz et A. Muller, Z. Phys. B 84, 189 (1986) 5. M.K. Wu et al., Phys. Rev. Lett. 58, 908 (1987) 6. J.L. Tholence et al., Phys. Lett. A 184, 215 (1994) 7. J. File et R.G. Mills, Phys. Rev. Lett. 10, 93 (1963) 8. W. Meissner et R. Ochsenfeld, Naturwiss 21, 787 (1933) 9. J.D. Livingstone, Phys. Rev. 129, (1943), (1963) 10. B.S. Deaver et W. M. Fairbank, Phys. Rev. Lett. 7, 43 (1961) 11. N.E. Philips, Phys. Rev. 134, 385 (1964) 12. A. Brown, M.W. Zemansky et H. A. Boorse, Phys. Rev. 92, 52 (1953) 13. Voir par exemple Q.H. Douglass et L.M. Falicov, Prog. in Low Temperature Phys. 4, 97 (1964) 14. P.L. Richards et M. Tinkham, Phys. Rev. 119, 575 (1959) 15. M.A. Biondi et M.P. Garfunkel, Phys. Rev. Lett. 2, 143 (1959) 16. J.W. Garland, Phys. Rev. Lett. 11, 114 (1963) 17. B.D. Josephson, Phys. Lett. 1, 251 (1962) ; Adv. Phys. 14, 419 (1965) 18. E. Maxwell, Phys. Rev. 78, 477 (1950) 19. S. Barisic, J. Labbé et J. Friedel, Phys. Rev. Lett. 25, 919 (1970) ; S. Barisic, J. Labbe, J. Friedel et F. Cyrot-Lackmann, J. Physique 30, 955 (1969) 20. V.L. Ginzburg et L.D. Landau, J.E.T. P. 20, 1064 (1950) 21. J.E. Zimmerman et J.E. Mercereau, Phys. Rev. Lett. 14, 887 (1965) 22. A.A. Abrikosov, Sov. Phys. J.E.T.P. 5, 1174 (1957) 23. C.J. Gorter et H.B.G. Casimir, Physica 1 , 306 (1934) 24. J. Bardeen, L.N. Cooper et J.R. Schrieffer, Phys. Rev. 108, 1175 (1957) 25. H. Fröhlich, Phys. Rev. 79, 845 (1950) 26. P.G. de Gennes, Superconductivity of metals et alloys (Benjamin, 1966) 27. L.N. Cooper, Phys. Rev. 104, 1189 (1956) 28. P.W. Anderson et P. Morel, Phys. Rev. 123, 1911 (1961) 29. R. Balian et N. R. Werthamer, Phys. Rev. 1312, 1553 (1963) 30. D.D. Osheroff, W.F. Gully, R.C. Richardson et D.M. Lee, Phys. Rev. Lett. 29, 920 (1972) 31. W.N. Hardy et al., Phys. Rev. Lett. 70, 3999 (1993) 32. C.C. Tsuei, J.R. Kirtley, C.C C. Chi, L.S. Yu-Jahnes, A. Gupta, T. Shaw, J.Z. Sunand, M.B. Ketchen, Phys. Rev. Lett. 73, 593 (1994) 33. N.N. Bogoliubov, Nuovo Cimento 7, 794 (1958) 34. D’après IBM Journal of Research and Development 6, (1962) 35. Voir par exemple R.D. Parks, Superconductivity, volume I (M. Dekker, New York), 1969
541
Physique de la matière condensée
36. L.P. Gorkov, Sov. Phys. 9, 1364 (1959) ; A.A. Abrikosov, L.P. Gorkov et I.E. Dzyaloshinskii, Methods of Quantum Field Theory in Statistical Physics (Prentice Hall, 1963) 37. G.D. Mahan, Many Particle Physics (Plenum, 1981) 38. H. Fröhlich, Proc. Roy. Soc. (London) A 223, 296 (1954) 39. Benoît Douçot, « Une invitation à la su praconductivité », Notes de Cours du D.E.A. « Champs, Particules, Matière » 40. G.E. Blonder, M. Tinkham et T. M. Klapwijk, Phys. Rev B 25, 4515 5 (1982)
542
Les supraconducteurs non conventionnels
12.1 Introduction Depuis la découverte expérimentale de la supraconductivité dans le Mercure en 1911, avec une température critique Tc de 4,2 K, jusqu’à la fin de 1986, la plus haute température critique observée n’avait progressé que de moins de vingt degrés Kelvin, malgré tous les efforts déployés dans les matériaux les plus divers, à caractère métallique. La théorie BCS, bien qu’apportant la compréhension microscopique du phénomène, n’avait pas permis de progrès décisifs dans l’obtention de température critiques élevées. L’extension de cette théorie à des couplages électron-phonon forts [1, 2] semblait même limiter les espoirs d’obtenir des températures beaucoup plus élevées. Le palier d’une vingtaine de degrés obtenu expérimentamentalement, semblait à beaucoup infranchissable. C’est pourquoi les activités de recherches sur la supraconductivité « conventionnelle », bien comprise sur le plan fondamental, s’étaient alors beaucoup ralenties. Cependant, l’association d’un modèle théorique bien compris et d’un corpus d’expériences en bon accord avec ce modèle avait érigé ce qu’on appelle en épistémologie un « paradigme », c’est-à-dire un modèle théorique de pensée qui oriente de façon cohérente la recherche et la réflexion scientifiques.
543
Physique de la matière condensée
12.2 Le « paradigme » de la supraconductivité « conventionnelle » 12.2.1 L’ordre supraconducteur Il est important de souligner que le point de départ de la théorie BCS n’est ni la résistance nulle du supraconducteur, ni sa capacité à expulser le flux du champ magnétique appliqué. D’après la théorie BCS, le signe distinctif de la supraconductivité n’est aucune de ces manifestations spectaculaires qui ont été à l’origine de sa découverte expérimentale, et qui continuent à nous fasciner par leur aspect spectaculaire et original pour tous ceux qui sont habitués aux lois de la physique classique. Pour cette théorie, ce qui exprime l’existence de la supraconductivité est en réalité le comportement d’une fonction de corrélation à deux particules. Une transition de phase est souvent accompagnée de l’apparition d’un ordre à longue distance. Cet ordre est représenté par un paramètre d’ordre dont la valeur est finie dans la phase ordonnée. Dans le cas de la transition supraconductrice, ce paramètre d’ordre est la fonction de corrélation à deux particules : s†1 ,s2 (r1 , r2 )s ,s (r2 , r1 ) =< r1 , s1 ; r2 , s2 | ρ (2) | r1 , s1 ; r2 , s2 > 1 2
(12.1)
où r1 et s1 désignent respectivement les positions et les spins des deux fermions et ρ (2) la matrice densité à deux particules. À haute température dans la phase normale, la valeur moyenne de cette fonction est nulle : aucune corrélation n’existe entre les fonctions d’onde individuelles. Au dessous de la température de transition, dans l’état supraconducteur, s1 ,s2 (r1 , r2 ) a une valeur non nulle pour des valeurs arbitraires de la distance entre les deux particules, r = r1 − r2 . Lorsque l’on parle de la formation de paires dans un supraconducteur, c’est bien de cette corrélation que l’on veut parler, et non pas une entité rigide à deux particules. L’apparition de l’ordre est aussi accompagnée par la brisure d’une symétrie. L’état ordonné est moins symétrique que l’état désordonné. Autrement dit, il ne reste pas invariant dans toutes les opérations de symétrie du système définies dans l’état désordonné. Dans le cas de la transition supraconductrice, la symétrie brisée est celle de l’invariance de jauge. L’état du supraconducteur est caractérisé par une cohérence de phase entre les fonctions d’onde à deux particules. Un tel état ne reste pas invariant sous l’opérateur de symétrie de jauge. Cette description de la supraconductivité est valable dans des contextes aussi différents que la supraconductivité de l’Aluminium, la suprafluidité de 3 He [3] et l’état fondamental d’une étoile à neutrons, même si, bien évidemment, les interactions physiques qui sont à l’origine de la formation des paires, dans ces trois cas de figures, sont très différentes. Dans le cas de l’Aluminium, c’est le couplage entre les électrons et les phonons qui crée un mécanisme d’attraction entre les électrons. Dans le cas de 3 He , l’échange des fluctuations de spin entre les fermions que sont les atomes à trois nucléons est à l’origine de la formation de paires. Tandis que les neutrons s’attirent par
544
12. Les supraconducteurs non conventionnels
l’intermédiaire de l’interaction forte. L’échelle d’énergie mise en jeu dans la formation des paires se manifeste par la diversité des valeurs de la température critique dans les trois cas : 3 × 10−3 K pour 3 He , 1 K pour l’aluminium et 1010 K pour une étoile à neutrons. Il est également important de souligner une autre différence essentielle entre ces trois exemples. Tandis que dans les métaux ordinaires, le paramètre d’ordre apparaît dans un réseau périodique et garde toute la symétrie du cristal, ni dans 3 He , ni dans l’étoile à neutrons, l’ordre suprafluide ne garde la symétrie sphérique du gaz de fermions qu’il respectait avant la condensation dans l’état supraconducteur. Nous reviendrons plus loin sur ce point important pour l’aspect non conventionnel de la suprafluidité.
Les vérifications expérimentales La théorie BCS prévoit des phénomènes microscopiques associés à la supraconductivité, qui sont pleinement confirmés par l’expérience. Notamment, elle prévoit l’ouverture d’une zone interdite (un « gap ») dans le spectre d’excitations. L’amplitude de ce gap à température nulle traduit la quantité finie d’énergie nécessaire pour créer une excitation électronique à partir du condensat. Cette théorie peut ainsi faire des prévisions quantitatives sur les paramètres fondamentaux de la supraconductivité. Elle relie ainsi l’amplitude du gap à la valeur de la température critique. D’autre part, son formalisme et ses concepts ont été employés avec succès dans des contextes où le système fermionique n’est pas la mer des électrons en interaction faible d’un métal et où le mécanisme d’appariement n’est pas lié à l’interaction électron-phonon. Nous avons déjà cité le cas de 3 He et de l’étoile à neutrons, mais bien d’autres exemples existent. La théorie BCS a gagné en puissance et en universalité.
12.2.2 Les points essentiels de la théorie BCS de la supraconductivité conventionnelle Avant d’étudier de réelles extensions de la supraconductivité « conventionnelle » à des cas que nous baptiserons de « non conventionnels », nous allons faire la liste des points essentiels qui caractérisent précisément cette supraconductivité « conventionnelle ». Le mécanisme d’appariement
Dans la théorie BCS originale, l’appariement des électrons en paires de Cooper est due à une instabilité de la surface de Fermi vis-à-vis d’une interaction attractive entre fermions. Cette instabilité existe en présence d’une interaction attractive entre fermions, prévue par Cooper. Dans le cas de cette théorie, l’interaction attractive résulte de l’interaction électron-phonon. Une remarquable signature expérimentale de cet effet est l’effet isotopique. On peut songer à d’autres mécanismes, à la place
545
Physique de la matière condensée
du couplage électron-phonon, pour donner lieu à une interaction attractive sur une fenêtre étroite d’énergie autour de la surface de Fermi. Dans une telle éventualité, l’essentiel du formalisme BCS resterait intact. Citons encore une fois le cas de la suprafluidité de 3 He , où l’emploi de ce formalisme pour aborder un mécanisme de formation de paires associant les fluctuations de spin à l’interaction de Van der Waals a été un succès. Une grande variété de mécanismes ont été proposés, où une grande variété d’autres quasiparticules, remplaçant les phonons comme bosons intermédiaires véhiculant l’interaction attractive entre électrons, ont été suggérées. Mais la vérification expérimentale sur ce point précis paraît très difficile. Une supraconductivité de basse température critique
Dans le modèle de supracondutivité conventionelle de BCS, la température critique est fixée par les énergies caractéristiques que sont l’énergie de Fermi, la fréquence de Debye et la force de l’interaction électron-phonon. Dans les cas usuels, les chiffres couramment rencontrées pour ces énergies fixent presque inéluctablement un plafond pour la température critique de supraconductivité dans le modèle BCS conventionnel d’une vingtaine de degrés K, comme l’ont montré les études de l’extension de la théorie BCS à un couplage fort d’Eliashberg et MacMillan. La symétrie du paramètre d’ordre
Une autre manière de proposer une supraconductivité qui s’écarte du modèle initial de BCS consiste à considérer la symétrie brisée par la transition supraconductrice. D’après la terminologie initiée par Fulde, dans le contexte de la supraconductivité des fermions lourds, et que nous allons poursuivre ici, on appelle une transition supraconductrice « non conventionnelle » une transition où en plus de la symétrie de jauge, une ou plusieurs autres symétries sont brisées. Comme nous l’avons vu, le paramètre d’ordre de l’état supraconducteur ne conserve pas la symétrie de jauge de l’état normal. Mais dans un supraconducteur conventionnel, il en garde toutes les autres. À l’opposé, au cours d’une transition non conventionnelle, le système perd d’autres symétries. Il peut s’agir soit de la symétrie d’inversion dans le temps, soit d’une composante de la symétrie cristalline. Le paramètre d’ordre de l’état supraconducteur est cette fonction d’onde à deux particules, mentionnée plus haut, s1 ,s2 (r, R), où r = r1 − r2 et R = 12 (r1 + r2 ). En limitant notre discussion aux systèmes homogènes, on peut oublier sa dépendance en R. La fonction d’onde à deux fermions doit être antisymétrique sous l’opération de permutation des particules. s1 ,s2 (r ) = −s1 ,s2 ( − r ) Le premier point à discuter concerne l’orientation relative des spins. On peut distinguer entre un cas singulet et un cas triplet. Dans le premier cas, la fonction d’onde est antisymétrique dans une opération de permutation de spins, tandis que dans le cas
546
12. Les supraconducteurs non conventionnels
triplet, elle est symétrique. Schématiquement, le cas singulet correspond à un spin total nul, tandis que dans le cas triplet, la valeur du nombre quantique S est l’unité. Reste la partie orbitale de s1 ,s2 (r ) ou celle de sa transformée de Fourier dans l’espace réciproque s1 ,s2 (k). Dans le cas singulet, elle est scalaire et est une fonction paire de k : (k) = ( − k) Dans le cas triplet, il s’agit d’une fonction vectorielle impaire : d (k) = −d ( − k) Ces conditions sont imposées par l’antisymétrie de la fonction d’onde. Dans le cas où il s’agit d’électrons dans un solide, la situation est plus compliquée. En présence de couplage spin-orbite, on ne peut plus décomposer la fonction d’onde aussi facilement. Le spin cesse d’être un bon nombre quantique. Mais tant que le cristal garde un centre d’inversion, la distinction entre les états de parité paire et impaire reste valable. Quand on parle d’une supraconductivité singulet en présence de l’interaction spin-orbite, on pense à un paramètre d’ordre qui serait une fonction paire de k et inversement, il s’agit d’une fonction impaire en k chaque fois qu’on évoque une supraconductivité triplet. Dans la supraconductivité usuelle, le paramètre d’ordre est pair. En plus, sa structure est triviale : il ne dépend pas de l’orientation de k. Ainsi, une telle supraconductivité est caractérisée par l’amplitude et la phase d’un scalaire. On parle d’une « supraconductivité d’onde s ». Toute autre est la supraconductivité d’onde p de 3 He. Dans ce cas, la fonction d’onde est impaire et, en l’absence de couplage spin-orbite, on peut parler d’une véritable supraconductivité triplet. La partie orbitale de la fonction d’onde a un moment angulaire L = 1 et le paramètre d’ordre est 9 fois dégénéré (avec 3 degrés de liberté pour le spin de la fonction d’onde et 3 pour son moment angulaire orbital). Le problème central de la supraconductivité non conventionnelle dans cette optique serait de déterminer la symétrie résiduelle du paramètre d’ordre supraconducteur. Il s’agit de savoir quelles sont les opérateurs de symétrie dont l’opération laisse le paramètre d’ordre invariant.
12.3 Les supraconducteurs « non conventionnels » Ce qui précède montre clairement qu’il existe de nombreuses façons de briser les différentes caractéristiques du « paradigme » de la supraconductivité BCS. En effet, les expériences ont clairement montré que de nombreux matériaux supraconducteurs ne vérifiaient pas ces caractéristiques considérées comme essentielles du « paradigme ». Le cas le plus spectaculaire fut sans doute celui des cuprates, qui avaient crevé le plafond de la plus haute température critique en 1986, même si ce ne furent pas les premiers exemples connus de supraconducteurs « non conventionnels ». Les supraconducteurs organiques d’une part (Jérome et al. [4]), et les fermions lourds d’autre part (Steglich
547
Physique de la matière condensée
et al. [5]) avaient en quelque sorte ouvert la voie, en dépit de température critiques modestes, mais avec des nouveautés conceptuelles considérables. Dans ce manuscrit, nous allons évoquer rapidement quelques exemples marquants de supraconducteurs non conventionnels, en ramenant à chaque fois le lecteur aux très nombreux articles de revue qui explicitent clairement ce que ces matériaux apportent de nouveau, précisémént sur le plan conceptuel. Nous allons en particulier évoquer brièvement le cas des cuprates [6], celui des organiques, celui des fermions lourds et celui des pnictures [7]. Cette liste n’est certainement pas exhaustive, ce qui signifie que nous ne pourrons pas mentionner d’autres exemples importants.
12.3.1 Les cuprates Au cours des années 1980, Raveau et Michel, Chimistes de Caen, avaient réussi à synthétiser des composés d’oxydes de métaux de transition, de la famille La2 CuO4 , présentant des propriétés métalliques [8]. Le caractère conducteur, alors que les composés de ce type sont habituellement des isolants de Mott (les électrons d de l’ion de transition sont localisés par les corrélations électroniques), est peut-être dû à l’hybridation importante de la bande d du Cuivre et de la bande d de l’Oxygène. Mais ce n’est que fin 1986 que la supraconductivité devait être observée dans La2−x Srx CuO4 , avec une température critique maximum d’environ 40 K, presque deux fois plus élevée que la plus haute température critique observée auparavant. Ce nouveau type de matériaux ouvrait une voie nouvelle qui allait permettre des progrès rapides : 95 K dans YBa2 Cu3 O7−x en février 1987, 115 K dans Bi2 Sr2 Ca2 Cu3 O10 , 125 K dans Tl2 Ba2 Ca2 Cu3 O10 en avril 1988, 155 K dans HgBa2 Ca2 Cu3 O9 sous pression de 250 kbars en 1993. Dans l’histoire de la Physique de la Matière Condensée, peu de découvertes ont déclenché une explosion de publications scientifiques d’une ampleur comparable à celle qui a suivi l’annonce de l’observation d’une transition supraconductrice dans un échantillon de BaLaCuO par Bednorz et Muller en 1986. Cette découverte a réellement ouvert une voie nouvelle non seulement sur le plan des matériaux, mais aussi et surtout sur le plan conceptuel. C’est réellement tout un pan de la Physique qui s’ouvrait à la recherche. Dans ce paragraphe, nous allons essayer de proposer une revue sommaire de l’essentiel de la Physique des cuprates supraconducteurs. Pour cela nous allons essentiellement nous appuyer sur un choix de quelques excellentes revues citées en référence et sur les exposés très clairs des manuscrits d’Habilitation à Diriger les Recherches de l’École Doctorale de Physique de la Région Parisienne, et notamment de ceux de Kamran Behnia, Julien Bobroff [9], Claude Pasquier, et Pawel Wzietek. Structure électronique des plans CuO2
Le point commun à tous les cuprates supraconducteurs est la présence de couches bidimensionnelles de plans CuO2 séparées entre elles par des blocs réservoirs de
548
12. Les supraconducteurs non conventionnels
Fig. 12.1 Maille élémentaire du composé YBa2 Cu3 O7 , qui fait apparaître deux plans CuO2 , siège de la supraconductivité (en grisé) [10, 9, 12].
charge, comme le montre la figure 12.1 qui représente l’exemple de YBaCuO [11]. Ces plans CuO2 réunissent trois propriétés qui sont essentielles pour la physique de ces matériaux : – la présence d’ions de transition Cu 2+ . Par leur valence 3d 9 et leur environnement cristallographique dans un octaèdre d’oxygène, ces ions possèdent un trou unique sur une orbitale d de type x 2 − y 2 . La répulsion coulombienne Ud est très élevée, de l’ordre de 9 à 10 eV. La faible valeur du spin 1/2 du Cu 2+ renforce les effets des fluctuations quantiques de spin. – une très forte covalence entre ions Cu 2+ et ions O 2− , liée à la géomètrie de ces plans et au fait que les niveaux électroniques de l’oxygène εp et du Cuivre εd sont les plus proches parmi les ions de transition. Cette covalence correspond ici à l’hybridation entre les orbitales dx 2 −y 2 du Cu et l’orbitale 2pσ de l’oxygène voisin qui pointe dans l’axe Cu−O−Cu. – une structure bidimensionnelle, qui renforce les effets quantiques également. Les orbitales pertinentes associées aux plans Cu 2+ sont représentées sur la figure 12.2. Les valeurs des répulsions coulombiennes, des fréquences de sauts entre orbitales et de l’écart d’énergie entre niveaux O et Cu exprimés en eV sont représentés dans le tableau ci-dessous. Ud
Up
Upd
=εp -εd
tpd
tpp
9,5
5
1
3,5
1,5
0,65
549
Physique de la matière condensée
Fig. 12.2 Orbitales en jeu pour décrire les propriétés électroniques des plans CuO2 [13, 9].
Fig. 12.3 Structure de bande d’un plan CuO2 . On note LHB et UHB les bandes de Hubbard basse et haute sur Cu, B et NB les bandes liante et non liante de l’hybridation O-Cu, Ud la répulsion coulombienne sur Cu et l’énergie de transfert de charge entre O et Cu (d’après [9]).
On constate que l’échelle d’énergie dominante est bien Ud et que tpd a une valeur élevée et une valeur faible. Cette forte covalence p − d , cette forte répulsion coulombienne Ud et la bidimensionalité placent les plans CuO2 dans la famille des systèmes fortement corrélés de façon analogue aux chaîne et aux et aux échelles de spin (figure 12.3). En l’absence de porteurs de charge supplémentaire, la répulsion Ud empêche les trous des plans CuO2 de se délocaliser dans le réseau, alors qu’un calcul de srtucture de bande sans corrélation prédirait un comportement métallique pour une bande demi-remplie. Les plans CuO2 sont des isolants de Mott à transfert de charge. Le couplage d’échange entre Cu est mesuré par diffusion de neutrons de l’ordre de 100 meV. Cette valeur est élevée, à cause de la covalence entre O et Cu. Les cuprates non dopés constituent donc une bonne réalisation d’un Hamiltonien d’Heisenberg de spins 1/2 à deux dimensions : H = J Si · Sj L’existence de couplages transverses entre plans permet l’apparition de l’antiferromagnétisme au vecteur d’onde π/a, π/a , de température de Néel TN comprise entre 250 à 400 K. Puisqu’il s’agit de spins 1/2, il existe de fortes fluctuations quantiques qui confèrent des propriétés originales à cet état.
550
12. Les supraconducteurs non conventionnels
L’effet du dopage en trous Il est possible de doper en trous les plans CuO2 en provoquant un transfert de charge depuis les blocs réservoirs. Ce transfert de charge s’obtient en changeant la composition de ces blocs, soit par ajout d’oxygène, soit en remplaçant des atomes par d’autres atomes de charge différente. La substitution cationique hérérovalente ou l’oxydation mène à l’introduction de trous sur l’orbitale 2p des oxygènes des plans. On attend a priori un comportement typique des trous sur orbitales Oxygène 2p distinct du comportement des trous sur site Cu. Il conviendrait de décrire ce système par un Hamiltonien de Hubbard à trois bandes dx 2 −y 2 , px et py qui fasse intervenir les termes cinétiques et coulombiens sur O et Cu. Cependant, les mesures par RMN montrent le même comportement de la susceptibilité uniforme en fonction de la température et du dopage sur les noyaux O, Cu, et Y . Ce comportement caractéristique d’une bande unique s’explique par la forte covalence entre Cu et O : le trou introduit par dopage s’hybride avec le trou Cu et l’ensemble forme une seule entité. Zhang et Rice ont proposé que le trou introduit par dopage se délocalise sur les orbitales de quatre oxygènes autour du Cuivre [14]. Le spin porté par ce trou forme alors avec le trou du Cu un singulet ou un triplet. Alors, les plans CuO2 dopés peuvent être décrits par un hamiltonien de Mott-Hubbard à une seule bande : + + cj σ + c.c. − t ci σ + c.c. + U ni↑ ni↓ (12.2) ciσ ciσ H = −t σ
σ
i
où les deux premiers termes t et t ’ décrivent les sauts entre premiers voisins ou entre seconds voisins, et U décrit la répulsion coulombienne. Le porteur élémentaire associé à cet hamiltonien n’est ni le trou sur Cu ni le trou sur O, mais un objet composite dont la densité de spin est essentiellement sur le site Cu associé à l’existence de singulets. De ce point de vue, les propriétés du système devraient évoluer non pas proportionnellement à x , le nombre de trous dopés, mais plutôt à 1 − x . Enfin, dans la limite d’un couplage fort où Ut 1, on peut transformer l’Hamiltonien de Hubbard en un Hamiltonien simplifié dit « t − J ». Dans ce modèle, on interdit la double occupation d’un site (comme si U était infini). Il apparaît un terme JSi Sj qui traduit un couplage d’échange antiferromagnétique entre proches voisins où J = 4t 2 /U π.
L’état supraconducteur Les cuprates supraconducteurs (figure 12.4) se caractérisent par la valeur de leur température critique très élevée. La supraconductivité est induite par des paires de Cooper, comme dans BCS, comme l’ont montré les mesures d’effet Josephson et de quantification du flux [16, 15]. La longueur de cohérence ξ , typique de l’extension
551
Physique de la matière condensée
Fig. 12.4 Diagramme de phase des cuprates [9].
d’une paire de Cooper, est de l’ordre de quelques dizaines d’Å, c’est-à-dire 10 à 20 fois moins que dans les supraconducteurs usuels. Par contre, la longueur de London, c’est-à-dire de pénétration du champ magnétique λ, est du même ordre de grandeur que dans le cas BCS (0,1 à 1 μm). Il existe dans les cuprates une forte anisotropie de ces propriétés, liée à la structure bidimensionnelle des plans. Enfin, ces supraconducteurs non conventionnels sont de type II, et leurs champs critiques Hc 2 , pouvant aller jusqu’à 100 Teslas, sont bien plus élevés que dans le cas BCS. Dans un supraconducteur de type BCS, le paramètre d’ordre supraconducteur possède une symétrie isotrope de type s, et il existe une relation universelle entre Tc et , 2 = 3, 5kB Tc . Dans les cuprates, la symétrie est anisotrope de type dx 2 −y 2 [17, 21]. Une telle symétrie signifie non seulement que le paramètre d’ordre change de signe selon la direction, mais qu’il existe des zones de la surface de Fermi selon les diagonales où le gap s’annule. Une explication de type BCS simple ne peut plus expliquer la supraconductivité de ces matériaux. Le transport dans l’état supraconducteur est dominé par l’existence de « nœuds » dans l’espace réciproque où le gap s’annule. Des quasiparticules peuvent exister le long de ces nœuds, responsables du transport de chaleur et de la variation de la longueur de pénétration. Leur comportement est typique de quasiparticules de Landau dans un modèle de Fermi. En résumé, l’état supraconducteur présente de nombreuses caractéristiques très différentes des supraconducteurs usuels de type BCS : symétrie anisotrope, gap non relié à Tc , modes magnétiques, etc. Cependant, certaines de ces propriétés peuvent s’expliquer dans un cadre BCS adapté, notamment le comportement des quasiparticules résiduelles.
552
12. Les supraconducteurs non conventionnels
L’état surdopé : vers un bon liquide de Fermi Plus le dopage en trou est élevé, plus la Tc décroît, et plus le comportement des plans CuO2 se rapproche de celui d’un liquide de Fermi usuel. Les mesures de photoémission révèlent l’existence d’une large surface de Fermi dont le volume est proportionnel à 1 − x , où x est le nombre de porteurs, et de type plutôt électrons. Ceci confirme que les porteurs ici en jeu ne sont pas simplement les trous dopés, mais plutôt une bande composée à la fois des trous sur Cu de l’isolant et des trous dopés. Les mesures de transport montrent un comportement en T 2 de la résistivité, caractéristique d’une diffusion de nature électronique d’un liquide de Fermi. Les mesures de temps de relaxation montrent de plus une variation de type Korringa, également attentue dans ce cas. Ainsi, dans les échantillons très surdopés, lorsque la Tc s’annule presque, les propriétes du système caractérisent un comportement typique d’un liquide de Fermi, tant du point de vue du magnétisme que de celui du transport. En fait, seuls les composés très surdopés sont donc de bons liquides de Fermi. Des études expérimentales sur la symétrie du paramètre d’ordre ont été menées. En particulier des collaborations ont été poursuivies entre H. Raffy et C.C. Tsuei et ont donné lieu à des publications importantes. Il faut, en particulier, mentionner les références [18–20]. Sur le plan expérimental, de nombreux et importants travaux sur les superconducteurs non conventionnels publiés récemment, souvent en collaboration entre Sherbrooke et Orsay [77–80].
1,5
TC A B
1,0
A
C D
E
0,5
0,0
B
C D E
0
100 200 Température (K)
300
Fig. 12.5 Résistivité planaire d’un Tl22 O1 pour différents dopages : ρ évolue d’un comportement linéaire à dopage optimum vers un comportement en T 2 à très fort dopage (Kubo, 1991 [22]).
553
Physique de la matière condensée
Près du dopage optimal : un métal anormal Près du dopage optimal, il existe encore une surface de Fermi, toujours de volume proportionnel à 1 − x et conforme aux calculs de bande avec seconds voisins. Dans ce calcul, il apparaît une singularité de Van Hove près du niveau de Fermi, qui pourrait influencer les propriétés électroniques du système. Hormis cette surface de Fermi, l’ensemble des propriétés du système présentent un comportement fortement anormal par rapport à un liquide de Fermi. Il n’apparaît plus de pic de quasiparticule cohérent bien défini. La quantité Im /T , où est la « self » énergie des électrons, présente de plus une variation universelle en fonction de ω/T , que l’on soit dans l’état normal ou dans l’état supraconducteur. Cette dépendance suggère que la seule énergie pertinente est ici la température. Les mesures de transport sont également très surprenantes. La résistivité planaire présente une variation linéaire en température sur toute la gamme observable, de 10 K à 1000 K, alors que dans un métal classique la diffusion par les phonons ne pourrait pas expliquer une telle linéarité sauf à condition de se limiter au dessus de D /4. Cette linéarité de la résistivité est donc liée à une diffusion de nature électronique très différente du T 2 attendu dans ce cas (figure 12.6). 800
ρab (μΩcm)
600
Bi2201 214 LSCO Bi2212
400
YBaCuo
200
0
0
200
400
600
800
Température (K)
Fig. 12.6 Résistivité dans le plan pour différents cristaux près du dopage optimal : la pente est à peu près indépendante du matériau étudié (Battlog, 1992).
Les mesures de magnétisme montrent, pour certaines d’entre elles, un comportement également non métallique. L’état dopé de façon optimale est donc difficilement descriptible en termes de liquide de Fermi simple, tant pour ses propriétés de spin que de charge. Il est même difficile de définir la nature exact des porteurs en jeu.
L’état sous-dopé et le pseudo-gap Dans l’état normal sous dopé, les propriétés physiques, au dessus de ce qu’on appelle la ligne de pseudogap T ∗ sont analogues à celles décrites ci-dessus pour le dopage optimum : lois d’échelle universelles, linéarités de la résistivité, susceptibilité uniforme constante, temps de vie des quasiparticules très court, etc.
554
12. Les supraconducteurs non conventionnels
Au contraire, en dessous de cette ligne de pseudogap, toutes ces propriétés sont fortement modifiées. Il apparaît un gel progressif des excitations de basse énergie, tant dans le canal spin que dans le canal charge. La température T ∗ définit ici le début de ce gel, qui n’a rien d’une transition de phase. D’ailleurs, cette température T ∗ peut dépendre à la fois de la technique de mesure et du critère retenu pour la mesurer. Historiquement, la RMN fut la première technique capable de distinguer les effets de ce pseudogap (figure 12.7).
Fig. 12.7 Manifestation du pseudogap sur les propriétés magnétiques des plans CuO2 . La figure montre la susceptibilité uniforme mesurée par RMN de 89 Y dans YBaCuO pour différents dopages, le zéro de susceptibilité se situant vers 150 ppm (Alloul, 1989 [20, 21], Bobroff, 2002 [25]). Les températures critiques sont indiquées avec les mêmes symboles sur le diagramme de phase en insert. Il apparaît une température T ∗ plus élevée que Tc .
Les mesures d’ARPES et d’effet tunnel permettent de sonder plus directement la forme du pseudogap [26]. Il apparait que le gap supraconducteur de symétrie d survit au dessus de Tc (figure 12.8) avec la même symétrie et la même amplitude. L’apparition de ce gap dans l’état normal s’accompagne de la disparition de portions de la surface de Fermi le long des verticales et des horizontales. Ce gap disparaît à peu près linéairement avec la température, pour s’éteindre à T ∗ . Il existe donc dans l’état normal sous-dopé un gap qui semble de même nature que le gap supraconducteur, de même amplitude indépendante de T , qui disparaît à T ∗ et qui décroît avec le dopage comme T ∗ . Ce gap affecte toutes les propriétés du système, autant celles de charge que de spin. L’état pseudogap pourraît être une subsistance de l’état supraconducteur. Il pourrait aussi s’agir d’un gap signalant l’apparition d’une phase ordonnée qui n’a rien à voir avec la supraconductivité. Ce « pseudo-gap » apparaît comme la conséquence d’un ordre local qui pourraît être dû aux fluctuations magnétiques, ainsi que proposé notamment par Bourbonnais et Caron. Cet ordre local n’étant pas un ordre à longue distance, induit donc ce « pseudo-gap » mais pas un véritable gap parce qu’il ne s’agit que d’un ordre local.
555
Physique de la matière condensée
‚ ‚ ‚
‚
‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚
Fig. 12.8 Mesure par effet tunnel du gap supraconducteur et de sa persistance au dessus de Tc , mesurée dans un sous-dopé Bi2212 (Renner, 1998 [29]).
Quelques propositions théoriques De nombreux modèles tentent d’interpréter les propriétés anormales des cuprates mais aucun, à ce jour, n’a pu donner une explication claire et cohérente de l’ensemble des proprétés expérimentales. On trouve dans les nombreux articles de revue des modèles qui proposent des interprétations très diverses. Nous nous servirons de ces tentatives d’explications parues dans la littérature données en référence, et notamment dans les manuscrits d’Habilitation à Diriger des recherches de l’École Doctorale de Physique de la Région Parisienne déjà mentionnés pour proposer un tableau de revue des principaux modèles théoriques proposés dans la littérature.
12.3.1.1 Modèles en couplage faible Plusieurs modèles proposent d’interpréter la supraconductivité découverte en 1986, ainsi que toutes les récentes découvertes expérimentales de « supraconductivité non conventionnelle » par des modèles où les interactions sont traitées en couplage faible. Parmi ceux-ci figurent notamment des modèles où l’on conserve pour l’essentiel le modèle BCS, avec encore le même rôle joué par les phonons et par l’interaction électron-phonon : Modèle BCS – Phonons
Certains auteurs proposent d’expliquer la supraconductivité dans un cadre de type BCS, avec un mécanisme d’appariement électron-phonon, comme dans les
556
12. Les supraconducteurs non conventionnels
supraconducteurs conventionnels. Dans ce cadre, les modes de phonons pourraient présenter des caractéristiques spécifiques : respiration des oxygènes apicaux, modes de type polarons ou bipolarons, liens avec les singularités de Van Hove, etc. [27]. Effets des singularités de Van Hove
Près du dopage optimum, une singularité de Van Hove apparaît près du niveau de Fermi. Cette spécificité a probablement des effets importants sur l’ensemble des théories décrites, au moins en couplage faible. La singularité de Van Hove peut permettre d’augmenter la Tc et peut empêcher le système d’aller vers d’autres ordres concurrents à basse température. Plusieurs études vont au delà de ce constat et proposent que la singularité de Van Hove soit à l’origine des propriétés anormales des cuprates, de leur supraconductivité et du pseudogap [28]. Une catégorie de modèle suppose que pour un dopage suffisant, l’effet de la répulsion coulombienne U peut être traité en couplage faible, dans une limite où U est plus petit que la largeur de bande. Le système a les caractéristiques d’un liquide de Fermi modifié par les corrélations ou d’autres spécificités liées à la surface de Fermi. Dans le modèle des liquides de Fermi presque antiferromagnétiques, des auteurs proposent que les fluctuations antiferromagnétiques de spin pourraient expliquer les propriétés particulières des cuprates. Une description phénoménologique des fluctuations dans l’état normal dopé de façon optimale via une susceptibilité magnétique fait apparaitre des corrélations antiferromagnétiques entre les sites Cuivre, sous la forme χ q, ω =
√ χ0 χ0 βξ 2 + 2 1 − i ωFL 1 + q − QAF ξ 2 − i ωω
sf
Le premier terme décrit un liquide de Fermi sans corrélations, de largeur de bande FL , et permet de décrire notamment la susceptibilité en q = 0 responsable du temps de relaxation nucléaire T1 et du décalage (« Knight Shift ») K vus par RMN de l’Oxygène et de l’Yttrium. Le second terme décrit les corrélations antiferromagnétiques autour du vecteur d’onde QAF , de portée ξ , d’énergie de fluctuation antiferromagnétique autour du vecteur d’onde QAF et d’énergie de fluctuation ωsf , qui justifient les mesures par RMN du Cu. Ce type de modèle mène à une supraconductivité de type d , médiée par les fluctuations antiferromagnétiques. Effets de Nesting
Une autre spécificité de la surface de Fermi joue probablement un rôle important, le possible Nesting le long des diagonales, à un vecteur proche de (π, π) [30, 31]. Cet effet pourrait provoquer les chutes observées dans les différentes
557
Physique de la matière condensée
fonctions de réponse dans la phase de pseudogap. Il pourrait être lié à des fluctuations de spin antiferromagnétiques, car le vecteur de nesting est proche du vecteur d’onde antiferromagnétique (π, π). Il a été proposé que ce nesting induise une onde densité de spin dans l’état très sous-dopé. Un trou introduit autour de lui une distortion locale de l’onde, de façon analogue à une charge et son polaron. Dans cette image, deux trous habillés de leurs « spins bags » [32] ont intérêt à s’apparier, d’où un mécanisme menant à la supraconductivité.
Modèle liés à la présence de points critiques quantiques Une point critique quantique est l’équivalent d’une transition de phase thermodynamique, où la température est remplacée par un autre paramètre. Il peut y avoir, dans ce cas, transition de phase à température nulle, au passage d’un point critique quantique. Si l’on introduit l’effet de la température, il peut apparaître deux ou trois phases différentes. Le régime critique quantique qui peut apparaître présente comme seule échelle d’énergie la température. L’état dopé optimum des cuprates présente aussi des caractéristiques propres à ce régime : loi d’échelle pour la dynamique de spin, la résistivité et la self-énergie. Plusieurs auteurs supposent qu’il existe un point critique quantique caché dans la phase supraconductrice, près du dopage optimum [33]. C. M. Varma propose, dans ce cadre, le modèle de Liquide de Femi Marginal pour expliquer les propriétés anormales de diffusion observées dans l’état normal [36]. Dans ce modèle, la température constitue la seule échelle d’énergie pertinente pour forcer la résistivité à être linéaire en température ; la self-énergie est réécrite phénoménologiquement de manière à ce que sa partie imaginaire soit proportionnelle au maximum entre ω et T . Dans ce cas, il n’existe pas de vraie quasiparticule au sens de Landau, puisqu’il y a divergence du poids de quasiparticule Z avec T ou ω ; mais cette divergence étant seulement logarithmique, le cadre du liquide de Fermi est plus ou moins préservé. Ce modèle permet de rendre compte des différentes lois d’échelle (T1 , ρ, ) [34]. Modèle des Courants Orbitaux
C. M. Varma propose de décrire la phase de pseudogap par un modèle microscopique où apparaîtraient au sein des plans CuO2 des courants orbitaux. Ce modèle ne fait pas appel au caractère fortement corrélé de plans CuO2 mais plutôt au fait que les énergies d’ionisation des Cu et des O sont proches et qu’il peut ainsi exister des fluctuations ioniques qui mènent à des boucles de courant. De tels courants brisent l’invariance par renversement du temps et la symétrie de rotation des plans CuO2 : ainsi peut on expliquer l apparition du pseudogap, qui constituerait alors une véritable forme de transition de phase [35].
558
12. Les supraconducteurs non conventionnels
Modèle Staggered Flux Phase
À partir d’un traitement en couplage fort, il a été proposé que des courants orbitaux alternés, cette fois, de plan à plan et non plus au sein d’un plan, pourraient expliquer les propriétés de la phase de pseudogap. Modèles de type « Hidden Order »
Les modèles que nous venons d’évoquer suggèrent l’existence d’un ordre caché dans la phase pseudogap, le pseudogap correspondant en fait à une véritable transition de phase. De nombreux travaux proposent de même que, s’il existe un point critique quantique, la phase pseudogap ordonnée pourrait avoir différentes natures, en particulier celle d’une onde de densité de spin, à nouveau dans le cas d’un couplage fort. La vraie transition de phase pourrait, cependant, ne pas être détectée à cause d’effets de désordre au sein des plans CuO2 .
Modèles en couplage fort Une catégorie de modèles traite le problème des cuprates dans la limite d’un couplage fort entre fermions. L’hamiltonien de Hubbard ou sa simplification en modèle t − J sont en général les ingrédients de départ de ces modèles. Modèle RVB
Anderson a proposé qu’un isolant de Mott puisse mener à un état original, dit « Resonating Valence Bond », dans la limite où U et le couplage antiferromagnétique sont très grands [37]. Dans ce cas, une méthode dite de « bosons esclaves » permet de montrer que les fortes fluctuations quantiques liées à la basse dimension et à la valeur 1/2 des spins favorisent l’existence d’un liquide de spin formé de paires de spin appariés en singulets. L’état RVB est une superposition quantique de ces différentes configurations singulets. Cet état n’est pas le fondamental dans le composé isolant, qui est antiferromagnétique, mais pourrait décrire la situation en présence de dopage. Dans ce cas, il y aurait séparation entre les degrés de liberté de spin et ceux de charge de l’électron (nommés spinons et holons) [38–40] (figure 12.9).
Fig. 12.9 Diagramme de phase en champ moyen d’un modèle RVB [54, 55].
559
Physique de la matière condensée
Stripes
Dans un scenario de « stripes », le système devient inhomogène et il y a formation de rubans contenant des trous, séparés par de zones isolantes antiferromagnétiques [56–60]. Dans un processus tunnel d’une charge qui sauterait d’une corde vers une autre corde, la zone isolante, par sa nature antiferromagnétique, n’autorise que le passage de paires de trous et non de trous individuels. Ainsi, l’effet tunnel ne peut être que de type Josephson, comme cela serait le cas entre deux supraconducteurs séparés par un isolant, d’où l’apparition de paires et de la supraconductivité. Les « stripes » permettraient également d’expliquer la phase de pseudogap, dans une image de paires préformées, toujours suivant le même mécanisme Josephson.
Modèles de paires préformées Une famille de pensée suppose que le pseudogap signale qu’il existe des paires de Cooper pré-formées qui existent au dessus de Tc . La température d’appariement n’est en effet pas nécessairement égale à Tc . Dans les cuprates, la faible valeur de la longueur de cohérence ξ et de la fréquence de plasma ωP suggèrent que ces deux températures puissent différer. Le pseudogap serait ainsi lié à de fortes fluctuations du paramètre d’ordre supraconducteur et signalerait seulement l’apparition d’une amplitude non nulle du paramètre d’ordre. La condensation à Tc serait alors intermédiaire entre une condensation de Bose-Einstein et un ordre BCS et signalerait la cohérence de phase de ce paramètre d’ordre. Ces propositions théoriques rassemblées ci-dessus sont nombreuses, diverses et souvent très originales. Malheureusement, il n’existe, à l’heure actuelle, aucune certitude qu’une d’entre elles soit reliée à la réalité expérimentale. Aucune de ces propositions n’est totalement en accord avec la totalité des expériences. Il est important ici d’insister sur le mécanisme proposé par C. Bourbonnais et L. G. Caron où les fluctuations antiferromagnétiques jouent un rôle pour expliquer diverses données expérimentales. Ce mécanisme a été proposé d’abord dans le cas des organiques, puis celui des cuprates, des fermions lourds, des fullerides et des composés au Fe. Tous ces composés supraconducteurs présentent, selon certains auteurs, dont en particulier D. Pines, H. Alloul et J. Friedel, certaines caractéristiques communes. Telles sont : une résistivité en T 2 , un ordre local antiferromagnétique dans une gamme de températures où la résistivité devient linéaire en T , un « pseudo-gap », selon la terminologie de Mott, dans cette gamme de températures intermédiaires, par un abaissement de la densité d’états au niveau de Fermi. Claude Bourbonnais a alors proposé que le couplage supraconducteur soit dû à un couplage des électrons de conduction par l’intermédiaire de ces fluctuations antiferromagnétiques, avec, en outre, une asymétrie générale du gap.
560
12. Les supraconducteurs non conventionnels
12.3.2 Les conducteurs et supraconducteurs organiques La recherche sur les conducteurs organiques a depuis longtemps suscité un très vif intérêt, parce que ces conducteurs constituent une classe de matériaux aux propriétés électroniques tout à fait originales et remarquables. La recherche dans ce domaine est toujours aussi intense depuis la découverte de la supraconductivité dans les sels de Bechgaard en 1979. Au delà du but initial de rechercher de nouveaux mécanismes de supraconductivité, il s’agit d’explorer la Physique de systèmes électroniques « exotiques », notamment surtout sur deux points importants, la Physique des électrons corrélés et la Physique des électrons en dimension réduite. Les conducteurs organiques bénéficient de l’extraordinaire richesse de la Chimie du Carbone, qui permet de synthétiser une multitude de matériaux à partir de simples briques de base. On dénombre ainsi, aujourd’hui, plus d’une centaine de composés organiques supraconducteurs. Les propriétés métalliques sont dues en général à un mécanisme de transfert de charge dans une configuration donneur-accepteur. Les anions, c’est-à-dire les accepteurs, vident partiellement la bande « Highest Occupied Molecular Orbital » du réseau de donneurs, en faisant apparaître une bande de conduction. Les électrons π, dont les orbitales s’étendent perpendiculairement au plan de la molécule et dont l’énergie de liaison est plus faible, se délocalisent dans ce processus. Dans la plupart des cas, les charges sur les anions restent localisées et ne participent pas à la conduction. En jouant sur la combinaison donneur-accepteur, ainsi que sur leurs agencements, les chimistes peuvent concevoir des familles de composés présentant un large spectre de paramètres électroniques fondamentaux, tels que la largeur de bande, la dimensionalité du système, adaptées par l’anisotropie de la structure de bandes, ou la frustation géométrique, selon la symétrie du réseau. Parmi les propriétés intéressantes de ces systèmes, tant du point de vue expérimental que du point de vue théorique, on remarquera : – Une grande anisotropie : la dimensionalité réduite accentue le rôle des fluctuations quantiques. – Des interactions entre molécules relativement faibles par rapport aux interactions intramoléculaires. En premier lieu, ceci autorise d’utiliser l’approximation des orbitales moléculaires et permet donc des calculs de structure de bande précis. En deuxième lieu, le faible recouvrement entre les orbitales moléculaires signifie qu’on a affaire à des conducteurs à bande étroite, de l’ordre de 0,1 eV, où le rôle des corrélations électroniques est dominant. – Une grande sensibilité à la pression. Le fait que l’on puisse modifier considérablement la largeur de bande avec des pressions modérées permet d’étudier le diagramme de phase dans des conditions de pression hydrostatique. – Des composés stœchiométriques (dans la plupart des cas) avec relativement peu de désordre et, en conséquence, une grande mobilité électronique. Il faut distinguer deux grandes familles de supraconducteurs organiques qui diffèrent entre elles essentiellement par leurs dimensionalités électroniques
561
Physique de la matière condensée
Pression (kbar)
Fig. 12.10 Diagramme générique de conducteurs organiques quasi-unidimensionnels dans un plan (pression, température), d’après [9].
– les sels de Bechgaard, de formule chimique (TMTSF )2 X,où TMTSF est la molécule organique de tétra-méthyl-tétra-séléna-fulvalène, et X est un anion inorganique (PF6 , ClO4, , etc.). Ces conducteurs organiques sont généralement considérés comme des conducteurs quasi-unidimensionnels (figure 12.10), à cause de l’anisotropie des intégrales de transfert électroniques dans les trois directions d’espace (ta ≈ 3000 K tb ≈ 300 K tc ≈ 10 K). – les sels de BEDT, de formule chimique (BEDT −TTF )2 X , où BEDT −TTF est une molécule organique, également notée BEDT ou ET , et où X est à nouveau un anion, qui sont considérés comme des conducteurs quasi-bidimensionnels. Nous allons d’abord discuter la première famille.
Les supraconducteurs organiques quasi-unidimensionnels Matériaux
Les dérivés de la molécule fulvalène prototype TTF (tetra-thia-fulvalène) ont donné naissance à un grand nombre de sels montrant une supraconductivité de températures critiques allant de 1 à 12 K [41]. La région active de la molécule est localisée autour de la double liaison centrale carbone-carbone et les quatre atomes voisins de chalcogène (soufre et sélenium). Les molécules TM (TMTSF [42] et TMTTF [43]) donnent naissance aux conducteurs quasi-unidimensionnels, avec un paquet triclinique en zigzag de molécules planes le long de l’axe de forte conductivité. La famille prototype pour les conducteurs quasi1D est (TM )2 X, où X est un anion monovalent. Les calculs de Huckel étendus
562
12. Les supraconducteurs non conventionnels
ont été d’une remarquable efficacité pour prédire les recouvrements intermoléculaires qui fournissent les paramètres de la structure de bande pour (TMTSF )2 PF6 . Les bandes dérivant de l’orbitale moléculaire la plus élevée TM 0 (HOMO) présentent une largeur d’environ 1 eV pour les sels de TMTSF , et de 0,5 eV pour les sels de TMTTF . Cette bande est formellement à trois-quarts remplie, mais la structure cristalline tridimensionnelle rend l’interaction intermoléculaire alternée selon l’axe d’empilement. Cette structure devient dimérisée le long de l’axe d’empilement et un gap de dimérisation s’ouvre dans la dispersion d’énergie [51, 52]. Ce gap de dimérisation est important car il rend la bande à moitié remplie au lieu de 3/4 remplie. L’amplitude du gap de dimérisation est plus prononcée pour les composés soufrés que pour les composés séléniés. Un paramètre important qu’il est absolument nécessaire de considérer est la répulsion coulombienne entre les deux porteurs additionnels situés sur la même molécule (la répulsion « intra-atomique » U dans le modèle de Hubbard). Quand la molécule a une taille de 10–20 Å, la répulsion coulombienne est de l’ordre de 1 à 5 eV et peut être réduite davantage à 0,3–0,5 eV par l’écrantage de l’environnement. Une telle répulsion coulombienne est de l’ordre de grandeur de la largeur de bande et le rôle qu’elle peut jouer sur les propriétés de ces sels dépendra essentiellement de la dimensionalité de la surface de Fermi. Théorie
Il est bien connu que la réponse d’un gaz d’électrons 1D est singulière pour le vecteur d’onde 2kF en raison de la symétrie électron-trou à kF [45]. Par conséquent, la réponse nue vis-à-vis d’instabilités électron-trou se comporte de façon logarithmique à basse température, comme ξ01D 2kF , T ∼
1 EF ln 2π vF kB T
pour les canaux Peierls ou Densité de spin. Les interactions dans un gaz d’électrons 1D sont prises en compte par un ensemble de paramètres gi reliés aux changements spécifiques de vecteur d’onde opérés dans la diffusion, dénotés g q = 2kF 1 et g q = 0 2 [46, 47, 48, 49]. On peut aussi considérer la diffusion de deux porteurs d’un côté de la surface de Fermi vers l’autre côté. La changement de vecteur d’onde est alors de 4kF . L’existence d’une telle diffusion implique que 4kF soit égal à un vecteur du réseau réciproque. Il s’agit, dans ce cas, d’une diffusion Umklapp, qui peut survenir à une dimension, à cause de la dimérisation structurale des empilements organiques. La force de cette diffusion Umklapp est modélisée par un paramètre g3 qui est, au plus bas ordre, relié à la diffusion vers l’arrière g1 par g3 = g1 EFG divergente dans un gaz d’électron unidimensionnel. Par conséquent, un développement en perturbation de la fonction de réponse pour un canal donné, fera intervenir l’autre canal aussi : si bien que des développements diagrammatiques en échelle, conduisant à la théorie BCS en champ moyen, qui sépare les sommations des diagrammes Cooper
563
Physique de la matière condensée
et Peierls ne peuvent pas être utilisés pour le gaz d’électrons unidimensionnel. Le seul traitement pertinent est celui qui conserve le mélange des canaux dans le calcul des fonctions de réponse. Une telle situation est bien réalisée par une procédure de renormalisation dans laquelle l’énergie de Fermi EF est réduite vers des valeurs plus basses quand la température est abaissée, si bien que les différents termes en ln (T /EF ) du développement perturbatif deviennent moins divergents quand T décroît. La renormalisation de l’énergie de « cut off » (ou coupure) implique également la renormalisation des différents paramètres d’interaction. De plus, les excitations de charge et de spin de basse énergie et de grands vecteurs d’onde sont découplées. Les excitations de charge (et donc le comportement de la conductivité) sont reliées à la combinaison de g3 et g1 − 2g2 , tandis que la susceptibilité uniforme dépend seulement de g1 . La renormalisation de g3 est couplée à celle de g1 − 2g2 . Si g1 est positif, ce qui correspond au cas expérimental des conducteurs 1D, la susceptibilité uniforme est de la forme χS T = χS 0 1 + g˜1 T où
g1 T g˜1 T = g1 / 1 − ln π VF EF
Comme pour les degrés de liberté de charge, l’ensemble de paramètres g3 et g1 − 2g2 suivent les trajectoires 2 g˜3 − g˜1 − 2 g˜2 = δ2 où δ est une constante. Dans le cas de faible diffusion Umklapp, | g3 |< g1 − 2g2 , g3 est renormalisé à 0 et le système évolue vers une instabilité d’appariement attractif quandT tend vers 0 ; sinon, si | g3 |> g1 − 2g2 , le régime de couplage fort est atteint g3 ∼ πVF à une température Tρ ∼ EF exp ( − 1/δ). Le résultat global de la théorie 1D est l’existence de divergences en lois de puissance pour les fonctions de réponse, dépendant des constantes gouvernées par des exposants qui sont d’interaction ξDW 2kF , T ∼ T Kρ −1 et ξSC T ∼ T 4/Kρ −1 , où Kρ = 1 + g1 −2g2 2π VF au plus bas ordre [50]. Quand T tend vers 0, Kρ = 1 établit la frontière entre les interactions attractives (pour Kρ > 1) et les interactions répulsives (pour Kρ < 1). Dans la limite de couplage répulsif fort Kρ −→ 0, un gap ρ s’ouvre, la résistivité devenant activée en dessous de Tρ . Cependant, aucune singularité de la susceptibilité de spin uniforme n’est prévue à Tρ . La susceptibilité garde une valeur finie à température nulle. La comparaison entre la conductivité et la susceptibilité des conducteurs 1D fournit une illustration pédagogique du découplage spin-charge. Une propriété importante du gaz d’électrons 1D est le fait qu’aucun saut d’amplitude finie dans la distribution de Fermi ne se produise à kF . Le gaz d’électrons est un liquide de Luttinger et la densité d’états de quasiparticule s’annule selon une loi de puissance à l’énergie de Fermi : N (ω) ∼ ωα , où α =
564
1 4
Kρ +
1 Kρ
−2 .
12. Les supraconducteurs non conventionnels
Le concept de Physique 1D est limité, à basse température, par l’existence de couplages interchaînes dans les systèmes réels quasi-1D. La limitation des divergences logarithmiques doit se produire à Tx0 ∼ t⊥ /π, mais les corrélations intrachaînes tendent à empêcher le saut interchaîne à une seule quasiparticule et la température de cross over à une quasiparticule est réduite à basse température, selon Tx1 ∼
Tx0
t⊥ EF
1−Kρ Kρ
Quand Kρ −→ 0, le mouvement transverse ne se développe jamais et les particules restent confinées sur les chaînes jusqu’à température nulle. Bourbonnais et Caron ont suggéré que la renormalisation du saut à une particule n’empêche pas les sauts interchaînes à deux particules de deux particules liées (ou de paire électron-trou). 2 T Par conséquent, il existe une interaction d’échange interchaîne J⊥ ∼ π VF xρ1 entre les fluctuations de spin à 2kF entre chaînes voisines quand T < Tρ . La stabilisation d’un ordre Onde de Densité de Spin à longue portée devient possible à une température TN finie [44]. Les expériences
Après ce résumé sur la théorie du gaz d’électrons quasi-1D, nous souhaitons discuter un survol des grandes propriétés expérimentales des conducteurs 1D et établir la relation entre théorie et expériences. En nous basant sur l’étude extensive des (TMTSF )2 X utilisant la Chimie, les études en température sous pression, sous champ magnétique, il existe des évidences expérimentales montrant la pertinence du concept de séparation spin-charge, le rôle de la diffusion Umklapp et le rôle conjugué de la localisation de la charge à 1D et de la tridimensionnalité sous champ magnétique. Les propriétés de transport, les expériences de susceptibilité et de RMN ont contribué à démêler les propriétés physiques subtiles des composés (TM )2 X , qui ont été résumées dans le diagramme de phase générique généralisé montré sur la figure 12.10.
Les supraconducteurs organiques quasi-bidimensionnels Nous considérons dans ce paragraphe, le cas de la deuxième famille de supraconducteurs organiques, celle des supraconducteurs quasi-bidimensionnels (figures 12.11 et 12.12). La famille basée sur la molécule BEDT − TTF est la première lignée des composés apparus après celle des célèbres sels de Bechgaard (TMTSF )2 X où a été découverte la supraconductivité organique. Le premier composé métallique, dans la famille BEDT a été synthétisé en 1982, la supraconductivité a été découverte peu après dans un autre matériau basé sur la même molécule. L’idée originale était d’obtenir des
565
Physique de la matière condensée
Fig. 12.11 Diagramme de phase générique des supraconducteurs organiques quasibidimensionnels, dans le plan (pression, température), d’après [9].
Fig. 12.12 Structure cristalline du composé κ − (BEDT − TTF )2 Cu [N (CN )2 ] Br . Le cadre indique la maille élémentaire.
supraconducteurs de température critique plus élevée en jouant sur la dimension du système. En effet, la supraconductivité organique semblait souffrir de la compétition avec les effets unidimensionnels : les composés 1D montraient notamment une fâcheuse tendance à produire un ordre de charge ou une localisation de Mott. Selon cette stratégie, en ajoutant un cycle supplémentaire à la molécule TTF , on voulait densifier le réseau d’interconnection entre les molécules et surtout empêcher l’apparition automatique d’un arrangement en chaînes, typique des conducteurs 1D, grâce aux effets stériques des BEDT. En fait, la nouvelle famille de composés
566
12. Les supraconducteurs non conventionnels
continue encore à être étudiée jusqu’à aujourd’hui et n’a toujours pas livré tous ses secrets. Le premier supraconducteur à pression ambiante, κ − ET 2 CuN CNS 2 , présentait une structure électronique 2D et battait de loin le record de la température de supraconductivité organique, avec une Tc de l’ordre de 10 K. Le hasard du calendrier a fait que cette découverte a eu lieu en 1988, pratiquement en même temps que celles des cuprates. Les similitudes entre les deux familles ont été renforcées quand
une phase antiferromagnétique dans un composé a été découverte parent, κ − ET 2 Cu N CN 2 Cl [61] (figure 12.13).
Fig. 12.13 Diagramme de phase du composé κ − (ET )2 Cu [N (CN )2 ]Cl déterminé à partir des mesures de RMN et de susceptibilité alternative. En gris, la zone de coexistence antiferromagnétisme-supraconductivité (d’après [61]).
Deux décennies plus tard, ce sont finalement des modèles théoriques analogues qui sont désormais employés pour décrire la supraconductivité dans les BEDT et dans les cuprates (figures 12.14, 12.15, 12.16, 12.17, 12.18, 12.19 and 12.20). En conclusion, les différents résultats expérimentaux témoignent en faveur d’une supraconductivité non-conventionnelle. En ce qui concerne la symétrie du gap supraconducteur, la plupart des expériences, notamment les mesures de RMN, indiquent la présence de nœuds. Il manque cependant des expériences sensibles à la phase du paramètre d’ordre. Mais de telles expériences ne pourront se faire avant de disposer de méthodes de synthèse permettant d’obtenir des jonctions Josephson fiables avec les matériaux organiques. Une autre manifestation de la supraconductivité est l’observation du pseudogap dans la phase normale. Le phénomène de pseudogap ressemble à ce qui est connu dans les cuprates, avec, néanmoins une amplitude bien moindre, et qui ne détruit pas le caractère liquide de Fermi de l’état métallique.
567
Physique de la matière condensée
120 (BEDT – TTF)2 CuN(CN)2 Br 100 RESISTANCE (ohm)
1
1 – P= 1 2 – P=250 3 – P=435 4 – P=750
80 60 40
bar bar bar bar
2 3
20
4 0
0
100
200
300
TEMPERATURE (K)
Fig. 12.14 Évolution sous pression de la résistivité de κ − (ET )2 Cu [N (CN )2 ]Br (d’après [62]).
Fig. 12.15 (a) Structure de bande et (b) Surface de Fermi de κ − (ET )2 Cu [N (CN )2 ]Br [62].
De même, dans le régime isolant de Mott, le transport électrique semble assez bien reproduit par la théorie « Dynamical Mean Field Theory » négligeant les corrélations antiferromagnétiques. La faiblesse des corrélations antiferromagnétiques est liée à la frustation géométrique, qui apparaît ici, à la fois comme facteur clé pour stabiliser la supraconductivité dans un système avec interactions répulsives à demi-remplissage, et comme un des paramètres fondamentaux du modèle. Ceci implique, comme corrolaire, une grande sensibilité des corrélations aux détails de la structure de ces matériaux.
568
12. Les supraconducteurs non conventionnels
Point critique Isolant de Mott Métal
Isolant Antiferromagnétique
Fig. 12.16 Diagramme de phase de V2 O3 dans le plan (pression, température). Ce composé est souvent considéré comme l’archétype des isolants de Mott. Le diagramme de phase montre, une phase isolant de Mott, avec un point critique, une phase antiferromagnétique isolante, et une phase métallique (d’après [63].)
isolant point critique
, , ,
métal
, , ,
Fig. 12.17 Comportement de la résistivité du composé κ − (ET )2 Cu [N (CN )2 ]Cl au voisinage de la transition de Mott (d’après [64]).
Ces systèmes semblent assez bien décrits par le modèle de Hubbard à demiremplissage sur un réseau triangulaire anisotrope. Ce modèle reproduit à la fois le régime isolant, le régime métallique, le régime antiferromagnétique et le régime supraconducteur. Les modèles théoriques commencent à faire émerger une image cohérente en ce qui concerne la continuité entre les diagrammes de phase des cuprates et ceux des conducteurs organiques.
569
Physique de la matière condensée
200
T (K)
100
10 métal
liquide de spin
liquide de fermi 1
Supraconducteur 2
3
4 5 Pression (10-1 GPa)
6
7
Fig. 12.18 Suppression de l’ordre magnétique par la frustration : la phase antiferromagnétique est remplacée par un liquide de spin dans κ − (ET )2 Cu2 (CN )3 (d’après [65]).
Fig. 12.19 Exemple de coexistence entre la phase antiferromagnétique et la phase supraconductrice dans (TMTSF )2 Pf6 au voisinage de la pression critique pour la suppression de l’état fondamental Onde de Densité de Spin (d’après [66].
12.3.3 Les fermions lourds De nombreux composés de terres rares, tels CeUYb, qui contiennent des électrons f localisés, reçoivent généralement le nom de fermions lourds. Ce sont des composés métalliques qui possèdent une masse effective très élevée, souvent plusieurs centaines de fois la masse de l’électron libre et parfois jusqu’à plus de 1000 fois cette masse. Ce phénomène provient d’une interaction antiferromagnétique entre les électrons de conduction et des moments magnétiques localisés résidant sur un sous-réseau d’atomes du métal, qui établi ce qu’on appelle un effet Kondo. Il existe aussi une interaction indirecte entre les moments locaux, qui entre en compétition avec l’effet Kondo, causant une grande variété d’états fondamentaux du système, qui ont suscité
570
12. Les supraconducteurs non conventionnels
,
, , Densité des trous/Plan CuO2
,
Fig. 12.20 Exemple de coexistence des phases magnétique et supraconductrice : le diagramme du supraconducteur HgBa2 Ca4 Cu5 O12+δ (d’après [67]).
de nombreuses activités de recherche. Un des phénomènes les plus intéressants observés dans ces systèmes de fermions lourds est l’apparition de la supraconductivité dans certains composés. Dans le cadre de la théorie BCS, les impuretés magnétiques d’un métal détruiront fortement la température de transition, puisque l’interaction entre deux électrons dans une paire singulet de spin aura tendance à casser la paire. Donc, un système de fermions lourds, qui possède un moment local affectant fortement le système, à basse température, tendra à s’opposer à la formation de l’état supraconducteur. Cependant, depuis la découverte par Steglich et al. en 1979 de la supraconductivité dans CeCu2 Si2 , quelques exemples de fermions lourds supraconducteurs basés sur U ou Ce ont été découverts. Contrairement aux supraconducteurs conventionnels, ces supraconducteurs ne peuvent pas être expliqués par la théorie BCS, car ils montrent une riche variété de propriétés inattendues, en opposition avec les prédictions de la théorie BCS. Ceci fournit une bonne opportunité de renforcer notre connaissance des sytèmes d’électrons fortement corrélés. D’une façon générale un des points communs aux fermions lourds supraconducteurs est la très grande valeur du coefficient Cp /T de la chaleur spécifique électronique à TC , de l’ordre de quelques centaines, voir même plusieurs milliers de mJmol− 1K−2 , indiquant que les quasiparticules lourdes participent à l’appariement supraconducteur. Il faut aussi noter que Cp /T montre un comportement en loi de puissance en dessous de Tc, et non pas une dépendance exponentielle, qu’on attendrait pour un appariement de symétrie s. Ceci indique l’existence de nœuds dans le gap supraconducteur, suggérant une structure non-conventionnelle du gap. Une autre indication de l’appariment non s dans ces systèmes est leur sensibilité aux impuretés non magnétiques, contrairement au cas des supraconducteurs conventionnels, où des concentrations diluées d’impuretés non magnétiques ont
571
Physique de la matière condensée
peu d’effet sur les paramètres supraconducteurs. Des impuretés non magnétiques, telles que Y, La, et Th, ainsi que des impuretés magnétiques comme Gd affectent fortement la supraconductivité, en montrant un effet de « brisure de paires » ou « pair breaking » important. Puisque la diffusion par des impuretés non magnétiques détruit la fonction d’onde de la paire de Cooper, ceci a été interprété comme une évidence d’un appariement non s. Bien que les impuretés détruisent habituellement la transition supraconductrice dans les fermions lourds, un effet spectaculaire a été observé dans le système U1−x Thx Be13 . Comme le montre la figure 12.21, le système montre une double transition supraconductrice, pour une concentration de 3,3% de Th dans le site de U. Des preuves expérimentales de plus d’une transition supraconductrice ont été obtenues dans les fermions lourds supraconducteurs. L’interaction réciproque entre magnétisme et supraconductivité est une autre caractéristique remarquable des matériaux de type fermions lourds. Elle a ainsi montré une variété considérable de comportement, avec notamment une compétition, dans certains cas, une coexistence et/ou un couplage entre les paramètres de l’ordre magnétique et de l’ordre supraconducteur.
Fig. 12.21 Le système montre une double transition supraconductrice, pour une concentration de 3.3% de Th dans le site de U. [70, 71]
Le composé CeCu2 Si2 montre une compétition entre magnétisme et supraconductivité, chaque ordre existant dans son domaine propre. Par ailleurs, dans quelques composés basés sur U, tels que URu2 Si2 , UPd2 Al3 et UNi2 Al3 , un ordre magnétique coexiste avec la supraconductivité à une échelle microscopique sans forte interaction avec l’autre ordre, comme le montre les expériences de diffusion de neutrons et de μSR. Par contre, UPt3, qui est antiferromagnétique en dessous de TN = 5 K, avec un moment magnétique faible (μ = 0, 02μB ), montre un couplage entre les paramètres supraconducteurs et magnétiques : l’ordre magnétique est affecté par l’apparition de la supraconductivité (figure 12.22).
572
12. Les supraconducteurs non conventionnels
T(k)
Fig. 12.22 Diagramme de phase du composé UPt3 , dans le plan (température, champ magnétique) (d’après [68]).
Température (K)
Alors que le mécanisme d’appariement dans les supraconducteurs fermions lourds n’est pas encore totalement compris, ce qui n’est pas, non plus, le cas des cuprates, on pense que l’appariement supraconducteur est établi par l’intermédiaire de l’interaction magnétique, ce qu’on appelle parfois la « glue magnétique ». Ceci est suggéré par la supraconductivité induite par la pression dans CeIn3 et CdPd2 Si2 qui est due à un renforcement de l’hybridation entre électrons de conduction et moments locaux (figure 12.23).
´ Etat antiferromagnétique
´ Etat supraconducteur
Pression (kbar)
Fig. 12.23 Diagramme de phase de CeIn3 sous pression d’après [69].
573
Physique de la matière condensée
Les structures cristallines qui favorisent la supraconductivité, sont, de façon empirique, différentes dans les différents cas de supraconductivité, celle médiée par les phonons, celles des fermions lourds et celle des cuprates. Par exemple, alors qu’une haute symétrie est favorable pour des supraconducteurs conventionnels médiés par les phonons et qu’une structure en couches est favorable pour les cuprates, une supraconductivité appparaît avec des structures cristallines cubiques, tétragonales ou hexagonales pour des supraconducteurs de type fermions lourds. On sait encore peu de choses sur la relation entre structure et propriétés électroniques de la matière condensée. Avec ces divers comportements exotiques, il est encore difficile de comprendre l’origine de la supraconductivité et du mécanisme d’appariement dans les supraconducteurs de type fermions lourds. Bien que les températures de transition dans les fermions lourds soient basses (moins que 2–3 K), ces systèmes sont particulièrement intéressants dans la mesure où ils apportent des clés pour comprendre les mécanismes de systèmes d’électrons fortement corrélés et parce qu’ils fournissent des exemples d’autres classes de supraconducteurs, très probablement non-conventionels.
12.3.4 Les pnictures En février 2008, Hideo Hosono et al. [72] ont rapporté la découverte de la supraconductivité dans LaFeAsO dopé au fluor, ce qui a marqué le début d’efforts mondiaux sur la recherche de cette nouvelle famille de supraconducteurs. Rapidement, la température critique de supraconductivité a atteint 43 K par application de la pression, puis 55 K en remplaçant des atomes de La par d’autres éléments de Terres Rares [73], (voir figure 12.24). La relation antagoniste entre
Dopage x en F
TS en χ(T) TN en μSR TC en μSR
Ordre magnétique
Supraconductivité Dopage x en F
Dopage x en F
Fig. 12.24 (Gauche) Diagramme de phase de CeFeAsx O5−x Fx en fonction du dopage en fluor déterminé par diffusion de neutrons. On observe une transition douce (deuxième ordre) de l’anti-ferromagnétisme à dopage faible vers l’état supraconducteur à dopage plus fort. L’encart montre la valeur du moment magnétique alterné dans la phase anti-férromagnétique. (Droite) Diagramme de phase de LaO5−x Fx FeAs. On observe une transition plus abrupte (premier ordre) d’un état de type onde de densité de spin vers un état supraconducteur en fonction du dopage en fluor (d’après [73]).
574
12. Les supraconducteurs non conventionnels
supraconductivité et magnétisme avait conduit les chercheurs à éviter d’utiliser des éléments magnétiques, surtout ferro-magnétiques comme blocs de construction de nouveau matériaux supraconducteurs. Étant donné que l’élément Fe est fortement magnétique, (FeSCs), avec sa haute température critique de supraconductivité, était totalement inattendu. Le comportement de base des différentes classes de composés FeSCs est maintenant connu pour être tout à fait similaire. Nous ne discuterons donc ici que les propriétés universelles et nous nous focaliserons sur la classe du composé intermétallique, FeSCs de structure (122) ThCr2 Si2 [74].
Structures cristallines et paramètres d’ajustement Aujourd’hui, cinq différentes classes de composés SCs, basées sur Fe, ont été trouvées. Toutes ces structures partagent en commun une structure basée sur une couche plane de Fe, jointe par des pnictogène (P, As) en coordinence tétrahédrique, ou des anions chalcogène (S, Se, Te) arrangés selon une séquence d’empilement séparés par des alcalins, des alcalino-terreux ou des terres rares et des « couches de blocage » Oxygène/Fluor. Il est maintenant largement accepté que les interactions qui conduisent à la supraconductivité de haute température trouve son origine dans ces couches communes de Fer, de façon similaire aux oxydes de Cuivre dans les cuprates supraconducteurs. Comme dans les cuprates, la substitution chimique joue un rôle clé en induisant la phase supraconductrice des Pnictures de Fer. Cependant, il faut souligner trois différences : 1. dans l’arrangement des anions pnictogène/chalcogène au dessus et en dessous de la couche plane de Fer, contrairement à la structure plane Cuivre-Oxygène des cuprates ; 2. dans la possibilité de substituer ou de doper directement dans la couche d’appariement active ; 3. dans la nature métallique (plutôt qu’isolante) du composé parent. Ce sont ces traits, avec l’interaction réciproque entre magnétisme et supraconductivité, qui marquent les différences entre les cuprates et les Pnictures de Fer, qui apparaissent donc comme distincts certes, mais fortement reliés entre eux. Le diagramme de phase des SCs basés au fer est en fait, de façon frappante, similaire à celui d’autres classes de supraconducteurs non-conventionnels, y compris les cuprates, les organiques et les fermions lourds, qui sont tous supposés reposer sur des mécanismes d’appariements non conventionnels (non médiés par les phonons). Alors que le médiateur de l’appariement dans ces systèmes reste officiellement non identifié, de nombreuses évidences semblent souligner l’importance des fluctuations magnétiques de spin : dans tous les cas, le magnétisme doit être supprimé, soit sous pression soit par dopage, avant que la phase supraconductrice apparaisse en volume. Bien que leur nature soit plus métallique et donc plus proche des systèmes de type fermions lourds que des cuprates (avec leur physique d’Isolants de Mott), la ressemblance
575
Physique de la matière condensée
frappante des fondamentaux interpénétrants dans ces systèmes mérite réflexion de façon à élaborer une théorie générale de la supraconductivité non-conventionnelle. Le diagramme de phase générique des systèmes FeSC peut être obtenu en modifiant les propriétés chimiques ou structurales, en utilisant le dopage chimique ou la substitution chimique ou en appliquant une pression extérieure pour obtenir à partir d’un composé parent antiferromagnétique, non supraconducteur, un état supraconducteur et non antiferromagnétique.
Structure électronique De nombreuses recherches ont été menées pour comprendre les propriétés magnétiques et la structure électronique de ces matériaux. D’une façon générale, ces matériaux sont bien décrits comme des feuillets métalliques bidimensionnels, dérivés des états d du Fe hybridés avec les orbitales p de As placés dans une structure quasiionique composée de terres Rares, d’Oxygène, d’alcalins ou d’alcalino-terreux ou de terres alcalines formant des couches bloquantes. Un tel arrangement produit un matériau métallique, avec une valence nominale de Fe de Fe2+ , une faible concentration de porteurs et une forte densité d’états dominée par les états d du Fe. Basé sur cette structure en couches Fe-As, la structure de bande a été calculée en utilisant l’approximation de la densité locale (LDA), montrant que les propriétés électroniques sont dominées par 5 états d du Fe au niveau de Fermi, avec une surface de Fermi consistant en au moins quatre cylindres d’électrons et de trous quasi-2D. On obtient donc deux poches de trous centrées au centre de la Zone de Brillouin et deux poches d’électrons centrées en (0, ±π) et ±π , 0 . Il faut considérer deux positions non équivalentes pour les atomes d’As déplacées par maille élémentaire, et placer les poches d’électrons à ( ± π , ±π). On propose de placer un cinquième trou à 0, ±π au dessous et au dessus du réseau de Fe obtenu en repliant la zone de Brillouin pour inclure deux atomes de Fe dans la zone de Brillouin repliée ; sa présence peut être très sensible aux détails structuraux. Il semble bien que les effets de dopage électron/trou sur la structure électronique sont assez bien décrits dans un schéma de bande rigide : la topologie de base de la surface de Fe est conservée à la fois pour les électrons et pour les trous. L’ingrédient structural clé est une couche quasi-bidimensionnelle consistant en un réseau carré d’atomes de Fe avec des liaisons en coordinance tétrahédrique de Phosphore, d’Arsenic, de Sélénium ou de Tellure qui sont déviés au dessus et en dessous du réseau de Fer pour former une structure en échiquier qui double la maille élémentaire. Ces couches sont empilées simplement, comme dans FeSe ou bien sont séparées par des couches d’espacement, utilisant des alcalins (par exemple Li), des alcalino-terreux (par exemple Ba), des fluorures/oxydes (par exemple LaO ou SrF), ou des combinaisons plus compliquées de type perovskite (par exemple Sr3 Sc2 O5 ). Ces couches, qu’on appelle « couches de blocages » sont responsables d’un caractère quasi-bidimensionnel du cristal, puisqu’il forment des liaisons atomiques de caractère plus ionique avec les couches FeAs, tandis que la couche Fe-As elle même est tenue ensemble par une combinaison de liaisons covalentes (par exemple Fe-As) ou métallique (par exemple Fe-Fe).
576
12. Les supraconducteurs non conventionnels
Magnétisme La nature du magnétisme dans le composé parent FeSc est très largement débattue, en grande partie à cause de ses implications sur le mécanisme d’appariement. La structure électronique suggère que ce sont les mêmes interactions magnétiques qui assurent l’ordre antiferromagnétique et qui produisent également l’interaction d’appariement pour la supraconductivité. L’ordre antiferromagnétique pour tous les systèmes supraconducteurs basés sur FeAs se trouve dirigé le long de la direction (π, π) avec un arrangement dans l’espace réel consistant en « stripes » antiferromagnétiques le long d’une direction du sous-réseau de Fe, et de stripes ferromagnétiques le long de l’autre direction, avec un moment ordonné typiquement inférieur à 1 magnéton de Bohr. Des calculs théoriques ont montré que ces matériaux sont proches d’une instabilité de Stoner, suggérant qu’il s’agit d’un magnétisme itinérant. La plupart des modèles suggèrent une instabilité de type Onde de Densité de Spin de la Surface de Fermi. Il est assez largement suggéré que l’instabilité « Onde de densité de Spin » provient d’un « nesting » de la surface de Fermi, lié aux deux poches de la Surface de Fermi avec un vecteur de « nesting » proche du vecteur d’onde commensurable avec la structure Q =(π, π). Il y a de bonnes preuves expérimentales en faveur d’un nesting Q =(π, π) dans l’ensemble de la famille FeSC, comme semblent le montrer les mesures d’ARPES dans Ba1−x Kx FeAs2 , ainsi que les mesures d’oscillations quantiques dans LaFePO. De plus, le matériau Pnicture très voisin FeTe montre lui aussi un « nesting » dans la même direction (π, π), bien que le vecteur d’ordre magnétique soit tourné de 45 degrés.
L’état supraconducteur – La symétrie d’appariement Comme dans les cuprates, le mécanisme fondamental qui cause l’apparition de la supraconductivité de haute température dans FeSCs est une question d’importance primordiale. Dans un cas comme dans l’autre, les preuves expérimentales semblent aujourd’hui favoriser un mécanisme d’appariement non conventionnel intimement lié au magnétisme. Bien que la nature exacte de cet appariement ne soit pas encore connu de façon certaine, ni dans un cas, ni dans l’autre, de nombreuses expériences visant à déterminer la symétrie de l’appariement ont été réalisées. Pour les cuprates, les expériences mettent en évidence une symétrie du paramètre d’ordre singulet de type d , qui fait intervenir un changement de signe du paramètre d’ordre supraconducteur aux points nodaux situés sur la surface de Fermi. Pour FeSCs, les mesures initiales testant la symétrie du paramètre d’ordre indiquent un paramètre d’ordre entièrement « gapé », cohérent avec une symétrie s. En comparaison avec les cuprates et les autres supraconducteurs où l’on suppose une « médiation magnétique » de la supraconductivité, ce résultat est apparu comme une surprise. Cependant, une analyse théorique de la symétrie du paramètre d’ordre a été réalisée, donnant pour résultat une symétrie s, mais avec un changement de signe se produisant entre les différentes bandes de la structure de bandes complexe à plusieurs bandes. C’est ce
577
Physique de la matière condensée
qu’on a appelé la symmétrie « s± », obtenue de façon théorique avant la réalisation des études expérimentales. Les expériences de RMN ont rapidement montré, à partir de mesures de Knight shift, que la symétrie de spin de l’état supraconducteur était probablement singulet, impliquant une symétrie du paramètre d’ordre paire (c’est-à-dire onde s, onde d , etc). Aujourd’hui, cette expérience a été réalisée sur les principaux membres de la famille FeSC. Il semble donc raisonnable de supposer que les Pnictures de Fer sont de façon universelle des singulets de spin. La détermination de la symétrie orbitale est beaucoup plus complexe et fait l’objet de recherches approfondies. Les expériences pour déterminer la symétrie orbitale du paramètre d’ordre mesurent l’amplitude ou la phase du paramètre d’ordre. Dans le cas des cuprates, les expériences sur la phase ont fourni les preuves d’une symétrie où l’onde d changeait de signe ( x 2 − y 2 ). L’effet tunnel et les expériences de SQUID, l’observation d’un demi quantum de flux pour des échantillons polycristallins ou des bi-cristaux, et l’absence d’effet Josephson avec un supraconducteur connu pour correspondre à une symétrie d’onde s, ont été considérés comme des arguments en faveur d’une symétrie d’onde d . Pour les FeSCs, seul un petit nombre d’expériences ont été réalisées. Dans les échantillons polycristallins, pas d’observation de demi-quantum de flux n’a été faite dans une expérience de SQUID et un robuste effet Josephson d’axe c a été trouvé entre le Pb et BaFe2 As2 dopé au Potassium, ce qui élimine une symétrie prépondérante d’onde d dans ces matériaux, pour les concentrations de Potassium utilisées. Dans Fe(Se,Te), Hanaguri et al. [75] ont trouvé que le signe du gap était changé entre les poches d’électrons et les poches de trous. Ceci, ainsi que l’absence d’excitation de quasiparticule de basse énergie dans le gap tunnel (comme on devrait l’observer à partir de nœuds dans le cas d’un supraconducteur d’onde d ) suggère fortement une symétrie s ± . Tous ces résultats sont donc fortement en faveur d’une symétrie s ± dans FeSCs, mais des expériences testant la phase sur un plus grand nombre de matériaux sont nécessaires pour établir une conclusion définitive.
Bibliographie 1. G.M. Eliashberg, Sov. Physics 12, 1000 (1961) 2. W.L. McMillan, Phys. Rev. 167, 331 (1968) 3. D.D. Osheroff, R.C. Richardson et D.M. Lee, Phys. Rev. Lett. 28, 885 (1972) 4. D. Jérome, M. Ribault, A. Mazaud et K. Bechgaard, Journal de Physique 41, L95 (1980) 5. F. Steglich, J. Aarts, C.D. Bredl, W. Lieke, D. Meschede, W. Franz et H. Schäfer, Phys. Rev. Lett. 43, 1892 (1979) 6. J.G. Bednorz et K.A. Mueller, Z. Phys. B 64 (2) 189 (1986) 7. X.H. Chen, T. Wu, G. Wu, R.H. Liu, H. Chen et D.F. Fang, Letter Nature 453, 761 (2008)
578
12. Les supraconducteurs non conventionnels
8. L. Er-Rakho, C. Michel, J. Provost, B. Raveau, Journal of Solid State Chemistry 37, Issue 2, Pages 151 (1981) 9. J. Bobroff, Impuretés et Systèmes Corrélés : des chaînes aux cuprates supraconducteurs, http ://tel.archives-ouvertes.fr/tel-00005934/en/ 10. G. Castelani et C. Rizzoli, Nature 328, 606 (1987) 11. M. Imada, A. Fujimari, Y. Tokura, Rev. Mod. Phys. 70, 1039 (1981) 12. H. Maeda, Y. Takana, M. Fukotomi et T. Asano, J. Appl. Phys. 27, L209 (1988) 13. C.C Torardi et al., Science 240, 631 (1988) 14. F.C. Zhang et T.M. Rice, Phys. Rev. B 37, 3759 (1988) 15. C.E. Gough et al., Nature 326, 855 (1987) 16. D. Esteve et al., Europhys. Lett. 3, 1327 (1987) 17. C.C. Tsuei et al., Phys. Rev. Lett. 73, 593 (1994) 18. J.R. Kirtley, C.C. Tsuei, H. Raffy, Z.Z. Li, A. Gupta, J.Z. Sun, S. Megtert, Europhysics Lett. 36, 707 (1996) 19. C.C. Tsuei, J.E. Kirtley, Z.D. Ren, H. Raffy, Z.Z. Li, Nature 387, 481 (1997) 20. C.C. Tsuei, J.R. Kirtley, G. Hammerl, J. Mannhart, H. Raffy, Z.Z. Li, Phys. Rev. Lett 93, 18 7 004 (2004) 21. C.C. Tsuei, J.R. Kirtley, Physica C 367, Issues 1-4, 1 (2002) 22. Y. Shimakawa, Y. Kubo, T. Manako, et H. Igarashi, Phys. Rev. B 40, 11400 (1989) 23. H. Alloul, T. Ohno, P. Mendels, Phys. Rev. Lett. 63, 1700 (1989) 24. H. Alloul, P. Mendels, H. Casalta, J.F. Marucco et J. Arabski, Phys. Rev. Lett. 67, 3140 (1991) 25. J. Bobroff, H. Alloul, S. Ouazi, P. Mendels, A. Mahajan, N. Blanchard, G. Collin, V. Guillen, J.-F. Marucco, Phys. Rev. Lett. 89, 157002 (2002) 26. J.M. Harris et al., Phys. Rev. B 54, 15665 (1996) 27. J. Labbé et J. Bok, Europhys Lett. 3, 1225 (1987) 28. J. Friedel, J. Phys. Cond. Mat. 1, 7757 (1989) 29. Ch. Renner, B. Revaz, J.-Y. Genoud, K. Kadowaki et O. Fischer, Phys. Rev. Lett. 80, 149 (1998) 30. S. Charfi, R.J. Tarento, M. Héritier, Journal de Physique 2, 1853 (1992) 31. A. Virostek et J. Ruvalds, Phys. Rev. B 42, 4064 (1990) 32. J.R. Schrieffer, X.G. Wen et S. Zhang, Phys. Rev. 39, 1163 (1989) 33. A.J. Millis, Phys. Rev. B 48, 7183 (1993) 34. C.M. Varma et al., Phys. Rev Lett. 63, 1996 (1989) 35. C.M. Varma, Phys. Rev. B 55, 14554 (1997) 36. P.B. Littlewood et C.M. Varma, Phys. Rev. B 46, 405 (1992) 37. P.W. Anderson, Science 235, 4793 (1987) 38. J.M. Tranquada, S.M. Heald et A. R. Moodenbaugh, Phys. Rev. B 36, 5263 (1987) 39. G. Baskaran, Z. Zou et P.W. Anderson, Solid State Comm. 63, 973 (1987) 40. S.A. Kivelson, D.S. Rokhsar et J.P. Sethna, Phys. Rev B 35, 8865 (1987) 41. D. Jérome et H.J. Schulz, Adv. Physics 31, 299 (1982)
579
Physique de la matière condensée
42. D. Jérome, A. Mazaud, M. Ribault, et K. Bechgaard, J. Phys. Lett. (Paris) 41, L45 (1980) 43. G. Brun, S. Peytavin, B. Liautard, E. Toreilles, M. Maurin, J.M. Fabre, et L. Giral, C. R. Acad. Sc. (Paris) 284C 211 (1977) 44. A.W. Overhauser, Phys. Rev. Lett. 9, 462 (1960) 45. T. Giamarchi, Quantum Physics in One-Dimension (Clarendon Press, Oxford, 2004) 46. H.J. Schulz, Phys. Rev. Lett. 64, 2831 (1990) 47. J. Voit, Rep. Prog. Phys. 58, 977 (1995) 48. T. Giamarchi, Physica B 230-232, 975 (1997) 49. V.J. Emery, J. Phys. (Paris) Coll. 44, C3-977 (1983) 50. J. Solyom, Adv. Phys. 28, 201 (1979) 51. S. Barisic et S. Brazovskii, Recent Developments in Condensed Matter Physics, V. 1, Eds. J.T. Devreese (Plenum Press, New York, 1981), p. 327 52. V.J. Emery, R. Bruinsma et S. Barisic, Phys. Rev. Lett. 48, 1039 (1982) 53. N. Nagaosa et P.A. Lee, Phys. Rev B 45, 966 (1992) 54. P.A. Lee et N. Nagaosa, Phys. Rev B 46, 5621 (1992) 55. M. Oroda et al., Journal Phys. Soc. Japan 67, 2606 (1992) 56. V.V. Moschkalkov, L.T. Trappeniers et J. Vanacken, Europhys. Lett. 46, 75 (1999) 57. D. Poilblanc et T.M. Rice, Rhys. Rev. B 39, 9749 (1989) 58. J.A. Zaanen et G. Gunnasson, Phys. Rev B 40, 7391 (1989) 59. S.A. Kivelson et al., Nature 393, 550 (1989) 60. H.J. Schultz, Journal de Physique 50, 2833 (1989) 61. S. Lefebvre, P. Wzietek, S. Brown, C. Bourbonnais, D. Jérome, C. Mézière, M. Fourmigué et P. Batail, Phys. Rev. Lett. 85, 5420 (2000) 62. Yu.V. Sushko, V.A. Bondarenko, R.A. Petrosov, N.D. Kushch et E.B. Yagubskii, J. Phys. I France 1, 1375 (1991) 63. H. Mukuda, Y. Yamaguchi, S. Shimizu, Y. Kitaoka, P. Shirage et A. Iyo, Phys. Soc. Jpn. 77, 124706 (2008) 64. F. Kagawa, T. Itou, K. Miyagawa, et K. Kanoda, Phys. Rev. B 69, 064511 (2004) 65. Y. Kurosaki, Y. Shimizu, K. Miyagawa, K. Kanoda, and G. Saito, Phys. Rev. Lett. 95, 177001 (2005) 66. N. Joo, P. Auban-Senzier, C.R. Pasquier, S. Yonezawa, R. Higashinaka, Y. Maeno, S. Haddad, S. Charfi-Kaddour, M. Héritier, K. Bechgaard et D. Jérome, Eur. Phys. J. B 52 3, 337 (2006) 67. H. Seo, C. Hotta, H. Fukuyama, Chem. Rev. 104, 5005 (2004) 68. K. Hasselbach, L. Taillefer et J. Flouquet, Phys. Rev. Lett. 63, 93 (1989) 69. I.R. Walker, F.M. Grosche, D.M. Freye, G.G. Lonzarich, Physica C 282, Part 1, 303 (1997) 70. E.W. Scheidt et T. Schreiner, Phys. Rev. B 58, 1513 (1998) 71. V. Martisovits, G. Zarand et D.L. Cox, Phys. Rev. Letters 84, 5872 (2000) 72. Y. Kamihara, T. Watanabe, M. Hirano et H. Hosono, J. Am. Chem. Soc. 130 (11), 3296 (2008)
580
12. Les supraconducteurs non conventionnels
73. 74. 75. 76.
77. 78.
79.
80.
M.R. Norman, Physics 1, 21 (2008) R. Marchand et W. Jeitschko, Journal of Solid Sate Chemistry 24, 351 (2003) T. Hanaguri, S. Niitaka, K. Kuroki et H. Takagi, Science 328, 5977 (2010) D. Leboeuf, N. Doiron-Lexrand, J. Levallors, R. Daon, J.-B. Bonnemaison, N.E. Hussey, L. Balicas, B.J. Ramshaw, R. Liang, D.A. Bonn, W.N. Hardy, S. Adachi, C. Prons, K. Toullefer, Nature 450, 433 (2007) S. Chakravarty, Science 319, 735 (2008) P. Auban-Senzrer, D. Jérome, N. Doiron-Lexgrand, S. René de Cotret, A. Sedeki, C. Bourbonnoirs, L. Toullefer, K. Beckgaar, Journal of Physics, Condensed Matter 23, 345-702 (2011) D. Leboeuf, N. Doiron-Leyraud, B. Vignolle, M. Sutherland, B.J. Ramshaw, J. Levallois, R. Drou, F. Laliberté, O. Cyr-Choinière, J. Chang, Y.J. Jo, L. Balicas, R. Liang, D.A. Bonn, W.N. Hardy, C. Proust, L. Taillefer, Physical Review B 83, 54-506 (2011) N. Doiron-Leyraud, P. Auban-Senzier, S. René de Cotret, A. Sedeki, C. Bourbonnais, D. Jérome, K. Bechgaard, L. Taillefer, arXiv:0905.0964 Pressure induced Fermi surface reconstruction in the iron - arsenide superconductor Ba1−x Kx Fe3 As2 , E. Hassinger, G. Gredat, F. Valade, S. René de Cotret, A. Juneau-Fecteau, J.-Ph. Reid, H. Kim, M. A. Tanatar, R. Prozorov, B. Shen, H.-H. Wen, N. Doiron-Leyraud, L Taillefer, Physical Review B 86, 140502 (2012)
581
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Exemples d’analogies élaborées par de Gennes 13.1 Le parcours scientifique de Pierre-Gilles de Gennes Au cours de son parcours scientifique, Pierre-Gilles de Gennes a connu diverses institutions de recherche, très variées et très complémentaires. Il a su, bien évidemment, en profiter pour élargir de façon importante une culture scientifique déjà très large, qui a contribué à l’épanouissement de son oeuvre scientifique. Pierre-Gilles de Gennes, lui même, a contribué de façon exceptionnelle au développement de ces diverses institutions de recherche. Rappelons l’enseignement de Mathématiques Spéciales qu’il a suivi au Lycée Janson de Sailly, donné par le frére d’André Guimer, avec un programme spécial comportant beaucoup de Physique mais aussi de Chimie et de Biologie. Pierre-Gilles de Gennes, sorti de l’École Normale Supérieure (ENS) en 1955, travaille d’abord comme Ingénieur au Commissariat à l’Énergie Atomique, où il prépare une thèse de doctorat ès sciences, intitulée « Contribution à l’étude de la diffusion magnétique des neutrons », soutenue en 1957. Il s’intéresse aux phénomènes critiques qui apparaissent au voisinage de la température de Curie des matériaux magnétiques. Il comprend comment les moments magnétiques, ordonnés à basse température, se désordonnent lorsque la température augmente. En fait, il utilise une approximation de Van Hove, premier terme d’un développement à l’approche de Tc , pour décrire les fluctuations magnétiques. Il était conscient de la nécessité,
583
Physique de la matière condensée
pour etre plus exact, d’une approche développée plus tard par Wilson. Il a utilisé la même approche, à la suggestion de J. Friedel pour calculer la résistivité pour le couplage magnétique des Terres Rares (avant sa thèse). Il était par ailleurs intéressé par la percolation dès avant sa thèse. Il découvre l’universalité de ce phénomène et développe, à ce propos, le concept de percolation. Des phénomènes en apparence très différents au niveau microscopique, se comportent de la même façon à un niveau macroscopique. Il applique ce concept pour comprendre la diffusion de neutrons dans les liquides, la relaxation des spins dans les cristaux magnétiques avec A. Abragam, ou la conduction électrique dans un réseau. Entre 1959 et 1961, il est ingénieur détaché du CEA, ce qui lui permet de faire un séjour post-doctoral à l’Université de Californie à Berkeley, dans le groupe de Charles Kittel. Il étudie les ondes de spin dans les grenats d’Yttrium. Il comprend comment les spins désordonnés possèdent des excitations collectives. Ayant analysé la diffusion de neutrons par les fluctuations magnétiques dans le Nickel, il étend un traitement similaire pour discuter la résistivité électrique des métaux de Terres Rares et expliquer le couplage magnétique de leurs couches 4f comme dû au double échange d’origine magnétique. Il avait, en même temps d’autres intérêts, notamment les effets de résonance dans les matériaux magnétiques, ainsi que les effets de percolation dans les alliages. Jacques Friedel a souligné ce qui était résolument neuf dans ces approches, ainsi que leur influence considérable. Il a aussi souligné combien ces contacts précoces avec C. Kittel, à Berkeley, et avec H. Casimir à Eindhoven, ont joué un rôle très positif sur le développement futur du parcours de recherche de Pierre-Gilles de Gennes. Son recrutement à la nouvelle Faculté des Sciences d’Orsay, lui a permis de développer un groupe de travail, très rapidement productif et original sur la supraconductivité des métaux. Ce groupe de travail à Orsay, au Laboratoire de Physique des Solides, a connu très rapidement des succès considérables. Y étaient associés, autour de de Gennes de nombreux jeunes chercheurs, expérimentateurs comme théoriciens, associants dans le même dialogue leurs recherches originales. En 1967-68, en pleine explosion de résultats expérimentaux du groupe d’Orsay sur les supraconducteurs, Pierre-Gilles de Gennes décide d’explorer d’autres sujets de Physique de la Matière Condensée. Il se tourne alors, successivement, vers les solutions de polymères, les cristaux liquides nématiques et Cholestériques, puis vers différents problèmes relevant de la Biophysique : le fonctionnement des muscles, la transmission de l’influx nerveux, les membranes lipidiques, etc. C’est alors que ce produit le passage de la « Matière Dure » démarches vers ce qui s’appellera rapidement la Matière Molle. L’émergence de cette notion s’est produite en proposant des pistes nouvelles, aussi bien au niveau théorique qu’au niveau de pistes expérimentales, provoquant discussions et enthousiasme et fédérant de jeunes chercheurs et de moins jeunes, autour de thématiques défrichées par Pierre-Gilles de Gennes. Très vite, les résultats originaux pleuvent, sur la physique des Cholestériques, sur leurs défauts, sur les instabilités des phases mésomorphes, etc. Le nombre de chercheurs qui, à Orsay s’intéressent aux cristaux liquides croît très vite, aussi bien au niveau théorique qu’au niveau expérimental. Le Laboratoire de Physique des Solides est un pôle créatif qui attire des chercheurs américains d’universités prestigieuses (Harvard, MIT, etc.) qui viennent se former à Orsay, puis repartent pour développer aux USA
584
13. Exemples d’analogies élaborées par de Gennes
leurs propres équipes. Pierre-Gilles de Gennes s’intéresse alors aux transitions entre phases des cristaux liquides, utilisant les approches des brisures de symétrie, celles des lois d’échelle, comme dans les systèmes magnétiques, pour identifier les exposants critiques de ces transitions. En 1971, un tournant se produit, dû à la rencontre de de Gennes avec K. Wilson, qui vient d’appliquer aux transitions de phase les techniques du Groupe de Renormalisation, et d’expliquer les relations entre exposants critiques et classes d’universalité, en montrant que les exposants critiques ne dépendent que de la dimension du paramètre d’ordre et de la dimension d’espace. P.-G. de Gennes avait immédiatement compris l’importance de l’apport de K. Wilson sur les transitions de phase, notamment celles des phases mésomorphes, mais aussi bien au-delà. Il avait en effet compris comment retrouver les exposants des lois d’échelle des polymères, à condition de faire tendre la dimension du Paramètre d’Ordre vers zéro. C’est le fameux « théorème n=0 ». En faisant tendre vers 0 la dimension du paramètre d’ordre, on ne conserve que les chemins d’interaction sans boucle, et on décrit donc les chaînes de polymères autoévitantes. Ainsi s’ouvrait la voie vers la Physique des polymères. On avançait alors vers la compréhension des solutions de polymères par des approches en lois d’échelle. Après l’étude des polymères linéaires flexibles, compris de façon très originale et très élégante, P.-G. de Gennes se tourne alors vers les polymères ramifiés, la transition Sol-Gel, la percolation, puis vers les polymères aux interfaces. En 1976, de Gennes prend la direction de l’École Supérieure de Physique et de Chimie Industrielles (ESPCI), où il suscite une profonde réforme des études, puis il pousse à la création du Laboratoire de Physico-Chimie Curie, cherchant à mettre directement en contact des Physiciens et des Biologistes. Vers 1983-1985, il aborde les phénomènes de Mouillage et met en évidence le rôle des interactions de Van der Waals dans la formation du film de mouillage. En 1991 les travaux illustres de de Gennes sont reconnus par le Prix Nobel de Physique, attribué pour l’ensemble de ses travaux. Puis, P.-G. de Gennes continue à explorer de nouveaux domaines, notamment depuis son installation à l’Institut Curie : les Milieux Granulaires, la Dynamique de Chaînes des polymères Confinés aux interfaces, la Transition Vitreuse, les Matériaux Biomimétiques, l’Adhésion cellulaire, le fonctionnement du cerveau et de la mémoire, etc.
13.2 Trois exemples d’analogies développées par P.-G. de Gennes Dans ce paragraphe, nous allons exposer trois exemples d’analogies entre transitions de phase développées par P.-G. de Gennes. Ce ne sont, bien évidemment que trois exemples, choisis parmi tant d’autres, que la totalité de cet ouvrage ne serait sans doute pas suffisante pour les exposer toutes. Pour beaucoup, Pierre-Gilles de Gennes est le grand maître de ces analogies. Cette aptitude à découvrir de telles analogies n’est
585
Physique de la matière condensée
évidemment pas le résultat d’un hasard, mais certainement d’un grand nombre de qualités exceptionnelles réunies chez le même scientifique : – une richesse culturelle considérable, celle d’un Physicien de la Matière Condensée, bien évidemment, mais sans doute aussi d’un scientifique qui montrait un intérêt très marqué, également, pour la Chimie et pour la Biologie. – d’un scientifique très désireux de poursuivre sans relâche un renouvellement incessant de ses thèmes de recherche. – d’un véritable créateur très original, qui montrait un intérêt passionné pour tous les progrès de la connaissance, y compris dans le champ très large des Sciences Humaines. Dans ce qui suit, nous allons évoquer brièvement trois exemples, selon un choix évidemment très arbitraire et très réducteur : 1) Les analogies entre les transitions de phase des supraconducteurs et celles des cristaux liquides. 2) La Physique et la physico-chimie des polymères : la découverte n=0. 3) La percolation : un concept unificateur.
13.2.1 Les analogies entre transitions de phase des supraconducteurs et celles des cristaux liquides Introduction En 1972, Pierre-Gilles de Gennes a publié un article particulièrement remarquable et novateur, soulignant une analogie extrêmement féconde entre les cristaux liquides smectiques et les supraconducteurs, d’une part, et entre les transitions de phase nématique-smectique A des cristaux liquides et phase normale-phase supraconductrice des matériaux supraconducteurs [1]. Cette publication a réellement ouvert une nouvelle ère de la recherche sur la Physique des cristaux liquides. Dans ce paragraphe, nous rappellerons comment le contenu de ces publications ont eu un impact important, aussi bien sur le plan théorique que sur le plan expérimental. Les cristaux liquides sont des matériaux qui présentent une anisotropie caractéristique des solides cristallins, mais aussi un manque de rigidité, qui leur a valu leur nom de cristaux liquides. Ces matériaux sont très clairement des matériaux qui suivent les lois de la Physique Classique. Les supraconducteurs sont des matériaux qui perdent leur résistance au passage d’un courant électrique, habituellement à des températures inférieures à une vingtaine de degrés Kelvin. La supraconductivité est fondamentalenent un phénomène quantique, produit par la condensation de paires d’électrons, les paires de Cooper, dans un état à N corps possédant une cohérence de phase.
586
13. Exemples d’analogies élaborées par de Gennes
En 1972, P.-G. de Gennes a établi une analogie étroite entre la phase smectique A des cristaux liquides et les supraconducteurs, ouvrant là une nouvelle ère de la Recherche sur les cristaux liquides. Nous discuterons dans ce paragraphe les bases physiques de cette analogie, ainsi que ses conséquences sur la Physique des cristaux liquides.
Rappels sur les supraconducteurs Comme nous l’avons vu au chapitre 11, la théorie phénoménologique de Laudau-Ginzburg fournit une description remarquable de la phénoménologie des supraconducteurs. On considère un paramètre d’ordre ψ, qui, parce que l’électron qu’il décrit porte une charge, doit se coupler, d’une façon invariante de gauge, avec le potentiel vecteur A, dont le rotationnel est l’induction magnétique B. La densité d’énergie libre peut être décomposée en deux parties : FSC = Fψ + FA Le premier terme est l’énergie libre associée au développement du paramètre d’ordre complexe ψ 2 + 1 g | ψ |4 A ψ | Fψ = d 3 x r | ψ |2 +C | ∇ − 2ie 2 h¯ c où e est la charge électrique h¯ est la constante de Planck et c la vitesse de l’électron, de la lumière et où r = a T − Tc change de signe à la température de transition de champ moyen Tc . La dérivée invariante de jauge ∇ − 2ie h¯ c A fournit le couplage critique entre le champ magnétique et l’ordre supraconducteur. Le second terme est l’énergie magnétique 2 FA = 12 K d 3 x ∇ × A = 12 K d 3 x B2 où K = 4π1μ0 , où μ0 est la perméabilité de l’état normal. Cette énergie libre prévoit une transition de phase du second ordre à r = 0, de l’état normal à l’état supraconducteur, avec ψ = ± | r | /g pour r < 0 √ Elle comprend deux échelles de longueur : la longueur de cohérence ξ = C / | r | 1/2
. et la longueur de pénétration, λ = h¯ 2 c 2 K / 8Ce 2 ψ 2 Dans la suite on considèrera souvent une généralisation de FSC où ψ a n/2 com posantes complexes, c’est-à-dire où ψ = ψ1 , ψ2 , ..., ψn/2 , ψk étant un champ complexe, et où d est la dimension d’espace. Les propriétés magnétiques d’un supraconducteur sont particulièrement importantes : l’énergie libre de Gibbs s’écrit G = FSC + FH où FH =
1 4π
d 3x H · ∇ × A =
1 4π V
H·B
587
Physique de la matière condensée
où B est le champ de Maxwell, c’est-à-dire l’induction moyenne décrivant un supraconducteur placé dans un champ magnétique extérieur. L’état supraconducteur expulse généralement le flux magnétique, = B · d S = A · d l. Cependant, le flux magnétique est quantifié en multiples du quantum de flux φ0 = hc/ 2e . Ce flux peut pénétrer dans l’échantillon, en volume, dans le coeur des défauts topologiques, ces vortex quantifiés, dans lesquels la phase de ψ change de 2π dans un circuit autour du coeur. Il existe deux types de supraconducteurs caractérisés par l’importance du√paramètre de Ginzburg κ = λ/ξ . Dans les supraconducteurs de type I, où κ < 1/ 2, le flux magnétique est totalement expulsé de la phase supraconductrice. Le diagramme de phase est celui de la figure 12.11. Le champ critique qui détruit totalement l’ordre supraconducteur dans une transition du premier ordre est 1/2 Hc = 4πμ0 r 2 /g √ Dans les supraconducteurs de type II, c’est-à-dire les systèmes où κ > 1/ 2, une nouvelle phase apparaît, la phase d’Abrikosov (ou « phase mixte ») qui autorise une pénétration partielle du flux sous la forme d’un réseau de vortex, alignés parallèlement au champ magnétique (voir chapitre 11). Le diagramme de phase dans le plan (champ magnétique, température) est celui de la figure 11.19. La phase d’Abrikosov existe entre deux champs critiques : au dessus du champ critique inférieur Hc1 , où il devient plus favorable de créer un vortex, et au dessous du champ critique supérieur Hc2 , qui détruit totalement l’ordre supraconducteur. L’énergie libre de Ginzburg-Landau peut être considérée comme une énergie effective dans une représentation d’intégrale fonctionnelle de la fonction de partition : Z H, T = Dψ exp − G [ψ] /T
Introduction aux cristaux liquides nématiques et smectiques La phase nématique est la plus simple des phases cristaux liquides. Il s’agit d’une phase de symétrie avec un axe local d’anisotropie dont la position est donnée uniaxiale, par x = x, y, z , le long du vecteur unitaire n(x ), appelé le directeur de Frank. Le paramètre d’ordre décrit la phase nématique par rapport à la phase isotrope. Il s’écrit sous la forme d’un tenseur δQij = S ni nj − 13 δij où ni est le vecteur unitaire spécifiant la direction d’une molécule individuelle et S est l’amplitude du paramètre d’ordre. En l’absence de champ extérieur, l’énergie du nématique est invariante sous l’effet de rotations rigides du directeur. Les distorsions de basse énergie du système sont décrites par une énergie libre de type élastique, appelée l’énergie libre de Frank : 2
2
2 + K3 n× ∇ × n } Fn = 12 d 3 x {K1 ∇ · n + K2 n· ∇ × n où K1 , K2 et K3 sont les constantes élastiques mesurant, respectivement, l’énergie d’une déformation en éventail (« splay » ∇ · n = 0), d’une déformation de torsion
588
13. Exemples d’analogies élaborées par de Gennes
(« twist » n · ∇ × n = 0) et d’une déformation de courbure (bend n× ∇ × n = 0). L’énergie libre de Franck est l’analogue, pour les cristaux liquides, de l’énergie magnétique FA des supraconducteurs, décrits dans le paragraphe précédent. le directeur (qui n’est pas un vecteur mais un axe) est selon n0 = À l’équilibre, 0, 0, 1 , et, à l’approximation harmonique en déviations δn = n − n0 on a
2 d d q 2 2 d K1 q⊥ + K3 q | δn⊥ q | 2π 2 + K2 q⊥ + K3 q2 | δnt q |2
1 Fn [Kα ] = 2
de δn q sur les où, à trois dimensions δn t et δn⊥ sont respectivement les projections vecteurs unitaires et = −qx , qy , 0 /q⊥ , où q⊥ = qx , qy , 0 . Pour une dimension d’espace d, δnt est la composante de δn perpendiculaire à n0 dans le plan q − n0 . Cette décomposition sépare δn = δnt + δn⊥ en une partie δn⊥ parallèle à q⊥ et une partie δnt perpendiculaire à q⊥ . La chiralité des molécules constituantes favorise la torsion du directeur. Elle donne naissance à l’énergie : FCh = −h d 3 x n · ∇ × n favorisant une torsion non nulle n · ∇ × n où h est un paramètre qui dépend de la concentration de molécules chirales et de leur dégré de chiralité. Pour une valeur non nulle de h, le fondamental nématique se transforme en un état cholestérique, avec n(x ) = 0, sin k0 x, cos k0 x où k0 = h/K2 ≡ 2π/P, P étant le pas cholestérique. Les phases smectiques sont des structures en couches possédant une modulation de densité périodique dans une direction. Dans les smectiques A, le directeur n du nématique et la normale aux couches N sont parallèles àl’équilibre, alors que dans les smectiques C, n fait un angle avec N. Les smectiques ont un espacement de couches préféré d et beaucoup de leurs propriétés géométriques peuvent être expliquées en supposant un espacement donné des couches fixé.
L’énergie libre de de Gennes – Les analogies entre transitions de phase La publication de de Gennes sur l’analogie cristaux liquides-smectiques part d’une observation topologique [2]. Si l’espacement des couches d est fixé et n est parallèle à N, alors 1 n·d l = k d
589
Physique de la matière condensée
où l’intégrale est calculée autour d’une boucle fermée et où k est un nombre entier, le nombre de lignes de défauts pénétrant la boucle, qui est nul en l’absence de défauts topologiques (appelés « dislocations »). Cette relation est l’analogue de la quantification du flux dans les supraconducteurs. Cette relation établit la première partie de l’analogie cristaux liquides-supraconducteurs. Nous voyons donc qu’il faut noter que le directeur est l’analogue du potentiel vecteur A, que ∇ × n est l’analogue de B et que Fn est l’analogue de FA . Dans les systèmes chiraux, FCh est alors l’analogue de FH et h est l’analogue de H. Il faut également poser la question suivante, qui est évidemment essentielle : dans le cadre de cette analogie, quel est l’équivalent de ψ ? MacMillan [3] et Kobayashi [4] se sont intéressés à la description de la transition de phase entre nématique et smectique A. Ils ont introduit un paramètre d’ordre σ =< cos q0 z 32 cos2 θ − 12 > où θ est l’angle de l’axe long d’une molécule en forme de baguette avec l’axe d’anisotropie, qui se couple au paramètre d’ordre nématique S =< 32 cos2 θ − 12 >. McMillan a dérivé une théorie de champ moyen du diagramme de phase montrant l’ensemble de trois phases : une phase isotrope, une phase nématique et une phase smectique A. Cependant, ni McMillan ni Kobayashi n’ont discuté la phase de σ . Mais, de Gennes a compris que cette phase spécifiait la position des couches smectiques, et était donc crucialement importante. En fait, de Gennes a introduit, plutôt que σ , l’amplitude complexe de l’onde de densité de masse, en écrivant un développement de cette densité de masse : ρ(x ) = ρ0 + √1 ψe izq0 + c.c. + ... 2
e −iuq0 .
Les déplacements de couches sont décrits par la variable de où ψ =| ψ | phase u(x ), définie en tout point de l’espace x où les couches smectiques sont bien définies. Dans la phase smectique, l’amplitude | ψ | du paramètre d’ordre prend une valeur non nulle, et l’énergie libre des distorsions de grande longueur d’onde est dominée par la phase u et le directeur n. Si | ψ | est spatialement constant, l’énergie libre de de Gennes devient ; F = Fu + Fn avec Fu =
1 2
2 2 d d x B ∇ u + D ∇⊥ u + δn
où B = C q0 | ψ |2 et où D = C⊥ q0 | ψ |2 . Les distorsions δnt du directeur perpendiculaire à q⊥ coûtent une énergie de volume = 0, mais que n · ∇ × δn = 0 ainsi que n0 × (figure 13.1). Puisque q · δn t 0 t ∇ × δnt = 0, cela signifie que à la fois la torsion et la courbure sont expulsées de la phase smectique, mais pas la distorsion en éventail (« splay »). Il s’agit là de la version « cristal liquide » du mécanisme de Higgs de la physique des particules : la torsion et la courbure acquièrent une « masse » induite par le développement de l’ordre smectique.
590
13. Exemples d’analogies élaborées par de Gennes
verre nématique verre flexion rot
éventail
torsion rot
Fig. 13.1 Les trois types de distorsions élastiques qu’il est possible de créer dans un cristal liquide nématique. La figure montre comment chaque type peut être obtenu séparément en plaçant de façon convenable des parois de verre. La géométrie « tordue » (twisted) entre parois parallèles, communément appelée plage tordue, a été utilisée dès 1911 par C. Mauguin.
Les profondeurs de pénétration pour la torsion et pour la courbure sont, respectivement,
λ3 = KD3 ∼| r |−1/2 λ2 = KD2 ∼| r |−1/2 Une déformation en éventail, pour q · δn⊥ non nulle, peut pénétrer dans un smectique, mais doit être accompagnée d’une distorsion des couches smectiques. En présence d’une valeur non nulle de ∇⊥ u, δn relaxe vers δn = −∇⊥ u + O ∇ 3 u à l’équilibre. n relaxe vers une valeur locale de la normale aux couches N. La relaxation 2 2 2 de n élimine la contribution ∇⊥ u à l’énergie, laissant un terme ∇⊥ u venant du terme en éventail dans l’énergie de Frank : Fel =
1 2
2 2 2 d 3 x B ∇ u + K1 ∇⊥ u
Il s’agit de l’équivalent de la célèbre énergie élastique de Landau-Peierls pour un solide unidimensionnel. Si on ajoute l’énergie élastique de Frank à l’énergie libre F obtenue plus haut, nous obtenons la forme proposée par de Gennes. L’analogie que présente cette forme avec
591
Physique de la matière condensée
celle de Landau-Ginzburg pour les supraconducteurs permet de tirer de nombreuses conséquences. En voici deux exemples.
Le directeur En présence d’un champ magnétique extérieur, la transition état normal-état supraconducteur devient du premier ordre et au voisinage de Tc , la ligne de transition est une droite de pente négative. Pour obtenir un déplacement analogue du point de transition lorsqu’un système passe de l’état nématique à l’état smectique A, il faut trouver quelle est la grandeur qui joue le rôle de l’induction magnétique B. Si on raisonne par analogie, on voit que c’est le vecteur b = rot n qui joue le même rôle dans la phase smectique.
Les dislocations L’analogue des vortex de la phase supraconductrice, pour la phase smectique A, sont les lignes de dislocations autour desquelles la phase q0 u de ψ change de 2π m, où m est un entier. Si est une boucle entourant un coeur de dislocation, alors : 2π m du = v · dl = q0 = md Il y a deux sortes de dislocations dans les smectiques : les dislocations vis, dans lesquels la normale à la boucle est parallèle à la normale aux couches N, et les dislocations coins, dans lesquelles la normale à la boucle est perpendiculaire à N. Une dislocation vis a la structure d’un escalier en spirale et son champ de déplacement est simplement u = d /2π tan−1 y/x .
13.2.2 Physique et physico-chimie des polymères – La découverte n = 0 Introduction Dans ce paragraphe, nous décrivons comment une note de deux pages, publiée dans Physics Letters a bouleversé la Physique et la Physico-chimie des polymères [5]. Ce qu’on a appelé « le théorème n=0 » est né au moment où les idées du groupe de renormalisation ont commencé à se propager parmi la communauté des physiciens. K. Wilson venait de rencontrer Pierre-Gilles de Gennes et de lui expliquer ses idées sur sa découverte, qui révolutionnera la Physique des transitions de phase. PierreGilles de Gennes l’enseignera immédiatement dans son cours du Collège de France et, en préparant son cours, il comprit très vite que cette découverte allait permetttre de décrire la configuration d’une chaîne, qui, dans un bon solvant ne peut se recouper avec elle-même. C’est le fameux problème du « volume exclu » des polymères. P.-G. de Gennes a vu tout de suite que ce problème revenait à étudier un système magnétique
592
13. Exemples d’analogies élaborées par de Gennes
dont le paramètre d’ordre comprend n composantes, à condition de passer à la limite où n tend vers zéro. Le « théorème n = 0 » ouvre une nouvelle voie. La renormalisation ne s’applique pas seulement aux transitions de phase près d’un point critique. Cette procédure permet aussi de décrire des situations où l’on considère des objets qui possèdent la propriété essentielle d’être invariants par homothétie. C’est ainsi que que les lois d’échelle vont maintenant s’étendre à la Physique et à la Physico-Chimie des polymères.
La renormalisation et la physique des polymères C’est au cours de l’année académique 1971–72 que P.-G. de Gennes a eu l’idée d’appliquer les concepts de la renormalisation de K. Wilson à la physique des polymères, et notamment la propriété d’invariance par dilatation. Cette nouvelle théorie fournissait le moyen de traiter le problèmes des fluctuations critiques, qu’on ne savait pas étudier de façon simple, en traitant un régime beaucoup plus simple de fluctuations faibles. Cette nouvelle approche s’avérait présenter une généralité remarquable. Puisque le comportement de lois de puissance anormales repose sur une propriété de symétrie, tout système présentant la même forme de symétrie doit présenter les mêmes lois de puissance. De plus, des quantités fluctuantes plus générales qu’une densité scalaire devaient pouvoir aussi être expliquées de la même façon. On pouvait ainsi étudier les fluctuations vectorielles de l’aimantation locale dans un métal, sur le point de subir une transition vers une phase ferromagnétique. Mais il était aussi possible de généraliser ce cas en étudiant un système présentant un nombre arbitraire n de composantes : n = 1 pour un gaz, n = 3 pour un système magnétique d’Heisenberg, etc. À ce moment, Pierre-Gilles de Gennes avait compris la connexion qui existait entre la théorie de Wilson et un problème de nature complètement différente, le fameux « Problème de Volume Exclu » de la Physique des polymères. Les polymères sont de longues chaînes dont les liens sont tordus de façon aléatoire sous l’effet des fluctuations thermiques, quand ils sont dissouts dans un solvant approprié. Une telle chaîne peut être décrite comme une sorte de marche aléatoire. P.-G. de Gennes avait noté la ressemblance entre cette tentative de comptage des contacts entre monomères et une forme anormale de comptage dans un gaz dense : les molécules de gaz, comme les monomères, ne peuvent pas se recouper l’une l’autre. Dans la méthode de Wilson, le même ensemble de diagrammes décrivait des champs fluctuants possédant un nombre arbitraire de composantes n. Dans ce schéma, il y avait une correspondance parfaite entre un diagramme de polymère et un diagramme correspondant d’un champ de vecteur. De plus, l’expression mathématique associée à un diagramme de polymère donné était identique à celle du champ de vecteur, à condition de choisir convenablement la valeur de n. Cette valeur de n « magique » était n = 0. Alors, ces diagrammes étaient la seule condition nécessaire imposée par la théorie de Wilson pour déterminer cette symétrie de groupe de renormalisation et par conséquent ses exposants critiques. Les formules approchées pour ces exposants avaient été exprimées en fonction de n. Il suffisait simplement de faire tendre n vers 0 dans ces
593
Physique de la matière condensée
formules pour découvrir l’information pertinente pour le problème des polymères auto-évitents. Pierre-Gilles de Gennes était en mesure d’obtenir les exposants du Problème de Volume Exclu, en transcrivant simplement la théorie de Wilson pour les phénomènes critiques. Cette transcription fut expliquée par une publication de moins de deux pages du Journal « Physics Letters », publiée le 10 janvier 1972. Un des problèmes les plus difficiles et les plus étudiés de la Physique Statistique était résolu de façon très simple. La notion de renormalisation était, auparavant, considérée comme intimement liée à la notion de brisure spontanée de symétrie et de transition de phase. Ici, la nouvelle réalisation de la symétrie de renormalisation, dans le cas des polymères, n’avait aucun lien avec la notion de « brisure spontanée » de symétrie ni avec une quelconque « transition de phase ». La note de P.-G. de Gennes fut intitulée « Exponents for the excluded volume problem as derived by the Wilson method ». Comme on l’a vu, le Problème de Volume Exclu est le nom donné par les physiciens des polymères pour expliquer comment la taille R d’un polymere auto-évitant croît avec sa longueur N . Cela revient à trouver l’exposant ν dans la formule R ∼ N ν . La méthode de Wilson se réfère de façon spécifique à une technique de calcul de diagrammes. Puisque la valeur numérique correspondant à un diagramme donné ne dépend que de la distance entre points d’interaction sélectionnés, chaque diagramme a une dépendance simple par rapport à la dimension d’espace. Le point critique, où apparaît le comportement intéressant est justement le point où les valeurs numériques divergent. C’est le groupe de renormalisation qui fournit le sens physique de cette divergence (voir chapitre 4). Les divergences disparaissent au dessus de la dimension d’espace d = 4. Si on suppose que d est très proche de 4, on peut obtenir des quantités finies en réalisant un développement de Taylor par rapport au petit paramètre ε = d − 4. La publication de Wilson “Critical exponents in 3.99 dimensions” [6], non encore publiée lors de la publication de l’article de P.-G. de Gennes, a permis de calculer les exposants critiques des polymères au second ordre en ε, permettant ainsi d’évaluer le résultat pour un espace tridimensionnel en évaluant le résultat du développement pour ε = 1. Les conclusions du court article de P.-G. de Gennes ont été immédiatement et chaleureusement acceptées par la communauté de la Physique Statistique. La découverte n = 0 a été très rapidement publiée dans le Compte Rendu des « Conférences de Cargese sur le Groupe de Renormalisation » et dans l’article de revue de Wilson et Kogut de 1974 [7].
13.2.3 La percolation : un concept unificateur Le concept de percolation a été découvert, d’abord, par le mathématicien Hammersley [8]. Cependant, il n’est pas exagéré d’affirmer que le concept de percolation a été également « co-inventé » par Pierre-Gillles de Gennes, tant ce dernier a élargi et généralisé cette notion. Pierre-Gilles de Gennes a publié un article sur ce sujet dans le périodique « La Recherche », généralement considéré comme un périodique
594
13. Exemples d’analogies élaborées par de Gennes
de vulgarisation. Cette publication a été intitulée, par de Gennes, « La percolation : un concept unificateur » [9]. Ce périodique inhabituel avait été choisi, clairement, dans le but d’élargir le lectorat académique traditionnel de Pierre-Gilles de Gennes. Le but était, de toute évidence, de ne pas se limiter aux problèmes traditionnels de Physique de la Matière Condensée mais de leur donner une diffusion vers un public beaucoup plus large. Le problème de la percolation, tel qu’il a été étudié par le mathématicien Hammersley, permet une description statistique des systèmes constitués d’un grand nombre d’objets qui peuvent être reliés entre eux. Dans un tel système, la communication à grande distance est soit possible, soit impossible suivant le nombre d’objets et de liaisons : il existe un seuil de transition précis entre ces deux régimes. On peut ainsi décrire dans des termes identiques, par exemple, la conduction dans certains types d’alliages, la viscosité de matériaux polymérisés, l’entretien d’un réseau téléphonique ou la formation d’un continent par exhaussement d’un archipel. La transition de percolation est maintenant entrée dans le cadre connu des transitions de phase et bénéficie ainsi de l’arsenal théorique accumulé dans ce domaine durant plusieurs décennies. Dans son article publié dans La Recherche, Pierre-Gilles de Gennes a exposé de façon particulièrement simple et claire quelques exemples classiques de seuils de percolation. Sont ainsi évoqués quelques exemples simples : celui d’une transition où l’on passe d’un système d’îles à un système continental par abaissement du niveau de la mer. À partir d’un certain niveau de la mer, il apparaît une île arbitrairement grande, sur laquelle un voyageur peut aller aussi loin qu’il le désire sans franchir un bras de mer. L’apparition du continent est un exemple de transition de percolation. Un autre exemple est celui d’un réseau de transmissions partiellement détérioré. Selon les cas, deux points du réseau peuvent encore être connectés, mais si le nombre de liaisons actives est plus bas, deux points éloignés ne seront plus connectés. On peut réaliser des expériences où la conductance macroscopique d’un mélange de billes conductrices et isolantes devient nulle quand le pourcentage de billes conductrices p devient inférieur à une valeur critique p = 0, 32. Très tôt, on a essayé de trouver des formules plus ou moins approchées pour le seuil de percolation. On s’est appuyé sur l’arsenal des transitions de phase. Un exemple classique de transition de phase nous est fourni par les matériaux ferromagnétiques : dans le cas métallique, par exemple, chaque atome apporte un moment magnétique et deux moments voisins sont couplés : l’énergie est plus basse quand les moments sont parallèles. À basse température les moments sont alors très alignés et le système montre une aimantation macroscopique M0 . Quand la température croît, un certain désordre apparaît et M0 décroît. Finalement, lorsque le point de Curie est atteint, les moments sont fortement désordonnés et l’aimantation est nulle. La transition à Tc a fait l’objet d’études intensive et est maintenant bien comprise. Très tôt, on a pressenti qu’il y avaitune analogie entre le comportement de l’aimantation M T 0 et la probabilité S∞ p qu’un site appartienne à l’arbre infini dans le problème de la percolation.
595
Physique de la matière condensée
Le grand progrès réalisé à ce stade est de faire bénéficier les études sur la percolation de l’ensemble des connaissances théoriques accumulées grâce aux études sur les transitions de phase. Les relations entre la Physique Statistique et l’étude des comportements de groupes d’êtres vivants, désormais, sont également discutés. Ainsi, dans un banc de poissons, tous les participants nagent spontanéments dans le même sens. Cela peut être comparé à l’action d’un aimant, dans lequel tous les moments magnétiques tendent à être paralllèles. Si l’on en vient aux populations humaines, on rencontre évidemment un degré de complexité énorme. Dans son article paru dans La Recherche, P.-G. de Gennes a balayé un grand nombre d’exemples variés relatifs aux applications du concept de percolation, qui vont des transitions sol-gel, à la propagation des épidémies ou de celles des incendies de forêts. Comme il le dit, les modèles esquissés sont souvent encore très éloigné de la réalité pratique, mais il espérait que les connaissances accumulées sur des exemples physiques permettrait de mieux comprendre certains processus sociologiques simples. Il faut espérer que grâce à des actions interdisciplinaires originales le nombre de chercheurs possédant la culture nécessaire à cette fin pourra se développer dans les années à venir.
Bibliographie 1. 2. 3. 4. 5. 6. 7.
P.-G. de Gennes, Solid State Commun. 10, 753 (1972) P.-G. de Gennes, Mol. Cryst. Liq. Cryst. 21, 49 (1973) W.L. McMillan, Phys. Rev. A 4, 1238 (1971) K. Kobayashi, J. Phys. Soc. Jpn. 29, 101 (1970) P.-G. de Gennes, Physics Letters A 38, 339 (1972) K.G. Wilson et M.E. Fisher, Phys. Rev. Lett. 28, 240 (1972) K.G. Wilson et J. Kogut, The renormalization group and the expansion, Physics Reports (1974) 8. J.M. Hammersley et G. Mazzarino, Markov-fields, correlated percolation, and the Isingmodel, Lecture notes in mathematics 1035, 201 (1983) 9. P.-G. de Gennes, La Recherche, http ://www.larecherche.fr/content/recherche/article ?id= 14383 (1976)
596
Physique des atomes froids et physique de la matière condensée 14.1 Introduction Des projets récents de recherche visent à réunir les chercheurs dans deux domaines voisins : celui de la Physique des Atomes Froids et celui de la Physique de la Matière Condensée. Les Atomes Froids offrent des possibilités uniques de réaliser les systèmes modèles avec un degré de contrôle et de réglage sans précédents, permettant de tester de nombreux problèmes pertinents dans le domaine des corrélations fortes. Ils sont, de ce fait, directement reliés, à différents laboratoires de recherche importants, tels le Laboratoire Kastler-Brossel, le Laboratoire Aimé Cotton, Le LPTMS, etc. en France, l’Université de Genève (Thierry Giamarchi), ou l’ETH Zurich (G. Blatter, T. Esslinger, M. Troyer). Différents projets s’articulent notamment autour de trois axes principaux : (i) l’exploration, tant théorique qu’expérimentale, de divers systèmes modèles, comme le modèle de Hubbard, (ii) les problèmes de sondes et de thermométrie qui sont incontournables dans les recherches sur les systèmes quantiques fortement corrélés, et qui peuvent également être mis en œuvre dans les gaz d’atomes froids, (iii) les états dynamiques hors d’équilibre et les nouvelles phases qui peuvent être réalisés dans les gaz d’atomes froids, qui n’ont pas pour le moment de contrepartie en matière condensée, mais qui peuvent ouvrir de nouveaux domaines de recherche ou guider la recherche de nouveaux matériaux.
597
Physique de la matière condensée
I. Bloch et al. ont publié, récemment, une revue générale sur ce sujet dans « Review in Modern Physics, qui traite de la description de la superfluidité dans les systèmes de Fermions. Contrairement au cas des superfluides conventionnels comme l’He 4 ou celui des supraconducteurs conventionnels, où la fonction d’onde macroscopique fournit une description phénoménologique des degrés de liberté superfluides, la situation des gaz dilués est considérablement plus simple. Grâce au fait que les interactions soient faibles dans ce cas, la condensation de Bose-Einstein des gaz dilués donne lieu à un condensat essentiellement pur, suffisamment au dessous de la transition. Par conséquent, dans les gaz dilués, l’aspect à N corps est en fait réduit à une description à une particule, où les interactions donne simplement naissance à un potentiel additionnel proportionnel à la densité locale de particules. Ajouter de petites fluctuations autour de la description d’ordre zéro conduit à la théorie bien connue de Bogoliubov des gaz de fermions en interaction faible. Le problème à N corps est alors complètement résolu en termes de quasiparticules en l’absence d’interaction. Au cours de ces dernières années, deux nouveaux développements d’un intérêt majeur ont considérablement élargi la physique accessible grâce aux gaz ultra-froids. Ils sont désormais associés à : – la possibilité d’accorder la force des interactions dans les gaz ultra-froids par les résonances de Feshbach ; – la possibilité de changer la dimensionnalité avec des potentiels optiques, en particulier, en engendrant des potentiels périodiques pour les atomes froids par des réseaux optiques.
14.2 La physique de Fermi-Hubbard décrivant des atomes dans un réseau optique Le modèle de Fermi-Hubbard est un concept clé pour la Physique de la Matière Condensée. Il fournit des concepts cruciaux pour la Physique Electronique, et pour les propriétés magnétiques des matériaux. Cependant, la nature complexe des systèmes de Fermions crée une barrière difficile pour répondre à d’importantes questions, notamment concernant la supraconductivité d’onde d ou le magnétisme quantique. Récemment, il est devenu possible d’accéder expérimentalement au modèle de Fermi-Hubbard en utilisant un gaz quantique fermionique chargé sur un réseau optique. Dans cette approche atomique du modèle de Fermi-Hubbard, l’hamiltonien résulte directement du potentiel du réseau optique créé par les champs laser qui interfèrent et les collisions ultra-froides à courte portée. Cette approche fournit un itinéraire pour simuler la physique de l’hamiltonien et pour poser des questions ouvertes et des défis innovant sur le système à N corps sous-jacent. Dans ce chapitre, nous souhaitons apporter une vue d’ensemble sur les efforts actuels pour comprendre et réaliser des expériences sur des atomes fermioniques dans des réseaux optiques et discuter des expériences clés sur les régimes métalliques, ainsi que sur les
598
14. Physique des atomes froids et physique de la matière condensée
régimes isolants de bande, superfluides et isolants de Mott, avec des atomes dans un réseau optique. Le modèle de Fermi-Hubbard est un concept clé pour la Physique de la Matière Condensée et fournit, de façon cruciale, un aperçu des propriétés électroniques et magnétiques des matériaux. Pourtant, la nature complexe des systèmes de Fermions constitue un obstacle pour répondre à des questions importantes concernant, par exemple, la supraconductivité d’onde d et le magnétisme quantique. Récemment, il est devenu possible de fournir une réalisation expérimentale du Modèle de FermiHubbard en utilisant un gaz fermionique quantique chargé dans un réseau optique. Dans cette approche atomique de la statistique de Fermi-Hubbard, l’hamiltonien est une conséquence directe du potentiel du réseau optique créé en faisant interférer les champs laser et des collisions ultra froides à courte portée. Cette méthode fournit une nouvelle voie pour simuler la Physique de l’hamiltonien, pour répondre aux questions ouvertes et résoudre de nouveaux défis posés par le problème à N corps du systême sous-jacent. L’étude développée dans ce chapitre donne un aperçu des l’efforts actuels pour chercher à comprendre et à réaliser des expériences faites avec des atomes fermioniques dans des réseaux optiques et pour discuter des expériences clés dans les systèmes métalliques, les isolants de bande, les superfluides et les isolants de Mott. Les années récentes ont vu des progrès remarquables dans le contrôle et la manipulation des gaz quantiques. Ce développement pourrait bientôt influencer profondément notre compréhension actuelle de la Physique du Problème à N corps quantique. Les approches du problème à N corps des gaz quantiques sont fondamentalement différentes de la voie empruntée par d’autres systèmes de matière condensée, où les phénomènes observés expérimentalement stimulent la recherche d’une explication théorique nouvelle. Par exemple, l’observation de la supraconductivité a abouti à la théorie de Bardeen-Cooper-Schrieffer (BCS). Dans la recherche sur les gaz quantiques, le point de départ est un modèle à plusieurs corps qui peut être réalisé expérimentalement, tel qu’un gaz de Bose en interaction faible. L’étude du système conduit alors à l’observation d’un phénomène fondamental, comme la condensation de Bose-Einstein (BEC) [1, 2, 3]. On peut citer d’autres exemples, tels que le cross over entre un condensat moléculaire de Bose-Einstein et régime BCS [4–10], étudié dans un gaz de Fermi atomique en interaction forte et la transition superfluide-isolant de Mott observée dans un gaz de Bose soumis au potentiel d’un réseau optique [11, 12]. Le défi important pour le domaine de recherche sur les gaz quantiques est d’aboutir à des visions innovantes sur la Physique Quantique du problème à N corps. Par exemple, sera-t-il possible de répondre à des questions posées depuis longtemps sur un modèle sous-jacent ? Un système unique, dans cette quête de réponses, est le modèle de Fermi-Hubbard, modèle clé pour décrire les propriétés électroniques des solides. Ce modèle suppose qu’il existe une seule bande statique et des interactions locales entre les particules [13–15]. Pourtant, la question de savoir si l’état fondamental à deux dimensions, du modèle de Fermi-Hubbard peut rendre compte de la superfluidité ou de la supraconductivité d’onde d à jusqu’à présent défié les
599
Physique de la matière condensée
analyses théoriques, en dépit de 20 années d’efforts intensifs, mais qui se sont révélées comme très fructueuses pour la Physique de la Matière Condensée. De même, le modèle de Hubbard pour des spins frustrés ou le modèle de Hubbard sur les systèmes désordonnés posent toujours des problèmes difficiles. Ces difficultés trouvent leur origine dans le fait que se posent conjointement les problèmes de la localisation, de la cohérence et de l’ordre de spin [17]. Par conséquent, accroître les efforts de recherche dans le domaine des gaz quantiques ouvre également sur le problème de la recherche sur le gaz de Fermi à deux composantes, avec interactions répulsives, piégé dans le potentiel périodique d’un réseau optique tridimensionnel. Ce système fournit une réalisation expérimentale presque idéale du modèle de Fermi-Hubbard avec des paramètres presque totalement accordables. On s’attend à ce qu’une expérimentation puisse fournir une réalisation expérimentale presque idéale du diagramme de phases à basse température du modèle de Femi-Hubbard bidimensionnel, possédant des paramètres presque totalement accordables [18]. Une telle réalisation peut être considérée comme la simulation quantique d’un problème ouvert et très pertinent de la Physique du problème à N corps quantique. Le concept du modèle de Hubbard réalisé dans le cadre d’un gaz quantique dans un réseau optique a été, à l’origine, proposé dans une publication théorique [11]. Sa réalisation expérimentale pour les bosons [12], les fermions [19] et les mélanges de Fermions et de bosons [20, 21] a, à son tour, déclenché un intérêt théorique considérable pour ces systèmes. Des expériences ont maintenant donné accès à la Physique des systèmes fortement corrélés du modèle de Fermi-Hubbard [22–24]. Il semble donc approprié de donner un point de vue sur l’état actuel des efforts poursuivis sur ce sujet et de discuter des perspectives d’avenir. Un autre objectif de cette courte revue est de rendre accessibles les concepts et les considérations pertinents pour les expériences, aux lecteurs de la communauté de la Matière Condensée et aux chercheurs qui entrent dans cette thématique. Cette revue est centrée sur les gaz quantiques fermioniques dans des réseaux optiques et leurs liens avec le modèle de Fermi-Hubbard.
14.3 Gaz quantiques atomiques Il faut souligner que cette voie vers la dégénérescence quantique d’un gaz d’atomes, doit être considérée comme un sentier étroit qui évite la solidification, en conservant le nuage atomique à des densités inférieures à 1014 atomes par cm3 . À plus fortes densités, des collisions inélastiques à trois corps se produisent, et conduisent à la formation de molécules et à la libération de l’énergie de liaison. Pour aller dans cette voie, les expériences exploitent l’effet mécanique de la lumière laser, qui ralentit les atomes [33–35], suivi par un refroidissement par évaporation du nuage atomique dans un piège magnétique ou optique [32]. Ces efforts sont récompensés par un dispositif expérimental quantique à N corps du système qui peut être entièrement caractérisé à l’échelle microscopique et qui se trouve découplé de l’environnement.
600
14. Physique des atomes froids et physique de la matière condensée
Les premières recherches sur les condensats de Bose-Einstein dans un gaz en interaction faible d’atomes ont été rapidement accompagnés, avec succès, par la création de gaz de Fermi quantiques dégénérés [36–38]. En exploitant les résonances de Feshbach [39, 40] il a été possible d’accorder l’interaction entre les atomes de la collision et d’avoir accès au cross over entre un Condensat de Bose-Einstein moléculaire et un appariement BCS [29, 30]. Des gaz de Fermi quantiques dégénérés ont pu être préparés dans les espèces atomiques suivantes : 40 K [36], 6 Li [37, 38], 3 He [41] et 173 Yb [42].
14.4 Atomes dans les réseaux optiques Un outil très intéressant pour manipuler les gaz quantiques ultrafroids est le réseau optique [27], qui est créée par les ondes stationnaires laser. Dans le réseau optique, les atomes sont soumis à un potentiel périodique dû à l’interaction du moment dipolaire électrique induit des atomes avec la lumière laser [43]. Pour des fréquences laser en dessous de la fréquence de résonance atomique, les atomes sont attirés vers les régions de haute intensité laser. Ceci est souvent désigné par le terme « désaccord vers le rouge ». Dans ce cas, un « anti-noeud » de l’onde stationnaire agit comme un minimum de potentiel. Le concept d’un réseau optique a été initialement proposé dans le contexte de la spectroscopie laser [44, 45], et avec la découverte du refroidissement laser (46, 47), il est devenu accessible expérimentalement. La quantification du mouvement des atomes dans les potentiels de réseaux optiques a été étudiée [48–51], et l’arrangement périodique des atomes a été directement révélé par l’observation de la diffusion de la lumière laser, diffusée sous l’angle de Bragg de cet échantillon atomique très diluée [52, 53]. En chargeant des condensats de Bose-Einstein dans le potentiel périodique d’une onde stationnaire laser unique, une nouvelle direction a été explorée. Après des études initiales sur les propriétés de cohérence de la condensation de Bose-Einstein [56, 57], un large domaine de recherche a été effectuée dans cette configuration [28]. En outre, la recherche a été étendue aux gaz de Fermi quantiques dégénérés [58] et à des mélanges de gaz de Fermi-Bose [59]. La physique des systèmes fortement corrélés du modèle de Bose-Hubbard est devenue accessible dans un montage expérimental avec trois ondes laser stationnaires superposées, se superposant sur le condensat. La transition de phase quantique a été prédite théoriquement [11, 60]. Il s’agit d’une transition entre une phase spatialement cohérente superfluide et un état Isolant de Mott. Cette transition montre une disparition soudaine de la cohérence spatiale, lorsque le rapport entre l’énergie collisionnelle et l’énergie cinétique atteint une valeur critique [12]. La réversibilité de ce processus et le spectre d’excitation gappé de l’isolant de Mott ont été étudiés récemment. Une autre voie expérimentale a été de geler le mouvement atomique selon deux directions et d’étudier les gaz de bose unidimensionnel.
601
Physique de la matière condensée
De nombreux aspects fascinants de ces systèmes de Bose fortement corrélés ont été décrits dans la revue référencée ci-dessous [12, 25, 61–66]. Les aspects de ces systèmes de Bose fortement corrélés ont été examinés en référence [25]. Plus récemment, un modèle de Fermi-Hubbard a pu être réalisé en chargeant un gaz quantique dégénéré d’atomes fermioniques d’un résau optique tridimensionel [19]. Ce résultat à été directement connecté aux frontières de recherche sur les gaz quantiques et la Physique de la Matière Condensée.
14.5 Le modèle de Fermi-Hubbard dans un piège atomique Un réseau optique créé par trois ondes stationaires laser donne naissance à un potentiel périodique de la forme Vr e´ seau = V 0x cos2 kx +V 0y cos2 ky +V 0z cos2 kz où k = λ/2π est le vecteur d’onde du laser réseau. La constante du réseau d est relié à la longueur d’onde du laser λ par d = λ/2. Un réseau symétrique correspond à V0 = V0 (x, y, z ).La profondeur du réseau est proportionnelle à l’intensité du laser et inversement proportionnelle au désaccord entre la fréquence du laser et la fréquence de la transition atomique 43 . Les valeurs de V0 (x, y, z ) sont habituellement supposées constantes, ce qui est justifié pour une région située dans le centre du piège et qui est faible comparée à la taille du réseau. Les termes d’interférence entre les trois ondes stationnaires peuvent être évités en choisissant convenablement les polarisations et les désaccords de fréquence des ondes stationnaires. La profondeur de réseau V0 est 2 souvent exprimée en termes d’énergie de recul Er = h¯ k /2m, qui est l’énergie cinétique d’un atome de masse m et hk ¯ est le moment d’un seul photon. Pour des potentiels de réseau suffisament forts, les opérateurs champ atomiques peuvent être developpés en termes de fonctions de Wannier, et le mouvement atomique est déterminé par l’effet tunnel entre sites adjacents. Dans la plus basse bande, l’effet tunnel direct de premiers voisins à voisins suivants est typiquement abaissé d’un ordre de grandeur, comparé à l’effet tunnel entre voisins... Dans la plupart des expériences, le gaz de Fermi est préparé dans un mélange des deux états de spin, ce qui correspond à différents sous-niveaux du fondamental atomique. La collision entre deux atomes de différents états de spin donne lieu à des interactions à courte portée. Dans le cas où tous les atomes sont préparés dans la bande la plus basse, ce concept conduit à l’hamiltonien de Hubbard. Pour un gaz d’atomes fermioniques à deux composantes, le modèle de Hubbard [11] dans un réseau optique peut s’écrire : † cj,σ + h.c. + U ni,↑ ni,↓ + εi ni ci,σ H = −t ,σ
602
i
i
14. Physique des atomes froids et physique de la matière condensée
Le premier terme contient l’énergie cinétique et est proportionnel à l’élément de matrice d’effet tunnel t entre sites adjacents du réseau, et < i, j > dénote une paire † et cj,σ sont les opérateurs de création et d’annid’atomes voisins. Les opérateurs ci,σ hilation d’une particule de spin σ aux sites i et j . Le nombre d’occupation du site i est donné par ni,↑ . Le second terme décrit l’énergie d’interaction dans le système et est déterminé par l’interaction intra-atomique U. Le dernier terme rend compte du confinement additionnel Vtrap qui est en général harmonique. Le décalage d’énergie du réseau sur le site i est donné par εi . Expérimentalement, le couplage tunnel est contrôlé par l’intensité de l’onde stationnaire du laser. Ceci permet de faire varier la dimensionalité du système et rend possible d’accorder l’énergie cinétique. Une dimensionalité réduite est obtenue en gelant le mouvement atomique dans certaines directions. Par exemple, faire agir deux ondes stationnaires à de très fortes intensités suprime l’effet tunnel dans deux directions et crée un ensemble de tubes unidimensionnels. La profondeur d’énergie de la plus basse bande est donnée par W = 4tD, où D est la dimensionalité du système [67]. L’interaction intra-atomique U peut être approchée par U = g d 3 r ∇ |w(r)|4 , où w(r) est la fonction de Wannier d’un atome sur un seul site du réseau. À cause de l’énergie cinétique des atomes, deux atomes de différents spins interagissent habituellement par l’intermédiaire d’une onde s libre, et la constante de couplage est donnée par g = 4πa/m, où la longueur de diffusion d’onde s libre est a et la masse atomique m. La longueur de diffusion a, et avec elle l’interaction intra-atomique U, peuvent être adaptées à des valeurs négatives ou positives en exploitant les résonances de Feshbach... Un champ magnétique extérieur est présent dans la plupart des expériences. Son effet est de créer un grand gap d’énergie entre les états de différentes directions de spin. Dans ce cas, le nombre d’atomes dans chaque spin est une quantité conservée. Un gaz de Fermi à une seule composante est effectivement sans interaction parce que le principe de Pauli ne permet pas de collision d’onde s. Le confinement harmonique fournit un potentiel de piégeage pour les atomes. Il s’agit d’un aspect central pour les systèmes expérimentaux. Il est produit soit par les rayons du réseau optique, soit par un piège additionnel optique ou magnétique. Une conséquence importante du confinement est que différentes phases à N corps peuvent coexister à l’intérieur du piège. Dans une approximation de densité locale, le potentiel chimique local μlocal (r) = μ−Vtrap (r) décroît avec une distance croissante du centre du piège. μ est le potentiel chimique global. Pour des fermions sans interaction, la situation peut être analysée en termes d’états propres d’énergie à une seule particule. Les états propres de basse énergie, qui s’étendent loin du centre du piège, et les états propres de haute énergie, qui sont localisés dans les régions externes du piège, peuvent être identifiés. Une mesure très adéquate pour un piège harmonique avec une fréquence de piégeage de moyenne géo 3/2 métrique ω est le nombre caractéristique N0 = W /mω2 d 2 [68, 69, 70, 71, 72]. Ce nombre relie la largeur de bande au potentiel de piégeage et définit le nombre d’atomes piégés par état de spin, qui correspond au demi remplissage dans le centre du piège à température nulle. Le remplissage caractéristique correspondant ρ = N /N0
603
Physique de la matière condensée
peut être contrôlé dans l’expérience en changeant le nombre total d’atomes N, les fréquences de piégeage ou la largeur de bande.
14.6 Physique à N corps avec des interaction attractives ou répulsives La physique à N corps du modèle de Fermi-Hubbard est gouvernée par l’effet concerté des interactions, de la délocalisation et de l’ordre de spin, et couvre un champ très large de phénomènes. Dans ce qui suit, nous allons discuter principalement les aspects les plus pertinents et les plus innovants pour les expériences futures. Dans les expériences sur des réseaux optiques, il est possible de rendre petites toutes les échelles d’énergie pertinentes comparées au gap d’énergie entre la bande de Bloch la plus basse et la bande suivante. La Physique est alors déterminée par les échelles d’énergie de la largeur de bande et de l’interaction U. L’échelle d’énergie suivante est l’énergie de super-échange t 2 /U , qui décrit des processus d’effet tunnel virtuels. Les plus petites températures expérimentalement réalisables dans les réseaux optiques sont, actuellement encore trop hautes pour qu’il soit possible d’accéder à l’énergie de séparation entre sites adjacents. À cause du potentiel de piégeage, il existe une autre échelle d’énergie qui est l’énergie de séparation entre sites adjacents du réseau. Le modèle de Hubbard avec interaction attractive U , où l’interaction intra-atomique entre particules de direction de spins différentes est négative a été intensément étudié, à cause du contexte de la supraconductivité [73]. Dans le cas homogène, c’est-à-dire sans potentiel de piégeage, la situation générale est la suivante : à basse température, la superfluidité d’onde s avec un crossover entre une condensation de Bose Einstein et une supraconductivité BCS est prédite. Le régime BCS est caractérisé par des interactions attractives faibles entre particules (U t ). La température critique croît en fonction de |U | /t. Dans le régime du condensat de Bose-Einstein, les interactions fortes conduisent à des paires liées qui peuvent subir une condensation de Bose-Einstein, avec une température critique décroissant comme t 2 / |U |. Les paires peuvent être considérées comme des bosons de coeur dur, et l’effet tunnel des paires est dominé par l’effet tunnel de second ordre t 2 /U. Les interactions entre premiers voisins entre paires sont répulsives et sont également proportionnelles à t 2 /U. Dans le cas du demi-remplissage, une onde de densité de charge est formée, avec une densité réduite sur chaque site du réseau second voisin. Ceci conduit à un schéma de type « échiquier » de la distribution de densité (75-77). Au dessus de la température critique de superfluidité, un régime de paires préformées, de type pseudogap, est prédit. Le potentiel de piégeage a d’importantes conséquences sur la formation d’onde de densité de charge. Le confinement contrarie la répulsion de premiers voisins entre des paires liées attractives et favorise la formation d’un isolant de bande dans le centre du piège. Pour obtenir une région superfluide d’une certaine taille à l’intérieur du piège,
604
14. Physique des atomes froids et physique de la matière condensée
un potentiel de confinement d’amplitude très faible et un petit nombre d’atomes sont requis, le potentiel chimique global ne devant pas excéder t 2 /U [77]. Un point de départ intuitif pour la Physique du modèle de Hubbard avec interaction répulsive est la situation du cas attractif à travers une transformation particule-trou [17, 76, 77]. À plus haute températue quand il n’y a pas d’ordre pour les degrés de liberté de spin, le système montre un cross over d’un liquide de Fermi métallique vers une phase isolant de Mott. Dans la phase métallique, les atomes se délocalisent pour minimiser leur énergie cinétique. Dans la phase isolant de Mott (U t ), les interactions répulsives entre atomes de spins différents dominent et les atomes sont localisés. L’occupation d’un site du réseau par deux atomes est supprimée, à cause de l’interaction répulsive ou du principe de Pauli. La phase isolant de Mott se comporte comme un isolant de bande et est incompressible. Cependant, la phase isolant de Mott peut porter une forte entropie de spin. La phase basse température du modèle de Hubbard répulsif est caractérisée par un ordre de spin. À la température de Néel, un système infini subit une transition de phase du second ordre vers un état ordonné antiferromagnétique. Pour des interactions répulsives faibles, une onde de densité de spin est formée et la température de Néel est exponentiellement faible en fonction de U /t [78, 79]. Pour des interactions répulsives croissantes, le système montre un cross over vers un isolant de Mott antiferromagnétique. Dans le régime isolant de Mott, la température de Néel est proportionnelle à l’énergie de superéchange, qui est l’échelle d’énergie dominante dans la limite de couplage fort où U /t 1. Ceci peut être représenté en considérant deux sites adjacents occupés une seule fois par des spins de directions opposées. Un effet tunnel virtuel entre les sites leur permet d’abaisser leur énergie, comparé à la situation où les deux atomes ont le même spin... Cette interaction antiferromagnétique de superéchange est donnée par Jex = 4t 2 /U et favorise l’ordre antiferromagnétique. La physique d’atomes localisé peut être décrite par un hamiltonien de spin d’Heisenberg H = Jex Si Sj où Si est l’opérateur de spin 1/2 [79, 80]. L’ordre antiferromagné
tique est attendu quand le système n’est pas frustré magnétiquement, ce qui est le cas dans les situations expérimentales d’un réseau cubique simple ou plus généralement si le réseau est « alterné ». Cependant, il est possible expérimentalement de créer des réseaux optiques de géométrie triangulaire, qui frusterait l’ordre magnétique. Dans ce cas, à basse température, une transition du premier ordre entre un métal et un isolant de Mott est attendue [81]. Pour une discussion qualitative des phases locales à l’intérieur du piège, nous considérerons le cas de fortes interactions répulsives où U T et U W , sans discuter le rôle des interactions de super-échange. Pour un faible nombre d’atomes et un remplissage du centre de moins d’un atome par site, la totalité de l’échantillon est dans une phase métallique. Un accroissement du nombre d’atomes jusqu’à un niveau où le potentiel chimique excède la largeur de bande conduira à la formation d’une phase isolant de Mott dans le centre du piège. Un accroissement encore plus fort du nombre d’atomes conduirait à une extension spatiale de la région isolant de Mott, jusqu’à ce que le potentiel chimique dépasse l’énergie répulsive U. À ce
605
Physique de la matière condensée
point, une phase métallique avec un remplissage supérieur à un atome par site se forme au centre du piège. Pour un nombre d’atomes encore plus fort, il se forme une bande isolante dans le centre du piège. À cause du confinement harmonique, il n’est généralement pas utile de caractériser le système par ses propriétés globales. On recherchera des sondes de propriétés locales. Le spectre d’excitation du modèle de Hubbard à interaction répulsive change de caractère, avec un cross over d’un métal vers un isolant. Pour des interactions répulsives faibles (U < t ), le système peut être traité comme un liquide de Fermi et les excitations sont très semblables à des quasiparticules. Au voisinage de l’isolant de Mott, un gap se développe dans le spectre d’énergie, et le système peut être décrit en termes de deux bandes de Hubbard. Ces deux bandes de Hubbard, basse et haute, sont séparées en énergie par l’interaction U et élargies par le terme de hopping. Ces excitations de haute énergie correspondent à la création de sites de réseau doublement occupés (doublons) [82]. Dans le cas idéal d’isolant de Mott magnétiquement frustré à température nulle, on s’attend à ce que le poids spectral de la quasiparticule de basse énergie s’annule à la transition vers l’isolant de Mott et soit déplacé vers les excitations de hautes énergies. Les excitations de haute énergie [17] sont expérimentalement accessibles.
14.7 Limitations de la description de Fermi-Hubbard Il y a différents aspects importants de la Physique des atomes fernioniques dans un réseau optique qui ne sont pas directement pris en compte par le modèle de FermiHubbard, mais qui doivent cependant être considérés. Le modèle de Hubbard à une seule bande ne prend pas en compte correctement la Physique à deux particules quand la longueur de diffusion approche la taille des fonctions de Wannier. Dans ce cas, de plus hautes bandes doivent alors être considérées et le potentiel de diffusion doit être convenablement régularisé. Pour un réseau optique suffisamment profond, les sites individuels du réseau peuvent être approchés par un oscillateur harmonique, pour lequel le problème à deux particules avec un potentiel de contact régularisé peut être résolu analytiquement [83]. Alors que le couplage par effet tunnel détermine la plus courte échelle de temps dans le système, l’échelle de temps maximale pour une expérience est habituellement donnée, pour une expérience, par les pertes atomiques, subies dans les collisions inélastiques entre atomes, et les collisions avec les gaz d’atomes du fond, ou la diffusion inélastique de photons des rayons du réseau. Ces processus ne sont pas décrits par l’hamiltonien de Hubbard, et il dépendent du choix spécifique du réseau optique, des conditions du vide et des espèces d’atomes. Le temps de vie d’un atome dans un réseau optique est typiquement de l’ordre de 100 ms à 5 s. Une conséquence importante du fait que les atomes piégés soient isolés de leur environnement est qu’il est plus utile de réfléchir en termes d’entropie par particule plutôt que de température. Comme il ny a pas actuellement de méthodes agissant sur
606
14. Physique des atomes froids et physique de la matière condensée
les atomes à l’intérieur d’un réseau optique, l’entropie finale du système est fournie par par l’entropie de l’ensemble avant le chargement dans le potentiel du réseau optique. En supposant un chargement adiabatique, l’entropie totale reste la même, mais elle doit être répartie entre les différentes régions du piège. Cependant, actuellement, il n’est pas évident de déterminer à quel degré un état de basse entropie doit être transféré dans le réseau optique.
Réalisations expérimentales Des expériences avec des atomes fermioniques dans des réseaux ont été 40 optiques menées à bien avec les isotopes fermioniques du potassium K et du lithium 6 Li , ainsi que l’ytterbium fermionique 173 Y . Le modèle de Hubbard a été réalisé pour 40 K. Les expériences sur le Lithium ont été réalisées dans un régime superfluide, avec ces interactions fortement attractives, en dehors de la description à une seule bande [84], mais les expériences dans le régime de Hubbard sont actuellement en cours. Ci-dessous, nous discuterons brièvement les propriétés spécifiques de 40 K et de 6 Li par rapport aux résonances de Feshbach, et aux procédures pertinentes pour produire et observer des gaz quantiques fermioniques dans des réseaux optiques.
14.8 Résonances de Feshbach Les résonances de Feshbach, qui permettent l’ajustement de la longueur de diffusion dans le canal d’onde s, sont expérimentalement accessibles, à la fois pour 40 K et pour 6 Li. La résonance de Feshbach est le résultat du couplage entre deux potentiels interatomiques différents ou canaux. Un comportement résonant se produit quand un état lié d’un canal fermé est accordé à l’énergie de deux atomes en collision dans le canal ouvert. Le contrôle de ces niveaux d’énergie par un champ magnétique extérieur est possible si les moments magnétiques entre les deux canaux diffèrent. Le résultat est un comportement résonant de la longueur de diffusion a en fonction du champ magnétique B. En partant de la valeur du fond abg , la longueur de diffusion a B de diffusion diverge à la position de résonance B0 . La longueur près d’une résonance de Feshbach varie selon la loi a B = abg 1 − / B − B0 , où la divergence est caractérisée par sa largeur . Dans le cas des Résonances de Feshbach dites étroites, la fraction de l’état dans le canal fermé de l’état moléculaire profondément lié est négligeable et une description à un seul canal est suffisante pour décrire la physique collisionnelle. En balayant de façon adiabatique le champ magnétique à travers la résonance, des molécules de Feshbach faiblement liées de caractère bosonique peuvent être formées, en partant de la branche attractive. Le régime de cross over BEC-BCS peut être étudié près de la résonance de Feshbach [29]. Le cross over BEC-BC dans le régime de Hubbard
607
Physique de la matière condensée
d’un réseau optique est centré sur la valeur de la longueur de diffusion attractive libre où des paires liées se forment dans le potentiel du réseau. Plusieurs résonances de Feshbach sont connues pour 40 K (85-87). Les résonances de Feshbach les plus pertinentes expérimentalement sont les résonances larges se produisant entre les sous-niveaux magnétiques Zeeman | F = 9/2, mF = −9/2 et | F = 9/2, mF = −7/2, située à 202,1 Gauss, et entre les sous-niveaux magnétiques Zeeman | F = 9/2, mF = −9/2 et | F = 9/2, mF = −5/2, située à 224,2 Gauss [87]. Ici, F est le moment angulaire total et mF est le nombre quantique magnétique. La longueur de diffusion du fond est positive et a une valeur de 174 a0 (où a0 est le rayon de Bohr). Les largeurs correspondantes des résonances sont de plusieurs Gauss. Les principales limitations pour les expériences avec 40 K sont les pertes inélastiques rencontrées au voisinage des deux résonances de Feshbach. Pour un gaz de potassium avec une interaction attractive, dans le mélange | F = 9/2, mF = −9/2 et | F = 9/2, mF = −7/2, ceci limite la durée de vie de la phase superfluide dans le cross over BEC-BCS dans un piège harmonique à environ 30 ms, même si la durée de vie de la paire est renforcée par le blocage de Pauli. La température la plus basse reportée dans un piège harmonique pour un gaz avec interaction attractive de 40 K est T /TF = 0,05 [30].
14.9 Perspectives Les atomes froids fournissent un outil très innovant pour étudier la Physique des Systèmes Fortement Corrélés dans le cas des corrélations fortes dans une gamme largement ajustable d’interactions et pour des systèmes d’une propreté jamais atteinte. Des modèles de base en Physique des systèmes à N corps, tels que le modèle de Hubbard avec interaction intra-atomique et les pseudopotentiels de Haldane pour la Physique, plus bas niveau de Landau ont été introduits à l’origine dans un contexte de Physique de la Matière Condensée, comme des descriptions idéalisées d’effets de corrélations fortes pour décrire des matériaux réels. Ils peuvent désormais être appliqués à un niveau quantitatif. Dans ce qui suit, nous proposons une esquisse de directions futures possibles.
Le magnétisme quantique Les défis majeurs rencontrés dans la Physique des atomes ultrafroids dans des réseaux optiques se trouvent dans la réalisation et l’étude de configurations qui peuvent servir à la réalisation de systèmes modèles pour des problèmes de base en Magnétisme Quantique. Pour des mélanges à deux composantes d’atomes fermioniques, dans un réseau optique, repèrés par une variable de pseudospin |↑>, |↓> et avec des interactions dominantes entre elles U J , la théorie des perturbations au second ordre appliquée au terme d’énergie cinétique, nous permet de faire correspondre
608
14. Physique des atomes froids et physique de la matière condensée
l’hamiltonien de Hubbard avec un modèle d’Heisenberg anisotrope avec des interactions effectives spin-spin entre atomes sur des sites de réseau premiers voisins z z z y y
Jex SR SR + Jex⊥ SRx SRx + SR SR
R,R
En « ajustant » les termes d’échange Jexz = 2 J↑2 + J↓2 /U↑↑ − 4J↓2 /U↓↓ et Jex⊥ = 4J↑ J↓ /U↑↓ ,par l’intermédiaire d’amplitudes d’effet Tunnel dépendant du spin ou d’interactions dépendant du spin, il est possible de passer d’une phase quantique à une autre. La possibilité la plus naturelle consiste à introduire un hamiltonien de spin de type Heisenberg isotrope, avec des amplitudes d’effet tunnel égales et des interactions intra-atomiques. Ceci fournit un hamiltonien de spin isotrope de type Heisenberg SR SR H = Jex R,R
Ici, le couplage de superéchange Jex = 4J 2 /U↑↓ a un signe positif, donc favorise antiferromagnétiquement les phases ordonnées. L’observation de tels états magnétiquement ordonnés requiert d’atteindre expérimentalement de très basses température kB T < 4J 2 /U (pour J /U 1). Werner et al. [2005] ont montré que de telles températures pouvaient être atteintes en utilisant un procédé de refroidissement de type Pomeranchuk durant le chargement des atomes dans le réseau. Du point de vue de la Physique de la Matière Condensée, un des défis le plus difficiles réside dans la réalisation et dans l’étude du modèle de Hubbard fermionique avec interaction répulsive dans un réseau optique avec des interactions et une fraction de remplissage « ajustables ». Ainsi qu’Hofstetter (2002) l’a discuté, un tel système constituerait une version « atomes froids » de l’un des modèles les plus intensément étudiés en Physique de la Matière Condensée. Il permettrait d’accéder aux phases supraconductrices conventionnelle, mais aussi non conventionnelle, de symétrie d’onde d, comme trouvée dans les supraconducteurs de haute température. Evidemment, la réalisation de ces modèles pour des atomes froids ne résoudrait pas pour autant ce dernier problème. Cependant, ce serait un outil extrêmement appréciable de pouvoir tester certaines issues ouvertes dans ce domaine. Dans ce contexte, des propositions spécifiques ont été avancées pour réaliser des états de type « Resonating Valence Bonds » en transformant de façon adiabatique des états de spin dans des super-réseaux optiques. Des états de liquides de spin plus complexes peuvent être créés en forçant la frustration dans des phases ordonnées antiferromagnétiques, dans des réseaux triangulaires ou de type Kagomé. Les problèmes d’impuretés quantiques, qui ont joué un rôle important dans l’étude du magnétisme, peuvent être réalisés dans le contexte des Atomes Froids en confinant des atomes dans un piège optique « fortement ajusté » ou dans un réseau optique « profond ». Pour des bosons ou des fermions de coeur dur, la variable de pseudospin effective associée à un nombre d’occupation local n = 1, 0 peut être couplée à un
609
Physique de la matière condensée
réservoir, soit de Condensat de Bose-Einstein, soit de gaz de Fermi dégénéré, en utilisant des transitions Raman.
Désordre Anderson (1958) a introduit le concept de localisation par le désordre. Il a montré que des ondes dans un milieu présentant un désordre statique (« trempé ») peut devenir localisé par construction d’interférences constructives entre ondes multiplement réfléchies. Qualitativement, cet effet se produit au dessous d’un « bord de mobilité ». Les états électroniques deviennent localisés quand le libre parcours moyen, dans un traitement d’approximation de Born de la diffusion par le potentiel désordre, devient plus petit que la longueur d’onde λ. C’est ce qu’on appelle le critère de Ioffe-Regel. Ce critère s’applique à trois dimensions, dans une situation où existe un désordre de courte portée, en l’absence d’interaction. En présence d’interactions, dans le cas où la localisation peut être produite à la fois par le désordre (localisation d’Anderson) et par les interactions (localisation de Mott), le problème n’est pas si bien compris. À une dimension, et à deux dimensions, un désordre arbitrairement faible conduit à une localisation, même si λ l . Toutes les ondes deviennent localisées. Les Atomes Froids fournissent un nouvel outil pout traiter le problème de la localisation, en particulier dans le cas d’interactions « accordables », sur une large portée. Pour des bosons sans interaction, l’état fondamental en présence de désordre est obtenu en plaçant toutes les particules dans le niveau d’énergie à une particule le plus bas en présence du potentiel aléatoire. En ajoutant de faibles interactions répulsives, un nombre fini d’états localisés dans ce qu’on appelle les « queues de Lifschitz » du spectre à une particule seront occupés. Tant que le potentiel chimique est dans ce domaine de basse énergie, ces états ont un recouvrement spatial négligeable. À très basse densité, les bosons répulsifs donnent naissance à un « verre de Lifschitz » de condensats fragmentés et locaux. Quand la densité augmente, ces condensats locaux deviendront couplés par un effet tunnel Josephson et finiront par former un superfluide, où la cohérence s’établit sur tout l’échantillon. L’analyse quantitative de cette transition a été donnée en premier par Giamarchi et Schultz (1988) dans le cas particulier unidimensionnel. Ils ont décrit un liquide de Luttinger par une analyse hydrodynamique quantique. Ils ont montré qu’une interaction faible tend à supprimer l’effet de la localisation d’Anderson. Cet effet apparait également pour un remplissage commensurable dans le réseau optique. Un désordre faible ne détruit pas la superfluidité, à condition que l’exposant de Luttinger reste plus grand que 3/2. Dans le modèle de Lieb-Liniger avec une constante de couplage effective γ définie par 2a 2 g1 n1 ≈ = γ = 2 2 |a | n n1 2⊥ h¯ n1 /M 1 1 ceci exige que γ 8. Dans le régime qui correspond à la limite opposée K < 3/2, c’est-à-dire dans le cas de faible densité ou de fortes interactions, près de la limite de Tonks-Girardeau, même un désordre faible détruit la superfluidité.
610
14. Physique des atomes froids et physique de la matière condensée
L’état fondamental alors perd la cohérence de phase à longue portée. Des résultats exacts pour la distribution de moment et la densité d’états locale ont été obtenus par De Martino et al. (2005) dans la limite spéciale du gaz de Tonks-Girardeau, où le problème est équivalent à des fermions sans interaction.
Remerciements Ce dernier chapitre n’a évidemment pu être rédigé que grâce à l’aide des nombreuses revues récentes et de grande qualité sur la Physique des Atomes Froids. Toutes ce révues ont été largement citées dans les références bibliographiques données à la fin de ce chapitre, et tout particulièrement les suivantes : – I. Bloch, J. Dalibard et W Zwenger, Rev. Mod. Phys. 80, 885 (2008) – W. Ketterle, D.S. Durfee, D.M. Stamper-Kurn, Making, probing and understanding Bose-Einstein condensates, in Proc. Int. School of Phys. “Enrico Fermi” Course CXL, ed. Minguscio, S. Stringari, C. Wieman, pp. 67–176 (IOS Press, Amsterdam, 1999) – C. Cohen-Tannoudji, Rev. Mod. Phys. 70, 707 (1998) – S. Giorgini, L.P. Pitaevskii, S. Stringari, Rev. Mod. Phys. 80, 1215 (2008) – W. Ketterle, M.W. Zwierlein, Making, probing and understanding ultracold Fermi gases, in Proc. Int. School Phys. “Enrico Fermi” Course CLXIV, ed. M. Inguscio, W. Ketterle, C. Salomon, pp. 95–287 (IOS Press, Amsterdam, 2008) – T. Esslinger, Annu. Rev. Condens. Matter Phys. (2010) L’auteur du manuscrit adresse un remerciement particulièrement enthousiaste et respectueux à tous.
Bibliographie 1. M.H. Anderson,J.R. Ensher, M.R. Matthews, C.E. Wieman, E.A. Cornell, Science 269, 198 (1995) 2. K.B. Davis, M.O. Mewes, M.R. Andrews, N.J. van Druten, D.S. Durfee et al. Phys. Rev. Lett. 75, 3969 (1995) 3. F. Dalfovo, S. Giorgini, L.P. Pitaevskii, S. Stringari, Rev. Mod. Phys. 71, 463 (1999) 4. M. Greiner, C. Regal, D. Jin, Nature 426, 537 (2003) 5. S. Jochim, M. Bartenstein, A. Altmeyer, G. Hendl, C. Chin et al., Science 302, 2101 (2003) 6. C.A. Regal, M. Greiner, D. Jin, Phys. Rev. Lett. 92, 040403 (2004) 7. M.W. Zwierlein, C.A. Stan, C.H. Schunck, S.M.F. Raupach, A.J. Kerman, W. Ketterle, Phys. Rev. Lett. 92, 120403 (2004) 8. J. Kinast, S.L. Hemmer, M.E. Gehm, A. Turlapov, J.E. Thomas, Phys. Rev. Lett. 92, 150402 (2004) 9. T. Bourdel, L. Khaykovich, J. Cubizolles, J. Zhang, F. Chevy et al. Phys. Rev. Lett. 93, 050401 (2004)
611
Physique de la matière condensée
10. G.B. Partridge, K.E. Strecker, R.I. Kamar, M.W. Jack, R.G. Hulet, Phys. Rev. Lett. 95, 020404 (2005) 11. D. Jaksch, C. Bruder, J.I. Cirac, C.W. Gardiner, P. Zoller, Phys. Rev. Lett. 81, 3108 (1998) 12. M. Greiner, O. Mandel, T. Esslinger, T.W. Hansch, I. Bloch, Nature 415, 39 (2002) 13. F. Gebhard, The Mott Metal-Insulator Transition (Springer Verlag, Berlin, 1977) 14. J. Hubbard, Proc. R. Soc. London A 276, 238 (1963) 15. J. Hubbard, Proc. R. Soc. London A 277, 237 (1964) 16. P.W. Anderson, Science 235, 1196 (1987) 17. A. Georges, G. Kotliar, W. Krauth, M.J. Rozenberg, Rev. Mod. Phys. 68, 13 (1996) 18. W. Hofstetter, J.I. Cirac, P. Zoller, E. Demler, M.D. Lukin, Phys. Rev. Lett. 89, 220407 (2002) 19. M. Kohl, H. Moritz, T. Stoerle, K. Gunter, T. Esslinger, Phys. Rev. Lett. 94, 080403 (2005) 20. K. Gunter, T. Stoferle, H. Moritz, M. Kohl, T. Esslinger, Phys. Rev. Lett. 96, 180402 (2006) 21. S. Ospelkaus, C. Ospelkaus, O. Wille, M. Succo, P. Ernst et al., Phys. Rev. Lett. 96, 180403 (2006) 22. N. Strohmaier, Y. Takasu, K. Gunter, R. Jordens, M. Kohl et al., Phys. Rev. Lett. 99, 220601 (2007) 23. R. Jordens, N. Strohmaier, K. Gunter, H. Moritz, T. Esslinger, Nature 455, 204 (2008) 24. U. Schneider, L. Hackermuller, S. Will, T. Best, I. Bloch et al., Science 322, 1520 (2008) 25. I. Bloch, J. Dalibard, W. Zwerger, Rev. Mod. Phys. 80, 885 (2008) 26. M. Lewenstein, S. Sanpera, V. Ahufinger, B. Damski, Sen.U. De AS, Adv. Phys. 56, 243 (2007) 27. D. Jaksch, P. Zoller, Ann. Phys. 315, 52 (2005) 28. O. Morsch, M. Oberthaler, Rev. Mod. Phys. 78, 179 (2006) 29. S. Giorgini, L.P. Pitaevskii, S. Stringari, Rev. Mod. Phys. 80, 1215 (2008) 30. W. Ketterle, M.W. Zwierlein, Making, probing and understanding ultracold Fermi gases, In Proc. Int. School Phys. “Enrico Fermi” Course CLXIV, ed. M. Inguscio, W. Ketterle, C. Salomon, pp. 95 (IOS Press, Amsterdam, 2008) 31. A.J. Leggett, Rev. Mod. Phys. 73, 307 (2001) 32. W. Ketterle, D.S. Durfee, D.M. Stamper-Kurn, Making, probing and understanding Bose-Einstein condensates in Proc. Int. School of Phys. “Enrico Fermi” Course CXL, ed. Minguscio, S. Stringari, C. Wieman, p. 67 (IOS Press, Amsterdam, 1999) 33. W.D. Phillips, Rev. Mod. Phys. 70, 721 (1998) 34. C. Cohen-Tannoudji, Rev. Mod. Phys. 70, 707 (1998) 35. S. Chu, Rev. Mod. Phys. 70, 685 (1998) 36. B. DeMarco, D.S. Jin DS, Science 285, 1703 (1999) 37. A.G. Truscott, K.E. Strecker, W.I. McAlexander, G.B. Partridge, R.G. Hulet, Science 291, 2570 (2008) 38. F. Schreck, L. Khaykovich, K.L. Corwin, G. Ferrari, T. Bourdel et al., Phys. Rev. Lett. 87, 080403 (2001)
612
14. Physique des atomes froids et physique de la matière condensée
39. E. Tiesinga, B.J. Verhaar, H.T.C. Stoof HTC, Phys. Rev. A 47, 4114 (1993) 40. C. Chin, R. Grimm, P. Julienne, E. Tiesinga, Rev. Mod. Phys. 82, 1225 (2010) 41. J.M. McNamara, T. Jeltes, A.S. Tychkov, W. Hogervorst, W. Vassen, Phys. Rev. Lett. 97, 080404 (2006) 42. T. Fukuhara, S. Sugawa, Y. Takasu, Y. Takahashi, Phys. Rev. A 79, 021601(2009) 43. R. Grimm, M. Weidemuller, Y.B. Ovchinnikov, Adv. At. Mol. Opt. Phys. 42, 95 (2000) 44. V.S. Letokhov, JETP Lett. 7, 272 (1968) 45. V.S. Letokhov, V.G. Minogin, Phys. Lett. A 61, 370 (1977) 46. T.W. Hansch, A.L. Schawlow, Opt. Commun. 13, 68 (1975) 47. J. Dalibard, C. Cohen-Tannoudji, J. Opt. Soc. Am. B 6, 2023 (1989) 48. P. Verkerk, B. Lounis, C. Salomon, C. Cohen-Tannoudji, J.Y. Courtois, G. Grynberg, Phys. Rev. Lett. 68, 3861 (1992) 49. P.S. Jessen, C. Gerz, P. Lett, W. Phillips, S. Rolston et al. Phys. Rev. Lett. 69, 49 (1992) 50. G. Grynberg, B. Lounis, P. Verkerk, J. Courtois, C. Salomon, Phys. Rev. Lett. 70, 2249 (1993) 51. A. Hemmerich, T.W. Hansch, Phys. Rev. Lett. 70, 410 (1993) 52. G. Birkl, M. Gatzke, I.H. Deutsch, S.L. Rolston, W.D. Phillips, Phys. Rev. Lett. 75, 2823 (1995) 53. M. Weidemuller, A. Hemmerich, A. Gorlitz, T. Esslinger, T Hansch, Phys. Rev. Lett. 75, 4583 (1995) 54. M. Ben Dahan, E. Peik, J. Reichel, Y. Castin, C. Salomon, Phys. Rev. Lett. 76, 4508 (1996) 55. S.R. Wilkinson, C.F. Bharucha, K.W. Madison, N. Qian, M.G. Raizen, Phys. Rev. Lett.76, 4512 (1996) 56. B.P. Anderson, M.A. Kasevich, Science 282, 1686 (1998) 57. C. Orzel, A.K. Tuchmann, M.L. Fenselau, M. Yasuda, M.A. Kasevich, Science 291, 2386 (2001) 58. G. Modugno, F. Ferlaino, R. Heidemann, G. Roati, M. Inguscio, Phys. Rev. A 68, 011601R (2003) 59. H. Ott, E. de Mirandes, F. Ferlaino, G. Roati, G. Modugno, M. Inguscio, Phys. Rev. Lett. 92, 160601 (2004) 60. M.P.A. Fisher, P.B. Weichman,G. Grinstein, D.S. Fisher, Phys. Rev. B 40, 546 (1989) 61. M. Greiner, M. Mandel, T.W. Hansch, I. Bloch, Nature 419, 51 (2002) 62. T. Stoferle, H. Moritz, C. Schori, M. Kohl, T. Esslinger, Phys. Rev. Lett. 92, 130403 (2004) 63. M. Greiner, I. Bloch, O. Mandel, T.W. Hansch, T. Esslinger, Phys. Rev. Lett. 87, 160405 (2001) 64. H. Moritz, T. Stoferle, M. Kohl, T. Esslinger, Phys. Rev. Lett. 91, 250402 (2003) 65. B. Paredes, A. Widera, V. Murg, O. Mandel, S. Folling et al. Nature 429, 277 (2004) 66. T. Kinoshita, T. Wenger, D.S. Weiss, Science 305, 1125 (2004) 67. W. Zwerger, J. Opt. B Quantum Semiclassical Opt. 5, S 9 (2003). 68. L. Viverit, C. Menotti, T. Calarco, A. Smerzi, Phys. Rev. Lett. 93, 110401 (2004)
613
Physique de la matière condensée
69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79.
80. 81. 82. 83. 84. 85. 86. 87. 88. 89.
614
C. Hooley, J. Quintanilla, Phys. Rev. Lett. 93, 080404 (2004) M. Rigol, A. Muramatsu, Phys. Rev. A 70, 043627 (2004) A.M. Rey, G. Pupillo, C.W. Clark, C.J. Williams, Phys. Rev. A 72, 033616 (2005) P.B. Blakie, A. Bezett, P. Buonsante, Phys. Rev. A 75, 063609 (2007) R. Micnas, J. Ranninger, S. Roaszkiewicz, Rev. Mod. Phys. 62, 113 (1990) P. Nozières, S. Schmitt-Rink, J. Low Temp. Phys. 59, 195 (1985) A. Auerbach, Interacting Electrons and Quantum Magnetism (Springer-Verlag, Berlin, 1990) A. Moreo, D.J. Scalapino, Phys. Rev. Lett. 98 216402 (2007) A.F. Ho, M.A. Cazalilla, T. Giamarchi, Phys. Rev. A 79, 033620 (2009) F. Werner, O. Parcollet, A. Georges, S.R. Hassan, Phys. Rev. Lett. 95, 056401 (2005) A. Georges, Condensed matter physics with light and atoms : strongly correlated cold fermions in optical lattices, in Ultra-cold Fermi gases, International School of Physics Enrico Fermi Vol. 164, edited by M. Inguscio, W. Ketterle, C. Salomon, pp. 477–510 (IOS Press, 2008) L.M. Duan, E. Demler, M.D. Lukin, Phys. Rev. Lett. 91, 090402 (2003) G. Kotliar, Science 302, 679 (2003) W.F. Brinkman, T.M. Rice, Phys. Rev. B 2, 1324 (1970) T. Busch, B.G. Englert, K. Rzazewski, M. Wilkens, Found. Phys. 28, 549 (1998) J.K. Chin, D.E. Miller, Y. Liu, C. Stan, W. Setiawan et al., Nature 443, 961 (2006) T. Loftus, C.A. Regal, C. Ticknor, J.L. Bohn, D.S. Jin, Phys. Rev. Lett. 88, 173201 (2002) C.A. Regal, C. Ticknor, J.L. Bohn, D.S. Jin, Phys. Rev. Lett. 90, 053201 (2003) C.A. Regal, D.S. Jin, Phys. Rev. Lett. 90, 230404 (2003) D.S. Petrov, C. Salomon, G.V. Shlyapnikov, Phys. Rev. Lett. 93, 090404 (2004) M. Bartenstein, A. Altmeyer, S. Riedl, R. Geursen, S. Jochim et al. Phys. Rev. Lett. 94, 103201 (2005)