369 88 111MB
French Pages 482 [471] Year 2021
E N S E I G N E M E N T S U P P H YS I QU E
Agrégation Master Licence
Jolidon
PHYSIQUE EXPÉRIMENTALE Optique, magnétisme, électrotechnique, mécanique, thermodynamique et physique non linéaire
E N S E I G N E M E N T S U P P H YS I QU E
A g r ég at io n – M a s te r – Lic e n c e
Collectif Jolidon La collection « Enseignement Sup Physique » se présente comme une introduction sur des sujets incontournables en physique. Adaptée aux besoins des étudiants et des chercheurs, le traitement rigoureux, mais accessible, de chaque sujet est idéal pour ceux qui veulent une amorce dans un sujet donné pour les préparer à une étude ou à une recherche plus avancée. Ce livre regroupe 25 expériences de physique. Pour chacune, les aspects théoriques nécessaires à la compréhension du phénomène physique et l’élaboration du protocole sont détaillés. Des mesures, obtenues en laboratoire d’enseignement, sont présentées et systématiquement comparées aux prédictions théoriques. Un traitement rigoureux des incertitudes permet des discussions riches, allant au-delà des modèles proposés. Des schémas détaillés des dispositifs expérimentaux et des traitements numériques dans le langage libre Python facilitent la reproduction des expériences.
Illustration de couverture : Niels Bohr et Wolfgang Pauli jouant avec une toupie tippe-top lors de l’inauguration du nouvel institut de physique à Lund, en Suède (Erik Gustafson, 1954).
Pensé pour les candidats aux concours du CAPES et de l’agrégation, cet ouvrage s’adresse également aux étudiants de CPGE, de licence et de master, ainsi qu’aux enseignants du secondaire et du supérieur.
Le collectif Jolidon est composé de Éric Brillaux, Benjamin Crinquand, Louisiane Devaud, David Dumont, Camille Eloy, Antoine Essig, Benjamin Guiselin, Christopher Madec, Alexandre Michel, Jérémy Sautel, Théo Sépulcre et Louis Villa.
ISBN : 978-2-7598-2364-2 9 782759 823642
www.edpsciences.org
JOLIDON
Physique expérimentale Optique, magnétisme, électrotechnique, mécanique, thermodynamique et physique non linéaire
Illustration de couverture : Niels Bohr et Wolfgang Pauli jouant avec une toupie tippe-top lors de l’inauguration du nouvel institut de physique à Lund, en Suède (Erik Gustafson, 1954).
Le collectif JOLIDON est composé de : Éric Brillaux, Benjamin Crinquand, Louisiane Devaud, David Dumont, Camille Eloy, Antoine Essig, Benjamin Guiselin, Christopher Madec, Alexandre Michel, Jérémy Sautel, Théo Sépulcre et Louis Villa, anciens élèves de l’ENS de Lyon, agrégés de physique et doctorants.
Imprimé en France
ISBN (papier) : 978-2-7598-2364-2 - ISBN (ebook) : 978-2-7598-2523-3
Tous droits de traduction, d’adaptation et de reproduction par tous procédés, réservés pour tous pays. La loi du 11 mars 1957 n’autorisant, aux termes des alinéas 2 et 3 de l’article 41, d’une part, que les « copies ou reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective », et d’autre part, que les analyses et les courtes citations dans un but d’exemple et d’illustration, « toute représentation intégrale, ou partielle, faite sans le consentement de l’auteur ou de ses ayants droit ou ayants cause est illicite » (alinéa 1er de l’article 40). Cette représentation ou reproduction, par quelque procédé que ce soit, constituerait donc une contrefaçon sanctionnée par les articles 425 et suivants du code pénal.
© EDP Sciences, 2021
Table des matières Avant-propos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Incertitudes et ajustements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I
Optique
I.1 Réglage d’un interféromètre de Fabry-Perot . . . . . . . . . . . . . . . . . . . . . . I.2 Spectroscopie à l’aide d’un interféromètre de Fabry-Perot . . . . . . . . . . . . I.3 Décalage isotopique hydrogène-deutérium . . . . . . . . . . . . . . . . . . . . . . . . I.4 Effet Zeeman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.5 Spectroscopie par transformée de Fourier . . . . . . . . . . . . . . . . . . . . . . . .
II
21 40 47 54 73
Magnétisme
II.1 Ascension d’un liquide paramagnétique . . . . . . . . . . . . . . . . . . . . . . . . . II.2 Cycle d’hystérésis d’un milieu ferromagnétique . . . . . . . . . . . . . . . . . . . II.3 Domaines de Weiss : origine de l’hystérésis ferromagnétique . . . . . . . . . . II.4 Mesure du moment magnétique d’un aimant permanent. . . . . . . . . . . . . II.5 Freinage magnétique dans un tube conducteur. . . . . . . . . . . . . . . . . . . .
III
1 3
105 122 142 168 181
Électrotechnique
III.1 Machine à courant continu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
199 III.2 Machine asynchrone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 III.3 Transformateur électrique monophasé . . . . . . . . . . . . . . . . . . . . . . . . . 247 IV
Mécanique
IV.1 Mesure du module de Young par méthode acoustique . . . . . . . . . . . . . .
271 IV.2 Dynamique d’un gyroscope déséquilibré . . . . . . . . . . . . . . . . . . . . . . . . 289 IV.3 Dynamique d’un gyroscope libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 V
Thermodynamique
V.1 Thermométrie à gaz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
323
V.2 Thermométrie électrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . V.3 Expérience de Rüchardt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . V.4 Mesure d’une chaleur latente de vaporisation. . . . . . . . . . . . . . . . . . . . . V.5 Supraconductivité : lévitation Meissner et chute de résistivité. . . . . . . . . V.6 Diffusion du glycérol dans l’eau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
VI
339 356 369 379 400
Phénomènes non linéaires et instabilités
VI.1 Pendule double puits électronique . . . . . . . . . . . . . . . . . . . . . . . . . . . .
419 VI.2 Résonance paramétrique d’un circuit RLC . . . . . . . . . . . . . . . . . . . . . . 436 VI.3 Instabilité de Rayleigh-Plateau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451
Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
473
Avant-propos Théorie et expérience sont d’égale importance pour la modélisation et compréhension d’un phénomène physique ; pourtant ces deux aspects sont souvent traités séparément dans les manuels d’enseignement. En rédigeant ce recueil de physique expérimentale, nous avons voulu refléter leur dialogue dans un exposé didactique. L’exhaustivité étant impossible, nous avons plutôt cherché à illustrer des phénomènes originaux au détriment de certaines expériences classiques, de façon à éviter les recoupements avec des manuels récents, généralistes ou spécialisés. Pour chaque expérience, nous proposons un cadre théorique suffisamment large pour comprendre en détail le protocole, mais aussi en cerner les limites. Cela offre un regard critique sur le résultat expérimental, et enrichit sa discussion. En retour, toute déviation au résultat attendu, détectée par un traitement rigoureux des incertitudes, motive l’approfondissement de l’analyse théorique. Ce livre est destiné à la préparation des concours du CAPES et de l’agrégation, propices au dialogue entre ces aspects pratiques et théoriques. Nous espérons que les étudiants de classes préparatoires ou des universités et leurs enseignants y trouveront aussi des pistes de travaux pratiques, de TIPE, voire des illustrations originales de leurs cours. L’aller-retour entre théorie et expérience pourrait également offrir aux étudiants un aperçu de la démarche de recherche. Pour s’adresser à ces différents lecteurs, nous avons souhaité que chaque expérience se suffise à elle-même. Des compléments développent les étapes plus techniques, et une bibliographie apporte des pistes pour approfondir les sujets abordés dans chaque expérience. Cet ouvrage est divisé en six thèmes : optique, magnétisme, électrotechnique, thermodynamique, mécanique, et un regroupement de phénomènes non linéaires et d’instabilités. Un chapitre préliminaire rappelle les notions d’incertitudes et d’ajustement de données expérimentales. Les concepts importants sont illustrés par de nombreux exemples indiqués par un trait vertical vert . Dans les expériences, un trait noir indique une remarque d’ordre physique ; un trait rouge une remarque d’ordre technique, utile à la réalisation de l’expérience. Cet ouvrage est le fruit d’un travail collectif, et ce, bien au-delà du cercle de ses auteurs. Il n’aurait pu voir le jour sans l’aide et le soutien permanents dont nous avons bénéficié lors de notre scolarité à l’École normale supérieure (ENS) de Lyon. Nous avons eu la chance d’y côtoyer des enseignants passionnés, passionnants et investis. Ce soutien des équipes pédagogique et administrative nous a été particulièrement précieux durant notre année de préparation au concours de l’agrégation : nous tenons à les en remercier chaleureusement. Nous souhaitons également remercier l’équipe technique, investie dans les modules expérimentaux en physique pour toute l’école, en particulier Christian Ballesio, Benoît Capitaine, Adrien Favero et Jacques Marot. Nous souhaitons aussi remercier Martin Devaud, Clément Gouiller, Benjamin Huard, Sylvain Joubaud, Philippe Odier, Jason Reneuve, Romain Volk et 1
2 Jean-Paul Zaygel pour les discussions fructueuses autour de certaines expériences, ainsi que Benoît Cerutti et Serge Florens pour leur soutien à notre projet. Cette publication prend sa forme achevée grâce à nos relecteurs scientifiques, qui ont accepté de l’examiner et de la commenter pour enrichir ses expériences. Trois personnes ont ainsi travaillé à nos côtés : Luc Dettwiller, professeur en classes préparatoires au lycée Blaise Pascal de Clermont-Ferrand, docteur en optique et Observateur Associé au coronographe CLIMSO du Pic du Midi ; Hervé Gayvallet, maître de conférences à l’ENS de Lyon et Patrick Rigord, professeur agrégé à l’ENS de Lyon. Nous avons à cœur à travers ces quelques lignes de leur témoigner notre immense gratitude. Leurs commentaires scientifiques, toujours pertinents et circonstanciés, ont beaucoup enrichi notre travail. Par leur soutien et leurs encouragements, ils nous ont motivés pour mener à bien ce projet qui leur doit tant. Nous remercions enfin notre éditeur EDP Sciences d’avoir accepté de publier cet ouvrage dans sa collection « Enseignement Sup Physique ». Nous sommes bien évidemment intéressés par les remarques et discussions scientifiques à propos de cet ouvrage dans lequel, malgré de nombreuses relectures, des erreurs et coquilles ont pu se glisser. N’hésitez donc pas à nous contacter à l’adresse e-mail suivante : [email protected]. Le collectif Jolidon
Notations mathématiques : Les vecteurs sont notés en gras, le produit vectoriel × et l’opérateur différentiel vectoriel nabla ∇. Afin d’alléger les notations, nous omettons les parenthèses après un trait de fraction : nous noterons ainsi a/bc au lieu de a/(bc). La dérivée temporelle d’une fonction f ne dépendant que du temps t est parfois notée f˙ = df /dt.
Incertitudes et ajustements Le résultat de toute mesure est entaché d’une erreur, que l’on peut estimer en évaluant une incertitude. Ce chapitre met l’accent sur une utilisation pratique des incertitudes et de l’ajustement d’un modèle par rapport à un jeu de données expérimentales. Nous tirons grandement profit de la Réf. [1], dont nous recommandons la lecture dans un premier temps, que l’on pourra compléter des Réf. [2-4] pour approfondir la discussion.
Sommaire 1 2 3
Notion d’incertitude . . . . . . . . . . . . . . . . . . . Évaluation des incertitudes . . . . . . . . . . . . . . . Ajustement d’un modèle sur des données . . . . . . . .
3 6 11
1 Notion d’incertitude Dans toute la suite, nous appellerons point de mesure la donnée d’une seule valeur mesurée. En répétant N fois l’évaluation d’une grandeur physique dans les mêmes conditions, on obtient alors une série de mesures, composée de N points de mesure, à partir de laquelle on détermine le résultat de mesure.
1.1 Erreurs expérimentales Au cours d’une expérience, il est impossible de maîtriser l’intégralité des paramètres pouvant influer sur la grandeur mesurée. Chaque point de mesure est entaché d’une erreur, définie comme l’écart à la valeur vraie 1 , et que l’on souhaite minimiser. En pratique, la valeur vraie – et donc l’erreur – sont inconnues, mais deux types d’erreurs peuvent être distingués, selon leur origine et leur nature [1]. Les erreurs aléatoires proviennent de fluctuations non maîtrisées des grandeurs qui influent sur la mesure, de sorte que chaque répétition ne se fait jamais exactement dans les mêmes conditions. Les erreurs systématiques (ou biais) sont, elles, identiques pour de multiples réalisations de l’expérience dans les mêmes conditions. La Fig. 1 schématise quatre situations qualitatives après obtention d’une série de mesures. Pour caractériser la série de mesures (dont chaque point est représenté par une croix bleue), il est courant de distinguer les notions de justesse, de précision et de fidélité. La justesse évalue l’écart entre le résultat de mesure et la valeur vraie (croix rouge), et la précision est inversement proportionnelle à la dispersion des points de mesure autour du résultat de mesure. On parle de fidélité lorsqu’il y a à la fois justesse et précision. Le cas (i) correspond à une série de mesures très dispersée, mais centrée autour de la valeur vraie. La mesure est juste mais peu précise. Le 1. La définition de la valeur vraie est problématique [2, 4]. En pratique, la valeur vraie est inconnue, puisqu’elle correspond au résultat d’une mesure fictive idéale, dont l’erreur serait nulle.
3
4 (b)
(i)
×× + × ××
(ii)
(iii)
+
(iv)
× ×××
+×× ××× × ×× × +
Justesse
(a)
(i)
t´e ´eli d Fi (iv)
(ii)
(iii) Pr´ecision
Fig. 1 (a) Distributions possibles d’une série de mesures. La valeur vraie est représentée par une croix rouge et les points de mesure par des croix bleues. Le cercle tireté jaune symbolise la dispersion des résultats. (b) Position des différents cas dans un diagramme justesse/précision.
cas (ii) est le plus défavorable : les points sont dispersés et en moyenne éloignés de la valeur vraie. La mesure est donc peu fidèle. Dans le cas (iii) la mesure est précise, mais peu juste. Cette situation trahit l’existence d’une erreur systématique. Enfin, le cas (iv) présente la situation idéale d’une haute fidélité : la mesure est juste et précise. En conclusion, une erreur aléatoire entraîne une perte de précision, et une erreur systématique une perte de justesse. Cependant, cette distinction entre erreurs aléatoires et systématiques n’a que peu d’utilité pratique. En effet, il est impossible de déceler une erreur systématique sans connaître la valeur vraie. On peut toutefois estimer quantitativement la composante aléatoire de l’erreur. Il est donc préférable, plutôt que de classer les erreurs selon leur nature, de distinguer les méthodes d’estimation des erreurs aléatoires [2]. Les deux méthodes existantes sont de nature probabiliste, mais l’une est de nature statistique (Sec. 2.1) et l’autre non (Sec. 2.2).
1.2 Définition de l’incertitude Supposons que l’on dispose d’une série de mesures comportant un nombre infini de points, que l’on caractérise par une variable aléatoire x (dimensionnée), associée à une densité de probabilité p(x). Tout point de mesure appartient au support de p, noté [a, b]. À partir de cette série de mesures fictive, on peut identifier le résultat de mesure à la moyenne statistique de x, définie par ˆ b hxi = p(x)x dx. (1) a
La dispersion des points de mesure autour du résultat de mesure, associée à la largeur caractéristique de p, est définie par l’écart-type s ˆ b σx = p(x)(x − hxi)2 dx. (2) a
Cependant, lorsqu’on réalise une expérience, on ne connaît ni la distribution p, ni son support [a, b], parce qu’on ne dispose que d’un nombre fini de points de mesure.
5
Incertitudes et ajustements
Les Éq. (1) et (2) sont donc inutilisables en pratique, et il est nécessaire d’estimer la distribution de probabilité p, ou au moins hxi et σx . Nous notons hxiest l’estimation de la moyenne de p. Soulignons que hxiest est aussi une variable aléatoire de moyenne hxi, et d’écart-type σhxi 2 . Toute la difficulté lors de l’estimation de p provient du fait qu’elle comporte en général une composante qui peut être évaluée statistiquement, et une autre non. Il est donc nécessaire d’utiliser différentes méthodes d’estimation et de les coupler pour déterminer p aussi fidèlement que possible. Nous montrerons comment réaliser ces estimations dans la Sec. 2. On appelle incertitude la grandeur qui quantifie la finesse de l’intervalle de valeurs que peut vraisemblablement prendre la grandeur mesurée, et donc la fiabilité que l’on peut attribuer au résultat de mesure. Il est indispensable de l’évaluer pour comparer des résultats expérimentaux entre eux, ou encore le résultat d’une expérience à une valeur vraie, qu’elle soit issue d’un modèle théorique ou d’un étalonnage. On assimile dans tout ce livre l’incertitude sur le résultat de mesure à l’incertitudetype ∆x, définie comme l’estimation de σhxi . Une fois les estimations réalisées, on présente le résultat sous la forme d’un intervalle centré, résultat de mesure = (hxiest ± ∆x) unité.
(3)
1.3 Crédibilité et présentation du résultat de mesure Pour une distribution de probabilité gaussienne, l’incertitude-type donne un intervalle de confiance de 68 %, autrement dit la valeur vraie possède une probabilité d’environ 0,68 de se trouver dans l’intervalle [hxiest − ∆x, hxiest + ∆x]. Ce choix signifie aussi que, pour un grand nombre de mesures, environ un tiers des valeurs ne sont pas contenues dans le domaine indiqué par l’Éq. (3). On jugera donc qu’un résultat de mesure est compatible avec la valeur vraie si hxiest ne s’écarte pas de plus de 2∆x de cette dernière 3 , ce qui correspond à un intervalle de confiance de 95 %. Supposons que l’on estime la moyenne arithmétique à partir de M séries de mesures (autrement dit on réalise M fois une expérience donnée, afin d’obtenir M résultats de mesure). Si les expériences sont indépendantes, la variable hxiest suit une loi de probabilité gaussienne lorsque M → +∞, quelle que soit la loi de probabilité p que suit la variable aléatoire x [3]. Ce résultat, appelé théorème central limite, justifie l’utilisation de la distribution gaussienne dans l’interprétation des intervalles de confiance.
Pour écrire le résultat de façon cohérente, la dernière décimale de hxiest en écriture scientifique doit correspondre au même ordre de grandeur que l’incertitude ∆x. Il est donc suffisant d’écrire ∆x avec un seul chiffre significatif. Une exception peut être faite lorsque la troncature entraînerait une perte importante d’information, en particulier si le chiffre dominant de l’incertitude est petit (typiquement 1 ou 2). 2. Par simplicité, et afin d’éviter toute confusion entre l’écart-type et son estimation, nous notons σhxi au lieu de σhxiest , bien que la variable aléatoire soit hxiest et non hxi. 3. Il existe un critère similaire pour justifier l’élimination d’un point de mesure jugé suspect, appelé critère de Chauvenet (voir par exemple la Réf. [3]).
6 Écrire 2,6 ± 1,3 plutôt que 3 ± 1 peut se justifier, car le deuxième chiffre significatif de l’incertitude représente environ 12 % de la valeur centrale du résultat de mesure.
2 Évaluation des incertitudes Il existe deux méthodes d’évaluation des incertitudes. La première est une méthode statistique, dite de type A, où les incertitudes sont déterminées sur un ensemble d’occurrences expérimentales. Une loi de probabilité est donc évaluée a posteriori. La seconde, de type B, ne correspond pas à une évaluation statistique. Elle présuppose une loi de probabilité en se fondant sur la connaissance qu’un évènement se produise a priori [2].
2.1 Évaluation de type A L’évaluation de type A est purement objective, et consiste en un traitement statistique d’une série de mesures {xi } , i ∈ J1, N K. Elle est adaptée aux situations expérimentales où l’erreur provient principalement d’une dispersion statistique. Sans connaissance préalable de la distribution de probabilité p, la meilleure estimation 4 de hxi est donnée par la moyenne arithmétique des N valeurs mesurées xi [5], hxiest =
N 1 X xi , N i=1
(4)
et la meilleure estimation de la composante statistique de l’écart-type σx est 5 [3] v u N 2 u 1 X σx, A = t xi − hxiest . (5) N − 1 i=1 L’Éq. (5) donne l’incertitude sur chacun des points de mesure constituant la série. On cherche plutôt à évaluer l’incertitude sur la moyenne estimée de la série de mesures, qui s’identifie à l’incertitude-type sur le résultat de mesure et vaut σx, A σhxi, A = √ . N
(6)
Plus le nombre N de valeurs mesurées est grand, plus l’estimation de la moyenne est précise, autrement dit plus l’incertitude-type sur la moyenne√est faible. Dans ce cas, on écrira le résultat de mesure sous la forme hxiest ± σx, A / N . Alice mesure 5 fois le temps de chute d’un objet d’une hauteur fixe avec un chronomètre très précis, et obtient la série de mesures suivante (en secondes) : {12,7 ; 11,9 ; 12,3 ; 11,7 ; 12,2}. En utilisant les Éq. (4) et (6), le résultat de mesure prend la forme (12,2 ± 0,2) s. Ici, le temps de réaction de l’expérimentateur est bien plus grand que 4. Parmi les estimateurs non biaisés, le meilleur est celui dont la convergence avec N est la plus rapide vers la valeur vraie [3]. 5. La moyenne étant inconnue, il faut l’estimer par l’Éq. (4), ce qui impose une relation entre les xi et conduit à diviser par N − 1 (au lieu de N ) afin d’obtenir un estimateur σx, A non biaisé.
Incertitudes et ajustements
7
la résolution de l’appareil et l’évaluation de type A suffit pour évaluer l’incertitude.
Attention toutefois, l’Éq. (6) estime correctement l’incertitude totale seulement si les fluctuations aléatoires sont bien plus grandes que la résolution de l’appareil de mesure, ou l’incertitude de lecture d’une graduation. Quel que soit le nombre de mesures de la taille d’un objet avec une règle, l’incertitude est toujours minorée par la résolution de la règle (par exemple, 1 mm) : l’Éq. (6) ne donne pas l’incertitude totale.
Pour tenir compte de ces limitations, il faut recourir au second type d’estimation : l’évaluation de type B.
2.2 Évaluation de type B L’évaluation de type B est réalisée en postulant une distribution de probabilité p0 raisonnable à partir de connaissances a priori sur la grandeur mesurée. L’incertitudetype s’obtient alors par l’écart-type de p0 , donné par l’Éq. (2). Cette estimation ne s’obtient pas seulement à partir d’une série de mesures, mais dépend de facteurs extérieurs : expérience précédente, valeur tabulée par un constructeur, calibration, littérature (handbook), etc. À défaut d’une méthode générale, l’estimation (à travers le choix de p0 ) est plus délicate et la méthode employée doit être exposée clairement. Dans la suite, nous discutons les quelques situations fréquemment rencontrées. 2.2.1 Lecture de graduations et appareil analogique Cette situation se rencontre lors de la lecture d’une longueur sur une règle, d’un volume sur une éprouvette graduée, ou de l’utilisation de tout appareil analogique avec graduations, dont le pas est noté δ. À cause de la résolution finie de l’appareil de mesure, la valeur mesurée doit être interpolée entre les deux graduations les plus proches. Deux situations caractéristiques peuvent se présenter. S’il est impossible de situer la mesure au sein de l’intervalle [nδ, (n + 1)δ] entre deux graduations consécutives, on considère que la distribution de probabilité p0 des résultats de mesure √ est uniforme sur cet intervalle. L’incertitude-type vaut alors σB = σuni = δ/2 3 (Fig. 2(a)). En revanche, si la mesure se situe plutôt au centre de l’intervalle, on peut (a)
(b)
p0
p0
2/δ
2 σtri
1/δ 0
2 σuni nδ
x
(n + 1) δ
0
nδ
x
(n + 1) δ
Fig. 2 Densités de probabilité p0 , (a) uniforme et (b) triangulaire, entre deux graduations nδ et (n + 1)δ. L’incertitude de type B s’identifie à l’écart-type (σuni ou σtri ) de p0 , qui couvre la surface colorée centrée au milieu des graduations.
8 √ privilégier une densité de probabilité triangulaire, pour laquelle σB = σtri = δ/2 6 (Fig. 2(b)). De la même manière, si l’on estime que le résultat de mesure est proche d’une graduation, on peut utiliser une distribution triangulaire, centrée cette fois sur la graduation 6 . Cette méthode s’applique aussi aux situations où l’on ne peut pas mesurer précisément une valeur, mais seulement un intervalle. Par exemple, lors de la détermination de la fréquence de résonance d’un circuit RLC à l’aide d’un oscilloscope, il est parfois difficile de situer précisément le maximum de la tension aux bornes de la résistance. Si la tension est considérée √ comme maximale sur l’intervalle [980 Hz, 996 Hz], l’incertitude associée vaut 16/2 3 Hz ' 4,6 Hz, et l’on écrira le résultat sous la forme frés = (988 ± 5) Hz.
2.2.2 Appareil numérique La valeur indiquée par un appareil numérique est toujours accompagnée d’une incertitude liée à sa constitution, qui dépend du calibre, et précisée par le constructeur dans la notice. Dans ce cas, on parle de précision de l’appareil numérique. L’incertitude donnée par le constructeur est toujours supérieure à la résolution de l’appareil. Si l’instrument de mesure est mal connu, il peut être nécessaire de l’étalonner. L’incertitude constructeur d’un voltmètre indique 0,001U +4 digits (parfois noté NUR , pour unité de représentation). Au pourcentage indiqué de la valeur U lue s’ajoute alors 4 fois la plus petite puissance de dix affichée par le voltmètre dans le calibre utilisé. Si on lit une tension de 2,3120 V sur l’afficheur, on écrira le résultat (2,312 ± 0,003) V. Parfois une valeur donnée remplace les digits, comme dans l’Exp. V.1, « Thermométrie à gaz », où le constructeur du manomètre numérique indique une incertitude sur la pression de 0,01p + 4 hPa.
2.3 Évaluations composées des incertitudes Les sources d’erreur dans une expérience sont en général multiples, et chacune est estimée par une méthode éventuellement différente (A ou B). On évalue l’incertitude totale en composant les incertitudes obtenues séparément par chaque méthode, que celles-ci soient identiques à chaque répétition de l’expérience (Sec. 2.3.1), ou différentes (Sec. 2.3.2). 2.3.1 Incertitudes identiques à chaque répétition de la mesure Lorsque la mesure est affectée d’incertitudes évaluées par les deux méthodes A et B, et que l’incertitude de type B est identique à chaque répétition de la mesure, on effectue une sommation quadratique 7 : q 2 2 (7) ∆x = σhxi, A + σB , 6. Il faut garder à l’esprit que l’on n’estime l’erreur qu’au premier ordre. S’il existe évidemment une incertitude sur cette estimation, suite au choix de la distribution de probabilité, il serait inutile de vouloir quantifier cette « incertitude sur l’incertitude ». 7. On peut montrer que pour deux variables aléatoires et non corrélées p X et Y d’écarts-types 2 + σ 2 [5]. σX et σY , l’écart-type sur la variable X + Y est donné par σX+Y = σX Y
9
Incertitudes et ajustements
où σhxi,A est obtenu par traitement statistique et donné par l’Éq. (6), et σB désigne l’incertitude-type sur chaque point de mesure évaluée par la méthode B. L’incertitude sur le résultat de mesure est donc minorée par σB , quel que soit le nombre de points de mesure. Alice consulte la notice constructeur du chronomètre, et lit une précision de ±0,6 s à 95 %. Elle divise donc par deux afin d’obtenir l’incertitude-type (à 68 %) associée σB = 0,3 s. En composant avec l’incertitude statistique précédemment obtenue σhxi, A = 0,2 s, selon l’Éq. (7), le résultat de mesure devient (12,2 ± 0,4) s.
2.3.2 Incertitudes différentes à chaque répétition de la mesure Supposons que l’on dispose d’une série de mesures dont chaque point xi est issu d’une répétition de la même expérience. Lorsque plusieurs personnes réalisent une expérience, elles peuvent obtenir des résultats de mesure et des incertitudes différentes. C’est le cas lorsqu’elles n’utilisent pas des instruments de même précision, ou qu’elles ne mènent pas l’expérience dans les mêmes conditions. L’incertitude ∆xi sur chaque point de mesure peut, comme dans l’Éq. (7), provenir de la composition d’incertitudes évaluées par les méthodes A et B. La meilleure estimation de hxi s’obtient en pondérant la moyenne par les poids wi = 1/∆x2i [3] ; autrement dit, N P
hxiest =
w i xi
i=1 N P
(8)
. wi
i=1
Un point contribue donc d’autant moins qu’il est incertain (relativement aux autres). L’incertitude-type s’estime à partir des N points de mesure par ∆x =
N X
!−1/2 wi
.
(9)
i=1
Elle est toujours inférieure au minimum des ∆xi . Lors de la mesure du temps de chute d’un même objet d’une hauteur fixée, Alice, Bob et Charles obtiennent les trois résultats de mesure suivants : (12,2 ± 0,4) s ; (11,9 ± 0,2) s et (11,4 ± 1,5) s. Les incertitudes diffèrent, car ils n’ont pas utilisé le même matériel ni réalisé le même nombre de points de mesure. En utilisant les Éq. (8) et (9), le résultat déduit de ces trois expériences se met sous la forme (12,0 ± 0,2) s. On remarque que l’expérience la moins précise affecte peu le résultat final.
Les équations précédentes ne doivent en revanche pas être utilisées lorsque les résultats de mesure sont incompatibles aux incertitudes près, sous peine de parvenir à un résultat aberrant. Dans l’exemple précédent, le frère d’Alice affirme avoir obtenu le résultat (21,9 ± 0,2) s. Combiné au résultat d’Alice, l’utilisation abusive des Éq. (8) et (9) conduirait au résultat (20,0 ± 0,2) s, qui n’est compatible avec aucun des deux précédents. Il faut
10 utiliser les expériences de Bob et Charles pour conclure à l’existence probable d’une erreur systématique dans l’expérience du frère d’Alice.
2.4 Propagation des incertitudes Suite à une expérience, la grandeur d’intérêt est souvent obtenue indirectement, comme une fonction de variables directement mesurées. Il est alors nécessaire de savoir comment l’incertitude sur les variables mesurées se répercute sur la grandeur d’intérêt : on parle de propagation de l’incertitude. Si l’on déduit une grandeur q = q(y1 , . . . , yn ) de la mesure d’autres variables expérimentales indépendantes {yi }, d’incertitudes {∆yi }, l’incertitude-type ∆q sur la grandeur q est donnée par la formule de propagation des incertitudes [3]
∆q =
"
∂q ∆y1 ∂y1
2
+ ··· +
∂q ∆yn ∂yn
2 #1/2
(10)
.
Notons que cette formule fournit une estimation acceptable de l’incertitude si la fonction q est linéarisable localement en yi . Si cela n’est pas le cas, une différentiation à l’ordre non nul suivant est nécessaire. Dans le cas où les mesures sont corrélées, l’Éq. (10) constitue une borne supérieure de l’incertitude [3]. Ne disposant pas de réfractomètre, Alice décide d’utiliser la loi de la réfraction de Snell-Descartes pour mesurer l’indice de réfraction n2 = n1 sin(i1 )/ sin(i2 ) (et n1 < n2 de sorte que le rayon réfracté existe toujours). Elle connaît parfaitement l’indice n1 et mesure au goniomètre les angles incident i1 et réfracté i2 positifs par rapport à la normale au dioptre. L’Éq. (10) conduit à ∆n2 =
"
n1 cos(i1 ) ∆i1 sin(i2 )
2
+
n1 sin(i1 ) cos(i2 ) − ∆i2 sin2 (i2 )
2 #1/2 ,
(11)
qui peut se réécrire plus simplement ∆n2 = n2
"
∆i1 tan(i1 )
2
+
∆i2 tan(i2 )
2 #1/2 .
(12)
Lorsque i1 tend vers 0, i2 également et on ne mesure aucune déviation ; il est donc normal que l’incertitude diverge. Lorsque i1 tend vers π/2, l’incertitude s’annule parce que la fonction n2 (i1 ) atteint un extremum et l’Éq. (10) cesse d’être valable.
fréquente est celle où q s’écrit comme un produit, soit q(y1 , . . . , yn ) = Qn Uneαsituation i i=1 yi . Dans ce cas (et ce cas seulement), l’Éq. (10) se simplifie en ∆q = q
"
∆y1 α1 y1
2
2 #1/2 ∆yn + · · · + αn . yn
On notera que cette formule ne s’applique pas à l’exemple précédent.
(13)
Incertitudes et ajustements
11
Dans l’Exp. II.5, « Freinage magnétique dans un tube conducteur », un aimant de moment magnétique M et de masse m chute à vitesse constante vlim dans un cylindre creux d’épaisseur w et de rayon moyen R, par compensation du poids et de la force de freinage inductive. La vitesse s’écrit vlim = amR4 /wM2 dans l’approximation où le champ créé par l’aimant est dipolaire, où a est parfaitement connu. L’incertitude relative sur vlim vaut ∆vlim = vlim
"
∆m m
2
+
∆R 4 R
2
+
∆w w
2
+
∆M 2 M
2 #1/2 .
2.5 Sous-estimation ou surestimation des incertitudes Lorsqu’on cherche à tester la validité d’un modèle théorique, une surévaluation des incertitudes peut masquer des effets subtils de désaccord avec la théorie (limites de la théorie du gaz parfait, effets relativistes sur la précession du périhélie de Mercure, etc.). Une sous-évaluation des incertitudes peut également poser problème, en remettant en cause un modèle potentiellement valide. C’est pourquoi il est essentiel de faire preuve de bon sens et d’honnêteté intellectuelle pour estimer au mieux les incertitudes dans une expérience donnée. Il faut justifier la manière dont les incertitudes sont évaluées (en particulier pour le type B), et prendre garde à leur mauvaise estimation et leurs répercussions sur l’interprétation des résultats.
3 Ajustement d’un modèle sur des données Beaucoup d’expériences visent à vérifier un modèle, c’est-à-dire à savoir avec quel degré de confiance l’ensemble des données expérimentales affectées de leurs incertitudes {(xi , ∆xi ), (yi , ∆yi )}, est compatible avec une loi du type y = f (x; {τj }) où {τj } désigne l’ensemble des paramètres d’ajustement. Dans ce livre, nous nous ramenons dès que possible à un modèle affine, de sorte que {τj } désigne le couple de réels {a, b} tel que f (x; {a, b}) = ax + b. L’ajustement consiste à trouver les valeurs optimales τj? des paramètres τj telles que f (x; {τj? }) soit « le plus proche » possible des données expérimentales. Il permet en premier lieu de s’assurer que le modèle théorique décrit bien le phénomène physique, et en second lieu de déduire des caractéristiques du système à partir des τj? . Bien que souvent réalisées simultanément, ces deux étapes sont conceptuellement très différentes. Un critère pertinent et couramment utilisé pour optimiser les paramètres d’ajustement est la méthode des moindres carrés.
3.1 Principe de la méthode des moindres carrés La méthode des moindres carrés consiste à minimiser la somme des carrés des distances entre les points expérimentaux et le modèle [3]. En l’absence d’incertitude sur les abscisses (∆xi = 0), les paramètres optimaux τj? sont ceux qui minimisent la fonction 2 N X yi − f (xi ; {τj }) 2 χ ({τj }) = . (14) ∆yi i=1
12 Les distances sont pondérées par l’inverse des incertitudes, si bien que la contribution d’un point sera d’autant moins importante qu’il est incertain (relativement aux autres). Dans le cas où les incertitudes sur les xi ne sont pas négligeables, et indépendantes des incertitudes sur les yi , on utilise la méthode de la variance effective [6]. La fonction à minimiser a alors pour expression χ2 ({τj }) =
N X
(yi − f (xi ; {τj }))2 , + (f 0 (xi ; {τj })∆xi )2
∆yi2 i=1
(15)
où f 0 désigne la dérivée de f par rapport à x. Ce résultat n’est valable que si la dérivée de f varie peu autour du point xi , autrement dit si f 0 (xi ; {τj }) f 00 (xi ; {τj })∆xi . Cette approximation est toujours vérifiée pour un ajustement affine, car la dérivée seconde est nulle : c’est ce qui fait sa robustesse lorsque l’ajustement est réalisé par la méthode des moindres carrés.
La minimisation par la méthode des moindres carrés est optimale si f dépend linéairement des paramètres d’ajustement : on essaie donc, dans la mesure du possible, de se ramener à ce cas. Si par exemple le modèle prévoit f (x; {τj }) = τ1 (τ2 x + x3 ), on préférera ajuster la fonction g(x; {τj0 }) = τ10 x + τ20 x3 . La méthode est également mieux maîtrisée si f est affine en x. Dans l’exemple précédent 8 , il est préférable d’ajuster la fonction h(x2 ; {τj0 }) = g(x; {τj0 })/x = τ10 + τ20 x2 , en veillant à adapter l’incertitude sur la nouvelle abscisse x2 et la nouvelle ordonnée h. De la même manière, lorsque la courbe d’ajustement est une exponentielle, on préférera tracer son logarithme et recourir à un ajustement affine. Cela est utilisé dans l’Exp. V.2, « Thermométrie électrique ». Lors du passage au logarithme, on veillera à recalculer les incertitudes avec l’Éq. (10) : pour une variable adimensionnée x d’incertitude-type ∆x, on obtient ln(x + ∆x) ' ln(x) + ∆x/x au premier ordre en ∆x/x. L’incertitude devient une incertitude relative par passage au logarithme, et prend de très grandes valeurs lorsque x est proche de 0.
Les ajustements non affines sont possibles, mais plus sensibles aux valeurs initiales données aux paramètres d’ajustement 9 . La fonction χ2 ({τj }) peut en effet présenter des minima locaux, au lieu d’un unique minimum global dans le cas d’un ajustement affine, ce qui complique la procédure de minimisation (Fig. 3(a)). L’ajustement fournit également une incertitude ∆τj sur chaque paramètre τj [3]. Pour un unique paramètre τ , un développement de Taylor à l’ordre deux au voisinage du paramètre optimal τ ? donne 1 χ2 (τ ) ' χ2 (τ ? ) + H(τ − τ ? )2 + O (τ − τ ? )3 . 2
(16)
Le coefficient H détermine la courbure de la parabole osculatrice du χ2 autour de p τ ? (Fig. 3(b)). Il est relié à l’incertitude sur τ ? par ∆τ = 2/H : plus H est grand, plus le minimum du χ2 est marqué, et plus l’incertitude sur l’optimum est petite. 8. On retrouvera cet exemple dans l’Exp. VI.1, « Pendule double puits électronique ». 9. Cette discussion ne s’applique qu’aux algorithmes les plus simples. Il existe des méthodes plus avancées (stochastiques par exemple) qui permettent des ajustements non linéaires et/ou à plusieurs variables [7].
Incertitudes et ajustements (a)
13
(b)
χ2
χ2
τ˜
τi1
τi2
τ?
τ
H1 H2 < H1
τ?
τ
Fig. 3 (a) Illustration de l’importance du choix des valeurs initiales des paramètres d’ajustement. Si la fonction χ2 (τj ) présente des minima locaux, comme τ˜ sur le schéma, un paramètre initial comme τi1 peut poser un problème d’estimation du paramètre optimal τ ? . (b) Plus la courbure H de l’Éq. (16) est grande, plus le minimum du χ2 est marqué, et plus l’incertitude ∆τ sur le paramètre optimal τ ? est petite. Ces figures représentent ce qu’il se passe pour un unique paramètre τ , mais cette minimisation a lieu dans un espace multidimensionnel.
Lorsque la minimisation fait intervenir plusieurs paramètres τi , il est possible de généraliser les résultats précédents à partir de la matrice hessienne du χ2 . Un exemple de code Python permettant de réaliser des ajustements affines est proposé dans la Réf. [4].
3.2 Test du χ2 Pour évaluer la qualité d’un ajustement, on peut utiliser le test dit « du χ2 ». Nous discutons uniquement le cas où ∆yi f 0 (xi )∆xi . On définit le χ2 réduit par χ2red =
χ2 (τ ? ) , N −P
(17)
où P est le nombre de paramètres τj ajustables (2 pour un modèle affine) et N le nombre de points de mesure de la série. Dans le cas où toutes les incertitudes sont identiques et égales à ∆y, la grandeur N 2 1 X yi − f (xi ; {τj? }) N − P i=1
(18)
2 constitue un bon estimateur de la variance σstat de la distribution des données expérimentales autour du modèle, et alors 2 σstat χ2red ' . (19) ∆y
Lorsque χ2red 1, les incertitudes expérimentales sont grandes devant l’écart moyen au modèle et sont probablement surévaluées (Fig. 4(a)). Le modèle reproduit les données expérimentales, mais des déviations à la loi proposée risquent de ne pas être visibles (Sec. 2.5). À l’inverse, si χ2red 1, ou bien les incertitudes expérimentales ont été sous-évaluées, ou bien le modèle proposé n’est pas en accord avec les
14 (a)
(b) 125
χ2red = 0,10
100
y (unit´e arb.)
y (unit´e arb.)
125
75 50 25
χ2red = 22
100 75 50 25
0
0 0
5
10 15 x (unit´e arb.)
20
0
5
10 15 x (unit´e arb.)
20
(c)
y (unit´e arb.)
125
χ2red = 1,0
100 75 50 25 0 0
5
10 15 x (unit´e arb.)
20
Fig. 4 Illustration du test du χ2 . (a) Si χ2red 1, les incertitudes sont surévaluées et peuvent cacher des écarts au modèle. (b) Si χ2red 1, le modèle s’écarte fortement des données, ou les incertitudes sont sous-évaluées. (c) Si χ2red ' 1, le modèle permet de reproduire raisonnablement les données.
données (Fig. 4(b)). Enfin, pour χ2red ' 1, le modèle proposé est acceptable compte tenu des incertitudes (Fig. 4(c)).
3.3 Limites du test du χ2 Avant d’évaluer aveuglément les données de façon statistique, il est indispensable de faire preuve d’esprit critique. Le quartet d’Anscombe présenté en Fig. 5 fournit un exemple de quatre jeux de données ayant des propriétés statistiques identiques : même moyenne, même médiane, même variance [8]. Le meilleur ajustement obtenu par la méthode des moindres carrés est également identique dans les quatre cas : y = 0,5x + 2,5 avec χ2red = 1. Pourtant, seules les données présentées en Fig. 5(a) sont raisonnablement ajustées par la droite proposée. Généralement, lorsque les données révèlent une structure particulière, c’est que le modèle choisi n’est pas le bon (Fig. 5(b)). L’observation simple des données permet aussi de se rendre compte de l’existence d’un point aberrant (Fig. 5(c)) ou isolé (Fig. 5(d)). De plus, le test du χ2 ne peut être interprété que si la fonction modèle f dépend
15
Incertitudes et ajustements (b) 14
14
12
12 y (unit´e arb.)
y (unit´e arb.)
(a)
10 8 6 4 2
8 6 4
0
5
(c)
10 15 x (unit´e arb.)
2
20
14
14
12
12
10 8 6 4 2
0
5
10 15 x (unit´e arb.)
20
0
5
10 15 x (unit´e arb.)
20
(d)
y (unit´e arb.)
y (unit´e arb.)
10
10 8 6 4
0
5
10 15 x (unit´e arb.)
20
2
Fig. 5 Quartet d’Anscombe illustrant l’importance d’observer dans un premier temps les données avant toute étude statistique [8]. Les quatre jeux de données ont les mêmes propriétés statistiques et mènent au même ajustement par la méthode des moindres carrés : y = 0,5x + 2,5, et χ2red = 1. Seul le modèle (a) est compatible avec une droite, (b) possède une allure parabolique, (c) présente un point aberrant qui fausse l’ajustement et (d) un point isolé, où tout se passe comme si l’ajustement était fait sur deux points.
linéairement de l’ensemble des paramètres τj [9]. Mais même dans ce cas, la valeur du χ2 réduit est estimée à partir d’un nombre fini de mesures expérimentales, p et possède donc aussi une incertitude. Les fluctuations de χ2red sont de l’ordre de 2/(N − P ), que l’on peut assimiler à l’incertitude sur la valeur de χ2red . En Fig. 4, on réalise un p ajustement avec N = 12 points, et 2 paramètres. L’incertitudetype sur χ2red vaut 2/10 ' 0,45. À un niveau de confiance de 68 %, les valeurs acceptables de χ2red sont comprises entre 0,55 et 1,45, donc seul l’ajustement de la Fig. 4(c) est acceptable.
Le test du χ2 doit donc être employé avec précaution pour des jeux de données de petite taille. Si dans le cadre des expériences d’enseignement, l’évaluation du χ2red n’est pas toujours pertinente, la connaissance de cette méthode reste importante.
16
3.4 Décrément logarithmique Dans le cas particulier où une loi y(x) possède une enveloppe exponentielle, y(x) = e−Λx fp (x),
(20)
et que la fonction fp (x) est périodique, il n’est pas possible de se ramener directement à une dépendance affine. Cette situation est rencontrée dans l’Exp. V.3, « Expérience de Rüchardt » d’où sont issues les données de la Fig. 6 : l’écart entre la pression p dans le récipient fermé dans lequel coulisse le mobile, et cette même pression à l’équilibre pe , évolue avec le temps t = x selon l’Éq. (20). La fonction périodique est une sinusoïde fp (x) = A sin(ωx+φ), où A est l’amplitude initiale des oscillations de pression, φ la phase à l’origine et ω la pseudo-pulsation.
Pour estimer Λ tout en évitant un ajustement non linéaire pour les raisons évoquées en Sec. 3.1, on utilise la méthode du décrément logarithmique. Il faut commencer par repérer les maxima locaux ymax,i de la série de points {xi , yi }, en admettant qu’ils sont répartis de manière assez dense pour que {ymax,i } soit très proche d’un maximum local de la fonction y. Ces maxima ont pour abscisses {xmax,i }, et sont répartis périodiquement, de sorte que fp (xmax,i ) = A0 ne dépend pas du maximum i choisi. On isole ainsi la dépendance exponentielle de y. Ensuite, le tracé de ln(|ymax,i |) en fonction de xmax,i permet un ajustement affine ln(|ymax,i |) = −Λxmax,i + ln(|A0 |) où Λ est la constante de temps de l’Éq. (20), comme montré sur la Fig. 6(b). Le raisonnement précédent est équivalent en substituant les minima aux maxima.
(a)
(b) 6
2,0
4 1,5 ln(|yextr |)
y(x)
2 0
1,0
-2
0,5
-4 -6
0
1
2
3
4 x
5
6
7
8
0,0
0
1
2
3
4 x
5
6
7
8
Fig. 6 (a) Exemple de fonction y(x) s’écrivant comme le produit d’une fonction périodique fp (x) = A sin(ωx + φ) et d’une enveloppe exponentielle e−Λx (courbes rouges). Les points expérimentaux (disques bleus) comprennent des extrema (triangles rouges). (b) Logarithme de la valeur absolue des extrema yextr (triangles rouges), et ajustement affine (droite continue). Sur cet exemple, nous trouvons une pente de valeur absolue Λ = (0,204 ± 0,006) s−1 .
Table des matières
17
Lorsque fp est centrée autour de zéro, comme sur la Fig. 6(a), le décrément peut se faire sur tous les extrema, puisque les minima de positions {xmin,i } donnent également |fp (xmin,i )| = |A0 |. La fonction argrelextrema de la bibliothèque Python scipy.signal détecte automatiquement les extrema locaux d’une série de points.
Références [1]
F.-X. Bally et J.-M. Berroir, « Incertitudes expérimentales, » Bup, 104 (928), p. 995-1019, 2010.
[2]
Joint Committee for Guides in Metrology. (2008). Guide to the expression of Uncertainty in Measurements, adresse : https : / / www . bipm . org / en / publications/guides/gum.html (visité le 10/08/2019).
[3]
J. Taylor, Incertitudes et analyse des erreurs dans les mesures physiques : avec exercices corrigés. Dunod, 2000.
[4]
M. Fruchart, P. Lidon, E. Thibierge, M. Champion et A. Le Diffon, Physique expérimentale. De Boeck Supérieur, 2016.
[5]
W. Appel, Mathématiques pour la physique et les physiciens. H&K, 2008.
[6]
J. Orear, « Least squares when both variables have uncertainties, » Am. J. Phys., 50 (10), p. 912-916, 1982.
[7]
W. H. Press, S. A. Teukolsky, W. T. Vetterling et B. P. Flannery, Numerical recipes: the art of scientific computing, 3e éd. Cambridge University Press, 2007.
[8]
F. J. Anscombe, « Graphs in statistical analysis, » Am. Stat., 27 (1), p. 1721, 1973.
[9]
R. Andrae, T. Schulze-Hartun et P. Melchior, « Dos and don’ts of reduced chi-squared, » 2010. arXiv preprint : 1012.3754.
Réglage d’un interféromètre de Fabry-Perot
I.1
L’interféromètre de Fabry-Perot est un dispositif interférentiel à division d’amplitude permettant des mesures spectroscopiques de haute précision. Après des rappels d’interférométrie et une exposition du fonctionnement de l’appareil, nous présentons un protocole de réglage. Des méthodes de mesure des principales caractéristiques de l’appareil sont ensuite proposées. L’application de l’interféromètre à la spectroscopie fera l’objet des expériences suivantes.
Sommaire 1 2 3 4 5 6
Introduction . . . . . . . . . . Rappels d’interférométrie . . . Interféromètre de Fabry-Perot . Réglage de l’interféromètre . . Rayons des anneaux et épaisseur Finesse . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
21 22 25 27 30 33
1 Introduction Les interférences sont un phénomène caractéristique de la nature ondulatoire d’un signal [1]. En optique, les premières observations d’interférences datent du début du xviie siècle, et furent expliquées ultérieurement par la nature ondulatoire de la lumière. Elles furent par la suite largement mises à profit, car elles permettent des mesures très précises, notamment de spectroscopie. L’interféromètre de Fabry-Perot fut proposé en 1899 [2] comme concurrent au dispositif de Michelson [3], que celui-ci avait utilisé dans ses fameuses expériences sur l’éther [4]. Le dispositif de Fabry-Perot est composé de deux lames parallèles, partiellement réfléchissantes. Son originalité est qu’il produit des interférences entre un grand nombre d’ondes, ce qui améliore sa sensibilité et la précision de ses mesures par rapport à l’appareil de Michelson. Ce dispositif est encore d’actualité : sous forme de cavités optiques, on le retrouve dans certains lasers [5], ou bien dans les bras des interféromètres LIGO et Virgo [6] utilisés pour détecter les ondes gravitationnelles. Après une brève discussion de la notion d’interférométrie, nous proposons une présentation du fonctionnement de l’interféromètre de Fabry-Perot, puis un protocole de réglage. Dans le but d’utiliser l’appareil en spectroscopie, nous donnons enfin des méthodes de mesure de ses principales caractéristiques : l’épaisseur et la finesse. 21
22
Optique
2 Rappels d’interférométrie 2.1 Obtention des interférences Considérons deux signaux optiques monochromatiques supposés scalaires de pulsations ω1 et ω2 et de même amplitude u0 . Notons u1 = u0 ei(ω1 t+φ1 ) et u2 = u0 ei(ω2 t+φ2 ) leurs représentations complexes. On ne s’intéresse ici qu’à leur évolution temporelle. Par superposition, les deux signaux s’ajoutent et l’intensité mesurée par un détecteur s’écrit [7]
I = K u20 1 + cos (ω2 − ω1 )t + φ2 − φ1 , (1)
où h·i désigne la moyenne temporelle 1 et K une constante positive. Le second terme, responsable des interférences, est non nul seulement si les deux ondes ont la même pulsation ω = ω1 = ω2 . Les deux signaux doivent également être corrélés : leur déphasage φ1 − φ2 ne doit pas varier aléatoirement. Les signaux sont alors dits cohérents entre eux [8]. En optique, la seule solution pratique pour respecter ces conditions est d’utiliser une source unique, et de séparer sa lumière en différentes composantes, qui suivent des trajets différents, pour former des sources secondaires cohérentes entre elles. Mesurer l’intensité I permet ensuite de déduire le déphasage accumulé entre ces trajets suite à la différence de chemins optiques parcourus. Cette différence de marche, notée δ, est définie par φ1 − φ2 = 2π δ/λ, où λ est la longueur d’onde de la source dans le vide. Une option pour obtenir des sources secondaires cohérentes est d’utiliser des dispositifs séparant spatialement le faisceau primaire en faisceaux secondaires, qui se chevauchent sur le champ d’interférence (Fig. 1(a)). On parle alors de division du front d’onde. C’est par exemple le cas des trous de Young. Pour des sources ponctuelles, on peut alors observer les interférences en tout point du champ d’interférence. Ces interféromètres souffrent cependant d’une forte sensibilité à la cohérence spatiale, c’est-à-dire aux fluctuations de phase entre différents points sources séparés spatialement. En effet, les différents points d’une source optique étendue sont a priori des sources incohérentes entre elles. Par exemple, dans le cas d’une lampe spectrale, chaque atome excité émet de la lumière indépendamment de tous les autres. Chaque point de la source crée donc sa propre figure d’interférence, et leur superposition peut brouiller la figure complète. Plus la source est angulairement étendue, plus le brouillage est important 2 . On dit que les sources étendues ont une cohérence spatiale faible.
2.2 Localisation des interférences Il existe cependant des configurations permettant l’utilisation de sources étendues et donc l’observation d’interférences plus lumineuses et contrastées [8, 9]. Considérons un dispositif interférentiel quelconque constitué de deux voies distinctes (1) et (2), comme représenté en Fig. 1(c). On considère les systèmes optiques 1. La moyenne se fait sur une base de temps propre au système de détection [8]. Le temps de réponse de l’œil est de l’ordre de 10−2 s, celui d’une photodiode au mieux de l’ordre de 10−9 s. La période des ondes lumineuses visibles étant de l’ordre de 10−15 s, aucun détecteur ne peut suivre l’amplitude d’un signal optique en temps réel. 2. La forme exacte de la figure d’interférence, en tenant compte de la cohérence spatiale, est donnée par le théorème de Van Cittert-Zernike [8].
I.1 Réglage d’un interféromètre de Fabry-Perot (a)
23
(c)
S A1
S0
(1) M
u1
(b)
S u2
A2
(2)
S
Fig. 1 Schémas de principe des interféromètres à division du front d’onde en (a) et à division d’amplitude en (b). La ligne tiretée représente une lame partiellement réfléchissante. (c) Schéma d’un interféromètre éclairé par une source étendue. Les points A1,2 sont conjugués à M par les optiques des voies (1) et (2) respectivement.
constituant les deux voies comme stigmatiques [1]. On note S un point source, et M un point du champ d’interférence. L’élargissement de la source n’induit pas de brouillage de la figure d’interférence si l’intensité en M , et donc la différence de marche d’après l’Éq. (1), ne dépend pas du point source. Notons S 0 un second point source. Considérons, pour i ∈ {1, 2}, les rayons issus de S et S 0 passant par la voie (i) qui se croisent en M . Par stigmatisme de la voie, il existe des points Ai où les rayons se croisent : Ai est conjugué à M par les optiques de la voie (i). En accord avec le principe de Fermat, le stigmatisme des voies impose que les chemins optiques (Ai M ) ne dépendent pas du chemin suivi par les rayons [1], si bien que (Ai M ) ne dépend pas de la position de la source S 0 . Les différences de marche entre les rayons allant de S et S 0 à M sont alors ( δ(S, M ) = (SM )2 − (SM )1 = (SA2 ) − (SA1 ) + (A2 M ) − (A1 M ) , (2) δ(S 0 , M ) = (S 0 M )2 − (S 0 M )1 = (S 0 A2 ) − (S 0 A1 ) + (A2 M ) − (A1 M ) d’où δ(S 0 , M ) − δ(S, M ) = [(S 0 A2 ) − (SA2 )] − [(S 0 A1 ) − (SA1 )]. La longueur S 0 Ai est donnée par s 2 S 0 S · SAi S0S2 0 0 S Ai = kS S + SAi k = SAi 1 + + . (3) 2 SAi SA2i On obtient donc S Ai = SAi 0
02 1 SS 0 1− SS · ui + O , SAi SA2i
(4)
où ui = SAi /SAi . Ainsi, au premier ordre en SS 0 /SA1 et SS 0 /SA2 , c’est-à-dire pour une source peu étendue par rapport à la distance au dispositif, et pour un
24
Optique
milieu d’indice optique n, δ(S 0 , M ) − δ(S, M ) ' n (u1 − u2 ) · SS 0 .
(5)
Si δ(S 0 , M ) = δ(S, M ), l’intensité en M ne dépend pas du point source et il est alors possible d’obtenir une figure d’interférence contrastée, même si la source est étendue. Cette condition est vérifiée si (u1 − u2 ) · SS 0 = 0, ce que l’on peut obtenir de deux manières différentes. •
•
Soit l’élargissement de la source se fait dans une direction orthogonale aux rayons qui interfèrent. Les interférences restent visibles dans tout le champ d’interférence. Dans le cas de l’expérience des trous de Young, cela revient à remplacer le trou source par une fente fine dans un plan parallèle à l’écran d’observation. Soit les rayons arrivant en M sont tels que u1 = u2 . Ces rayons doivent donc être issus d’un unique rayon incident, ce qui n’est pas possible avec un dispositif à division du front d’onde. Il faut un interféromètre utilisant un miroir partiellement réfléchissant, un dioptre produisant une double réfraction ou un réseau : on parle de division d’amplitude (Fig. 1(b)). Les interférences sont alors les plus contrastées là où se croisent les rayons émergents issus d’un unique rayon incident : c’est le théorème de localisation. Les interféromètres à division d’amplitude permettent donc l’obtention d’interférences lumineuses et contrastées pour des sources étendues, au prix de la localisation des interférences.
Le cas de l’interféromètre de Fabry-Perot est représenté en Fig. 2(a). Le dispositif se compose d’une lame d’air constituée de miroirs partiellement réfléchissants et se fonde donc sur la division d’amplitude. D’un unique rayon incident émergent des rayons parallèles entre eux : les interférences sont localisées à l’infini. Un défaut de parallélisme des lames induit un coin d’air résiduel. La localisation des interférences ne se fait alors plus à l’infini et la figure à l’infini est brouillée. Cette sensibilité aux réglages est d’autant plus prononcée que la source a une grande largeur angulaire. En pratique, le seul dispositif optique rigoureusement stigmatique pour tout point est le miroir plan. L’interféromètre de Fabry-Perot étant constitué, en première approximation, de miroirs partiellement réfléchissants, l’hypothèse de stigmatisme rigoureux de ses voies est valide.
Le cas du laser monomode est particulier, car c’est le seul type de source primaire spatialement cohérente 3 . Une approche naïve serait d’estimer la cohérence spatiale d’un faisceau laser par sa dimension transverse minimale, appelée col (waist en anglais), de l’ordre de quelques millimètres. Mais il faut tenir compte du mécanisme d’émission particulier du laser [3, 5] : comme le milieu émetteur est tout entier synchronisé sur un seul mode de vibration de la cavité résonnante, aucune fluctuation de déphasage ne s’introduit entre les différents points d’émission, et on peut donc considérer parfaite la cohérence spatiale d’un laser. Le principal facteur 3. C’est l’une des raisons pour lesquelles le laser fut une révolution dans le domaine de l’optique. En tant que source intense et cohérente, il permet l’obtention de figures d’interférence contrastées sans contrainte de localisation.
I.1 Réglage d’un interféromètre de Fabry-Perot
25
limitant cette cohérence est la présence de plusieurs modes transverses dans la cavité d’émission, chaque mode étant incohérent avec les autres. Ce point est détaillé beaucoup plus largement dans la Réf. [5]. En conclusion, un interféromètre de Fabry-Perot éclairé par un laser forme des interférences en tout point du champ d’interférence 4 . Si on l’éclaire avec une source étendue comme une lampe spectrale, les interférences sont localisées à l’infini, et un défaut de parallélisme brouille la figure d’interférence à l’infini. Une fois l’interféromètre réglé, la figure d’interférence est lumineuse et contrastée.
3 Interféromètre de Fabry-Perot 3.1 Présentation de l’appareil Un interféromètre de Fabry-Perot est constitué de deux lames partiellement réfléchissantes. Le parallélisme et la distance entre celles-ci se règlent à l’aide de vis. Un schéma simplifié est représenté en Fig. 2(a). Les lames de verre identiques (L1 ) et (L2 ) réfléchissent partiellement la lumière grâce au dépôt d’une fine couche métallique ou d’un traitement multi-diélectrique sur une des faces. Les faces traitées sont placées en regard l’une de l’autre, vers l’intérieur de la cavité, de sorte qu’en transmission tous les rayons utiles traversent chaque lame une seule fois. Les lames étant de même épaisseur et de même indice optique n(λ), les rayons de même longueur d’onde λ parcourent le même chemin optique à l’intérieur des lames. Le déphasage entre deux rayons successifs ne dépend (a)
(b)
(L1 )
(L1 )
(L2 )
(G1 )
(L2 ) ψp+1 K
(F1 )
...
J
θ θ
...
... ...
ψin θ (G2,3 )
ψ1 ψ0 e
(F2,3 )
θ
I
ψp L ψ0
e ψin
Fig. 2 (a) Schéma d’un interféromètre de Fabry-Perot, composé de deux lames partiellement réfléchissantes (L1 ) et (L2 ) et de vis de réglage (G1,2,3 ) et (F1,2,3 ). La face partiellement réfléchissante des lames est représentée par un trait noir épais, et leur espacement est noté e. (b) Trajet d’un rayon dans l’interféromètre. Les rayons réfléchis du côté de la source ne sont pas représentés. 4. Cela est vrai tant que la différence de chemin optique est plus faible que la longueur de cohérence temporelle (de l’ordre de 0,1 m pour un laser HeNe), ce qui est toujours vérifié en pratique. Pour l’interféromètre de Fabry-Perot, la différence de marche maximale est de l’ordre de l’épaisseur de la cavité multipliée par sa finesse (Sec. 6), donc de l’ordre de 1 cm.
26
Optique
donc pas de la longueur d’onde et la dispersion du verre n’affecte pas la figure d’interférence. Les vis de réglage sont situées de part et d’autre de l’interféromètre. Il y en a généralement trois sur chaque lame : (G1 ), (G2 ) et (G3 ), de pas de vis long, assurent un réglage grossier, et (F1 ), (F2 ) et (F3 ) un réglage fin. On utilise dans la suite un étalon Fabry-Perot, pour lequel l’espacement des lames n’est pas réglable en maintenant leur parallélisme : un réglage est nécessaire à chaque changement d’épaisseur de la cavité.
3.2 Intensité transmise On détermine à présent l’intensité transmise par l’interféromètre en un point M à l’infini. On éclaire sous un angle d’incidence θ par une onde plane monochromatique de longueur d’onde λ dans l’air et d’amplitude ψin , comme représenté en Fig. 2(b). Dans toute la suite, on ne tiendra pas compte de la polarisation des ondes, de sorte que le modèle scalaire de la lumière s’applique. Les réflexions multiples entre les lames créent une infinité d’ondes transmises : on note ψp l’amplitude complexe de la (p + 1)-ième onde transmise. Ces ondes interfèrent à l’infini. Le système étant invariant par rotation autour de la normale aux lames, la figure d’interférence est constituée d’anneaux centrés sur l’axe optique, qui est parallèle à cette normale. L’épaisseur des lames de verre n’intervient pas dans le calcul de la différence de marche, car chaque rayon les traverse une fois chacune avec toujours le même angle d’incidence. Par application du théorème de Malus et de la loi du retour inverse de la lumière [1], les chemins optiques entre M et les points L et K sont identiques. Les ondes ψp et ψp+1 sont en phase au point I. En assimilant l’air extérieur et celui entre les lames au vide d’indice optique nv = 1, le déphasage entre ψp et ψp+1 en sortie de l’appareil est donné par φ=
2π (IJ + JK − IL) . λ
(6)
Comme IJ = JK = e/ cos(θ) et IL = 2e sin(θ) tan(θ), on a φ=
4π e cos(θ). λ
(7)
Il nous reste à déterminer l’amplitude des ondes. On note (r, t) les coefficients de réflexion et transmission en amplitude des lames, et (R = |r|2 , T = |t|2 ) ceux en puissance. On les suppose réels : les déphasages de π induits par les réflexions se compensent, car tous les rayons sont réfléchis un nombre pair de fois. Tous les rayons sont également transmis deux fois, ce qui engendre un facteur t2 . Le (p + 1)-ième rayon est réfléchi 2p fois, d’où un facteur r2p . L’amplitude de l’onde en sortie de l’interféromètre est donc ψs =
X p≥0
ψp = ψin t2
X p≥0
r2 eiφ
p
=
ψin T . 1 − Reiφ
(8)
I.1 Réglage d’un interféromètre de Fabry-Perot
1,0
I/Imax
R = 0,5 R = 0,7 R = 0,95
∆φ
0,8
27
δφ
0,6 0,4 0,2 0,0
0
2π
4π
6π
8π
10π
φ (rad)
Fig. 3 Intensité transmise en fonction du déphasage, pour différents coefficients de réflexion. L’intensité est donnée par la fonction d’Airy de l’Éq. (9). ∆φ est la distance entre deux maxima successifs et δφ est la largeur à mi-hauteur d’un pic.
En prenant le module carré, l’intensité peut se mettre sous la forme I(φ) = K |ψs |2 =
Imax , 1 + m sin2 (φ/2)
(9)
où Imax = K|ψin |2 T 2 /(1−R)2 et m = 4R/(1−R)2 . La fonction I(φ) est une fonction d’Airy, représentée en Fig. 3. À e et λ fixées, elle ne dépend que de l’angle d’incidence θ. Elle présente des pics prononcés, qui apparaîtront comme des anneaux sur la figure d’interférence observée à l’infini. Ces pics correspondent aux annulations de sin2 (φ/2), qui ont lieu pour φ = 2kπ, k ∈ Z. L’entier k est l’ordre d’interférence et numérote les maxima. Pour obtenir un grand nombre d’anneaux, il faut éclairer l’interféromètre sous un maximum d’angles d’incidence. On formera donc l’image de la source sur les lames, avec un faisceau d’ouverture angulaire la plus grande possible. Cela permet d’avoir davantage de points expérimentaux pendant l’analyse des images, et in fine de réduire les incertitudes expérimentales au cours des ajustements linéaires. On a ici supposé les coefficients de réflexion et transmission, appelés coefficients de Fresnel [10], indépendants de l’angle d’incidence. Ce n’est qu’une approximation. Par symétrie de révolution autour de l’axe optique, la dépendance en θ est paire et donc nulle au premier ordre en θ. L’évaluation du terme de deuxième ordre pour une lame métallique mince est laborieuse.
4 Réglage de l’interféromètre Le protocole de réglage du parallélisme entre les lames que nous proposons est en grande partie tiré des Réf. [11, 12].
28
Optique
(a)
(b)
(c)
(FP) Laser
´ Ecran Fig. 4 (a) Schéma du montage pour le réglage préliminaire de l’étalon FabryPerot à l’aide d’un laser. Photographies des figures obtenues (b) avant ajustement du parallélisme et (c) après.
4.1 Réglage préliminaire avec un laser Choisir l’épaisseur de réglage à l’aide des vis grossières. L’une d’elles doit être munie d’un vernier permettant un choix approximatif de l’épaisseur de l’interféromètre : nous la noterons (G3 ). Le choix de l’épaisseur de l’interféromètre est dicté par les mesures spectroscopiques à réaliser. Cela sera discuté dans l’Exp. I.2, « Spectroscopie à l’aide d’un interféromètre de Fabry-Perot ». Ici, on peut prendre e ' 1 mm.
Régler les vis de réglage fin à mi-course, afin de laisser de la marge pour le réglage de précision du parallélisme. Éclairer l’interféromètre avec un laser en incidence normale sur la première lame, de telle sorte que le faisceau arrive au centre des lames, et placer un écran parallèle aux lames à environ un mètre en sortie de l’interféromètre (Fig. 4(a)). On observe de multiples taches, comme en Fig. 4(b), correspondant aux réflexions multiples sur les lames. On observe en fait trois séries de taches, dont deux de plus faible intensité, provenant de réflexions résiduelles sur les faces externes des lames partiellement réfléchissantes. Les lames sont légèrement prismatiques afin de rejeter ces réflexions parasites lorsque les faces internes sont parallèles, et permettent d’éviter un effet Fabry-Perot au sein des lames de verre [11].
Régler le parallélisme en utilisant les vis (G1 ) et (G2 ) pour superposer les taches (Fig. 4(c)). On prendra soin de ne pas toucher à (G3 ) afin de ne pas modifier l’épaisseur. On peut éventuellement régler le parallélisme plus finement en utilisant un faisceau élargi. Placer un objectif de microscope ou une lentille de très courte focale en sortie du laser. Régler le laser et la lentille pour que l’interféromètre soit éclairé de manière uniforme. Si le parallélisme est bon, on observe des anneaux très fins et centrés sur l’axe optique. Sinon, agir de nouveau sur (G1 ) et (G2 ) pour centrer les anneaux. En utilisant une lentille de courte focale, on éclaire l’interféromètre avec un large éventail d’angles d’incidence et on augmente le nombre d’anneaux observables.
I.1 Réglage d’un interféromètre de Fabry-Perot
29
D´epoli (FP) Lampe
Condenseur
Lentille
´ Ecran
Fig. 5 Schéma du montage de réglage avec une lampe spectrale. Le dépoli n’est utilisé que lorsqu’on regarde directement dans l’interféromètre, et dans ce cas le condenseur n’est pas nécessaire. La forte cohérence spatiale du laser permet l’observation d’interférences contrastées quelle que soit la position de l’écran. Élargir le faisceau ne change pas cette propriété.
4.2 Réglage avec une lampe spectrale Pour affiner le réglage, on utilise une lampe spectrale. Cette source étant spatialement incohérente, la figure d’interférence est bien plus sensible au réglage de l’inclinaison des lames. La figure d’interférence étant localisée, on l’observe sur un écran dans le plan focal image d’une lentille convergente, ou bien directement à l’œil en regardant la source à travers les lames et un dépoli (sauf pour une source dangereuse, comme un laser), ou bien encore grâce à un appareil photographique (voir Sec. 4.3). Éclairer l’interféromètre avec une lampe spectrale. Faire converger la lumière sur les lames à l’aide d’un condenseur, comme indiqué sur la Fig. 5. L’idéal est d’utiliser une lampe dont on peut isoler une composante monochromatique. Nous avons choisi une lampe à vapeur de cadmium et un filtre pour sélectionner la raie rouge de longueur d’onde 643,8 nm. Des lampes à vapeur de sodium ou de mercure sont également de bons choix. Placer un verre dépoli entre le condenseur et l’interféromètre pour regarder la source à travers les lames sans risque pour l’œil. Si le réglage préliminaire du parallélisme est correct, on observe des anneaux. Cependant, si ces anneaux rentrent ou sortent du centre de la figure lorsqu’on déplace l’œil le long d’un diamètre des lames, c’est que le parallélisme n’est pas parfait. Ce mouvement des anneaux trahit des variations d’épaisseur le long du diamètre parcouru. Déplacer l’œil vers une des vis de réglage grossier. Si les anneaux semblent rentrer vers le centre de la figure d’interférence, desserrer légèrement la vis. Si, au contraire, les anneaux semblent sortir, serrer légèrement la vis. Les vis étant placées à 120◦ les unes des autres, leurs influences sur l’inclinaison des lames ne sont pas indépendantes : itérer l’opération précédente. On peut à présent utiliser (G3 ), car les modifications d’épaisseur sont minimes. Utiliser les vis de réglage fin quand le déplacement des anneaux est faible. Lorsqu’un œil fixe situé en face des lames observe la figure d’interférence, il n’utilise qu’une petite portion de l’interféromètre pour laquelle l’épaisseur est quasi
30
Optique uniforme. Mais lors d’un déplacement de l’œil le long d’un diamètre, l’épaisseur varie si les lames ne sont pas parallèles. Le rayon Rk de l’anneau d’ordre k croît avec l’épaisseur e (Éq. (12)), donc si l’épaisseur diminue le long d’un diamètre menant à une vis, le rayon diminue et l’anneau semble rentrer vers le centre de la figure d’interférence. Il faut desserrer la vis afin de réduire la variation d’épaisseur. À l’inverse, si l’épaisseur augmente, l’anneau semble sortir de la figure et il faut serrer la vis.
Placer en sortie de l’interféromètre une lentille convergente de grande distance focale, environ un mètre, et projeter la figure d’interférence sur un écran placé dans son plan focal image. Il est également possible d’utiliser un appareil photographique (voir Sec. 4.3). Si le parallélisme est correctement réglé, le contraste est uniforme et on peut procéder aux mesures. Une lentille de grande distance focale permet d’obtenir une image large mais au détriment de l’éclairement. Un compromis est nécessaire.
4.3 Étalonnage de l’appareil de mesure Toute mesure sur la figure d’interférence nécessite sa projection, car en sortie de l’interféromètre la figure d’interférence est localisée à l’infini. L’utilisation d’une lentille de projection n’est pas toujours optimale, car la figure d’interférence est souvent peu lumineuse. Nous avons choisi de prendre des images de la figure avec un appareil photographique en visant directement à travers l’interféromètre. Il faut alors mesurer la distance focale de l’objectif et la taille d’un pixel, afin d’extraire des informations quantitatives à partir des photographies. Pour ce faire, on projette à l’infini l’image d’un objet de taille connue à l’aide d’une lentille de focale f10 . On prend alors une photographie de cette image, en vérifiant préalablement que la même mise au point de l’appareil photographique permet de voir nets cette image et les anneaux d’interférence, les deux étant à l’infini. En notant AB la taille de 0 la taille de l’image en pixels, la focale en pixels fpx de l’appareil l’objet et A0 Bpx photographique est donnée par fpx =
0 A0 Bpx f10 . AB
(10)
Si l’appareil photographique est choisi comme système de projection, il faut remplacer f 0 par fpx dans les résultats de cette expérience et celles utilisant le Fabry-Perot comme instrument de mesure : Exp. I.2, « Spectroscopie à l’aide d’un interféromètre de Fabry-Perot », I.3, « Décalage isotopique hydrogène-deutérium » et I.4, « Effet Zeeman ».
5 Rayons des anneaux et épaisseur Une fois l’interféromètre réglé, c’est la mesure des rayons des anneaux qui permet ensuite la mesure des caractéristiques de l’appareil et les applications à la spectroscopie. Nous présentons ici leur expression en fonction des propriétés de l’appareil et de la lampe, puis comment l’utiliser pour mesurer l’épaisseur e.
I.1 Réglage d’un interféromètre de Fabry-Perot
31
(FP) Rk θk
θk f0 ´ Ecran
Lentille
Fig. 6 Schéma de la projection de la figure d’interférence par une lentille de distance focale f 0 . L’anneau d’ordre k correspond aux rayons sortant de l’interféromètre avec un angle θk et a un rayon Rk sur l’écran.
5.1 Rayons des anneaux Comme la figure d’interférence est localisée à l’infini, on la projette avec une lentille convergente de distance focale f 0 sur un écran placé dans son plan focal image (Fig. 6). Dans le cas d’un étalon d’épaisseur e, éclairé par un rayonnement monochromatique de longueur d’onde λ, l’anneau d’ordre k ∈ Z correspond aux rayons sortant de l’interféromètre avec un angle θk défini par l’accord de phase φk = 2kπ, soit, avec l’Éq. (7), cos (θk ) =
λk . 2e
(11)
Le rayon Rk = f 0 tan (θk ) a pour carré " # 2 2e 2 02 Rk = f −1 . λk
(12)
Ainsi l’anneau de plus faible rayon est celui d’ordre maximal kmax = E (2e/λ) = 2e/λ − ε, où E désigne la partie entière et avec ε ∈ [0, 1[. L’ordre du i-ème anneau visible en partant du centre est alors ki = kmax − (i − 1). Le carré du rayon de cet anneau est finalement, au premier ordre en λ/e, R
(i) 2
=f
02
λ (i + ε − 1) + O e
λ2 e2
.
(13)
On utilisera en pratique des épaisseurs de l’ordre de 1 mm et des longueurs d’onde de l’ordre de 500 nm, si bien que le premier ordre de l’expression précédente sera suffisant pour mesurer l’épaisseur e. En cas d’utilisation d’un appareil photographique, le facteur fpx déterminé en Sec. 4.3 remplace la focale f 0 dans l’Éq. (13).
5.2 Protocole Une fois l’étalon réglé, placer l’appareil photographique en sortie proche de l’interféromètre, et régler la distance focale et la mise au point afin de voir les anneaux
32
Optique
nets. Cela doit correspondre à la bague de mise au point au maximum, la figure d’interférence étant localisée à l’infini. Prendre une photographie. Sans toucher au zoom, étalonner l’appareil photographique en mesurant fpx . Pour mesurer la distance focale f10 de la lentille de calibrage, nous avons utilisé la méthode de focométrie dite de Bessel [3]. Cette mesure est à réaliser avec soin, car elle constitue la principale source d’erreur sur fpx , et donc sur toute mesure effectuée par projection.
Pour exploiter l’image, nous traçons le profil d’intensité radial de la figure au moyen de la fonction PlotProfile du logiciel ImageJ [13, 14]. Le profil est moyenné sur quelques pixels dans la dimension transverse à la coupe pour obtenir des pics mieux définis. On veillera néanmoins à ne pas trop augmenter l’épaisseur de moyennage pour éviter un élargissement artificiel des pics et un affaissement de leur maxima. Sans appareil photographique, on peut projeter la figure d’interférence sur un écran et relever les distances manuellement. Cette méthode s’avère limitée par le manque de luminosité pour les expériences de spectroscopie.
5.3 Résultats Nous mesurons l’épaisseur de l’étalon en utilisant une lampe à vapeur de cadmium et un filtre rouge sélectionnant la raie de longueur d’onde λ = 643,8 nm. La (a)
(b)
(c) I/Imax
1,0 0,5 0,0
0
500
1000
1500
2000
2500 Pixel
3000
3500
4000
4500
Fig. 7 (a) Photographie de la figure d’interférence d’une lampe à vapeur de cadmium munie d’un filtre rouge pour une épaisseur de (2,513 ± 0,006) mm. (b) Pho0 tographie de calibrage de l’appareil photographique. Ici A0 Bpx = (3183 ± 2) px. (c) Profil d’intensité normalisé pour une coupe radiale de la photographie.
I.1 Réglage d’un interféromètre de Fabry-Perot
33
R(i) 2 (106 px2 )
5
4
2
1
0 0,0
0,2
0,4 0,6 0,8 2 ifpx λ (104 px2 · m)
1,0
1,2
Fig. 8 Carré du rayon d’un anneau R(i) (en px2 ) en fonction de son numéro i, pour un réglage avec une lampe à vapeur de cadmium et un filtre rouge. Un ajustement 2 affine R(i) 2 = a ifpx λ + b donne a = (398 ± 1) m−1 et b = (−1,5 ± 0,2) × 104 px2 .
Fig. 7 présente l’image exploitée, son profil d’intensité, et la photographie de calibrage de fpx . Pour le calibrage, nous avons utilisé une lentille de distance focale f10 = (16,3 ± 0,1) cm et pour objet une règle de largeur AB = (2,031 ± 0,001) cm, mesurée au palmer. On obtient fpx = (255 ± 2) × 102 px. L’évolution du carré des rayons R(i) en fonction de leur numéro de position i sur la figure est présentée en 2 λ est 2ifpx λ ∆fpx , avec ∆fpx l’incertitude sur Fig. 8. L’incertitude sur l’abscisse ifpx la mesure de la distance focale fpx . Elle est linéaire en i, ce qui explique sa croissance 2 et l’importance de minimiser ∆fpx . Un ajustement affine R(i) 2 = a ifpx λ + b donne −1 4 2 a = (398 ± 1) m et b = (−1,5 ± 0,2) × 10 px . Le modèle donné en Éq. (13) est donc vérifié et l’épaisseur e = 1/a est de (2,513 ± 0,006) mm. Toutes les épaisseurs données dans les expériences suivantes utilisant l’interféromètre de Fabry-Perot ont été mesurées de manière similaire.
6 Finesse La fonction d’Airy, représentée en Fig. 3, comporte des maxima également espacés, correspondant aux anneaux de la figure d’interférence. Pour un coefficient R proche de 1, on obtient des interférences très contrastées : les pics sont très fins et bien séparés. Pour quantifier cela, on définit la finesse F=
∆φ , δφ
(14)
où ∆φ désigne l’écartement entre les pics et δφ la largeur à mi-hauteur d’un pic. Les maxima de I sont numérotés par l’ordre d’interférence k ∈ Z et correspondent aux déphasages φ = 2kπ, donc l’écart de déphasage entre deux pics successifs vaut ∆φ = 2π.
(15)
34
Optique
Par définition de δφ, δφ Imax I 2kπ + = 2 2
=⇒
4 δφ ' √ , m
(16)
dans la limite δφ 1, valable pour R ' 1. La finesse théorique du Fabry-Perot a donc pour expression √ √ ∆φ π m π R F= ' = . (17) δφ 2 1−R
La finesse quantifie la qualité de l’interféromètre en matière de résolution spectrale. Si F 1, les pics sont fins et il est alors possible de distinguer des longueurs d’onde proches, comme nous le verrons dans l’Exp. I.2, « Spectroscopie à l’aide d’un interféromètre de Fabry-Perot ». En pratique, la finesse de l’instrument est réduite par d’autres facteurs (défauts de planéité des miroirs, non-monochromaticité de la source, etc.). On gardera donc à l’esprit que la finesse instrumentale, que l’on mesure, est toujours plus faible que la finesse théorique. Pour un étalon de laboratoire d’enseignement, on peut espérer une finesse instrumentale F ' 10, à comparer à F = 2 pour un interféromètre de Michelson, pour lequel I varie de façon sinusoïdale [3].
6.1 Méthode de mesure Il est possible de mesurer la finesse instrumentale de l’étalon à partir d’un système d’anneaux. Puisque la finesse est définie comme le rapport entre la distance séparant deux pics successifs et la largeur d’un pic, considérons la distance entre les anneaux d’ordre k + 1 et k − 1. Dans la limite continue k 1, 2 dRk 2 2ef 0 Rk−1 − Rk+1 ' −2 = . (18) dk Rk k 3 λ On a, dans le cas le plus défavorable, e de l’ordre de 0,1 mm et λ de l’ordre de 500 nm, d’où k ' 400, ce qui justifie notre approximation. Le rayon des anneaux est une fonction décroissante de l’ordre d’interférence, ce qui explique que Rk−1 > Rk+1 .
On définit également la largeur δRk d’un anneau comme la largeur à mi-hauteur du pic correspondant de la fonction d’Airy (Fig. 3). Avec les définitions de la Sec. 3, elle est associée à la phase φ0k = 2kπ + δφ/2. L’angle θk0 correspondant vérifie λ δφ λk 1 cos (θk0 ) = k+ = 1+ , (19) 2e 4π 2e 2kF d’après les Éq. (7) et (17). On en déduit le rayon Rk0 = Rk − δRk /2 associé " # 2 2e 1 2 02 (Rk − δRk /2) = f 2 −1 . λk (1 + 1/2kF)
(20)
I.1 Réglage d’un interféromètre de Fabry-Perot
35
Comme le rayon Rk décroît avec k et que δRk est positif, c’est bien la distance Rk − δRk /2 et non Rk + δRk /2 qui correspond à l’angle 2πk + δφ/2.
L’épaisseur des anneaux étant négligeable devant leur diamètre et la finesse étant au moins de l’ordre de l’unité, nous considérons les limites δRk Rk et kF 1, pour lesquelles, avec l’Éq. (12), 2 1 2ef 0 1 . (21) δRk ' F λ Rk k 3 Le rapport des Éq. (18) et (21) donne pour expression de la finesse F'
Rk−1 − Rk+1 . 2 δRk
(22)
En pratique, on ne connaît pas l’ordre d’interférence k, mais le numéro i de l’anneau en partant du centre (l’anneau i = 1 étant celui de plus faible rayon). Considérons le i-ème anneau, d’ordre d’interférence ki . Le rayon Rki étant une fonction décroissante de ki , les anneaux i + 1 et i − 1 ont pour ordre d’interférence respectif ki − 1 et ki + 1. Ainsi la finesse devient F'
R(i+1) − R(i−1) . 2 δR(i)
(23)
C’est cette équation qui nous permettra de mesurer la finesse de l’étalon, et donc d’estimer si l’interféromètre possède une finesse suffisante pour résoudre deux longueurs d’onde proches, comme nous le verrons dans l’Exp. I.2, « Spectroscopie à l’aide d’un interféromètre de Fabry-Perot ». Cette expression est très similaire à la définition de la finesse F = ∆φ/δφ, mais elle porte directement sur les rayons R des anneaux. Cela n’avait a priori rien d’évident, I(R) n’étant pas une fonction d’Airy.
Cette formule donne une finesse expérimentale, diminuée par les caractéristiques de la source et par les pertes réelles dans la cavité formée par les lames (Sec. 6.3).
6.2 Résultats Nous mesurons la finesse de l’étalon à l’aide des données de la Fig. 7. Une vérification de la relation (23) est proposée en Fig. 9. Un ajustement affine R(i+1) − R(i−1) = a 2 δR(i) + b donne a = 4,6 ± 0,2 et b = (−8 ± 5) px. La loi est donc vérifiée, et on obtient une finesse F = 4,6 ± 0,2.
(24)
Comme attendu, c’est une valeur assez faible pour un étalon Fabry-Perot, à comparer avec les finesses atteignables en laboratoire, d’environ 104 [15]. Elle est cependant supérieure à celle d’un interféromètre de Michelson, qui est de 2 par définition. Cette finesse sera suffisante pour les mesures faites dans les Exp. I.2, « Spectroscopie à l’aide d’un interféromètre de Fabry-Perot », I.3, « Décalage isotopique hydrogènedeutérium » et I.4, « Effet Zeeman ».
36
Optique
R(i+1) − R(i−1) (px)
300 250 200 150 100 20
30
40
50
60
70
2 δR(i) (px)
Fig. 9 Écart entre les rayons R(i+1) − R(i−1) (en px) en fonction du double de la largeur à mi-hauteur δR(i) du rayon de numéro i, pour un réglage avec une lampe à vapeur de cadmium et un filtre rouge. Un ajustement affine R(i+1) − R(i−1) = a 2 δR(i) + b donne a = 4,6 ± 0,2 et b = (−8 ± 5) px.
6.3 L’interféromètre de Fabry-Perot comme cavité optique L’originalité de l’interféromètre de Fabry-Perot par rapport à d’autres interféromètres vient de sa nature de cavité optique, qui fait de lui un résonateur optique. La plupart de ses caractéristiques se comprennent à partir des propriétés générales des oscillateurs. En particulier, on peut expliquer pourquoi la finesse expérimentale est bien plus faible que celle, théorique, donnée par l’Éq. (17) ; pour un coefficient de réflexion en puissance R = 0,95, typique d’un Fabry-Perot d’enseignement, on attendait F ' 60. Pour mesurer expérimentalement le coefficient R, on pourra consulter la Réf. [12].
L’évolution de l’amplitude scalaire u dans l’espace assimilé au vide entre les lames est décrite par l’équation de d’Alembert. On se limite à une dimension d’espace, selon x, ce qui revient à se restreindre à l’incidence normale sur la cavité : 2 ∂ 2 u(x, t) 2 ∂ u(x, t) − c = 0, (25) ∂t2 ∂x2 où c est la célérité de la lumière dans le vide. Intéressons-nous à une solution sinusoïdale, de la forme 2πx 2πx + u2 (t) sin . (26) u(x, t) = u1 (t) cos λ λ
En supposant que les miroirs sont des conducteurs parfaits, le champ s’annule à leur surface. Les conditions aux limites sont donc u(0, t) = u(e, t) = 0, ce qui impose que les seules longueurs d’onde possibles sont celles vérifiant la condition de résonance λj = 2e/j pour j ∈ N∗ . Les oscillations permises par la cavité se décomposent alors en modes stationnaires orthogonaux de la forme 2πx uj (x, t) = uj (t) sin . (27) λj
I.1 Réglage d’un interféromètre de Fabry-Perot
37
Enfin, en réinjectant dans l’Éq. (25), on obtient l’équation d’évolution temporelle pour un mode : 2 πjc d2 uj + uj (t) = 0. (28) dt2 e Chaque mode a donc pour pulsation propre ωj = πjc/e pour j ∈ N∗ . L’intensité Ij du mode j en sortie de la cavité est proportionnelle à |uj |2 , donc à l’énergie contenue dans ce mode par la cavité. Pour décrire de façon réaliste la dynamique d’un mode j, on introduit les pertes énergétiques de la cavité caractérisées par un facteur de qualité Qj . On discutera ensuite de son lien avec la finesse et des sources de pertes courantes. L’équation d’évolution devient ωj duj d2 uj + + ωj2 uj = f cos(ωt), dt2 Qj dt
(29)
avec f un forçage harmonique représentant ici la lumière incidente sur la cavité. En l’absence de forçage, l’énergie contenue dans la cavité décroît. En moyenne sur une période et pour des pertes faibles (Qj 1), on a hIj i (t) = hIj i (0) e−t/τj ,
avec
τj =
Qj . ωj
(30)
Le facteur de qualité mesure donc le rapport du temps caractéristique de l’amortissement et de la période des oscillations. Dans le cas d’un forçage externe, la réponse en fréquence du mode proche de la résonance (donc, pour ω − ωj ω et Qj 1) est donnée par 2 1 |f | . (31) Ij (ω) = 2 4ωj (ω − ωj )2 + (ωj /2Qj )2
On reconnaît une fonction lorentzienne, centrée sur la pulsation de résonance ωj . La longueur d’onde de résonance est donc λj = 2e/j, comme calculé en Sec. 3. La largeur à mi-hauteur du pic vaut δωj = ωj /Qj . L’intensité totale étant la somme de celles de chaque mode, on retrouve la réponse en fréquence de la cavité prédite par l’Éq. (9) : des lorentziennes régulièrement espacées, dont la largeur dépend des pertes. Cette largeur est mesurée par Qj aussi bien que par F, les deux étant reliés, pour le mode j, par Qj = ωj /δωj = jF (en utilisant la définition F = ∆ω/δωj ). On peut encore réécrire la finesse sous la forme F = 2πτj c/2e, où 2e/c est le temps nécessaire à la lumière pour faire un aller-retour dans la cavité. Puisque τj est le temps d’amortissement du champ dans la cavité, F mesure donc le nombre d’allerretours faits par la lumière avant de sortir de la cavité et d’être perdue. Jusqu’ici, la seule source de perte envisagée était la transmission des miroirs. Toute autre perte s’y ajoutera : on s’attend donc toujours à mesurer une finesse inférieure à celle prévue par l’Éq. (17) 5 . Par exemple, l’étendue transversale finie d’une cavité laser provoque une diffraction et coupe une partie du faisceau lumineux à chaque trajet dans la cavité. 5. On aurait pu s’attendre à une dépendance en T plutôt que R, puisque les pertes se font par transmission. C’est en fait équivalent, puisque T = 1 − R en l’absence d’absorption.
38
Optique De ce fait, le taux de perte en énergie vaut ∆I/I = exp(−2 a2 /w2 ) = κ, avec w la largeur transverse du faisceau laser au niveau des miroirs et a celle de la cavité [16]. Si on note ∆t = e/c le temps de trajet d’un aller dans la cavité, alors I(t) = I(0)eln(1−κ) t/∆t ' I(0)e−tκ/∆t
(32)
dans la limite des pertes faibles. Le facteur de qualité associé vaut Qj = ωj
∆t πj = κ κ
donc
2
F = πe2a
/w2
.
(33)
Pour une cavité Fabry-Perot, on peut rajouter des pertes par absorption des miroirs, par défaut de planéité des lames ou par effet de taille transverse finie : les rayons lumineux non parfaitement alignés s’échappent de la cavité après quelques allers et retours. Le facteur de qualité global est donné par sommation des inverses des différents facteurs de qualité. On peut limiter ces pertes en utilisant une cavité confocale, dont les miroirs paraboliques focalisent le faisceau lumineux à chaque aller-retour. Ceci est discuté en détail dans la Réf. [16]. Les relations et méthodes de mesure présentées dans cette expérience seront utilisées dans les expériences suivantes, où l’interféromètre de Fabry-Perot sera l’appareil de mesure.
Références [1]
M. Bertin, J.-P. Faroux et J. Renault, Optique et physique ondulatoire. Dunod, 1986.
[2]
C. Fabry et A. Perot, « Théorie et applications d’une nouvelle méthode de spectroscopie interférentielle, » Ann. Chim. Phys., 16, p. 115-144, 1899.
[3]
M. Fruchart, P. Lidon, E. Thibierge, M. Champion et A. Le Diffon, Physique expérimentale. De Boeck Supérieur, 2016.
[4]
A. A. Michelson et E. W. Morley, « On the relative motion of the Earth and the luminiferous ether, » Sidereal Messenger, 6, p. 306-310, 1887.
[5]
B. Cagnac et J.-P. Faroux, Lasers. EDP Sciences, 2002.
[6]
F. Cavalier, P. Hello et N. Leroy, « Virgo et la quête des ondes gravitationnelles, » Images de la physique, 2010.
[7]
D. Mauras, Optique physique et électronique. PUF, 2001.
[8]
J.-R. Champeau, R. Carpentier et I. Lorgeré, Ondes lumineuses. De Boeck, 2009.
[9]
J.-M. Brébec, T. Desmarais, A. Favier, M. Ménétrier et al., Optique ondulatoire : 2 nde année MP-MP*-PC-PC*-PSI-PSI*-PT-PT*. Hachette, 2004.
[10]
C. Garing, Ondes électromagnétiques dans le vide et les milieux conducteurs. Ellipses, 1998.
[11]
R. Duffait, Expériences d’optique. Bréal, 2000.
[12] Sextant, Optique expérimentale. Hermann, 1997.
I.1 Réglage d’un interféromètre de Fabry-Perot
39
[13]
National Institutes of Health and Laboratory for Optical and Computational Instrumentation. (2014). ImageJ, image processing and analysis in Java, adresse : https://imagej.net/ (visité le 06/07/2019).
[14]
C. A. Schneider, W. S. Rasband et K. W. Eliceiri, « NIH Image to ImageJ: 25 years of image analysis, » Nat. Methods, 9 (7), p. 671-675, 2012.
[15]
A. Rakhman, M. Hafez, S. Nanda, F. Benmokhtar et al., « A high-finesse Fabry-Perot cavity with a frequency-doubled green laser for precision Compton polarimetry at Jefferson Lab, » Nucl. Instrum. Methods Phys. Res. A, 822, p. 82-96, 2016.
[16]
D. Hennequin, V. Zehnlé et D. Dangoise, Les lasers, 3e éd. Dunod, 1999.
Spectroscopie à l’aide d’un interféromètre de Fabry-Perot
I.2
L’usage principal de l’interféromètre de Fabry-Perot est la spectroscopie optique, c’est-à-dire la mesure des longueurs d’onde lumineuses. L’épaisseur de la cavité de l’interféromètre est le paramètre essentiel de cette mesure, parce qu’elle détermine la résolution du dispositif. Nous donnons ici le critère permettant de choisir cette épaisseur et montrons comment relier le rayon des anneaux d’interférence à la longueur d’onde que l’on cherche à mesurer. Nous illustrons le critère et la méthode de mesure sur l’exemple canonique du doublet jaune du sodium.
Sommaire 1 2 3 4
Introduction à la spectroscopie . . Choix de l’épaisseur . . . . . . . . Méthode de mesure . . . . . . . . Étude du doublet du sodium . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
40 42 43 44
1 Introduction à la spectroscopie La lumière est une vibration du champ électromagnétique. Cette vibration peut se décomposer, par transformée de Fourier, en somme de signaux oscillant à des fréquences déterminées. La spectroscopie consiste à séparer et mesurer ces composantes, c’est-à-dire à établir le spectre de la lumière étudiée. Ce spectre nous renseigne sur la nature de la source observée, en particulier sur sa composition atomique, ou moléculaire. On se concentre, en optique, sur l’intervalle correspondant à la lumière visible, de longueurs d’onde comprises entre 380 nm et 760 nm. La spectroscopie est une technique particulièrement féconde [1] : par exemple, J. Fraunhofer remarqua et catalogua à partir de 1814 des raies sombres dans le spectre de la lumière solaire. Celles-ci correspondent aux longueurs d’onde absorbées par les éléments qui composent les couches externes du Soleil, et permettent donc d’en connaître la composition, ce qu’étudiera G. Kirchhoff en 1859 [2]. Depuis, la spectroscopie est devenue un outil d’importance en astronomie. Au xxe siècle, elle accompagne le développement de la physique atomique, et donc de la mécanique quantique, qui prédit de plus en plus finement les spectres d’émission des atomes. Ce point est approfondi par les Exp. I.3, « Décalage isotopique hydrogène-deutérium » et I.4, « Effet Zeeman ». Développer des spectroscopes de bonne résolution, capables de discerner des longueurs d’onde proches, constitue donc un enjeu majeur. On quantifie cette résolution par le rapport ∆λ/λ, ∆λ étant le plus petit écart de longueurs d’onde que l’appareil est capable de discerner autour de la longueur d’onde λ. 40
41
I.2 Spectroscopie à l’aide d’un interféromètre de Fabry-Perot
Il existe plusieurs façons de décomposer la lumière. Les spectroscopes les plus anciens utilisent des prismes de verre [3, 4] : ce milieu étant dispersif, l’angle de déviation entre le faisceau incident et le faisceau transmis dépend de la longueur d’onde. Néanmoins, la dispersion du verre est faible, ce qui limite la résolution du prisme, et est non linéaire en longueur d’onde, ce qui nécessite une calibration minutieuse. Les spectroscopes utilisent plus souvent des réseaux diffractants. En laboratoire d’enseignement, on peut atteindre une résolution d’environ ∆λ/λ ' 10−3 avec ces dispositifs, soit une précision d’environ 1 nm dans le visible 1 . Pour obtenir une meilleure résolution, on peut utiliser une méthode interférométrique. Par exemple, un interférogramme obtenu à l’aide d’un interféromètre de Michelson permet d’accéder à la transformée de Fourier du spectre de la source. On remonte au spectre lui-même soit par transformée de Fourier inverse, soit en mesurant quelques éléments caractéristiques de l’interférogramme. Cette méthode est développée dans l’Exp. I.5, « Spectroscopie par transformée de Fourier ». Nous détaillons ici comment utiliser l’interféromètre de Fabry-Perot à des fins de spectroscopie, en présentant comment extraire d’une figure d’interférence l’écart entre deux longueurs d’onde proches. Nous verrons notamment que le choix de l’épaisseur de la cavité optique fixe la résolution de l’appareil. Cet interféromètre permet une mesure plus fine que les méthodes à prisme ou à réseau, avec une résolution attendue autour de 10−5 (voir l’Éq. (2)). À titre de comparaison, le Tab. 1 donne quelques écarts de longueurs d’onde de doublets courants ainsi que des ordres de grandeur de largeurs de raies spectrales. Ces largeurs posent des limites importantes à la précision des mesures spectroscopiques. On consultera la Réf. [1] pour un tour d’horizon de la spectroscopie atomique. λ (nm) Doublet du mercure Hg Doublet du sodium Na Décalage isotopique H/D (raie rouge) Effet Zeeman Cd (raie rouge, 500 mT) Structure fine H (raie rouge) Largeur Doppler (500 K, 1 bar) Largeur collisionnelle (500 K, 1 bar)
576,9 et 579,0 589,0 et 589,6 656,10 et 656,28 643,8 656,3
∆λ/λ × 103 3,63 1,01 0,272 0,015 0,008 ' 0,003 ' 0,0002
e (mm) 0,02 0,06 0,26 4,7 8,9
Tab. 1 Quelques ordres de grandeur en spectroscopie optique [5]. La valeur de ∆λ/λ donnée pour l’effet Zeeman a été calculée pour la raie rouge du cadmium et un champ magnétique de 500 mT. Celle pour la structure fine de l’hydrogène est l’écart moyen de l’ensemble des raies présentes. Les largeurs Doppler et collisionnelle sont évaluées à 500 K et 1 bar pour la raie rouge du cadmium. Les mécanismes d’élargissement des raies sont discutés dans les Réf. [6, 7]. Les épaisseurs e sont les bornes inférieures du critère (4) pour l’interféromètre utilisé, de finesse F ' 4,6. 1. Il est difficile de faire mieux, car pour augmenter la résolution d’un réseau, il faut augmenter le nombre de traits éclairés, mais aussi diminuer la largeur de sa fente source, ce qui réduit la luminosité [4].
42
Optique
2 Choix de l’épaisseur Considérons un interféromètre de Fabry-Perot (déjà étudié dans l’Exp. I.1, « Réglage d’un interféromètre de Fabry-Perot », dont on utilisera les définitions et résultats). Il est éclairé par une source dont le spectre comprend un doublet de longueurs d’onde λ1 et λ2 > λ1 . Soient ∆λ = λ2 − λ1 leur écart et λ = (λ1 + λ2 )/2 la longueur d’onde moyenne. On cherche à mesurer ∆λ, tandis que λ est connue, car mesurable à l’aide d’un appareil de plus faible résolution. Les deux raies ayant des fréquences différentes, elles sont incohérentes entre elles. Ainsi, la figure d’interférence obtenue est la superposition des réseaux d’anneaux correspondant à chaque raie. Pour déterminer simplement l’écart ∆λ à l’aide des deux systèmes d’anneaux, il faut respecter deux conditions : (i) les anneaux de même ordre doivent être séparés, et (ii) les anneaux d’ordres différents ne doivent pas se chevaucher (voir Fig. 1). Concernant le point (i), on applique le critère de Rayleigh, selon lequel deux anneaux sont séparables si l’écart en position de leurs maxima est supérieur à leur largeur à mi-hauteur [8]. La séparation entre le pic d’ordre d’interférence k et le pic suivant augmente avec k. Pour une épaisseur de cavité e donnée, on applique le critère à l’ordre le plus élevé visible ; cela correspond aux rayons d’angle d’incidence θk faible, pour lesquels cos(θk ) ' 1, c’est-à-dire au centre de la figure. Pour un interféromètre de finesse F, le pic d’ordre k correspond au déphasage φk = 4πe cos(θk )/λ et a pour largeur à mi-hauteur δφ = 2π/F. La largeur à mi-hauteur est, en termes de longueur d’onde, δλ = λ
I
λ1 : λ2 :
k
δφ λ2 λ2 ' . = φk 2eF cos(θk ) 2eF
...
k+1 k+1 k
| {z }
|
Crit`ere de Rayleigh
k+5 k+6 k+4 k+5
...
{z
Cas favorables
(1)
}
|
{z
}
cos(θ)
Chevauchement d’ordres
Fig. 1 Illustration du critère d’encadrement (4) de l’épaisseur. La courbe rouge représente l’intensité pour la longueur d’onde λ1 en fonction du cosinus de l’angle d’incidence θ, celle en bleu correspond à la longueur d’onde λ2 . L’ordre de chaque pic est indiqué dans la partie supérieure de la figure. Aux faibles ordres, les pics ne sont pas suffisamment séparés selon le critère de Rayleigh. Aux ordres élevés, il y a chevauchement des deux systèmes de pics.
I.2 Spectroscopie à l’aide d’un interféromètre de Fabry-Perot
43
Le critère de Rayleigh prend alors la forme suivante : ∆λ > δλ
⇒
e>
λ2 . 2∆λ F
(2)
Pour respecter le point (ii), la distance entre les pics de même ordre correspondant aux deux longueurs d’onde ne doit pas être trop élevée, de sorte que le pic d’ordre k + 1 de λ1 ne chevauche pas le pic d’ordre k de λ2 . Au centre de la figure d’interférence – zone la plus défavorable – il y a chevauchement si l’on a simultanément 2 2e/λ1 = k + 1 et 2e/λ2 = k, soit e≥
λ2 . 2∆λ
(3)
Cela fixe une borne maximale sur l’épaisseur choisie. Les deux conditions précédentes peuvent se résumer par un encadrement de l’épaisseur e : λ2 1 λ2 σe , les répliques successives commencent à se chevaucher : on parle de repliement de spectre (Fig. 3). Dans ce cas, on ne peut plus reconstituer le spectre exact à partir |TF[I]| Repliement
σ −σe
−σe /2
σe /2 σs
σe
domaine utile
Fig. 3 Densité spectrale de la source (bleu) et répliques dues à la périodisation du spectre (rouge). Un algorithme numérique ne calcule que les valeurs dans la zone colorée (dans le cas d’un signal réel). Si un pic du spectre est attendu au-delà de σe /2, la périodisation le fait alors apparaître à un mauvais nombre d’onde, symétrique de σs par rapport à σe /2.
I.5 Spectroscopie par transformée de Fourier
79
du signal échantillonné, parce que des fréquences parasites se superposent au spectre réel de la source. Il faut donc, pour obtenir un spectre fidèle, que σe /2 > σs . Cette condition s’appelle le critère de Shannon. On le résume souvent par l’affirmation que, pour une sinusoïde, il faut acquérir au moins deux points par période. Enfin, puisque σe /2 est le nombre d’onde maximal que l’on peut mesurer, un algorithme numérique calcule la transformée de Fourier sur l’intervalle [−σe /2, σe /2] seulement.
2.3 Choix de l’interféromètre de Michelson Pour les expériences suivantes, nous choisissons de travailler avec un interféromètre de Michelson, qui est un interféromètre à division d’amplitude (par opposition aux interféromètres à division du front d’onde). Il a notamment été utilisé en 1887 dans la célèbre expérience de Michelson et Morley [11] pour mettre en évidence le mouvement de la Terre par rapport à l’éther. Malgré l’échec de cette expérience, interprété par A. Einstein en 1905 avec la théorie de la relativité restreinte, cet interféromètre est devenu un outil de mesure essentiel. Il a notamment été utilisé pour mesurer la longueur d’onde de la radiation d’une transition entre deux niveaux excités du Krypton 86, qui a servi d’étalon au mètre de 1960 à 1983. Cet interféromètre est, depuis, très largement utilisé, de l’enseignement à la recherche. Combiné à une cavité Fabry-Perot, il a permis la détection en 2016 des ondes gravitationnelles dans les expériences LIGO et Virgo [12]. Certains éléments théoriques concernant cet interféromètre ne sont pas abordés ici : on consultera les Réf. [8, 13]. La Fig. 4 représente l’interféromètre de Michelson, et illustre son fonctionnement en schématisant la marche d’un rayon incident. Il se compose d’une lame séparatrice (semi-réfléchissante), d’une lame compensatrice et de deux miroirs. L’angle entre (F1 )
miroir fixe (M1 )
(C) (S)
(F2 )
(G1 ) (T)
(G2 ) miroir mobile (M2 ) Fig. 4 Schéma d’un interféromètre de Michelson. Le faisceau incident est séparé en deux au niveau de la lame séparatrice (S). Le miroir (M1 ) est fixe alors que le miroir (M2 ) peut être translaté grâce à la vis micrométrique (T). L’angle entre les miroirs est ajustable grâce aux vis de réglages grossier (G1,2 ) et fin (F1,2 ). Une lame compensatrice (C) permet de compenser la dispersion de la différence de marche supplémentaire des ondes qui traversent la lame séparatrice.
80
Optique
ceux-ci, d’environ 90◦ , est ajustable à l’aide de vis (réglage fin et réglage grossier). L’un des deux miroirs est mobile, et peut être translaté. Ce mouvement peut être manuel ou automatisé si l’interféromètre de Michelson est muni d’un moteur. L’onde incidente est divisée en deux au passage de la lame séparatrice. Les deux ondes émergentes se propagent alors chacune dans l’un des bras de l’interféromètre, sont réfléchies sur les miroirs et se recombinent sur la lame séparatrice. Le rôle de la lame compensatrice est de compenser la dispersion de la différence de marche induite par les nombres de passages différents des deux ondes à travers la lame séparatrice. Les ondes interfèrent à la sortie de l’interféromètre. Nous sommes dans un cas d’interférence à deux ondes, et la transformée de Fourier de l’intensité vérifie l’Éq. (6). Figures d’interférence Pour exprimer la différence de marche δ en fonction des paramètres expérimentaux, considérons un interféromètre dit replié, où les axes orthogonaux aux deux miroirs sont superposés, par symétrie suivant le plan contenant la lame séparatrice. On note e la distance séparant les miroirs et α l’angle entre eux (Fig. 5). Deux configurations sont possibles : coin d’air et lame à faces parallèles (ou lame d’air). •
•
Dans la configuration coin d’air (Fig. 5(a)), on se place au contact optique, c’est-à-dire à écartement nul (e = 0) avec un léger angle entre les miroirs (α 6= 0). Pour une incidence normale sur (M1 ), la différence de marche entre les deux bras vaut δ = 2x tan(α), x étant la distance algébrique du rayon incident à l’arête du coin d’air. Elles donnent des franges rectilignes parallèles à l’arête du coin d’air, correspondant aux lignes d’équation x = cste. Dans la configuration lame d’air (Fig. 5(b)), l’angle entre les miroirs est finement ajusté de manière à obtenir α = 0. Pour un rayon d’incidence θ, la différence de marche vaut δ = 2e cos(θ). Les interférences sont des anneaux d’égale inclinaison, d’équation θ = cste. Au centre de la figure d’interférence, la différence de marche ne dépend que de e.
Dans la suite, nous réaliserons des mesures spectroscopiques dans ces deux configurations, qui se différencient par la manière dont on fait varier la différence de (a)
(b)
α (M1 )
(c)
(M1 ) (M2 )
(M2 )
(M1 )
θ+α
I
θ
θ
x
α (M2 )
J
K
x e
O
Fig. 5 Rayons incidents sur les miroirs de l’interféromètre de Michelson replié (a) en configuration coin d’air (e = 0 et α 6= 0) pour une incidence normale, (b) en configuration lame d’air (e 6= 0 et α = 0) et (c) en configuration coin d’air pour un angle d’incidence θ. Le cercle gris en (c) représente les lieux de localisation des interférences lorsque θ varie à x fixé.
I.5 Spectroscopie par transformée de Fourier
81
marche. Dans la configuration coin d’air, la figure d’interférence obtenue sur l’écran donne une portion de l’interférogramme et une photographie suffit à le mesurer. On parle de spectroscopie statique (Sec. 3). En configuration lame d’air, il faut modifier l’épaisseur e pour modifier δ. On parle de spectroscopie dynamique (Sec. 4). Localisation Lors d’une observation avec une source étendue, les interférences sont localisées, comme détaillé dans l’Exp. I.1, « Réglage d’un interféromètre de Fabry-Perot ». D’après le théorème de localisation, les interférences les plus contrastées sont localisées là où se croisent les rayons émergents issus d’un unique rayon incident. Dans le cas de la lame d’air, le théorème indique une localisation exacte à l’infini, ce qui permet d’obtenir une figure d’interférence très lumineuse en élargissant la source. Le cas du coin d’air est plus délicat : le point de localisation, noté K, se déplace en fonction de l’angle θ d’incidence sur (M1 ) 4 (Fig. 5(c)). Ainsi, autour d’une zone de localisation située proche des miroirs, la différence de marche entre les ondes donnant des interférences en K dépend de θ, et donc de la taille de la source. Calculons cette dépendance. On suppose que le système de projection utilisé pour observer la figure d’interférence est stigmatique. Ainsi, quel que soit θ, le point K est conjugué à un point d’observation M [15], pour lequel on calcule la différence de marche entre les deux rayons représentés sur la Fig. 5(c). Par stigmatisme, tous les rayons reliant K à M parcourent le même chemin optique. Les ondes qui interfèrent n’accumulent une différence de marche qu’entre I et K, qui vaut δ(θ, x) = IJ + IK − JK dans les notations de la Fig. 5(c) 5 . En appliquant la loi des sinus dans le triangle OIJ, on obtient que IJ = x sin (α)/ cos (θ + α). En l’appliquant à nouveau dans le triangle IJK, il vient ! sin 2(θ + α) JK x sin (α) sin (2θ) IK − = 1+ − δ(θ, x) = IJ 1 + IJ IJ cos (θ + α) sin (2α) sin (2α) = 2x tan (α) cos (θ). (12) Autour de l’incidence normale, la dépendance de δ en θ n’intervient qu’à l’ordre 2. Supposons que la source a une taille angulaire 2θmax . Il y a superposition d’une frange claire et d’une sombre en x si δ(0, x) − δ(θmax , x) = λ/2. On ne peut obtenir 2 un bon contraste qu’en vérifiant 2x tan (α) . λ/θmax . C’est une limitation intrinsèque de la méthode statique : pour augmenter la différence de marche maximale observable δmax = 2xmax tan (α), on doit diminuer la taille de la source, et donc la luminosité des franges. Le stigmatisme rigoureux n’est possible que pour un couple de points donné. Le point K se déplaçant avec l’angle θ, cette hypothèse n’est ici qu’une approximation.
3 Spectroscopie statique 3.1 Principe de la mesure Dans cette première expérience, nous travaillons en coin d’air, en nous appuyant sur la Réf. [16]. L’objectif de la méthode de spectroscopie qui est présentée ici est 4. Il décrit un cercle passant par O, I et l’intersection du miroir M2 avec l’incidence normale [14]. 5. Le chemin optique d’une portion virtuelle du chemin suivi par un rayon est compté négativement [15].
82
Optique
d’obtenir des spectres rapidement sur une grande gamme de longueurs d’onde. Le principe de la technique est le suivant : avec un interféromètre de Michelson réglé en coin d’air et éclairé en lumière parallèle (Fig. 5(a)), on obtient des franges d’interférence, dont le profil d’intensité constitue l’interférogramme. On les enregistre, par exemple avec un appareil photographique, pour en calculer la transformée de Fourier. En considérant une source de taille angulaire d’environ 4◦ , on s’attend d’après la Sec. 2.3 à une différence de marche maximale observable de δmax ' 1 × 10−4 m à λ = 500 nm, qui se traduit par une meilleure résolution atteignable de ∆λ ' 2 nm d’après l’Éq. (10). Le spectromètre ainsi constitué ne permet donc pas de faire des mesures de haute précision. Son intérêt réside plutôt dans la rapidité de l’acquisition. Comme les interférences sont localisées au voisinage des miroirs, on fait l’image de ceux-ci sur l’appareil de mesure. En injectant l’expression de la différence de marche dans l’Éq. (1), l’intensité observée pour une source monochromatique prend alors la forme 4π tan(α)X , (13) I(X) = I0 1 + cos λGt où X est l’abscisse sur l’image produite et Gt le grandissement transversal du dispositif d’imagerie. Le facteur tan(α)/Gt est a priori inconnu, et il faut donc le déterminer par étalonnage. On enregistre dans les mêmes conditions, c’est-à-dire sans modifier aucun réglage ni paramètre d’acquisition, l’interférogramme d’un laser de longueur d’onde d’émission λréf connue. La transformée de Fourier de l’interférogramme comporte alors un unique pic. En désignant par Σ la variable de Fourier conjuguée à X, le pic est positionné en Σréf = 2 tan(α)/λréf Gt . La calibration donne une abscisse en longueur d’onde Σréf λréf , (14) Σ où Σ est l’abscisse de la transformée de Fourier de l’interférogramme de la source initiale. Nous privilégions ici la précision à la facilité d’utilisation, et choisissons de travailler avec un appareil photographique et non une barrette CCD pour réaliser les acquisitions. Le grand nombre de pixels CCD d’un appareil photographique permet l’acquisition précise d’un interférogramme. Pour donner un ordre de grandeur, les barrettes CCD que l’on trouve dans le commerce et l’enseignement possèdent quelques milliers de pixels (2000 pour les plus courantes à 4000 pour une barrette de très haute définition). Quant aux appareils photographiques, ils en possèdent de 5 à 30 millions, répartis sur un plan, soit à peu près 5000 dans une rangée pour l’appareil que nous avons utilisé. Un autre avantage de l’appareil photographique est son réseau bidimensionnel de pixels, qui permet de moyenner l’intensité dans la direction de différence de marche constante. On améliore ainsi le rapport signal sur bruit. Cette méthode de mesure permet aussi de ne pas se préoccuper de l’angle entre les franges et le capteur, car cet angle peut être ajusté a posteriori. L’appareil photographique permet enfin de s’affranchir des lentilles de projection externes, qui peuvent causer de la distorsion, étant souvent de moins bonne qualité que celles de l’appareil. Son utilisation a cependant pour inconvénient le format des données. Les capteurs CCD délivrent une tension proportionnelle à l’intensité, mais cette linéarité λ=
I.5 Spectroscopie par transformée de Fourier
83
est perdue suite à la conversion des données aux formats usuellement utilisés en photographie (JPEG, TIFF, etc.). Elle est cependant primordiale : si l’on mesure une fonction non linéaire de I, la transformée de Fourier du signal mesuré n’est plus représentative du spectre de la source. Nous avons donc eu recours au logiciel externe libre dcraw [17], qui permet une conversion des données de l’appareil photographique vers un format qui conserve la linéarité (voir le Comp. C pour une discussion plus détaillée).
3.2 Protocole Nous ne donnons ici que les grandes lignes du réglage de l’interféromètre de Michelson. On pourra consulter les Réf. [5, 8] pour un protocole de réglage plus précis et les justifications des différentes étapes. Régler le parallélisme des lames séparatrice et compensatrice à l’aide d’un laser. Pour cela, les éclairer en incidence normale et observer des taches sur un écran placé derrière les lames et dans l’alignement du laser. Faire se superposer les taches observées en jouant sur les vis de réglage de ces lames. En élargissant le faisceau laser 6 , illuminer les deux miroirs. On observe alors des anneaux ou fractions d’anneaux à l’écran. Si on observe uniquement des fractions d’anneaux, diminuer l’angle entre les miroirs avec les vis (G1,2 ) jusqu’à obtenir des anneaux. Si les anneaux ne sont pas vraiment circulaires mais plutôt elliptiques, cela provient d’un mauvais réglage du parallélisme des lames séparatrice et compensatrice. Vérifier que la première étape a été bien réalisée.
Translater (M2 ) pour faire rentrer les anneaux, de façon à s’approcher du contact optique. On peut ajuster en alternance l’angle entre les miroirs plus finement grâce aux vis (F1,2 ) de manière à centrer les anneaux. Une fois les anneaux rentrés au maximum, on se trouve alors proche du contact optique. Introduire un léger angle entre les miroirs à l’aide des vis de réglage fin, de manière à observer des franges rectilignes sur l’écran. L’interféromètre de Michelson est alors réglé en coin d’air et au contact optique. La zone de localisation est d’autant moins étendue que ce réglage est précis (Sec. 2.3). On peut maintenant passer à l’utilisation de la lampe dont on veut mesurer le spectre. Éclairer l’interféromètre avec la source (par exemple une lampe spectrale à vapeur de mercure) placée au foyer objet d’une lentille, de manière à ce que le faisceau incident sur les miroirs soit le plus parallèle possible. Cela permet d’avoir une figure contrastée. On obtient alors des interférences localisées sur les miroirs. Plus l’éclairage est parallèle, plus la différence de marche maximale atteignable est grande.
On peut, si on désire observer les interférences sur un écran, faire l’image des miroirs sur cet écran grâce à une lentille de projection. Si un appareil photographique est utilisé, faire directement la mise au point sur les miroirs, sans lentille de projection. 6. Le réglage de l’interféromètre est plus facile à réaliser au laser, celui-ci étant une source spatialement et temporellement cohérente.
84
Optique On peut intercaler entre l’interféromètre et la lentille/l’appareil photographique deux polariseurs pour pouvoir contrôler facilement l’intensité arrivant sur le capteur 7 .
Augmenter l’angle entre les miroirs pour diminuer l’interfrange et ainsi couvrir un plus grand intervalle de différence de marche. Des franges verticales facilitent l’exploitation. Prendre une photographie de la figure d’interférence. Attention : une fois la photographie prise, il ne faut plus toucher aux réglages de l’interféromètre de Michelson ni de l’appareil (en particulier la mise au point et le zoom qui déterminent la distance focale du système de projection) avant d’avoir pris la photographie étalon avec le laser. Il peut être utile de prendre également des photographies, sans modifier les paramètres, en cachant chacun des miroirs. Ces dernières peuvent servir à retirer le fond lors de l’analyse des résultats, s’il est inhomogène. Cette étape n’est cependant pas nécessaire si le fond ne présente pas de forte inhomogénéité.
Remplacer la source par un laser de longueur d’onde connue et, sans rien modifier au montage, prendre une photographie. Cette dernière servira d’étalon.
3.3 Méthode d’analyse : exemple d’un filtre interférentiel Le spectre le plus simple à étudier est celui d’une lampe quartz-iode, suivie d’un filtre interférentiel. Pour un filtre à 620 nm nous observons la figure d’interférence présentée Fig. 6(a). Dans le but d’obtenir un interférogramme exploitable, nous avons converti les photographies, en suivant la procédure décrite dans le Comp. C, pour que l’intensité de l’image soit proportionnelle à l’intensité lumineuse mesurée. Nous avons ensuite utilisé le logiciel ImageJ [18, 19] pour obtenir le profil d’intensité d’une section transverse de la figure d’interférence et pour moyenner le profil le long des franges sur quelques pixels de manière à augmenter le rapport signal sur bruit 8 . L’interférogramme obtenu est donné Fig. 6(c). On trouve un profil analogue à celui de la Fig. 1(d), correspondant bien à un spectre contenant une unique raie large. La figure d’interférence et l’interférogramme utilisés pour la calibration du spectre sont présentés Fig. 6(b) et 6(d). L’interférogramme a été obtenu par les mêmes traitements que précédemment. Nous avons utilisé un laser vert de longueur d’onde λréf = 543,5 nm, dont le faisceau a été élargi par un objectif de microscope. On remarque des irrégularités sur la crête supérieure de son interférogramme, dues à des défauts de cet objectif et à des tavelures (speckle en anglais) [5]. La crête inférieure ne tombe pas à zéro, trahissant la présence d’une lumière parasite uniforme qui ne perturbe pas l’analyse. Pour calculer les spectres à partir des interférogrammes, nous utilisons la transformée de Fourier rapide (FFT, pour fast Fourier transform). Comme décrit dans le Comp. B, le signal numérique dont on veut calculer le spectre doit vérifier certaines conditions pour que sa FFT soit la plus proche possible de sa 7. Dans le cas de l’utilisation d’une lentille, il est plus judicieux de placer les polariseurs entre l’interféromètre de Michelson et la lentille de projection, là où les rayons sont quasi parallèles, qu’entre la lentille et l’écran, là où les rayons sont convergents. Les polariseurs fonctionnent en effet normalement en lumière parallèle. 8. Pour cela, il faut s’assurer que les franges sont bien verticales. Il est possible de faire tourner l’image avec ImageJ.
I.5 Spectroscopie par transformée de Fourier (a)
I/Imax
(c)
85
(b)
1,0 0,5 0,0
0
200
400
600
800
1000 1200 1400 1600 1800 2000 2200 2400 2600 X (px)
0
200
400
600
800
1000 1200 1400 1600 1800 2000 2200 2400 2600 X (px)
I/Imax
(d) 1,0 0,8 0,6
Fig. 6 Agrandissements des photographies des figures d’interférence obtenues (a) avec une lampe quartz-iode et un filtre interférentiel filtrant à 620 nm et (b) avec un laser de longueur d’onde 543,5 nm. Le faisceau laser a été élargi par un objectif de microscope. Les taches sur la photographie correspondent à des défauts de cet objectif et à un effet de tavelures (speckle en anglais) [5]. (c) et (d) : profils d’intensité pour des coupes horizontales des photographies.
transformée de Fourier. En particulier, le signal doit être nul à ses bords. Pour nous en assurer, nous multiplions les interférogrammes par une fenêtre de Blackman. Le spectre ainsi obtenu pour les interférences du laser est présenté Fig. 7(b). On note Σréf = (0,0580 ± 0,0003) px−1 l’abscisse du pic principal. En notant Σ la variable de la FFT associée à l’interférogramme du filtre interférentiel, cette calibration permet de convertir l’abscisse en longueur d’onde avec l’Éq. (14). Le spectre de la lumière émise par la lampe quartz-iode, puis filtrée par le filtre interférentiel, est présenté Fig. 7(a). Il présente un pic centré à (623 ± 2) nm, en accord avec les indications du constructeur. Ce pic a une largeur à mi-hauteur d’environ 18 nm, conformément aux caractéristiques usuelles des filtres de laboratoire d’enseignement 9 . Dans la suite, nous appliquons cette méthode à la mesure du spectre d’autres sources lumineuses. 9. Le spectre des lampes quartz-iode étant raisonnablement plat dans le visible [8], on peut assimiler le spectre mesuré à la transmittance (spectrale) du filtre interférentiel.
86
Optique (b)
0 400
|TF[I]| (unit´e arb.)
|TF[I]| (unit´e arb.)
(a)
0 500
600 λ (nm)
700
800
0
0,1 0,2 0,3 0,4 2 tan(α)/λGt (px−1 )
0,5
Fig. 7 (a) Spectre pour l’interférogramme de la lampe quartz-iode à travers le filtre interférentiel. La longueur d’onde centrale est de (623 ± 2) nm et la largeur à mi-hauteur du filtre est de l’ordre de 18 nm. (b) Spectre obtenu à partir des données d’interférence du laser, servant à la calibration.
3.4 Analyse de lampes spectrales Appliquons maintenant la méthode de spectroscopie statique par transformée de Fourier à des sources lumineuses de spectres plus riches. La photographie de la figure d’interférence et l’interférogramme obtenus pour une lampe à vapeur de cadmium sont représentés Fig. 8(a) et 8(c). La variation de l’intensité moyenne trahit un éclairement inhomogène des miroirs. Illustrons dans un premier temps comment déterminer certaines propriétés du spectre à l’aide de la figure d’interférence, sans avoir recours à une calibration. Contrairement au cas du filtre interférentiel, le contraste ne s’annule pas aux bords de l’interférogramme. On ne pourra donc pas mesurer la longueur de cohérence de la source. On observe des battements, avec un contraste non nul et variable aux anticoïncidences. Il y a donc au moins trois raies dans le spectre, dont deux proches. On peut estimer grossièrement l’écart en longueur d’onde entre les deux raies les plus intenses en étudiant les oscillations rapides, de période Xmoy , et les battements, de période Xbat , comme indiqué Fig. 1(c). On mesure de l’ordre de 30 oscillations rapides sur 250 px et environ 2 battements tous les 300 px, soit Xmoy ' 8 px et Xbat ' 150 px. Ainsi, avec l’Éq. (8), on obtient ∆λ = λmoy Xmoy /Xbat ' 30 nm, en estimant la longueur d’onde moyenne, pour cette lampe bleu-verte, à λmoy ' 490 nm. Cette analyse de l’interférogramme ne permet cependant de déduire que les caractéristiques des raies les plus intenses, et une étude approfondie nécessite l’utilisation de la transformée de Fourier. Le spectre obtenu présente quatre pics (Fig. 8(b)), correspondant aux quatre raies du cadmium dans le domaine visible [20]. Le doublet formé par les deux raies les plus intenses est séparé d’environ 30 nm, comme prédit par l’étude préliminaire des interférences. La comparaison entre les longueurs d’onde mesurées et celles tabulées est donnée dans le Tab. 1. Les résultats sont satisfaisants, malgré une résolution (définie comme la largeur à mi-hauteur des raies) de l’ordre de 5 nm. En particulier, nous n’atteignons pas la limite de résolution de la Sec. 3.1. Les largeurs des raies résultent ici du fenêtrage, et n’indiquent en aucun cas la largeur spectrale de la
I.5 Spectroscopie par transformée de Fourier (b)
|TF[I]| (unit´e arb.)
(a)
87
0 400
480
(c)
560 640 λ (nm)
720
800
I/Imax
1,0
0,6
0
250
500
1000 1250 X (px)
1500
1750
2000
(e)
|TF[I]| (unit´e arb.)
(d)
750
0 400
480
(f)
560 640 λ (nm)
720
I/Imax
1,0 0,6 0,2 0
500
1000
1500
2000
X (px)
Fig. 8 (a) Agrandissement de la photographie de la figure d’interférence d’une lampe à vapeur de cadmium. (b) Spectre obtenu à partir des données. Les longueurs d’onde mesurées sont données dans le Tab. 1. (c) Profil d’intensité pour une coupe horizontale de la photographie. (d) Agrandissement de la photographie de la figure d’interférence d’une lampe à vapeur de mercure. (e) Spectre obtenu à partir des données. Les longueurs d’onde mesurées sont données dans le Tab. 1. (f) Profil d’intensité pour une coupe horizontale de la photographie.
800
Optique
Raies du cadmium (nm, ±0,01) 467,81 479,99 508,58 643,85
Raies mesurées (nm) 468 ± 3 480 ± 3 509 ± 4 643 ± 6
Raies du mercure (nm, ±0,01) 404,66 435,83 546,07 576,96 579,06 690,74
Raies mesurées (nm)
| {z }
88
435 ± 4 546 ± 6 578 ± 7 -
Tab. 1 Comparaison des spectres mesurés par la méthode statique aux spectres tabulés, issus de la Réf. [20], pour le cadmium et le mercure.
raie de la source lumineuse (dont on donne des ordres de grandeur dans l’Exp. I.2, « Spectroscopie à l’aide d’un interféromètre de Fabry-Perot »). La photographie des interférences et l’interférogramme d’une lampe à vapeur de mercure sont donnés Fig. 8(d) et 8(f). On observe une nouvelle fois des battements, indiquant la présence d’un doublet dans le spectre. Avec environ 45 oscillations rapides sur 500 px et 9 battements sur 1800 px, on estime Xmoy ' 10 px et Xbat ' 200 px. L’Éq. (8) donne alors ∆λ ' 30 nm, pour une longueur d’onde moyenne verte à λmoy ' 540 nm. Comme nous l’avons dit, cette étude ne donne des informations que sur les raies les plus intenses. Le spectre obtenu par transformée de Fourier est présenté Fig. 8(e). Les deux raies les plus intenses forment bien un doublet espacé d’environ 30 nm. Les longueurs d’onde des raies mesurées sont données dans le Tab. 1. On obtient seulement trois des six raies du spectre visible du mercure [20]. Les raies à 404,7 nm et 690,7 nm ont des intensités plus faibles que les autres, ce qui les rend difficilement mesurables (Sec. 4). Les raies du doublet jaune, autour de 578 nm, sont nettement visibles, mais sous la forme d’une unique raie large. Notre résolution est trop faible pour les séparer. La méthode est donc bien adaptée aux sources possédant un spectre riche, car elle permet d’obtenir un spectre visible quasiment complet rapidement et avec une unique mesure. Elle rend notamment possible, par sa nature statique, la mesure d’évolution temporelle d’un spectre, comme illustré dans la Réf. [16] sur le spectre d’allumage d’une lampe spectrale. La résolution en longueur d’onde est cependant faible, et intrinsèquement limitée par la cohérence spatiale de la source : augmenter la résolution spectrale demande d’augmenter l’angle du coin d’air ou la taille de la photographie, ce qui oblige à diaphragmer la source, réduisant la luminosité.
4 Spectroscopie dynamique 4.1 Principe de la mesure Comme mentionné en Sec. 2.3, nous allons à présent nous placer en configuration lame d’air. La différence de marche est alors contrôlée par l’épaisseur e de la lame d’air, que l’on fait varier pour tracer l’interférogramme. Les interféromètres de Mi-
I.5 Spectroscopie par transformée de Fourier
89
Laser
chelson sont souvent munis de moteurs permettant de translater continûment l’un des miroirs. Si la vitesse du miroir est connue, on en déduit la différence de marche en fonction du temps, et l’acquisition temporelle du signal lumineux permet d’accéder à l’interférogramme. En pratique, les moteurs sont animés de mouvements irréguliers qui rendent impossible l’exploitation directe de l’interférogramme par transformée de Fourier. Une solution pour pallier ces problèmes d’irrégularités consiste à enregistrer simultanément les interférences issues de la lumière étudiée, et celles d’un laser qui servira d’étalon (Sec. 4.3). Un schéma du montage est proposé Fig. 9. Le signal lumineux est recueilli par une photodiode 10 , placée au foyer image d’une lentille de projection. Ce photodétecteur bénéficie d’une bonne linéarité, ce qui est indispensable pour mesurer un signal proportionnel à I. La photodiode est placée au centre de la figure d’interférence ; on récupère ainsi les faisceaux d’inclinaison nulle, de différence de marche δ = 2e (Fig. 5(b)). Si le miroir est en marche à vitesse constante v, on a δ(t) = 2vt + δ(0). Deux miroirs auxiliaires permettent au faisceau laser de traverser l’interféromètre. Le faisceau étant une source spatialement cohérente, il conduit à des interférences non localisées 11 : il n’y a pas de difficulté à les mesurer avec une photodiode placée sur le faisceau laser en sortie d’interféromètre. Par contre, la source laser étant peu étendue, on dispose d’un faible éventail d’angles d’incidence. Soit
(M1 )
θ
Lampe
(M2 )
Acquisition
fc = 10 Hz
Condenseur (C, S)
Fig. 9 Schéma du montage expérimental. Deux miroirs auxiliaires permettent au faisceau laser, en rouge, de traverser l’interféromètre sans se superposer au faisceau de la lampe spectrale. Les faisceaux sont recueillis par deux photodiodes (carrés noirs). Un seul des deux faisceaux laser en sortie de la séparatrice a été représenté en entier. Pour la lisibilité de la figure, l’angle θ est exagéré. 10. Le fonctionnement et l’utilisation des photodiodes, avec leur éventuel conditionnement, sont discutés dans la Réf. [8]. 11. Voir la Sec. 2 de l’Exp. I.1, « Réglage d’un interféromètre de Fabry-Perot ».
90
Optique
θ l’angle entre le rayon laser et la normale au miroir (Fig. 9) ; on n’obtient en sortie d’interféromètre qu’une petite portion de la figure d’interférence, correspondant aux rayons d’incidence proche de θ, interférant avec une différence de marche δlas (t) = 2 cos(θ)vt + δlas (0). Il est alors difficile d’en situer le centre, et donc de positionner le laser en incidence nulle [21]. On choisit donc de garder θ non nul, et de tenir compte de ce paramètre libre pendant l’analyse des données. Le signal de sortie est filtré pour éliminer le bruit de plus haute fréquence, notamment à 50 Hz. La fréquence maximale du signal d’intérêt dépend de la vitesse de défilement du moteur et du spectre de la source ; on l’estime dans notre cas à 5 Hz (Fig. 10). Nous avons choisi des filtres passe-bas d’ordre 4, de fréquence de coupure fc = 10 Hz. Le signal est ensuite numérisé par une carte d’acquisition. Paramètres d’acquisition On cherche dans la suite à atteindre une résolution d’environ 0,05 nm en longueur d’onde, ce qui correspond d’après l’Éq. (10) à δmax ' 5 mm à la longueur d’onde moyenne de 500 nm. Il faut également respecter le critère de Shannon sur tout le domaine du visible. On choisit comme longueur d’onde minimale observable λmin = 1/σmax = 300 nm (au-delà, la sensibilité de la photodiode est de toute façon trop faible). Le pas minimal d’échantillonnage en différence de marche correspondant est δe = λmin /2 = 150 nm. La fréquence d’échantillonnage associée dépend quant à elle de la vitesse du moteur : on la règle en s’assurant d’avoir au moins 4 points par période du signal laser pour un laser hélium-néon rouge de longueur d’onde λlas = 632,82 nm. Taille finie des capteurs Les photodiodes moyennent l’intensité lumineuse reçue sur toute la surface de leur cellule photosensible, de taille ddiode ' 1 mm. Si les franges sont de plus petite taille que le capteur, cet effet de moyenne va réduire l’amplitude d’oscillation des franges, ce qui se traduit sur l’interférogramme par une perte de contraste. Dans notre cas, la photodiode est placée au centre des anneaux de la figure d’interférence. Supposons qu’il s’y trouve une frange claire : le rayon p du premier anneau vaut R1 ' f λ/2e, pour une distance focale f de la lentille de projection et une source monochromatique. Le rayon diminue quand e augmente et on risque une perte de contraste aux grandes différences de marche. Ceci peut être compensé par une grande distance focale f , mais la figure d’interférence sera trop peu lumineuse. Au δmax donné précédemment, une distance focale de f ' 1 m est un bon compromis : on estime dans ce cas R1 ' 1 cm ddiode . Cette condition est plus contraignante pour la photodiode du laser, qui voit les anneaux à une inclinaison θ. Ceux-ci ne sont pas projetés par la lentille ; on suppose θ 1, on observe donc les interférences approximativement à l’infini. En notant d la distance des miroirs à la photodiode, on peut approximer l’épaisseur des anneaux par δR ' λd/2eθ, en ayant supposé δR θd. Avec θ ' 5◦ et d ' 1 m, on trouve δR ' 2 mm & ddiode . Bien que cette perte de contraste simule un effet de longueur de cohérence (Fig. 1(d) et 1(e)), il ne faut pas les confondre : un laser est cohérent sur une différence de marche d’environ 30 cm δmax .
4.2 Protocole Régler l’interféromètre en lame d’air, en suivant le protocole de la Sec. 3.2 jusqu’à l’obtention des anneaux. Un réglage particulièrement minutieux du contraste des anneaux est proposé dans la Réf. [8].
I.5 Spectroscopie par transformée de Fourier
91
Placer une lentille de distance focale f ' 1 m en sortie de l’interféromètre. Positionner une photodiode au centre des anneaux visibles dans le plan focal image de la lentille. Il est à présent inutile d’avoir une figure très étendue : régler le condenseur de la lampe de sorte à éclairer uniformément les miroirs de l’interféromètre pour augmenter la luminosité au centre de la figure d’interférence. À l’aide de deux miroirs auxiliaires, diriger le faisceau laser à travers l’interféromètre (Fig. 9). Les miroirs doivent être suffisamment petits et placés de façon à intercepter le faisceau laser sans occulter la lumière de la lampe. Placer une seconde photodiode sur le faisceau de sortie du laser. Il ne faut pas que la photodiode du laser soit éclairée par la lumière de la lampe étudiée.
Connecter les photodiodes à leur circuit de conditionnement si nécessaire, puis à leur filtre passe-bas, et enfin à la carte d’acquisition. Il peut aussi être nécessaire d’amplifier le signal en sortie des filtres. Faire défiler les franges manuellement jusqu’à annulation totale du contraste (on peut temporairement placer un écran devant la photodiode pour mieux voir les anneaux). Connecter le moteur à la vis du chariot. Cela modifie souvent le réglage du parallélisme : il faut le régler finement juste avant de lancer l’acquisition. Le rayonnement émis par la lampe a aussi tendance à chauffer et déformer légèrement les miroirs, même en présence d’un filtre anticalorique, et donc à dérégler le parallélisme. On peut attendre quelques minutes après un changement de lampe source avant de lancer l’acquisition.
Allumer le moteur. Les anneaux doivent défiler vers le centre. Lancer alors l’acquisition. L’acquisition du spectre complet est souvent longue. Avec le moteur que nous avons utilisé, de vitesse moyenne hvi ' 1 mm·h−1 , la mesure a une durée de 2h30 pour une lampe à vapeur de sodium. On peut au préalable faire un essai sur le défilement de quelques anneaux pour s’assurer du résultat. Il faut ensuite veiller à ne pas perturber le montage pendant toute la durée de l’enregistrement.
4.3 Exploitation L’interférogramme obtenu, avant tout traitement, avec une lampe à vapeur de mercure est présenté Fig. 10(a). Il n’est pas exploitable tel quel : les irrégularités du mouvement du moteur interdisent de supposer la différence de marche proportionnelle au temps. Il faut extrapoler δ à partir du signal laser. On présente ici le principe de ce traitement, et un code Python est proposé dans le Comp. D. L’intensité du signal laser vaut Ilas = 2I0 (1 + cos(2πδlas /λlas )). Numériquement, on recherche les instants ti des zéros de Ilas −hIlas i (hIi étant la moyenne temporelle de I), qui sont séparés par une différence de marche de λlas /2. On connaît alors la valeur de la différence de marche 12 aux instants ti : on a un échantillon de la fonction δlas (t). Nous utilisons cet échantillon pour estimer les différences de marche à tous les temps auxquels nous avons mesuré l’intensité de la lampe, c’est-à-dire estimer la fonction δ(t) à d’autres instants que ceux de notre échantillon. Nous avons utilisé 12. À une constante additive près, qui n’a pas d’importance dans la suite.
92
Optique
(a)
(I − hIi)/Imax
0 1550
0 1650
2090
2105
0
700
1400
(b)
2100
2800
2100
2800
t (s)
δ − 2hvit (µm) µ
6 4 2 0 700
1400 t (s)
Fig. 10 (a) Interférogramme obtenu avec une lampe à vapeur de mercure, avant traitement. Les encarts présentent des agrandissements permettant d’apprécier les différents battements observés. (b) Écart de la position du moteur au mouvement idéal au cours de la même acquisition.
pour cela une interpolation linéaire. Formellement, pour ti < t < ti+1 , on estime que δ(ti+1 ) − δ(ti ) δ(t) ' δ(ti ) + (t − ti ) . (15) ti+1 − ti Il est intéressant de comparer le résultat de l’interpolation à une translation uniforme du moteur à la vitesse hvi, soit δ(t) = 2 hvi t, où la vitesse moyenne a été obtenue par ajustement linéaire. Le tracé de l’écart au mouvement idéal est donné Fig. 10(b), et donne une idée du bruit effectivement corrigé par notre méthode. On constate une modulation périodique, qui correspond à la période de rotation du vernier, d’amplitude 3 µm, à laquelle s’ajoute un bruit aléatoire, plus fin, certainement dû aux frottements solides. Avec cette méthode, on ne corrige que la dérive lente du moteur. En effet, il faut que le moteur n’ait pas significativement dévié entre deux annulations du signal laser, qui ont lieu à une fréquence d’environ 1 Hz pour notre vitesse de moteur. Les irrégularités rapides ne posent pas de problème, dans la mesure où les bruits de plus haute fréquence sont filtrés en sortie de la photodiode.
Avec les différences de marche ainsi estimées, nous possédons un échantillon de I(δlas ), avec I l’intensité de la lampe. Mais nous ne pouvons pas en calculer la transformée de Fourier directement : les δlas , issus de l’interpolation, ne sont pas également répartis. Dans ce cas, l’algorithme de FFT ne peut pas être utilisé 13 . Une 13. En effet, la FFT calcule la transformée de Fourier discrète du signal (voir le Comp. B), qui n’a de sens que pour un échantillonnage régulier. Construire un autre estimateur de la transformée de Fourier serait possible, mais inefficace du point de vue du temps de calcul [22].
93
I.5 Spectroscopie par transformée de Fourier
solution consiste à estimer les valeurs de I à des différences de marche également espacées par une nouvelle interpolation à partir de notre échantillon de I(δlas ). Le signal ainsi estimé est soumis à un algorithme de FFT. Le fenêtrage est inutile si l’interférogramme est suffisamment large et de contraste nul à ses extrémités. Il faudra par contre fenêtrer le signal laser lors de son traitement. Nous utilisons pour cela une fenêtre de Blackman. Avec cette méthode, un pic net apparaît dans le spectre du signal laser, à la longueur d’onde attendue (λlas = 632,82 nm pour un laser hélium-néon). Pour obtenir le spectre d’une autre source, il faut encore tenir compte de l’angle résiduel θ (Fig. 9) : la lumière de la lampe spectrale subit, elle, une différence de marche δ = δlas / cos(θ). Pour mesurer cet angle θ, il faut supposer connue la longueur d’onde d’un pic du spectre d’une lampe. Sachant que TF[I(δ/ cos(θ))](σ) = cos(θ)TF[I(δ)](σ cos(θ)), nous mesurons en fait λmes = λ/ cos(θ). À partir de la raie verte du mercure et de sa valeur tabulée, nous obtenons θ ' 5°, ce qui semble un écart à l’orthogonalité raisonnable pour un faisceau réglé au jugé. Nous corrigeons la longueur d’onde mesurée de ce facteur angulaire, de façon à représenter le spectre en fonction de la longueur d’onde réelle. Il est à noter que si plusieurs spectres ont été acquis sans toucher au laser, une seule calibration est suffisante. Une amélioration possible de notre méthode consisterait à faire une première acquisition avec un second signal laser à la place de la lampe spectrale, qui serait un meilleur étalon de fréquence que l’une des raies de la lampe étudiée.
4.4 Résultats Les spectres obtenus par interférométrie dynamique sur les lampes à vapeur de mercure, d’une part, et de sodium, d’autre part, sont présentés respectivement Fig. 11(a) et 11(b). Des agrandissements sur les structures de doublet montrent que celui du mercure est parfaitement résolu, tandis que celui du sodium est proche de la limite de résolution de notre expérience. On peut estimer la résolution par
lampe Hg laser 575
0 350
585
420
490 560 λ (nm)
630
700
|TF[I]| (unit´e arb.)
(b) |TF[I]| (unit´e arb.)
(a)
585
0 380
595
470
815
560 650 λ (nm)
825
740
830
Fig. 11 Spectres de la lampe à vapeur de (a) mercure et (b) sodium, obtenus par spectroscopie par transformée de Fourier dynamique. Les encarts présentent des agrandissements des structures de doublet. Le spectre du signal laser est aussi représenté en rouge en (a).
94
Optique
Raies du mercure (nm, ±0,01) 404,66 435,83 546,07 576,96 579,06 690,74
Raies mesurées (nm) 404,7 ± 0,1 435,9 ± 0,1 calibration 577,1 ± 0,2 579,2 ± 0,2 690,8 ± 0,3∗
Raies du sodium (nm, ±0,01) 589,00 589,59 818,33 819,48
*
Raies mesurées (nm) 589,0 ± 0,1 589,7 ± 0,1 818,5 ± 0,3∗ 819,8 ± 0,3∗
Peu intenses.
Tab. 2 Comparaison des spectres mesurés par la méthode dynamique aux spectres tabulés, tirés de la Réf. [20], pour le mercure et le sodium. La raie verte du mercure sert de calibration, et n’est donc pas mesurée.
l’Éq. (10). En ayant acquis N ' 12 × 103 annulations du signal laser, la différence de marche totale vaut δmax ' N λlas /2. Autour de λ = 500 nm, on attend alors une résolution de 0,07 nm, ce qui est inférieur à la séparation du doublet du sodium. Les valeurs des raies mesurées sont comparées aux valeurs tabulées dans le Tab. 2 et sont en excellent accord. On remarque en particulier un second doublet dans le spectre du sodium, bien moins visible que le premier, à la frontière de l’infrarouge. Bien que ce doublet se situe en dehors du domaine du visible, la photodiode le détecte car elle est sensible au proche infrarouge. Les raies du sodium sont mesurées à partir de la calibration de la raie verte du mercure, validant la calibration entre interférogrammes différents enregistrés avec le même angle de laser. Comme attendu, la résolution de la méthode dynamique, d’environ 0,07 nm, est deux ordres de grandeur meilleure que celle de la méthode statique, d’environ 5 nm, puisqu’elle explore un intervalle de différence de marche bien plus large. Elle est néanmoins beaucoup plus longue à réaliser : on la réserve donc aux spectres exigeant une grande résolution spectrale.
Complément A - Propriétés usuelles de la transformée de Fourier Nous rappelons ici les définitions et résultats concernant la transformée de Fourier nécessaires à la compréhension de l’expérience. On se reportera à la Réf. [23] pour une présentation plus complète et rigoureuse. Soit f : R −→ R ou C. Sa transformée de Fourier est définie comme ˆ ˆ −i2πνt TF[f ](ν) = f (t)e dt ⇔ f (t) = TF[f ](ν)ei2πνt dν. (16) R
R
Dans la seconde équation, l’opération effectuée sur TF[f ] est la transformée de Fourier inverse, qui permet de retourner à la fonction initiale. Si t est un temps, ν est une fréquence. D’autres conventions existent ; elles se déduisent par changement
95
I.5 Spectroscopie par transformée de Fourier
Fonction f (t)
Transformée de Fourier TF[f ](ν)
2 2 1 √ e−t /2σ (gaussienne) σ 2π
e−2π
1 (lorentzienne) 1 + (αt)2
2
σ2 ν 2
π −2π|ν|/|α| e α
δ(t − t0 ) Πτ (t) =
1 si t ∈ [−τ /2, τ /2] 0 sinon
Xτ (t) =
∞ X n=−∞
(gaussienne)
e−i2πνt0
(porte)
τ sinc (πντ ) =
sin(πντ ) (sinus card.) πν
1 X1/τ (ν) (peigne) τ
δ(t − nτ ) (peigne)
Tab. 3 Fonctions usuelles en optique et leurs transformées de Fourier.
de variable dans l’intégrale. Les transformées les plus utilisées dans cette expérience sont répertoriées dans le Tab. 3. Ces exemples illustrent la propriété de contraction - dilatation de la transformée de Fourier : si l’intervalle sur lequel f est significativement différente de 0 est de largeur ∆t, alors, le support caractéristique de TF[f ] est de largeur ∆ν ≥ 1/∆t 14 . Cette propriété est intuitive : une impulsion courte contient des fréquences élevées, et a donc un spectre large. On peut également montrer la propriété de translation : si un signal est translaté de t0 , sa transformée est multipliée par e−i2πνt0 , et réciproquement, par changement de variable dans l’intégrale. La transformée de Fourier possède de nombreuses propriétés de symétrie. Par exemple, en prenant le complexe conjugué de l’Éq. (16), on montre que si f est à valeurs réelles, TF[f ](ν) = TF[f ](−ν). On dit que le spectre est hermitien. Enfin, on définit le produit de convolution de deux fonctions f et g par : ˆ [f ∗ g](t) = f (t − τ )g(τ )dτ. (17) R
Cela revient à calculer une moyenne glissante sur f avec une pondération donnée par g. L’importance de ce produit vient des relations suivantes, qui le lient à la transformée de Fourier : TF[f ∗ g] = TF[f ] × TF[g] et TF[f × g] = TF[f ] ∗ TF[g].
(18)
14. C’est une conséquence du théorème de Cauchy-Schwarz [23], parfois appelé à tort « principe d’incertitude ».
96
Optique
La preuve consiste essentiellement en un changement de variables : ˆ ˆ TF[f ∗ g](ν) = dt dτ f (t − τ )g(τ )e−i2πνt R ˆR ˆ = dτ g(τ )e−i2πντ dtf (t)e−i2πνt = TF[f ](ν) × TF[g](ν). R
(19)
R
Ces propriétés sont utilisées en Sec. 2.1 et dans le Comp. B pour calculer rapidement le spectre de certains signaux.
Complément B - Transformée de Fourier discrète Calculer la transformée de Fourier d’un signal mesuré est une opération courante en spectroscopie et plus largement en physique expérimentale. Nous avons déjà détaillé le rôle de la fréquence d’échantillonnage et de la taille de la fenêtre d’acquisition (Sec. 2.2). Néanmoins, les signaux numériques étant finis et discrets à la fois en temps et en fréquence, nous avons négligé le fait que le calcul numérique n’est pas à proprement parler une transformée de Fourier, mais plutôt une transformée de Fourier discrète (DFT, pour discrete Fourier transform). Il n’est pas évident qu’elle constitue une bonne estimation de la transformée de Fourier du signal analogique initial : il faut donc élucider le lien entre les deux transformées. La définition de la DFT est, pour une suite de N réels Xn [10], DFT[X]m =
N X n=1
Xn e−i2π mn/N
⇔
Xn =
N 1 X DFT[X]m ei2π mn/N . N m=1
(20)
La suite (Xn ) représente dans ce contexte les N points de mesure du signal mesurés à intervalles réguliers. La seconde équation signale que la DFT est inversible : il n’y a donc pas de perte d’information entre un signal discret et sa transformée discrète. Le lien entre la transformée d’un signal continu f (t) et la DFT appliquée au signal mesuré, après échantillonnage et fenêtrage, est donné par la relation exacte suivante [24] : ! N X X X −i2π mn/N νe f (n + kN )Te e = νe TF[f ] (m + kN ) . (21) N n=1 k∈Z
k∈Z
Le membre de gauche représente la DFT du signal f , évalué aux multiples entiers de la période d’échantillonnage Te , soit f (nTe ), et périodisé avec la période N Te , c’est-à-dire additionné aux mêmes signaux décalés de kN Te dans le temps pour tout k ∈ Z. Le membre de droite correspond à la transformée de Fourier de f , elle aussi échantillonnée à νe /N et périodisée avec la période νe = 1/Te . Ce résultat est schématisé Fig. 12. On a ramené le problème à seulement deux échantillonnages, un en temps et un en fréquence, en conséquence desquels apparaissent deux périodisations, respectivement en fréquence et en temps. On remarque en particulier que le fenêtrage discuté en Sec. 2.2 apparaît ici via les périodisations, et non pas par multiplication par une fonction porte, ce qui évite l’importante distorsion de spectre que celle-ci entraîne. Tout se passe comme si, au-delà des N points
97
I.5 Spectroscopie par transformée de Fourier (a)
(b) f
TF[f ]
TF t
(c)
(d) f XTe ∗ XN Te N Te
ν
0
TF[f ] Xνe /N ∗ Xνe
DFT t
0
νe /N ν
νe
Te Fig. 12 Illustration de l’Éq. (21). (a) Signal continu f (t) pair et (b) sa densité spectrale. (c) Même signal, une fois périodisé et échantillonné. N doit être choisi assez grand pour rendre négligeables les recouvrements. (d) Densité spectrale, échantillonnée et périodisée. νe doit être choisie assez grande pour pouvoir négliger les recouvrements.
mesurés, le signal se répétait. On peut maintenant donner les conséquences pratiques de cette égalité. Nous avons deux paramètres libres, la fréquence d’échantillonnage νe et le nombre de points N . Le résultat de la DFT est une bonne estimation de la transformée de Fourier du signal d’origine si les conditions suivantes sont vérifiées. •
•
Le spectre du signal doit être égal à sa périodisation de période νe sur l’intervalle [−νe /2, νe /2]. Ce sera le cas si le spectre n’a pas de fréquence plus haute que νe /2. On reconnaît le critère de Shannon, détaillé en Sec. 2.2, qui fixe le choix de la fréquence d’échantillonnage. Le signal f (t) doit être égal à sa périodisation, de période N Te , sur l’intervalle [−N Te /2, N Te /2]. C’est le cas si le signal est nul en dehors de la fenêtre d’observation, par construction aussi de largeur N Te , ce qui fixe N . La résolution du spectre est alors de νe /N , l’écart en fréquence entre deux points calculés par la DFT.
Il est en fait impossible d’avoir une fonction à support borné dont la transformée de Fourier est également à support borné. Les critères précédents ne sont donc toujours qu’approximativement vérifiés.
Un cas particulier concerne les signaux périodiques en temps : si la fenêtre d’observation contient un multiple entier de motifs périodiques de f (t), le signal sera bien égal à sa périodisation. Dans ce cas, il suffit d’enregistrer un seul motif périodique du signal (N Te = Tsignal ). Alors, chaque coefficient de la DFT correspond à un coefficient de la série de Fourier du signal périodique. La notion de résolution en fréquence n’a plus de sens.
98
Optique
Finalement, dans le cas où le signal n’est ni périodique, ni entièrement contenu dans la fenêtre d’observation, il faut recourir à la méthode du fenêtrage : on multiplie le signal par une courbe en cloche, s’annulant aux bords de la fenêtre d’observation. Le calcul de la DFT donne alors une bonne estimation du spectre convolué par la transformée de Fourier de la fonction fenêtre. Celle-ci est fortement piquée, mais de largeur supérieure à νe /N , la résolution intrinsèque de la DFT. On peut alors appliquer le critère de Rayleigh pour estimer la résolution de la DFT calculée. Pour les fenêtres de Blackman, utilisées dans cette expérience, on peut l’estimer à 2νe /N . On retrouve alors la résolution donnée en Sec. 2.2. En pratique, le calcul numérique de la DFT utilise un algorithme particulièrement efficace, appelé la fast Fourier transform (FFT) et détaillé dans les Réf. [10, 22].
Complément C - Encodage linéaire des photographies L’utilisation d’un appareil photographique présente plusieurs avantages déjà énoncés en Sec. 3.1 et dans l’Exp. I.2, « Spectroscopie à l’aide d’un interféromètre de Fabry-Perot », mais, dans le cas de cette expérience, se fait au détriment d’un encodage simple de la luminosité. Par défaut les photographies en format TIFF ou JPEG encodent la luminosité de manière non linéaire, pour s’adapter au comportement de l’œil. Il est cependant nécessaire, pour l’expérience décrite en Sec. 3, de forcer un encodage linéaire de la luminosité. Pour cela, nous avons enregistré les photographies en format brut (CR2/RAW) et nous les avons traitées avec le logiciel dcraw [17]. Ce code informatique permet de lire le fichier CR2, de décoder l’information qu’il contient à partir de celles sur l’appareil photographique 15 , d’appliquer une fonction gamma (fonction donnant la valeur d’un pixel à partir de la luminosité qu’il a reçue) et de sauvegarder la photographie en format TIFF 16 bits. La fonction gamma que nous avons choisie encode linéairement la luminosité, l’utilisation du format TIFF permet de ne pas avoir de perte d’information par compression des données et l’utilisation de 16 bits pour encoder la valeur d’un pixel (généralement seulement 8 bits sont utilisés) permet de limiter l’amplitude du bruit de quantification [10]. Le code dcraw existe pour les trois systèmes d’exploitation principaux (Mac OS, Windows, Ubuntu) et son téléchargement est gratuit. Nous avons analysé nos images avec les options -T et -4 permettant d’obtenir une image en format TIFF 16 bits avec une fonction gamma linéaire. Il faut pour cela ouvrir le terminal pour Mac et Ubuntu et l’invite de commande pour Windows, aller dans le dossier contenant la photographie à linéariser et entrer la ligne de commande suivante : dcraw -T -4 photo.cr2 en remplaçant photo.cr2 par le fichier à convertir. Il peut être nécessaire de placer le fichier dcraw dans le même dossier que la photographie si son chemin d’accès n’est pas connu par l’ordinateur. Pour nous assurer de la linéarité de la conversion, nous avons vérifié la loi de Malus [8] en utilisant la dépendance de l’intensité lumineuse 15. dcraw contient les caractéristiques d’un grand nombre d’appareils photographiques [17].
I.5 Spectroscopie par transformée de Fourier
99
I (unit´e arb.)
10 8
TIFF lin´eaire TIFF non lin´eaire
5 2 0 0,0
0,2
0,4 0,6 2 cos (θ)
0,8
1,0
Fig. 13 Évolution de l’intensité lumineuse I mesurée sur des photographies d’une source lumineuse avec deux polariseurs croisés d’un angle θ. L’image a été développée avec une fonction gamma linéaire (données bleues) et avec une fonction gamma par défaut (données rouges). L’utilisation d’une fonction gamma linéaire permet d’améliorer grandement la linéarité entre la valeur d’un pixel et l’intensité lumineuse qu’il a reçue. Un ajustement affine des données bleues donne χ2red = 1,1, validant ainsi une relation affine.
d’une image en fonction de l’angle entre deux polariseurs croisés, placés entre l’appareil photographique et une source de lumière. Les résultats sont présentés Fig. 13. Notre étude s’inspire de celle de la Réf. [25], dans laquelle l’auteur vérifie la linéarité en modifiant le diamètre du diaphragme d’ouverture. Dans les deux cas, on constate que la linéarité entre la valeur d’un pixel et l’intensité qu’il reçoit est bonne.
Complément D - Code Python pour la spectroscopie dynamique Le traitement des données proposé en Sec. 4.3 nécessite plusieurs étapes numériques importantes, qui sont réalisables rapidement avec les fonctions des modules NumPy et SciPy [26]. On donne ci-dessous un code complet. La détection des zéros du signal laser se fait par le module d’interpolation par spline de SciPy, à ne pas confondre avec les interpolations linéaires discutées dans le texte. Le fichier de données data.txt contient, dans l’ordre et sur trois colonnes, le temps écoulé, la tension aux bornes de la photodiode enregistrant le signal d’intérêt, et la tension aux bornes de celle enregistrant le laser.
4
#coding: utf8 import numpy as np import matplotlib.pyplot as plt from scipy import interpolate
7
data = np.loadtxt("./data.txt") t, signal, ref = data[:,0], data[:,1], data[:,2]
1
100
Optique
lambda_las = 632.82 #(nm) 10
ref -= np.mean(ref) ref_interp = interpolate.CubicSpline(t, ref) zero = ref_interp.roots()
#Détection des zéros
ddm_ref = np.arange(0, len(zero))*lambda_las/2 ddm = np.interp(t, zero, ddm_ref)
#1ère interpolation
13
16
19
22
ddm_reg = np.linspace(ddm.min(), ddm.max(), len(ddm)) ref_corr = np.interp(ddm_reg, ddm, ref) ref_corr *= np.blackman(len(ref_corr)) signal_corr = np.interp(ddm_reg, ddm, signal) TFref = np.abs(np.fft.rfft(ref_corr)) TFsignal = np.abs(np.fft.rfft(signal_corr)) sigma = np.fft.rfftfreq(len(t), np.diff(ddm_reg)[0])
#2nde interp.(ref) #2nde interp.(signal) #FFT, signal réel
25
28
plt.plot(1/sigma[1:], TFref[1:]) plt.plot(1/sigma[1:], TFsignal[1:]) plt.xlim((400,800))
#Spectre visible (nm)
Références [1]
B. W. Carroll et D. A. Ostlie, An introduction to modern astrophysics. Pearson, 2006.
[2]
É. Biémont, Spectroscopie atomique : instrumentation et structures atomiques. De Boeck Supérieur, 2006.
[3]
É. Biémont, Spectroscopie moléculaire : structures moléculaires et analyse spectrale. De Boeck Supérieur, 2008.
[4]
J.-R. Champeau, R. Carpentier et I. Lorgeré, Ondes lumineuses. De Boeck, 2009.
[5] Sextant, Optique expérimentale. Hermann, 1997. [6]
A. L. Fymat, « Polarization effects in Fourier spectroscopy (I). Coherency matrix representation, » Appl. Opt., 11 (1), p. 160-173, 1972.
[7]
M. Fox, Optique quantique, une introduction. De Boeck, 2011.
[8]
M. Fruchart, P. Lidon, E. Thibierge, M. Champion et A. Le Diffon, Physique expérimentale. De Boeck Supérieur, 2016.
[9]
S. Houard, Optique. De Boeck, 2011.
[10]
F. Manneville et J. Esquieu, Théorie du signal et composants. Dunod, 2010.
[11]
A. A. Michelson et E. W. Morley, « On the relative motion of the Earth and the luminiferous ether, » Sidereal Messenger, 6, p. 306-310, 1887.
[12]
F. Cavalier, P. Hello et N. Leroy, « Virgo et la quête des ondes gravitationnelles, » Images de la physique, 2010.
I.5 Spectroscopie par transformée de Fourier
101
[13]
G. Fortunato, « L’interféromètre de Michelson, quelques aspects théoriques et expérimentaux, » Bup, 91 (795 (2)), p. 15-56, 1997.
[14]
D. Mauras, Optique physique et électronique. PUF, 2001.
[15]
M. Bertin, J.-P. Faroux et J. Renault, Optique et physique ondulatoire. Dunod, 1986.
[16]
Y. El Azhari et S. Tagmouti, « Spectrométrie statique par transformée de Fourier, » Bup, 108 (967), p. 1281-1296, 2014.
[17]
D. Coffin. (2018). Decoding raw digital photos in Linux, adresse : https: //www.dechifro.org/dcraw/ (visité le 08/02/2019).
[18]
C. A. Schneider, W. S. Rasband et K. W. Eliceiri, « NIH Image to ImageJ: 25 years of image analysis, » Nat. Methods, 9 (7), p. 671-675, 2012.
[19]
National Institutes of Health and Laboratory for Optical and Computational Instrumentation. (2014). ImageJ, image processing and analysis in Java, adresse : https://imagej.net/ (visité le 06/07/2019).
[20]
A. Kramida, Y. Ralchenko, J. Reader et NIST ASD Team. (2018). NIST Atomic Spectra Database (version 5.6.1). National Institute of Standards and Technology, adresse : https : / / physics . nist . gov / asd (visité le 03/10/2019).
[21]
J.-P. Lecardonnel et R. Barbet-Massin, « Une manipulation de spectrométrie par transformation de Fourier, » Bup, 93 (815(2)), p. 7-23, 1999.
[22]
E. O. Brigham et R. E. Morrow, « The fast Fourier transform, » IEEE Spectrum, 4 (12), p. 63-70, 1967.
[23]
W. Appel, Mathématiques pour la physique et les physiciens. H&K, 2008.
[24]
J. Cooley, P. Lewis et P. Welch, « Application of the fast Fourier transform to computation of Fourier integrals, Fourier series, and convolution integrals, » IEEE Trans. Audio Electroacoust., 15 (2), p. 79-84, 1967.
[25]
M. Boers. (2013). Linear RAW conversions, adresse : https://mikeboers. com/blog/2013/11/07/linear-raw-conversions (visité le 08/02/2019).
[26]
P. Virtanen, R. Gommers, T. E. Oliphant, M. Haberland et al., « SciPy 1.0 : fundamental algorithms for scientific computing in Python, » Nat. Methods, 17, p. 261-272, 2020.
II.1
Ascension d’un liquide paramagnétique
Dans cette expérience, nous déterminons la susceptibilité magnétique d’un composé paramagnétique en solution, en mesurant la dénivellation du liquide lorsque celui-ci est soumis à un champ magnétique extérieur inhomogène (méthode de Quincke). Nous discutons ensuite l’effet du mouillage de la solution à l’interface avec le contenant lors de l’ascension du liquide.
Sommaire 1 2 3 4
Électromagnétisme dans un milieu magnétique Méthode de Quincke . . . . . . . . . . . . . . Mesure de la susceptibilité magnétique . . . . Hystérésis de mouillage . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
105 109 112 115
Compléments A B
Force subie par un matériau aimantable . . . . . . . . . 118 Fonctionnement d’une sonde à effet Hall . . . . . . . . . 119
Cette expérience étant la première d’une partie consacrée au magnétisme, nous commençons par rappeler quelques éléments essentiels de la théorie de l’électromagnétisme dans la matière, ce qui permet d’introduire les notations qui seront réutilisées dans les expériences suivantes. Pour plus de détails, on pourra se reporter à la Réf. [1].
1 Électromagnétisme dans un milieu magnétique Les effets du magnétisme s’observent dans toutes les phases de la matière. Il est possible de quantifier la réponse macroscopique d’un milieu à un champ magnétique grâce à une grandeur appelée aimantation. Il est alors intéressant de réécrire les équations de Maxwell pour prendre en compte cette réponse ; on les résout ensuite en postulant une relation constitutive du milieu. Dans la suite, nous présentons les principaux types de milieux magnétiques et les relations entre les grandeurs macroscopiques. Nous renvoyons à la Réf. [2] pour une introduction au traitement microscopique du magnétisme dans la matière.
1.1 Aimantation Le magnétisme trouve son origine microscopique dans l’existence de moments magnétiques élémentaires portés par les atomes, molécules, ions ou électrons libres. La distribution spatiale de moments magnétiques élémentaires décrivant l’ensemble de l’échantillon macroscopique est une grandeur qui varie fortement à l’échelle microscopique. On préfère raisonner comme si chaque élément de volume de matière 105
106
Magnétisme
portait un moment magnétique que l’on obtient par un lissage spatial de la distribution précédente [1], à l’échelle mésoscopique. On peut alors définir la densité de moment magnétique, grandeur intensive appelée aimantation macroscopique, notée M et exprimée en A·m−1 . En fonction du milieu, elle peut être spontanée ou induite par un champ magnétique extérieur. La nature des moments magnétiques élémentaires est orbitale ou intrinsèque (spin). L’existence du spin ne s’explique pas classiquement, et une description complète du magnétisme dans la matière doit être quantique : le théorème de Bohr-van Leeuwen affirme que pour un système classique, tous les effets du magnétisme microscopique se compensent pour donner une aimantation nulle [2, 3]. Néanmoins, à l’échelle macroscopique, la modélisation classique adoptée dans la suite s’avère suffisante.
On peut montrer que le champ magnétique généré par une distribution d’aimantation M est identique à celui produit par des distributions de courants d’aimantation volumique jaim = ∇ × M et surfacique js = M × n, où n désigne le vecteur normal unitaire extérieur à la surface du matériau [4]. Les courants d’aimantation s’ajoutent aux sources de champ magnétique déjà présentes dans l’équation de Maxwell-Ampère dans un milieu non magnétique, à savoir les courants libres jlib , et les courants de déplacement et de polarisation en régime variable. Cette équivalence est toutefois purement mathématique : les courants d’aimantation ne correspondent pas à des courants macroscopiques circulant dans le matériau aimanté.
1.2 Équations de Maxwell et relation constitutive La réponse d’un milieu à un champ constant se traite dans le cadre de la magnétostatique, dans lequel nous nous plaçons dans la suite. On peut montrer que les équations de Maxwell, valables à l’échelle microscopique, se réécrivent à l’échelle macroscopique. L’équation ∇ · B = 0 reste inchangée ; les sources de champ magnétique s’apparentent à des dipôles dont le champ est de divergence nulle. Les équations de la magnétostatique dans la matière s’écrivent ( ∇·B =0 , (1) ∇ × B = µ0 (jlib + jaim ) avec µ0 = 4π × 10−7 H·m−1 la perméabilité magnétique du vide. Le terme supplémentaire jaim = ∇ × M n’invalide pas l’équation de conservation de la charge électrique, car la divergence d’un terme rotationnel est nulle.
En introduisant une nouvelle variable H appelée excitation magnétique telle que B = µ0 (H + M ), on peut réécrire le système (1) sous la forme ( ∇ · H = −∇ · M . (2) ∇ × H = jlib L’introduction de H permet d’exprimer l’équation de Maxwell-Ampère uniquement en fonction des courants libres. Le théorème d’Ampère s’applique alors sous sa forme habituelle en substituant au champ magnétique B le champ µ0 H, ce qui permet de s’affranchir de la réponse magnétique du milieu.
II.1 Ascension d’un liquide paramagnétique
107
Ayant introduit une nouvelle grandeur vectorielle, une relation supplémentaire liant M et H est nécessaire pour résoudre le système (2). Cette nouvelle équation est empirique, contrairement aux équations de Maxwell dans la matière, et elle dépend du milieu magnétique considéré : elle est dite « constitutive du milieu ». On définit alors en régime statique le tenseur de susceptibilité magnétique [χ] décrivant la réponse du milieu, de composantes χij = lim ∂Mi /∂Hj , avec i et j deux H→0
indices associés à deux directions spatiales quelconques d’une base orthogonale. La susceptibilité magnétique, sans dimension 1 , détermine le développement au premier ordre de la fonction M (H). Si les termes d’ordres supérieurs à deux du développement de M (H) sont négligeables devant le terme d’ordre 1, et si M (0) = 0, le matériau est dit linéaire : c’est le cas de tous les corps qui ne sont pas dans une phase magnétiquement ordonnée (ce qui exclut le ferromagnétisme, l’antiferromagnétisme, le ferrimagnétisme, etc.). Nous nous plaçons dans ce cadre dans toute la suite de cette expérience. Dès lors, en régime permanent et pour un milieu local (la réponse à la position r ne dépend que de l’excitation à cette même position), on peut écrire M (r) = [χ](r)H(r).
(3)
En régime variable, la réponse magnétique d’un milieu n’est pas instantanée. Dans le domaine temporel, l’aimantation s’obtient en convoluant (voir le Comp. A de l’Exp. I.5, « Spectroscopie par transformée de Fourier ») l’excitation H(r, t) lui ayant donné naissance avec la fonction de réponse [χ](r, t). On peut alors écrire l’Éq. (3) pour les composantes spectrales des grandeurs qui dépendent de la pulsation ω : en effet un produit de convolution dans le domaine réel (ici temporel) se réduit à un produit simple dans l’espace réciproque (ici fréquentiel).
En supposant de plus le milieu homogène et isotrope, ce qui est le cas de la majorité des fluides et des solides amorphes ou polycristallins, le tenseur de susceptibilité est indépendant de la position r et se réduit à [χ] = χ1 où χ est un scalaire et 1 désigne la matrice identité. Moyennant toutes ces hypothèses 2 , M est relié simplement à H et à B par : 1 χ χ B= B, (4) µ0 1 + χ µ0 µr où l’on a introduit la perméabilité magnétique relative µr = 1 + χ, de sorte que B = µ0 µr H. M = χH =
La densité volumique d’énergie magnétique emmagasinée dans un matériau Emag = H · B/2 = µ0 µr H 2 /2 doit être positive, ce qui implique que µr ≥ 0 et donc χ ≥ −1.
1.3 Quelques catégories de milieux magnétiques Les milieux magnétiques présentent des comportements divers, car leur susceptibilité magnétique peut varier sur plusieurs ordres de grandeur et prendre un signe 1. La susceptibilité magnétique est parfois qualifiée de volumique (en référence à l’aimantation) [5]. Nous éviterons ce qualificatif pour prévenir toute confusion sur sa dimension. 2. On pourra consulter la Réf. [6] pour un exposé plus approfondi.
108
Magnétisme
quelconque. La réponse du matériau dépend de sa nature, mais aussi des conditions physiques (champ magnétique, température, pression, etc.) auxquelles il est soumis. Nous listons ci-après les trois grands types de comportements magnétiques. Le diamagnétisme est le comportement des milieux linéaires dont la réponse magnétique induite est faible et opposée au champ appliqué ; ils se caractérisent par une susceptibilité magnétique négative variant généralement entre −10−9 et −10−4 . On peut l’interpréter classiquement comme un phénomène d’induction : selon la loi de Faraday-Lenz, le moment magnétique induit des électrons s’aligne dans la direction opposée au champ appliqué. Cet effet est toujours présent dans la matière, mais il est masqué si les entités chimiques portent un moment permanent (paramagnétisme, ferromagnétisme, etc.) [2, 3]. Des corps comme H2 , N2 , ou encore CO2 , sont des exemples de milieux diamagnétiques, en phase liquide comme gazeuse. Les matériaux supraconducteurs sont des « diamagnétiques parfaits », pour lesquels la susceptibilité atteint la valeur minimale χ = −1. Leurs propriétés particulières sont étudiées dans l’Exp. V.5, « Supraconductivité : lévitation Meissner et chute de résistivité ».
Le paramagnétisme désigne également un comportement des milieux linéaires, mais contrairement au diamagnétisme, l’aimantation est dirigée dans le sens du champ appliqué. La susceptibilité magnétique est donc positive ; elle varie de 10−5 à 10−3 selon le matériau, à température ambiante. Microscopiquement, le paramagnétisme apparaît lorsque les entités chimiques possèdent un moment magnétique permanent, qui peut ainsi s’aligner avec le champ extérieur. C’est le cas des atomes dont une des couches électroniques internes est incomplète, en particulier les éléments de transition (Cr, Co...) ou les terres rares [7]. On peut montrer que la susceptibilité d’un système de moments magnétiques indépendants (sans interaction) vérifie χ ∝ 1/T . Cette relation, appelée loi de Curie, est en bon accord avec l’expérience pour un système dont les interactions entre moments magnétiques microscopiques sont faibles (en particulier dans une phase paramagnétique).
La susceptibilité des matériaux diamagnétiques ou paramagnétiques est faible, de sorte que l’Éq. (4) se simplifie en M ' χB/µ0 . Le ferromagnétisme est caractérisé par l’existence d’une aimantation spontanée à l’échelle mésoscopique (celle des domaines de Weiss [1]), et par un comportement fortement non linéaire avec une aimantation très forte dans le sens du champ extérieur (supérieure de six ordres de grandeur à celle du paramagnétisme). Contrairement aux deux cas précédents, l’interaction entre les moments magnétiques microscopiques permanents est grande en comparaison de l’énergie typique d’agitation thermique. Notons que la définition de la susceptibilité doit être modifiée à cause de l’hystérésis et de la non-linéarité du matériau. Ces propriétés des matériaux ferromagnétiques (notamment l’existence d’une aimantation permanente même en l’absence de champ appliqué) seront étudiées dans les Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique », II.3 « Domaines de Weiss : origine de l’hystérésis ferromagnétique » et II.4 « Mesure du moment magnétique d’un aimant permanent » auxquelles nous renvoyons pour plus de détails.
II.1 Ascension d’un liquide paramagnétique
109
2 Méthode de Quincke Nous décrivons dans la Sec. 2.1 le principe d’une méthode due à G. Quincke [8], permettant de mesurer la susceptibilité magnétique d’une solution paramagnétique en suivant la dénivellation du liquide dans un tube soumis à un gradient de champ magnétique. La mise en œuvre pratique sera étudiée en Sec 2.2.
2.1 Principe de la méthode et bilan des forces La solution paramagnétique dont on souhaite mesurer la susceptibilité χsol est contenue dans un tube en forme de U. Les extrémités verticales du tube sont notées 1 et 2, de section S1 et S2 respectivement (Fig. 1). Le fluide est soumis à un champ magnétique dont l’intensité varie le long du tube. Nous écrivons le bilan des forces pour le fluide au repos dans le référentiel du laboratoire, supposé galiléen. Le fluide est soumis, en plus des forces de pression, au poids et à une force volumique d’origine magnétique due à l’inhomogénéité du champ dans le fluide. L’équilibre hydrostatique du fluide est donc donné par 0 = −∇p + ρsol g +
χsol ∇(B 2 ), 2µ0
(5)
avec p la pression, g = −gez l’accélération de la pesanteur et ρsol la masse volumique de la solution. Le dernier terme de l’Éq. (5) correspond à la force magnétique volumique exercée sur un milieu local linéaire et isotrope de susceptibilité très inférieure à 1 (voir le Comp. A). On réécrit l’Éq. (5) dans le cas d’un milieu homogène : χsol 2 0 = ∇ −p − ρsol gz + B . (6) 2µ0 La quantité entre parenthèses est uniforme dans tout le fluide. En particulier, elle prend la même valeur au niveau de chaque interface libre, où la pression est égale S1
ez
S2 BE , patm ∆h1
z0 z + dz z
B0 , patm −∇p
fmag
∆h2
ρsol g
Fig. 1 Bilan des forces sur une tranche de fluide à l’équilibre de hauteur dz et de section S1 , baignant dans un champ magnétique inhomogène. Elle est soumise au poids (en bleu), aux forces de pression (en rouge) et à la force magnétique responsable de l’ascension (en vert). La dénivellation du fluide est représentée par l’aire hachurée en jaune.
110
Magnétisme
à la pression atmosphérique patm (nous reviendrons sur cette hypothèse dans la Sec. 4). L’intensité du champ magnétique est notée BE (l’indice « E » se rapporte à l’électroaimant, voir la Sec. 2.2.3) au niveau de la surface libre du tube 1 située en z1 = z0 + ∆h1 et B0 au niveau de la surface libre du tube 2 située en z2 = z0 − ∆h2 . On obtient χsol 2 (B − B02 ) = ρsol g(∆h1 + ∆h2 ). (7) 2µ0 E Grâce à la conservation du volume de fluide déplacé S1 ∆h1 = S2 ∆h2 , il est possible d’éliminer une des deux dénivellations, on peut donc se contenter de n’en mesurer une seule. On choisit d’éliminer ∆h1 au profit de ∆h2 (voir la Sec. 2.2.2), de sorte que ∆h2 =
χsol (B 2 − B02 ). 2µ0 ρsol g(1 + S2 /S1 ) E
(8)
2.2 Réalisation pratique de la méthode 2.2.1 Préparation de la solution paramagnétique On obtient une solution paramagnétique en diluant un sel paramagnétique dans un solvant (en général de l’eau distillée). La susceptibilité de la solution peut être reliée linéairement à celle de ses constituants purs sous l’hypothèse que les moments magnétiques du solvant et du sel n’interagissent pas, autrement dit que la solution est idéale (loi de Wiedemann) [9] : χsol,m = tm χsel,m + (1 − tm )χeau,m ,
(9)
où tm désigne le titre massique en sel de la solution et χi,m = χi /ρi est la susceptibilité massique du constituant i, et s’exprime en m3 ·kg−1 . La susceptibilité de quelques sels paramagnétiques est indiquée dans le Tab. 1. Pour les valeurs tabulées en convention CGS (par exemple dans la Réf. [5]), on prendra garde au facteur 4π dans la correspondance avec les conventions SI : χSI = 4πχCGS . Les interactions entre moments élémentaires des molécules en solution font que le champ magnétique local en un point P (défini comme la somme du champ extérieur imposé et du champ créé par les molécules, en excluant le champ de la molécule placée en P ), diffère en général du champ total macroscopique (qui inclut le champ créé par
Sel −3
χSI (10
)
FeCl2 ·4 H2 O 1,57
FeCl3 ·6 H2 O 1,29
FeSO4 ·H2 O 2,33
FeSO4 ·7 H2 O 0,96
Tab. 1 Susceptibilités magnétiques (sans dimension, en convention SI pour les champs) de quelques sels paramagnétiques hydratés à température ambiante, calculées à partir de la Réf. [5]. À titre de comparaison, χeau ' −9 × 10−6 . Ces sels peuvent tous être utilisés en solution pour la méthode de Quincke, mais les composés chlorés sont corrosifs et l’utilisation de gants et de lunettes est recommandée.
II.1 Ascension d’un liquide paramagnétique
111
la molécule placée en P et un lissage sur une échelle mésoscopique). Toutefois, dans l’approximation χ 1, on peut confondre au premier ordre en χ le champ local avec le champ macroscopique total. Nous renvoyons à la Réf. [1] pour plus de détails.
Si la solution paramagnétique est déjà préparée, il est impératif de connaître son titre massique tm avec précision. Sinon, il est préférable de préparer une solution à partir de sels paramagnétiques dont la susceptibilité est tabulée. À partir de l’Éq. (9), on exprime la susceptibilité de la solution en fonction de celle du sel et de sa masse volumique ρsel , selon ρsol tm ρsel 1 χeau . χsel − 1 − (10) χsol = ρsel tm ρeau 2.2.2 Réduction de l’incertitude relative sur la dénivellation Afin de réduire l’incertitude relative sur la dénivellation, on maximise ∆h2 en choisissant une section S2 petite par rapport à S1 . En effet d’après l’Éq. (8), ∆h2 est d’autant plus grand que le rapport S2 /S1 est faible, toutes choses étant égales par ailleurs. On peut également projeter une image agrandie du tube 2 sur un écran placé derrière une lentille convergente (Fig. 2), ce qui facilite la lecture de ∆h2 et réduit l’incertitude relative sur sa détermination en augmentant la résolution. La dénivellation mesurée sur l’écran est alors ∆hmes = Γ∆h2 , avec Γ le grandissement du système de projection. L’Éq. (8) donne ainsi ∆hmes =
Γχsol (B 2 − B02 ). 2µ0 ρsol g(1 + S2 /S1 ) E
(11)
L’Éq. (11) indique également que ∆hmes est d’autant plus importante que l’écart BE2 −B02 est important. Afin que la dénivellation du fluide soit importante, on impose un champ magnétique d’amplitude BE élevée à l’une des deux extrémités du tube, quand l’autre n’est soumise qu’au champ magnétique ambiant (champs magnétiques résiduels des appareils alentour et champ terrestre) d’amplitude constante B0 ' 5 × 10−5 T. Néanmoins, si le tube 2 est proche de la source de champ magnétique intense, ce champ B0 peut être plus important et varier avec BE . Nous travaillerons dans la suite en conservant ce terme dans les équations bien que B0 soit dans notre cas très petit devant BE . 2.2.3 Production d’un champ magnétique intense Un électroaimant muni de pièces polaires plates génère un champ BE horizontal et intense dans son entrefer (de l’ordre de 1 T) mais diminuant rapidement hors de celui-ci. Puisque seule la norme au carré du champ intervient dans l’Éq. (11), le sens du champ (et donc du courant circulant dans les bobines de l’électroaimant) n’a pas d’importance. Il est déconseillé d’utiliser des pièces polaires tronconiques. Certes, elles créent un champ plus intense que les pièces plates à courant donné, ce qui augmenterait la dénivellation du liquide, qui serait alors plus facilement mesurable. Mais si on
112
Magnétisme
augmentait trop la valeur du champ dans l’entrefer, la surface libre du tube 1 pourrait sortir de la zone centrale de l’entrefer, et serait alors soumise à un champ inconnu, de norme plus faible. Les pièces plates créent un champ uniforme sur une région beaucoup plus large du tube, de sorte que la surface libre est maintenue à un champ BE connu pendant toute la durée de l’expérience. En outre, plus la section S1 est grande, plus la dénivellation dans le tube 1 est faible, et plus on peut appliquer un champ intense avant que la surface libre ne sorte de l’entrefer.
3 Mesure de la susceptibilité magnétique 3.1 Protocole Nettoyer préalablement deux pipettes (dont la plus fine au moins est graduée) très soigneusement avec de l’acétone puis de l’éthanol, et les sécher afin d’éviter les phénomènes de mouillage (voir la Sec. 4). Réaliser ensuite un tube en U, en reliant les deux pipettes par un tuyau, puis fixer le tout à l’aide d’une potence (Fig. 2). Placer la pipette la plus large dans l’entrefer d’un électroaimant à pièces polaires plates (voir la Sec. 2.2.3) et la pipette graduée le plus loin possible. Remplir le tube en U avec la solution paramagnétique étudiée jusqu’à ce que le ménisque se situe à hauteur des pièces plates de l’électroaimant. Réduire au minimum l’épaisseur de l’entrefer pour maximiser le champ magnétique BE , tout en assurant un espace suffisant pour la mesure du champ magnétique au niveau du ménisque avec une sonde à effet Hall (voir le Comp. B). Durant toute l’expérience, on s’assurera que la sonde reste au niveau du ménisque, et on gardera l’épaisseur de l’entrefer constante. Mesurer également la valeur B0 du champ magnétique ambiant au niveau du tube 2. potence filtre AC pipette gradu´ee lampe ´electroaimant
lentille
alimentation ´ecran solution paramagn´etique Fig. 2 Schéma du dispositif expérimental. La solution paramagnétique est versée dans un tube en U composé de deux pipettes reliées par un tuyau. L’interface de la pipette la plus large est placée dans l’entrefer d’un électroaimant. L’image de l’autre interface est projetée sur un écran par l’intermédiaire d’un système optique constitué d’une lampe, d’un filtre anticalorique et d’une lentille. La sonde à effet Hall, située dans l’entrefer de l’électroaimant, n’est pas représentée.
II.1 Ascension d’un liquide paramagnétique
113
La détermination de BE par un étalonnage en fonction du courant parcourant les bobines de l’électroaimant est impossible ici à cause de l’hystérésis du matériau ferromagnétique (voir l’Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique »). On positionnera la sonde de sorte que la normale à sa plaque semi-conductrice soit parallèle à l’axe de l’entrefer. En effet, si la normale à celle-ci fait un angle θ avec la direction du champ à mesurer, il en résulte une sous-estimation sur la mesure de BE2 d’un facteur sin2 (θ). Une erreur de positionnement de la sonde de 5° engendre une erreur relative sur BE2 négligeable (0,8 % environ).
Éclairer l’autre ménisque avec une lampe. Si la lampe (quartz-iode par exemple) risque d’échauffer la solution, disposer un filtre anticalorique (AC) permet d’éviter la dilatation thermique du liquide et une variation de la susceptibilité du liquide paramagnétique avec la température (voir la Sec. 1.3). Faire l’image du ménisque sur un écran à l’aide d’une lentille de projection de courte distance focale (par exemple f ' 10 cm). Les graduations de la pipette sont utiles pour régler la netteté de l’image et pour calculer le grandissement Γ du système optique. En l’absence de graduations, le diamètre extérieur de la pipette peut aussi servir d’échelle de distance. Une lentille de courte distance focale permet de maximiser le grandissement tout en minimisant l’encombrement. On veillera aussi à bien aligner le montage horizontalement pour éviter des erreurs de parallaxe et à respecter la règle du « plus plat, plus près » pour la lentille [10].
Augmenter lentement l’intensité I du courant continu imposé par l’alimentation électrique pour augmenter la norme du champ BE dans l’entrefer. Mesurer la dénivellation ∆hmes sur l’écran, ainsi que BE . Répéter l’opération en augmentant toujours I pour éviter les effets d’hystérésis de mouillage discutés dans la Sec. 4. Une fois seulement après avoir atteint le courant maximal admissible par l’électroaimant, on peut obtenir un cycle complet en diminuant progressivement l’intensité du courant jusqu’à zéro.
3.2 Résultats Nous avons préparé une solution paramagnétique à partir d’un sel hexahydraté FeCl3 · 6 H2 O dont la susceptibilité est donnée dans le Tab. 1. La courbe de la dénivellation mesurée sur l’écran en fonction de la différence du carré des normes du champ au niveau des deux interfaces est tracée sur la Fig. 3. Deux ajustements affines ∆hmes = a(BE2 − B02 ) + b sont réalisés, l’un pour les mesures en champ croissant (en bleu), l’autre pour celles en champ décroissant (en rouge). La pente de l’ajustement en champ croissant (resp. décroissant) est ac = (15,37 ± 0,13) cm·T−2 (resp. ad = (15,65 ± 0,14) cm·T−2 ). L’incertitude-type sur BE est due à la précision de la sonde à effet Hall indiquée par le constructeur qui est de 1 % sur la gamme étudiée et à l’incertitude liée à sa résolution d’au plus 1 mT. L’incertitude-type de 0,9 mm sur ∆hmes est due à l’étalement d’environ 3 mm du ménisque sur l’écran. Les ordonnées à l’origine sont très faibles devant les valeurs typiques de dénivellation mesurées, et celle obtenue en champ croissant n’est pas compatible avec zéro. Ce dernier point ainsi que l’origine de l’écart (ici minime) entre ces deux courbes seront expliqués
114
Magnétisme 20
∆hmes (cm)
16 12 8 BE croissant BE d´ecroissant
4 0 0,0
0,2
0,4
0,6 0,8 BE2 − B02 (T2 )
1,0
1,2
Fig. 3 Dénivellation mesurée sur l’écran pendant un cycle complet (montée et descente du champ magnétique) en fonction du carré du champ magnétique dans l’entrefer. Un ajustement affine ∆hmes = a(BE2 − B02 ) + b a été réalisé indépendamment sur les deux courbes. On obtient ac = (15,37 ± 0,13) cm·T−2 et bc = (−0,26 ± 0,04) cm pour la montée (en bleu), et ad = (15,65 ± 0,14) cm·T−2 et bd = (−0,04 ± 0,04) cm pour la descente (en rouge).
dans la Sec. 4. En combinant les Éq. (10) et (11), on exprime la susceptibilité volumique du sel en fonction de la pente des ajustements expérimentaux (notée a) : 2µ0 ρsel g(1 + S2 /S1 ) 1 ρsel + 1− χeau . (12) χsel = a Γtm tm ρeau Les diamètres des tubes d1 et d2 sont mesurés au pied à coulisse 3 et permettent de calculer les sections S1 et S2 tandis que le grandissement Γ est obtenu par le rapport entre la distance mesurée sur l’écran séparant un certain nombre de graduations et leur distance réelle sur la pipette. Les valeurs numériques utiles sont reportées dans le Tab. 2. Grandeur
Valeur
Γ tm d1 d2
11,9 ± 0,2 0,583 4 (6,0 ± 0,1) mm (2,5 ± 0,1) mm
Grandeur
Valeur
ρsel S1 S2
1,82 × 103 kg·m−3 [5] (2,8 ± 0,1) × 10−5 m2 (4,9 ± 0,4) × 10−6 m2
Tab. 2 Valeurs numériques des paramètres de l’expérience.
3. L’incertitude est notablement plus large que la résolution du pied à coulisse (0,02 mm) car il est difficile de mesurer les rayons internes des tubes de verre très précisément. 4. L’incertitude sur tm est très faible devant les autres incertitudes et est donc négligée.
II.1 Ascension d’un liquide paramagnétique
115
La valeur de la susceptibilité du sel moyennée pour les champs croissant et décroissant est χFeCl3 ·6 H2 O,exp = (1,19 ± 0,03) × 10−3 . (13) La valeur tabulée donnée dans le Tab. 1 est χFeCl3 ·6 H2 O,tab = (1,29 ± 0,03) × 10−3 où l’incertitude vient de la plage de température sur laquelle est référencée cette valeur (entre 285 K et 300 K). L’écart entre ces deux valeurs provient probablement de l’Éq. (10), qui néglige surtout les interactions entre espèces différentes (ici l’eau et le sel paramagnétique). Lors de la dilution du sel paramagnétique dans l’eau, la modification des interactions entre les moments magnétiques des espèces peut conduire à une diminution de la susceptibilité de la solution. Pour étudier cet effet de solvatation, on pourrait répéter l’expérience pour différents titres massiques afin de vérifier la validité de la loi de Wiedemann.
4 Hystérésis de mouillage Si les tubes sont initialement mal lavés, il apparaît un effet d’hystérésis de mouillage plus important entre la montée et la descente du liquide dans le tube. Nous montrons comment le mouillage modifie la loi (11) et comparons nos résultats aux courbes expérimentales obtenues avec la même solution et le même dispositif expérimental que dans la section précédente (seule la valeur du grandissement Γ change par rapport au Tab. 2).
4.1 Effets capillaires L’angle de contact entre le ménisque et la paroi du tube n’est pas le même lorsque le liquide monte ou descend (Fig. 4). Cet angle, appelé angle de mouillage, varie entre un angle d’avancée θa quand le liquide monte et un angle de reculée θr lorsqu’il descend. Ce phénomène, nommé hystérésis de mouillage, est dû à la présence de rugosités ou d’hétérogénéités chimiques sur les parois des tubes [11, 12] et est donc d’autant plus présent que le tube n’a pas été soigneusement nettoyé (voir la Sec. 3.1). Les effets capillairesp dominent la pesanteur aux petites échelles, en deçà de la longueur capillaire lc = γsol /ρsol g, où γsol est le coefficient de tension superficielle entre l’air et la solution. Une mesure de la tension superficielle de la solution par la méthode d’arrachement [10] donne γsol = (66 ± 2) mN·m−1 , valeur proche de la (a)
(b)
θa
θr
Fig. 4 Ménisque de la surface libre du tube 2 (a) lorsque le liquide avance (θa ' 75°), et (b) lorsqu’il recule (θr ' 50°). Le trait blanc mesure 1 mm.
116
Magnétisme
tension superficielle de l’eau à température ambiante. La masse volumique mesurée de la solution est ρsol = (1,350 ± 0,001) × 103 kg·m−3 . La longueur capillaire est donc de l’ordre de 2,5 mm, c’est-à-dire de l’ordre du diamètre du tube 2. Dans ce tube, les effets capillaires ne sont pas négligeables et nous devons les inclure dans l’équation de la statique du fluide et discuter de leurs conséquences.
4.2 Modélisation Dans le tube 2, la pression p2 du liquide à l’interface liquide/air dépend du rayon de courbure du ménisque R2 , considéré sphérique, selon la loi de Laplace [12] p2 = patm −
2γsol . R2
(14)
En revanche, le diamètre du tube 1 étant grand devant la longueur capillaire, on peut négliger l’effet du mouillage dans ce tube (p1 ' patm en très bonne approximation). Dans toute la suite, nous supposons que le ménisque du tube 2 est sphérique, c’està-dire R2 = d2 /2 cos(θ2 ) avec θ2 l’angle de mouillage. L’assimilation du rayon de courbure à celui d’une sphère n’est valable que si d2 lc , alors que dans notre cas le diamètre du tube 2 est de l’ordre de la longueur capillaire ; néanmoins nous nous contentons de cette approximation pour simplifier la modélisation. L’intégration du bilan des forces fait apparaître un terme supplémentaire par rapport à l’Éq. (6), dû à la différence de pression entre les tubes : χsol 2 (B − B02 ) = ρsol g(z1 − z2 ) + patm − p2 , 2µ0 E
(15)
où z1 et z2 désignent les cotes des bas des ménisques dans les tubes 1 et 2 respectivement. L’angle de mouillage θ2 dépend des conditions initiales. Que l’on ait ou non déjà effectué une fois l’expérience, on a initialement θ2 = θa 5 . Comme aucun champ magnétique n’est appliqué initialement, l’Éq. (15) donne 0 = ρsol g(z1 (B0 ) − z2 (B0 )) +
4γsol cos(θa ) . d2
(16)
On retrouve le phénomène d’ascension capillaire dû au mouillage et à la différence de diamètre entre les deux tubes décrit par la loi de Jurin [10, 12]. Appliquons un champ magnétique croissant dans l’entrefer : le ménisque du tube 2 recule et passe de θa à θr , l’angle de mouillage est modifié. Une fois que ce dernier atteint une valeur stationnaire, l’Éq. (15) donne χsol 2 4γsol cos(θr ) (BE − B02 ) = ρsol g(z1 (BE ) − z2 (BE )) + . 2µ0 d2
(17)
La soustraction de l’Éq. (16) à l’Éq. (17) donne χsol 2 S2 ∆hmes 4γsol 2 (B − B0 ) = ρsol g 1 + + (cos(θr ) − cos(θa )) . 2µ0 E S1 Γ d2
(18)
5. À la fin d’une expérience, nous annulons le champ magnétique en éteignant l’électroaimant : le ménisque du tube 2 remonte. Il en est de même lorsque l’on vient de remplir le tube en U.
II.1 Ascension d’un liquide paramagnétique
117
L’Éq. (18) prédit une ordonnée à l’origine si l’on trace ∆hmes en fonction de BE2 −B02 batt = −
4Γγsol (cos(θr ) − cos(θa )) . ρsol gd2 (1 + S2 /S1 )
(19)
Cette valeur est négative car cos(θr ) > cos(θa ) (la Fig. 4 montre que θr < θa ). Si maintenant on diminue le champ après qu’il a atteint son maximum, l’angle passe à nouveau de θr à θa dans le tube 2. La condition finale, une fois la descente effectuée, est la même que la condition initiale avec θ2 = θa . Dès lors, l’ordonnée à l’origine prédite par l’Éq. (18) doit être nulle pour la courbe de champ décroissant. Ce changement d’angle de mouillage, et donc d’ordonnée à l’origine, est la signature du phénomène d’hystérésis de mouillage.
4.3 Mesure des angles de mouillage En utilisant la même solution, le même montage et le même protocole qu’en Sec. 3 mais cette fois sans nettoyer les tubes, on photographie le ménisque dans le tube 2 au cours de l’ascension et de la descente du liquide pour chaque valeur de BE , puis on détermine son rayon de courbure en l’ajustant par un cercle. Connaissant le diamètre du tube, on évalue le cosinus de l’angle de mouillage grâce à la relation géométrique R2 = d2 /2 cos(θ). Cette procédure donne une valeur plus précise qu’en évaluant directement l’angle de mouillage sur l’image, car les bords intérieurs du tube ne sont pas toujours nets et la tangente au ménisque est difficile à estimer. La Fig. 5(b) montre l’évolution du cosinus de l’angle de mouillage en fonction de l’écart entre les carrés des champs au niveau des deux ménisques pour les mesures en champ (a)
(b) 10
6 4
0,8 cos(θ)
∆hmes (cm)
8
1,0
BE croissant BE d´ecroissant
BE croissant BE d´ecroissant
0,6
2
0,4
0 0,00 0,15 0,30 0,45 0,60 0,75 0,90 BE2 − B02 (T2 )
0,2 0,00 0,15 0,30 0,45 0,60 0,75 0,90 BE2 − B02 (T2 )
Fig. 5 (a) Cycle complet observé de la dénivellation du liquide dans le tube. Un ajustement affine ∆hmes = a(BE2 −B02 )+b est réalisé indépendamment sur les deux portions du cycle. On obtient ac = (11,2 ± 0,2) cm·T−2 et bc = (−1,2 ± 0,1) cm pour la montée (en bleu) et ad = (12,2 ± 0,2) cm·T−2 et bd = (0,4 ± 0,1) cm pour la descente (en rouge). Les points gris sont les points pour lesquels l’angle de mouillage varie significativement. (b) Évolution du cosinus de l’angle de mouillage dans le tube 2 en fonction de BE2 − B02 . Le cycle met en évidence l’hystérésis de mouillage au cours de l’expérience. On en déduit cos(θa ) = 0,27 ± 0,03 et cos(θr ) = 0,65 ± 0,04.
118
Magnétisme
croissant et décroissant. On en déduit expérimentalement la valeur moyenne des cosinus des angles d’avancée cos(θa ) = 0,27 ± 0,03 et de reculée cos(θr ) = 0,65 ± 0,04, correspondant aux valeurs des plateaux. En utilisant l’Éq. (19), avec un grandissement valant cette fois Γ = 10,1 ± 0,2, on att prédit une ordonnée à l’origine batt c = (−2,6 ± 0,4) cm (champ croissant) et bd = 0 (champ décroissant). On s’affranchit des erreurs systématiques sur la hauteur, liées en particulier au repérage du champ magnétique nul, en calculant la différence att batt = (−2,6 ± 0,4) cm. Celle-ci est à comparer à la valeur expérimentale c − bd donnée par l’ajustement des portions de courbes bleue et rouge de la Fig. 5(a) : bc − bd = (−1,6 ± 0,1) cm. Le modèle simplifié présenté surestime l’ordonnée à l’origine en valeur absolue. En effet, d2 ' lc , le ménisque n’est donc pas rigoureusement sphérique et sa courbure réelle en son milieu est plus faible [11]. Le modèle fournit toutefois une explication satisfaisante et un ordre de grandeur correct pour l’ordonnée à l’origine observée. D’autres méthodes de mesure de la susceptibilité magnétique existent. La balance de Gouy permet par exemple de mesurer la variation du poids apparent d’un échantillon lorsqu’il est placé dans un champ magnétique. La balance d’Evans constitue une amélioration du dispositif de Gouy : l’échantillon est placé entre deux aimants dont le champ est connu, reliés par un fil de torsion [13]. La mesure de la force exercée par l’échantillon sur l’un des aimants permet de remonter à la susceptibilité. La popularité de ce dispositif tient au fait qu’il permet des mesures à la fois rapides et précises (incertitude relative de l’ordre de 1 %). À l’origine, on mesurait la force à partir du courant qu’il fallait imposer à une bobine pour que le système revienne à l’équilibre ; désormais, ces mesures sont réalisées par des méthodes optiques, plus précises. Enfin, plusieurs techniques fondées sur la résonance magnétique nucléaire (RMN) permettent de déterminer la susceptibilité avec une grande précision, notamment celles de matériaux diamagnétiques, en mesurant la distorsion du champ magnétique et donc le déplacement chimique, pour diverses orientations spatiales de l’échantillon [9].
Complément A - Force subie par un matériau aimantable En toute généralité, la force F subie par un moment magnétique M placé dans un champ magnétique extérieur Bext s’écrit [1] F = ∇(M · Bext ),
(20)
où le moment magnétique M doit être considéré constant au cours de la dérivation. Dans une base orthonormée (ex , ey , ez ), les composantes de cette force sont Fx = M ·
∂Bext , ∂x
Fy = M ·
∂Bext , ∂y
Fz = M ·
∂Bext . ∂z
(21)
Puisque M est considéré constant dans l’Éq. (20), on peut montrer par analyse vectorielle que F = ∇(M · Bext ) = (M · ∇) Bext + M × (∇ × Bext ). Dans le
II.1 Ascension d’un liquide paramagnétique
119
cas spécifique d’un champ Bext à rotationnel nul (donc en l’absence de courants extérieurs au voisinage du moment magnétique), on a F = (M · ∇) Bext . Considérons maintenant, dans un échantillon de matériau magnétique d’aimantation M , un élément de volume mésoscopique dV portant un moment magnétique dM = M dV . Cet élément est soumis à une force magnétique dF = ∇ dM · B 0 , 0 où B est le champ magnétique créé par l’ensemble des sources de champ à l’exception du volume de matériau considéré dV , c’est-à-dire par les courants libres et le reste du matériau aimantable. La force volumique dans le matériau s’écrit fmag = ∇ M · B 0 . Dans le volume de l’échantillon, le champ B 0 s’assimile à B, qui désigne le champ magnétique total dans le matériau. En revanche, B n’est pas défini à sa surface car l’aimantation y est discontinue. On peut cependant prouver que le champ B 0 défini cette fois relativement à un élément de surface infinitésimal du matériau, est continu à l’interface. La contribution de l’interface n’est pas négligeable, et il est difficile d’écrire une expression générale exploitable de la force volumique subie par le matériau.
Si on suppose le matériau linéaire et de susceptibilité magnétique χ 1, on peut se restreindre à calculer cette force au premier ordre en χ. En notant B0 le champ magnétique extérieur produit uniquement par des courants libres circulant en dehors du matériau magnétique, on obtient B 0 ' B ' B0 et M=
1 χ χ B' B0 . µ0 χ + 1 µ0
(22)
On peut alors donner une expression de la force volumique magnétique appliquée sur le matériau : fmag '
χ χ χ (B0 · ∇)B0 + B0 × (∇ × B0 ) = ∇(B0 2 ), µ0 µ0 2µ0
(23)
où dans la dernière égalité nous avons utilisé que ∇ × B0 = 0 dans le corps aimanté. Si l’on ne s’intéresse qu’à la résultante des forces, il n’est plus nécessaire de supposer χ 1 puisque la résultante des forces internes exercées par des moments du matériau sur d’autres moments est nulle, ce qui permet d’écrire ˚ F = fmag dV = (M · ∇) B0 + M × (∇ × B 0 ) , (24) V
et ce même si le moment magnétique total M du matériau dépend de B0 .
Complément B - Fonctionnement d’une sonde à effet Hall Une sonde à effet Hall est constituée d’une plaque semi-conductrice, parcourue par un courant (Fig. 6). Une fois plongée dans un champ magnétique, la plaque acquiert une tension UH , dite de Hall, liée à la composante normale à la plaque B du champ magnétique par la relation UH = RH iB/d, où i est l’intensité la traversant, RH la constante de Hall et d son épaisseur selon la direction ez perpendiculaire à
120
Magnétisme Uohm P 0 2
P2
i
Bez
(+)
Um
UH
Mat´ eriau semi-conducteur
P1 Fig. 6 Schéma d’une sonde à effet Hall, composée d’un matériau semi-conducteur parcouru par une intensité i. Placée orthogonalement à un champ magnétique Bez , une différence de potentiel UH , dite de Hall, apparaît entre les soudures (+) P1 et P20 . La mesure se fait cependant entre P1 et P2 , la tension Um mesurée contient alors une composante ohmique Uohm dont il faut s’affranchir.
la plaque [4]. La mesure d’un champ magnétique avec une telle sonde peut cependant présenter une erreur systématique, due à un défaut d’alignement des soudures. Notons P1 et P2 les points de mesure du potentiel sur la plaque semi-conductrice, a priori non alignés selon l’axe orthogonal à la direction du courant, et P20 le point opposé à P1 par rapport à la direction du courant (Fig. 6). La différence de potentiel (+) Um = UH +Uohm mesurée entre les deux soudures P1 et P2 contient alors la tension de Hall UH entre P1 et P20 et un terme ohmique Uohm entre P2 et P20 , dû au passage du courant i dans la sonde. Pour s’affranchir de Uohm , il faut retourner la sonde. Le champ magnétique vu par la sonde est alors de sens opposé et la tension mesurée (−) devient Um = −UH + Uohm . En prenant la différence des deux tensions, on obtient (−) (+) deux fois la tension recherchée : Um − Um = 2 UH . Comme la sonde possède une tension proportionnelle au champ que l’on mesure, on obtient B (+) −B (−) = 2 B, où B (+) est le champ lu sans retourner la sonde et B (−) le champ lu en la retournant.
Références [1]
M. Bertin, J.-P. Faroux et J. Renault, Électromagnétisme 4, milieux diélectriques et milieux aimantés. Dunod, 1996.
[2]
S. Blundell, Magnetism in condensed matter. Oxford University Press, 2001.
[3]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Physique statistique. Hermann, 1996.
[4]
C. Garing, Magnétisme : statique, induction et milieux. Ellipses, 1999.
[5]
W. Haynes, CRC handbook of chemistry and physics, 95e éd. CRC Press, 2014.
[6]
L. Dettwiller, « Propagation de la lumière, dispersion et absorption dans » : Optique géométrique et propagation, J.-L. Meyzonnette, éd., Hermès Lavoisier, 2003.
[7]
R. P. Feynman, R. B. Leighton et M. Sands, Le cours de physique de Feynman : électromagnétisme 2, 2e éd. Dunod, 2013.
II.1 Ascension d’un liquide paramagnétique
121
[8]
G. Quincke, « Electrical investigations, » Ann. Phys., 24 (3), p. 347-416, 1885.
[9]
P. Kuchel, B. Chapman, W. Bubb, P. E. Hansen et al., « Magnetic susceptibility: solutions, emulsions, and cells, » Concepts Magn. Reson. A, 18 (1), p. 56-71, 2003.
[10]
M. Fruchart, P. Lidon, E. Thibierge, M. Champion et A. Le Diffon, Physique expérimentale. De Boeck Supérieur, 2016.
[11]
E. Guyon, J.-P. Hulin et L. Petit, Hydrodynamique physique, 3e éd. EDP Sciences, 2012.
[12]
P.-G. De Gennes, F. Brochard-Wyart et D. Quéré, Gouttes, bulles, perles et ondes, 2e éd. Belin, 2005.
[13]
D. Evans, « A new type of magnetic balance, » J. of Phys. E : Sci. Instr., 7 (4), p. 247-249, 1974.
II.2
Cycle d’hystérésis d’un milieu ferromagnétique
Parmi les différentes propriétés magnétiques que peut présenter la matière, le ferromagnétisme se particularise par l’intensité et la non-linéarité de sa réponse à une excitation magnétique. Dans cette expérience, nous abordons le ferromagnétisme d’un point de vue macroscopique. Nous traçons les cycles d’hystérésis expérimentaux de matériaux ferromagnétiques doux ainsi que les courbes de première aimantation, et étudions la dépendance en fréquence des cycles d’hystérésis.
Sommaire 1 2 3 4
Introduction . . . . . . . Ferromagnétisme et cycles Construction du protocole Étude d’un cycle « doux »
. . . . . . . d’hystérésis expérimental . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
122 123 127 133
1 Introduction On distingue généralement trois grands types de comportements magnétiques d’un milieu : le diamagnétisme, le paramagnétisme et le ferromagnétisme. Ce dernier se définit comme étant la propriété qu’ont certains matériaux de s’aimanter très fortement sous l’application d’un champ magnétique extérieur, mais aussi de conserver cette aimantation lorsque le champ extérieur est annulé. Parmi les matériaux les plus courants, on peut citer le fer, le nickel et le cobalt. La terminologie « ferromagnétisme » provient d’ailleurs du fait que le fer est l’élément le plus abondant sur Terre parmi ceux présentant ce comportement. Non seulement la réponse d’un tel milieu à une excitation magnétique extérieure est non linéaire, mais son aimantation dépend aussi du champ magnétique qui lui a précédemment été appliqué : sa réponse magnétique présente une hystérésis, ce qui la rend encore plus complexe. La caractérisation de cette réponse magnétique et son analyse font l’objet de l’expérience que nous proposons ici. Les propriétés remarquables des matériaux ferromagnétiques sont mises à profit dans diverses applications de la vie courante : citons la fabrication d’aimants permanents (voir l’Exp. II.4, « Mesure du moment magnétique d’un aimant permanent ») ou la réalisation de circuits magnétiques couramment utilisés en électrotechnique (voir l’Exp. III.1, « Machine à courant continu » ou III.3, « Transformateur électrique monophasé » par exemple). Le comportement ferromagnétique de certaines roches permet par ailleurs de mesurer les variations du champ magnétique terrestre sur des temps géologiques, en étudiant l’aimantation rémanente des roches de la lithosphère : c’est le paléomagnétisme. 122
II.2 Cycle d’hystérésis d’un milieu ferromagnétique
123
Nous donnons une première approche de l’origine microscopique du ferromagnétisme ainsi qu’une description macroscopique qui suffit souvent pour des applications pratiques.
2 Ferromagnétisme et cycles d’hystérésis Avant toute chose, il est nécessaire de définir précisément ce qu’est un matériau ferromagnétique et d’établir les notions générales inhérentes au ferromagnétisme.
2.1 Transition de phase ferromagnétique-paramagnétique Le ferromagnétisme se caractérise par une aimantation potentiellement non nulle à champ magnétique extérieur nul. Lorsqu’on augmente la température T d’un tel matériau, on constate expérimentalement que son aimantation diminue. À champ nul, lorsque la température dépasse une certaine valeur critique TC , dite température de Curie, l’aimantation du matériau disparaît et celui-ci acquiert un comportement paramagnétique. Ce phénomène est caractéristique d’une transition de phase. Il est possible de comprendre l’origine de cette transition de phase à partir d’un modèle microscopique simple. Un matériau dont les constituants élémentaires (atomes, molécules, etc.) portent un moment magnétique non nul (dû aux spins électroniques par exemple), mais n’interagissant pas entre eux, acquiert un comportement paramagnétique [1]. Pour présenter des propriétés ferromagnétiques, il faut également qu’il existe entre les moments magnétiques atomiques une forte interaction favorisant leur alignement. Deux mécanismes sont alors en compétition dans le matériau. L’agitation thermique engendre des fluctuations de l’orientation des moments magnétiques et tend à les désorganiser, tandis que l’interaction entre les moments magnétiques tend au contraire à les aligner localement dans une même direction. À température élevée, l’effet de l’agitation thermique est prépondérant. À température faible, l’interaction des moments magnétiques domine, et on observe une aimantation macroscopique non nulle : le matériau est ferromagnétique. La prédominance de l’un ou l’autre de ces comportements peut être déterminée rigoureusement dans un cadre thermodynamique. À température T et volume V fixés, l’état d’équilibre du système est donné par la minimisation du potentiel énergie libre F [M ] = E[M ] − T S[M ], où pour une aimantation M donnée pouvant correspondre à plusieurs configurations microscopiques du système, E[M ] est l’énergie moyenne sur l’ensemble de ces configurations et S[M ] = kB ln (Ω[M ]) est l’entropie, qui dépend de leur nombre Ω[M ] [2]. La valeur de M à l’équilibre est celle qui minimise F . Lorsque T est faible, l’entropie contribue peu, et F [M ] est donc dominé par le terme énergétique E[M ]. Celui-ci est minimal lorsque les moments magnétiques sont alignés (M non nulle). À haute température au contraire, F [M ] est dominé par le terme entropique −T S[M ], qui est minimal lorsque les moments magnétiques sont désordonnés et orientés de manière aléatoire (M = 0). L’entropie est alors maximale car le système possède un nombre très important de configurations possibles. La phase dans laquelle se trouve le matériau résulte d’une compétition entre énergie et entropie. Pour déterminer la température critique TC , on peut comparer l’énergie d’agitation thermique kB T avec l’énergie caractéristique d’interaction des moments ma-
124
Magnétisme
gnétiques, issue d’un modèle microscopique 1 .
2.2 Origine de l’interaction entre atomes voisins Supposons que deux atomes voisins d’un matériau ferromagnétique solide interagissent uniquement via leurs moments magnétiques de spin, de norme µ. Dans l’approximation dipolaire, l’énergie d’interaction magnétique entre ces deux dipôles séparés d’une distance r a pour ordre de grandeur [2] µ0 µ2 . (1) 4πr3 L’ordre de grandeur d’un moment magnétique de spin est donné par le magnéton de Bohr µB ' 10−23 A·m2 . Pour une distance r de l’ordre de 10−10 m, typique de l’écart interatomique dans un solide, on a |Emag | ' 10−23 J, ce qui est inférieur à l’énergie d’agitation thermique kB T dès lors que la température dépasse 1 K. L’interaction dipolaire seule est alors insuffisante pour expliquer l’observation de comportements ferromagnétiques à température ambiante 2 . L’interaction tendant à aligner deux moments magnétiques voisins est en réalité d’origine quantique [2, 3]. Les moments magnétiques considérés sont des moments magnétiques de spin, portés par des électrons appartenant aux atomes du matériau. Considérons donc les spins de deux électrons (notés (1) et (2)) appartenant à deux atomes voisins et de moments magnétiques µ1 et µ2 . Comme les électrons sont des fermions, le vecteur d’état |Ψ(1, 2)i décrivant le système formé par les deux électrons doit être antisymétrique sous échange de (1) et (2). Autrement dit, on a |Ψ(1, 2)i = −|Ψ(2, 1)i. Or, cet état peut s’écrire comme le produit d’un vecteur d’état orbitalaire |ψorb (1, 2)i (décrivant les degrés de liberté de position des deux électrons) et d’un vecteur d’état de spin |ψspin (1, 2)i. Ainsi, si |ψorb (1, 2)i est symétrique sous échange de (1) et (2), il faut que |ψspin (1, 2)i soit antisymétrique sous cet échange, et vice versa. Une fonction d’onde orbitalaire antisymétrique permet une diminution de l’énergie d’interaction électrostatique, en minimisant le recouvrement entre les nuages électrostatiques. À l’inverse, une fonction d’onde symétrique est plus étendue spatiallement (les électrons sont délocalisés) et a une impulsion, et donc une énergie cinétique, plus faible d’après le principe d’indétermination de Heisenberg. Ainsi, pour un matériau donné, il est difficile de savoir si la fonction d’onde orbitalaire favorisée est symétrique ou antisymétrique ; cela dépend notamment de la distance interatomique et de la structure électronique des atomes. Si la fonction d’onde orbitalaire antisymétrique est favorisée, alors la fonction d’onde de spin est symétrique : les spins sont alignés et le matériau présente un comportement ferromagnétique. Dans le cas contraire où le vecteur d’état de spin antisymétrique est favorisé, les moments magnétiques µ1 et µ2 sont opposés. On parle alors d’antiferromagnétisme. |Emag | '
1. Le modèle le plus simple reproduisant les propriétés ferromagnétiques d’un ensemble ordonné d’atomes est le modèle d’Ising [2], qui ne considère qu’une interaction entre plus proches voisins, suffisante pour faire apparaître en dimension d ≥ 2 une transition de phase ferromagnétiqueparamagnétique. 2. Elle intervient en revanche à longue portée dans la décomposition d’un système ferromagnétique en domaines de Weiss (voir l’Exp. II.3, « Domaines de Weiss : origine de l’hystérésis ferromagnétique »).
II.2 Cycle d’hystérésis d’un milieu ferromagnétique
125
Cette interaction effective, dite d’échange, constitue une bonne explication du ferromagnétisme pour deux raisons [1]. Pour un solide donné, des calculs de matière condensée permettent de comparer les énergies d’interaction électrostatique des états orbitalaires symétrique et antisymétrique, et donc d’en déduire le comportement ferromagnétique ou antiferromagnétique. Ces calculs prédisent correctement la nature ferromagnétique du fer, du nickel et du cobalt purs, et antiferromagnétique du chrome et du manganèse purs. • L’interaction d’échange donne des énergies de couplage entre spins voisins de l’ordre de 10−20 J. Ses effets ne sont donc dominés par l’agitation thermique que pour des températures T ' 103 K, ce qui correspond aux températures de Curie observées usuellement. •
Le ferromagnétisme ne se rencontre que pour des solides cristallins. En effet, le mécanisme décrit ici ne saurait intervenir dans une phase fluide, dans laquelle les constituants élémentaires ne sont pas organisés selon un réseau. Il existe toutefois des « ferrofluides », constitués de particules ferromagnétiques solides en suspension dans un liquide visqueux (généralement des huiles) possédant un comportement paramagnétique et dont la susceptibilité est proche de celle des matériaux ferromagnétique les constituant (on parle de superparamagnétisme). Nous avons décrit ici une interaction d’échange entre atomes adjacents, dite directe. Elle peut également être médiée par un ion non magnétique du cristal ou par des électrons de conduction [3]. On parle alors de superéchange, ou d’échange indirect.
2.3 Domaines de Weiss Le mécanisme précédemment décrit permet d’expliquer l’existence de matériaux possédant une aimantation spontanée, en l’absence d’un champ magnétique extérieur. Cependant, certains matériaux présentent un comportement ferromagnétique (perméabilité magnétique élevée, non-linéarité par exemple) mais pas d’aimantation spontanée. Ce mécanisme ne permet donc pas d’expliquer à lui seul la réponse macroscopique d’un matériau ferromagnétique. Celle-ci dépend également de sa structure mésoscopique : un matériau ferromagnétique se divise en réalité en régions au sein desquelles les spins sont alignés, mais selon une direction qui varie d’une région à l’autre. Ces régions sont nommées « domaines de Weiss ». Le phénomène d’hystérésis du ferromagnétisme trouve son origine dans la dynamique de ces domaines, les propriétés de ces derniers seront étudiées en détail dans l’Exp. II.3, « Domaines de Weiss : origine de l’hystérésis ferromagnétique ».
2.4 Approche macroscopique du ferromagnétisme Il a été vu dans l’Exp. II.1, « Ascension d’un liquide paramagnétique », que l’étude macroscopique du magnétisme s’appuie sur les champs excitation magnétique H et aimantation M , reliés au champ magnétique B par la relation B = µ0 (H + M ).
(2)
Dans toute la suite, on considérera une excitation magnétique appliquée selon un axe fixe et on considérera les projections H, M et B des vecteurs H, M et B sur
126
Magnétisme
cette direction. Contrairement aux milieux diamagnétiques et paramagnétiques, la réponse en aimantation M = M (H) d’un milieu ferromagnétique isotrope à partir d’un état à H = 0 et M = 0, nommée « courbe de première aimantation », est non linéaire (Fig. 1(a)). •
•
•
Aux excitations faibles, M dépend linéairement de H, le coefficient de proportionnalité χ est la susceptibilité magnétique à l’origine. Les valeurs typiques de susceptibilités sont positives et atteignent des ordres de grandeur de 102 à 106 [1]. Pour des excitations plus importantes, la réponse est non linéaire et on ne peut plus définir une susceptibilité χ constante. On peut néanmoins lier M et H par une fonction χ(H), qui caractérise alors la courbe de première aimantation (voir la Sec. 4.2). Une fois que tous les moments magnétiques du milieu ont leur aimantation alignée selon l’excitation appliquée, l’aimantation atteint une valeur limite appelée aimantation à saturation et notée Ms . On aura alors toujours M = Ms , même si on continue d’augmenter H. D’un point de vue microscopique, le matériau constitue alors un unique domaine de Weiss, aimanté dans le sens de H.
Après avoir parcouru la courbe de première aimantation du milieu jusqu’à la saturation, on peut diminuer l’excitation H appliquée. La réponse magnétique ne suit alors pas la courbe de première aimantation parcourue précédemment : il y a un phénomène d’hystérésis (voir la Fig. 1(a)). L’aimantation suit une nouvelle courbe M (H) donnant, pour un H donné, une valeur de M plus élevée que la courbe de première aimantation. En particulier, on constate qu’une fois revenu à H = 0, l’aimantation a diminué mais ne s’est pas annulée : on l’appelle aimantation rémanente, notée Mr . Si on continue de diminuer H, l’aimantation diminue jusqu’à s’annuler pour H = −HcM où HcM est appelée excitation coercitive en aimantation. En poursuivant la diminution de H, le milieu prend des valeurs de M négatives jusqu’à saturer à M = −Ms . Si on augmente à nouveau H, on parcourt une courbe symétrique par rapport à l’origine de celle qui a été parcourue pour aller de +Ms à −Ms . On passera en particulier par les points (H = 0, M = −Mr ) puis (H = HcM , M = 0) avant d’atteindre de nouveau M = Ms pour une valeur suffisamment élevée de H. Le cycle ainsi parcouru est dénommé cycle d’hystérésis à saturation, présenté sur la Fig. 1(a). Notons qu’en réduisant la gamme d’exploration de H dès le tracé de la courbe de première aimantation, de sorte que le matériau n’atteigne jamais la saturation, on parcourt un cycle strictement inclus à l’intérieur du cycle à saturation. Ce cycle présente alors une aimantation M < Mr pour H = 0 et une excitation H < HcM pour M = 0. On peut également tracer le cycle à saturation en coordonnées (H, B), comme représenté en Fig. 1(b). Cette réponse en champ peut se déduire de la réponse en aimantation à l’aide de l’Éq. (2). On note deux distinctions fondamentales entre les deux représentations. •
Lorsque l’aimantation sature à M = Ms , le champ magnétique B = µ0 (H + Ms ) ne sature pas mais évolue linéairement en fonction de H.
II.2 Cycle d’hystérésis d’un milieu ferromagnétique (a)
127
(b) Ms
M
B µ0 Ms
Mr
Br
-HcM
H HcM -Mr
-HcM
HcB -HcB
H HcM
-Br -µ0 Ms
-Ms
Fig. 1 Cycles d’hystérésis à saturation dans les coordonnées (a) (H, M ) et (b) (H, B). Les courbes de première aimantation sont représentées par des lignes noires tiretées. Sur le cycle en coordonnées (H, B), la pente des asymptotes affines a été exagérée pour mieux illustrer la différence avec le cycle (H, M ).
•
Contrairement à M , le champ B ne s’annule pas si H = HcM , mais pour une valeur H = HcB < HcM , vérifiant la relation HcB + M (HcB ) = 0, appelée excitation coercitive en champ.
La connaissance des cycles d’hystérésis des matériaux ferromagnétiques permet de les classer en deux grandes catégories. Les matériaux ferromagnétiques doux possèdent une excitation coercitive HcM . 100 A·m−1 , et présentent donc un cycle d’hystérésis à saturation assez étroit et une aimantation facilement modifiable [1]. Les matériaux ferromagnétiques durs possèdent une excitation coercitive beaucoup plus élevée, entre 103 A·m−1 et 106 A·m−1 , et donc un cycle d’hystérésis à saturation très large. La saturation des matériaux durs est d’ailleurs difficilement atteignable dans le cadre de notre expérience, qui se restreint donc à l’étude des matériaux doux. Les matériaux durs seront étudiés plus en détail dans l’Exp. II.4, « Mesure du moment magnétique d’un aimant permanent ». Dans la section suivante, nous proposons un protocole permettant de tracer le cycle d’hystérésis de deux matériaux ferromagnétiques, afin d’évaluer les grandeurs d’intérêt Ms , Mr , HcM et HcB associées.
3 Construction du protocole expérimental Dans cette section, nous montrons comment mesurer l’excitation magnétique et le champ magnétique, à partir de la mesure de grandeurs électriques qui leur sont reliées.
3.1 Champ démagnétisant Pour tracer le cycle B = B(H) d’un matériau ferromagnétique, il est nécessaire de bien contrôler l’excitation magnétique H qui lui est appliquée. Dans l’approximation des régimes quasi stationnaires (ARQS) magnétique, on peut écrire deux des équations de Maxwell sous la forme suivante, adaptée à l’étude des milieux magnétiques :
128
Magnétisme
(
∇ × H = jlibre ∇·B =0
,
(3)
où jlibre désigne la densité de courants libres, excluant les densités de courants associées à la polarisation et l’aimantation de la matière [1]. L’Éq. (2) implique que ∇ · H = −∇ · M . La détermination de H peut être simplifiée en décomposant ce champ en la somme de deux composantes, l’une de rotationnel nul et l’autre de divergence nulle. On écrit donc de manière générale H = H0 + Hm , où H0 et Hm vérifient les équations suivantes : ( ( ∇ × H0 = jlibre ∇ × Hm = 0 , . ∇ · H0 = 0 ∇ · Hm = −∇ · M
(4)
(5)
La composante H0 est créée par les courants libres seuls ; elle représente l’excitation magnétique qui régnerait en l’absence du matériau magnétique. La composante Hm est induite par la présence du matériau ; elle est souvent nommée « champ démagnétisant ». Initialement, l’excitation H0 induit une aimantation dans le matériau, qui génère elle-même une excitation venant s’ajouter à l’excitation initiale, ce qui modifie à nouveau l’aimantation, et ainsi de suite. Avec H0 et Hm ainsi définis, H vérifie bien les équations de Maxwell (3). Dans un matériau ferromagnétique, l’excitation Hm n’est a priori pas négligeable devant H0 , comme cela serait le cas dans un matériau linéaire à faible susceptibilité magnétique. Elle n’est pas non plus contrôlée par l’expérimentateur comme l’est H0 . Il est toutefois possible, dans certaines géométries de matériau, telle la géométrie toroïdale, de se ramener à un champ démagnétisant nul et de contrôler ainsi directement H = H0 par l’intermédiaire des courants libres.
3.2 Intérêt de la géométrie toroïdale On considère un tore de matériau ferromagnétique (voir la Fig. 2), sur lequel est placé un bobinage que nous appellerons « primaire », constitué de NH enroulements recouvrant tout le tore de manière homogène, afin que la distribution de courants libres soit invariante par rotation. Ce bobinage est parcouru par un courant sinusoïdal iH (t), de fréquence suffisamment faible pour que l’on puisse travailler dans l’ARQS et considérer la réponse du milieu à une aimantation variable comme instantanée. Dans ce cadre, l’analyse des symétries et invariances suivie de l’application du théorème d’Ampère à H0 (Éq. (5)), sur un cercle de rayon r inclus dans le tore, donne l’excitation H0 créée par les courants libres au primaire en un point intérieur au tore de coordonnées polaires (r, θ) : H0 (t, r) =
NH iH (t) eθ , 2πr
(6)
où (O, er , eθ ) est le repère associé aux coordonnées polaires. À l’extérieur du tore, H0 est nulle partout [4]. L’application de cette excitation extérieure H0 dans le
II.2 Cycle d’hystérésis d’un milieu ferromagnétique
129
z
a b−a
O
b
eθ er
Fig. 2 Tore ferromagnétique à section carrée de côté b − a, a étant le rayon intérieur et b le rayon extérieur. Les vecteurs de la base polaire locale (er , eθ ) sont indiqués. Les bobinages ne sont pas représentés.
matériau ferromagnétique, considéré comme isotrope, engendre une aimantation locale M dans la direction de H0 , et dont la norme dépend de celle de H0 3 . Ainsi, on peut considérer que l’aimantation est de la forme M = M (t, r)eθ dans le tore, donc de divergence nulle. L’aimantation étant de plus nulle en dehors du tore, M est alors de divergence nulle partout. En reportant ce résultat dans l’Éq. (5), on voit que Hm est à la fois de divergence et de rotationnel nuls dans tout l’espace. Étant de plus nulle à l’infini, on montre à l’aide du théorème de Green que Hm = 0 uniformément [5]. Le champ H se réduit en tout point au champ H0 , donné par l’Éq. (6) dans le tore, et nul en dehors. La mesure du courant iH (t) parcourant le primaire donne alors directement accès à l’excitation magnétique totale H régnant en tout point du milieu, grâce à l’adoption de la géométrie toroïdale 4 .
3.3 Mesure des normes de H et B dans le matériau Nous avons vu comment l’emploi d’une géométrie toroïdale permet de connaître l’excitation magnétique H imposée. Nous utilisons donc un tore ferromagnétique dans notre expérience. Le choix de la forme de la section droite du tore est arbitraire ; nous utilisons un tore à section carrée, de circonférence moyenne `, de rayon intérieur a et de rayon extérieur b comme indiqué sur la Fig. 2. Dans la suite, les champs B, H et M sont supposés purement orthoradiaux. Nous décrivons maintenant la mesure de H et B à l’aide du circuit électrique schématisé sur la Fig. 3. Le principe est de faire parcourir périodiquement au matériau son cycle d’hystérésis en imposant une excitation magnétique H(t) sinusoïdale 5 , de fréquence f [4]. Le circuit primaire comprend NH enroulements recouvrant tout le tore, afin de se placer dans le cas décrit dans la Sec. 3.2. Il est branché en série avec une résistance R, et l’ensemble est alimenté par un amplificateur de puissance (son utilité est 3. Cette dépendance est complexe, puisque le milieu est non linéaire et sujet à hystérésis, mais sa connaissance exacte n’importe pas dans ce raisonnement. 4. Même dans le cas Hm = 0, l’expérimentateur n’a pas un contrôle total sur H car des courants de Foucault induits dans le matériau peuvent aussi générer une excitation magnétique (voir la Sec. 4.5). 5. Si le courant au primaire iH (t) est sinusoïdal, alors H(t) l’est aussi, mais pas B(t) du fait de la non-linéarité du matériau ferromagnétique.
130
Magnétisme Rd
amplificateur
iH
R
iB
vR
NH
NB
• • Ci
Ri
ve
+
vs
Fig. 3 Circuit électrique permettant le tracé d’un cycle d’hystérésis [6]. NH désigne le nombre d’enroulements du bobinage primaire, qui permet l’application de l’excitation magnétique. Pour la clarté de la figure, l’enroulement primaire représenté ne recouvre que partiellement le tore, ce qui n’est pas le cas en réalité.
discutée dans la Sec. 3.4), lui-même piloté par un générateur basses fréquences (GBF). Un courant sinusoïdal iH (t) parcourt donc le circuit primaire. La mesure de la tension vR (t) aux bornes de la résistance donne accès au courant iH (t) et donc à l’excitation magnétique H(t) dans le matériau d’après l’Éq. (6). H(t) est uniforme sur toute la hauteur du tore, et est donc indépendante de z. Cependant, la norme de cette excitation magnétique n’est pas uniforme sur toute une section droite du tore, et dépend de la coordonnée radiale r. On peut toutefois relier l’intensité iH (t) = vR (t)/R au primaire à la projection moyenne de H(t) selon eθ sur une section du tore, notée H(t), qui s’écrit H(t) =
1 b−a
ˆ
b
a
NH iH (t) NH ln (b/a) dr = vR (t). 2πr 2π(b − a)R
(7)
Nous mesurons par ailleurs les variations du flux magnétique à travers une section droite du tore à l’aide d’un second bobinage, que nous appellerons « secondaire » dans la suite. Notons NB le nombre d’enroulements du secondaire, et Φ = SB le flux magnétique à travers une section du tore, où S = (b − a)2 est l’aire de la section du tore et B la valeur moyenne de la projection de B selon eθ sur cette section. En vertu de la loi de Faraday, il s’établit une force électromotrice (f.é.m.) d’induction eext aux bornes du secondaire, donnée par la relation dB(t) dΦ(t) = −NB (b − a)2 . (8) dt dt La mesure de cette f.é.m. permet de remonter à B. La tension ve aux bornes du secondaire vaut en première approximation eext , et est appliquée en entrée d’un montage pseudo-intégrateur composé d’une résistance Ri et d’un condensateur de capacité Ci , représenté sur la Fig. 3 (voir la Sec. 4.1). En régime intégrateur, la tension vs en sortie de l’intégrateur vérifie eext (t) = −NB
dvs ve (t) NB (b − a)2 dB (t) = − = (t). dt Ri Ci Ri Ci dt
(9)
II.2 Cycle d’hystérésis d’un milieu ferromagnétique
131
En déchargeant le condensateur à un instant où le matériau est désaimanté (nous verrons comment le désaimanter dans la Sec. 4.2), et en choisissant cet instant comme origine des temps, on obtient une relation directe entre vs (t) et B(t) : B(t) =
Ri C i vs (t). NB (b − a)2
(10)
Cependant, la f.é.m. eext est également responsable de la circulation d’un courant iB au secondaire, qui crée dans le tore une excitation magnétique HB venant s’ajouter à l’excitation H0 créée par le circuit primaire. En appliquant l’Éq. (6) au secondaire, on trouve qu’en tout point du tore, kHB k / kH0 k = NB iB /NH iH . Il faut donc s’assurer que iB NH iH /NB pour pouvoir considérer que l’excitation magnétique totale dans le tore ferromagnétique est bien imposée par le courant iH seul. Pour cela, il faut que l’impédance d’entrée du montage intégrateur soit suffisamment importante. L’amplificateur opérationnel fonctionnant en régime linéaire, cette impédance d’entrée est donnée par la résistance Ri , que l’on choisira donc assez élevée. On vérifiera que iB NH iH /NB au cours de l’expérience. Le bobinage au secondaire possédant une résistance RB et une inductance propre LB , la tension au secondaire ve = eext − RB iB − LB diB /dt peut différer de la f.é.m. eext due à la circulation du courant au primaire. On peut approximer ve à eext si l’impédance d’entrée du montage intégrateur est grande en module devant l’impédance du bobinage secondaire. En prenant RB ' 10 Ω, LB ' 1 H, et T ' 10 s pour la période de iB , cela revient à exiger Ri RB et Ri LB /T . Une résistance Ri de l’ordre de 104 Ω convient alors.
Le montage présenté ici nous permet donc de déterminer l’excitation magnétique que l’on impose au matériau (Éq. (7)) et le champ magnétique qui y règne (Éq. (10)), en mesurant respectivement les tensions vR et vs .
3.4 Considérations énergétiques Le fait qu’un matériau présente une hystérésis d’aimantation a une conséquence énergétique importante. Un opérateur doit fournir un certain travail pour changer l’aimantation d’un matériau, par exemple de −Ms à Ms . Lorsque cet opérateur fait parcourir à un matériau le cycle d’hystérésis entier, il doit fournir un travail net Wcycle au matériau, puisque la relation M (H) est différente selon que H augmente ou diminue. Ainsi, faire parcourir son cycle d’hystérésis à un matériau ferromagnétique dissipe de l’énergie, généralement sous forme d’énergie thermique. Cela résulte de l’irréversibilité au niveau mésoscopique du mouvement de l’ensemble des domaines de Weiss composant le matériau. Il est possible d’obtenir une expression de Wcycle en fonction des caractéristiques du cycle d’hystérésis. Le calcul dans le cas général est complexe [1], mais peut s’effectuer plus simplement pour un tore ferromagnétique (voir la Sec. 3.3). On suppose pour simplifier que les normes des champs H = Heθ et B = Beθ sont uniformes dans le tore, ce qui revient à supposer que le rayon moyen du tore est bien plus grand que la taille typique de sa section. L’établissement du courant iH dans le bobinage primaire induit une force électromotrice e = −NH dΦ/ dt. Durant un court instant dt, le travail fourni par le générateur alimentant le primaire pour
132
Magnétisme
lutter contre la f.é.m. d’induction est δW = −e iH dt = NH
dΦ dB iH dt = NH SiH dt = NH SiH dB. dt dt
(11)
L’expression de H dans le tore 6 , donnée par l’Éq. (6), conduit à δW = `SH dB = V H dB,
(12)
où V = `S est le volume du tore. Le travail (positif) fourni par le générateur au cours d’un cycle s’écrit donc [4] ˛ ‰ Wcycle = δW = V H dB = V B dH. (13) cycle
ı
cycle
cycle
La grandeur cycle B dH = cycle H dB correspond à l’aire du cycle d’hystérésis B(H) du matériau. On fera attention au sens de parcours des cycles, il ne sera pas précisé dans la suite. L’énergie fournie par le générateur au cours d’un cycle est entièrement dissipée à cause de l’hystérésis du matériau. En pratique, des cadres ferromagnétiques sont utilisés dans des systèmes de conversion de puissance, notamment dans les transformateurs, où ils couplent magnétiquement deux circuits électriques (voir l’Exp. III.3, « Transformateur électrique monophasé »). Pour de tels systèmes soumis à des aimantations et désaimantations fréquentes, on préfère utiliser des matériaux ferromagnétiques doux, de cycle étroit et présentant donc de plus faibles pertes énergétiques. L’expression la plus générale de Wcycle , qui s’applique à toutes les géométries, est ˚ ˛ Wcycle = dV H · dB, (14) V
cycle
où dV désigne un élément de volume infinitésimal, et où l’intégration ne porte que sur le volume total V du matériau.
On peut également exprimer Wcycle en fonction des caractéristiques du cycle d’hystérésis en aimantation M (H). En injectant B = µ0 (H + M ) dans l’Éq. (14), on trouve ˚ ˛ ˚ ˛ Wcycle = µ0 dV (H · dM + H · dH) = µ0 dV H · dM , V
V
où la deuxième égalité vient du fait qu’on intègre une différentielle exacte H · dH = d(H 2 )/2 sur un contour fermé. Ce résultat n’est donc valable qu’à condition que le matériau revienne bien, au bout du cycle, à son état initial. En résumé, tracer le cycle d’hystérésis d’un matériau nécessite un apport d’énergie. Plus le cycle d’hystérésis du matériau étudié est large et la fréquence élevée, plus la puissance fournie par le générateur doit être importante afin de saturer périodiquement le matériau. Nous avons donc ajouté un amplificateur de courant au GBF branché sur le circuit primaire, afin de fournir la puissance nécessaire pour atteindre le cycle d’hystérésis à saturation. 6. Le calcul est plus compliqué pour une géométrie quelconque, car H ne s’assimile pas en général à H0 et comporte une contribution Hm due à l’aimantation du matériau.
II.2 Cycle d’hystérésis d’un milieu ferromagnétique
133
4 Étude d’un cycle « doux » Cette partie est consacrée au tracé et à l’étude d’un cycle d’hystérésis d’un matériau ferromagnétique doux. Le protocole adopté ici utilise le montage expérimental décrit dans la Sec. 3.
4.1 Bloc intégrateur et circuit électrique Un circuit RC, association en série d’une résistance R et d’un condensateur C, alimenté par un signal de pulsation ω, a un comportement pseudo-intégrateur si l’on mesure la tension de sortie aux bornes du condensateur, dans le régime RCω 1. Dans ce régime, un tel circuit présente une résistance d’entrée R, un gain 1/RCω et une fréquence de coupure 1/RC, au-dessus de laquelle le circuit intègre le signal d’entrée. Nous souhaitons avoir une résistance d’entrée élevée, pour pouvoir assimiler ve à eext , un gain suffisamment élevé, et une fréquence de coupure la plus faible possible, pour que le montage fonctionne en intégrateur sur des signaux de basse fréquence. Ces trois exigences sont difficiles à satisfaire simultanément avec un circuit RC. Nous choisissons donc de monter un circuit intégrateur comportant un amplificateur opérationnel (AO) supposé idéal (voir le bloc de droite sur la Fig. 3). Un tel montage est un intégrateur parfait, à toute fréquence, puisque les tensions en entrée et en sortie du circuit vérifient ve (t) = −Ri Ci dvs (t)/ dt. L’inconvénient d’un tel montage est l’absence de contre-réaction sur les tensions d’entrée continues, qui cause une dérive de l’intégration jusqu’à saturation de l’AO [7, 8]. Pour pallier ce problème, on peut brancher une résistance Rd en parallèle du condensateur. Les tensions ve et vs sont alors reliées par ve (t) = −Ri Ci
dvs (t) Ri − vs (t). dt Rd
(15)
Ainsi, la fréquence de coupure de ce montage intégrateur est 1/Rd Ci , et son gain est 1/Ri Ci ω : il est possible d’avoir une fréquence de coupure basse tout en gardant un gain raisonnable, en tirant profit du gain élevé de l’AO. Se munir d’un AO, sur lequel on aura pris soin d’annuler la tension de décalage selon la procédure détaillée dans la Sec. 3.1 de l’Exp. VI.1, « Pendule double puits électronique ». Réaliser un montage intégrateur comme sur la Fig. 3. On veillera à choisir Ri suffisamment grande, typiquement de l’ordre de 104 Ω pour les raisons évoquées dans la Sec. 3.3. Pour avoir un gain raisonnable, on pourra prendre Ci = 100 µF par exemple. Brancher un interrupteur ouvert en parallèle du condensateur. Sa fermeture temporaire permettra la décharge du condensateur et donc la remise à zéro de la tension de sortie de l’intégrateur. Brancher une résistance Rd en parallèle du condensateur. On travaille alors avec un montage pseudo-intégrateur, qui n’intègre correctement que les signaux dont la pulsation vérifie ω 1/Rd Ci . Dans nos expériences, la pulsation la plus faible correspond au tracé de la courbe de première aimantation, qui se fait typiquement sur une minute, soit à ω ' 0,1 rad·s−1 . Un bon compromis peut être de travailler à Ri = 10 kΩ, Ci = 100 µF et Rd 100 kΩ.
134
Magnétisme Nous avons utilisé un AO de type LTC1050CN8 pour lequel la tension de décalage est d’au plus ±5 µV (contre 1 mV pour un AO classique) et dont l’alimentation est stabilisée, afin de couper les perturbations amenées par le secteur. De la sorte, la dérive de l’intégrateur est faible et nous n’avons pas eu besoin de placer de résistance en parallèle de Ci .
Se munir également d’un GBF, d’un amplificateur de courant, d’un rhéostat, et enfin d’un tore fait en matériau ferromagnétique doux, muni d’un bobinage primaire uniforme sur les tores et d’un bobinage secondaire. Câbler l’ensemble de ces éléments ainsi que le montage intégrateur de sorte à obtenir le montage de la Fig. 3, en connectant le GBF à l’entrée de l’amplificateur de courant. Régler l’amplificateur de courant à son gain maximal. Si au cours des manipulations qui suivent, celui-ci ou l’AO viennent à saturer, il faudra soit diminuer son gain, soit diminuer l’amplitude de sa tension d’entrée. Visualiser les tensions vR et vs en mode XY sur un oscilloscope, avant de lancer une acquisition.
4.2 Courbe de première aimantation Un échantillon ferromagnétique de laboratoire peut présenter une aimantation rémanente. Pour tracer la courbe de première aimantation, il est d’abord nécessaire de le désaimanter. Pour ce faire, nous proposons le protocole suivant. Remettre à zéro la tension de sortie de l’intégrateur. Faire délivrer par le GBF une tension sinusoïdale d’une fréquence de quelques Hz, et d’amplitude élevée (dans notre cas environ 10 V avec un gain d’environ 3). Diminuer progressivement l’amplitude de la tension jusqu’à zéro, typiquement en une vingtaine de secondes tout en suivant l’évolution des tensions vR et vs à l’oscilloscope. La courbe que suit l’état magnétique du matériau dans le plan (H, M ) durant une désaimantation est représentée schématiquement sur la Fig. 4. On veillera à ne pas soumettre l’échantillon à des champs magnétiques parasites après cette manipulation. Nous pouvons maintenant tracer la courbe de première aimantation. Régler le GBF pour qu’il délivre une tension continue, prise nulle pour le moment (si nécessaire, remplacer le GBF par une source de tension continue). Attention à ne pas appliquer malencontreusement une tension non nulle à ce stade, auquel cas il faudra de nouveau désaimanter le matériau. Lancer l’acquisition des tensions vR , donnant H, et vs , donnant B. Augmenter progressivement la tension continue délivrée par le GBF jusqu’à atteindre la saturation du matériau, qui se traduit par une asymptote affine de vs en fonction de vR . Dans la pratique, on pourra aller jusqu’au courant maximal que peut délivrer l’amplificateur de courant. La durée de l’augmentation de la tension vR (et donc de l’acquisition) doit être grande devant le temps d’échantillonnage de la carte d’acquisition, afin d’obtenir
II.2 Cycle d’hystérésis d’un milieu ferromagnétique
Ms
135
M
H
Fig. 4 Lors d’une désaimantation, l’état magnétique du matériau dans le plan (H, M ) (représenté par la ligne rouge) est compris sur des cycles de plus en plus petits, inclus dans le cycle à saturation. Bien que le processus soit en réalité continu lorsque l’amplitude de la tension baisse continûment, nous n’avons ici représenté que trois variations soudaines de cycles. une courbe bien lisse. Nous avons utilisé une fréquence d’échantillonnage de 17 Hz et une durée totale d’acquisition de l’ordre de la minute.
Au cours de cette expérience, nous avons étudié deux matériaux : du fer doux et du ferrite de nickel (céramique isolante ferromagnétique). Leurs courbes de première aimantation B(H) sont représentées sur la Fig. 5. Nous n’avons pas représenté de courbe en aimantation M (H), car les excitations magnétiques auxquelles nous avons soumis les matériaux sont trop faibles pour observer une différence entre B et µ0 M : nous avons toujours |µ0 H| |B|. Dans le cas du ferrite, où B est plus faible, on a au plus |µ0 H| ' 10−3 T, pour B ' 10−1 T. On constate que le champ magnétique B n’évolue pas linéairement avec l’excitation magnétique H, comme décrit en Sec. 2.4. Par ailleurs, la courbe de première aimantation en coordonnées (H, B) doit présenter une pente à saturation µ0 = 4π × 10−7 H·m−1 , qui serait difficilement mesurable. Nous obtenons toutefois une pente bien supérieure à µ0 , de l’ordre de 10−3 H·m−1 pour le fer doux. Celle-ci est probablement due à une faible dérive de l’intégrateur utilisé pour la mesure de B. Une meilleure façon de détecter la saturation est de vérifier, sur le tracé d’un cycle complet, si les courbes à H croissant et H décroissant se superposent bien sur une certaine gamme au voisinage des extrema de H. Ainsi, les résultats de la Sec. 4.3, notamment la Fig. 6, suggèrent que nous avons bien ici atteint des valeurs de H permettant de saturer les deux matériaux étudiés. Les deux courbes de première aimantation présentent, comme indiqué en Sec. 2.4, une zone linéaire pour de faibles excitations magnétiques. A priori uniquement définie pour des matériaux linéaires, la perméabilité magnétique relative µr est aussi définie pour des matériaux ferromagnétiques doux par B = µ0 µr H. Elle n’est bien définie que sur la courbe de première aimantation, où B est une fonction univoque de H, et elle dépend de H puisque la réponse B(H) est non linéaire. Il est cependant utile de connaître un ordre de grandeur de la valeur maximale de µr = B/µ0 H, car il est courant d’approximer un matériau ferromagnétique doux par un matériau paramagnétique de très grande perméabilité magnétique. Ici on trouve µr ' 5000 pour
136
Magnétisme 1,5
B (T)
1,0 Fer doux Ferrite Ni 0,5
0,0
0
100
200
300 400 H (A.m−1 )
500
600
700
Fig. 5 Courbes de première aimantation d’échantillons de fer doux (en bleu) et de ferrite de nickel (en rouge). On retrouve l’évolution non linéaire décrite dans la Sec. 2.4 et une asymptote affine pour B(H).
le fer doux et µr ' 1000 pour le ferrite. Ces valeurs élevées sont typiques de matériaux ferromagnétiques et contrastent avec les valeurs de perméabilité très proches de 1 obtenues pour les matériaux paramagnétiques (voir l’Exp. II.1, « Ascension d’un liquide paramagnétique »).
4.3 Tracé du cycle Nous nous intéressons maintenant au tracé du cycle d’hystérésis à saturation du matériau. Régler le GBF pour qu’il délivre une tension sinusoïdale de faible fréquence, par exemple 50 mHz. De la sorte, le processus d’aimantation est quasi statique, et on peut négliger les effets dynamiques (voir la Sec. 4.5). Choisir l’amplitude maximale permise par l’amplificateur, afin d’atteindre le cycle à saturation du matériau (ou à défaut le plus large possible). Remettre l’intégrateur à zéro et observer l’allure de vs en fonction de vR à l’oscilloscope et vérifier que l’on atteint bien la saturation. Lancer l’acquisition des tensions vR et vs sur une durée correspondant à une période de vR (soit 20 s dans notre cas), de sorte à tracer exactement un cycle. Nous pouvons mesurer, à partir des cycles d’hystérésis à saturation représentés sur la Fig. 6, les propriétés magnétiques des échantillons de fer doux et de ferrite que l’on a rassemblées dans le Tab. 1. Les incertitudes sont données par les légères différences existant entre les grandeurs mesurées de chaque côté du cycle, qui est en théorie symétrique par rapport à l’origine (H = 0, B = 0). Les pertes par cycle sont ¸ définies par Wcycle /V = H dB (Éq. (13)), et correspondent à l’énergie par unité de volume à apporter pour parcourir une fois le cycle d’hystérésis. Elles sont obtenues en intégrant numériquement l’aire d’un cycle d’hystérésis (Sec. 3.4), à l’aide de la fonction scipy.integrate.simps de Python.
II.2 Cycle d’hystérésis d’un milieu ferromagnétique
137
1,5
B (T)
1,0 0,5 0,0 -0,5 -1,0
Fer doux Ferrite Ni
-1,5 -700
-500
-300
-100 100 H (A.m−1 )
300
500
700
Fig. 6 Cycles d’hystérésis à saturation pour le fer doux (en bleu) et le ferrite de nickel (en rouge). Les deux cycles sont approximativement symétriques par rapport à l’origine.
Dans le cas du fer doux, il est difficile de comparer ces mesures à des valeurs tabulées, car ses propriétés magnétiques dépendent très fortement de sa composition exacte (par exemple sa teneur en silicium), qui nous est ici inconnue. Les valeurs obtenues pour l’aimantation à saturation, le champ rémanent et l’excitation coercitive sont toutefois en accord avec les ordres de grandeur usuels [1, 9] : entre 0,5 et 2 T pour µ0 Ms , 2 et 200 A·m−1 pour HcB . Il est difficile de trouver des données relatives à Wcycle /V ; la plupart des références fournissent plutôt la puissance dissipée par unité de masse, donnée pour plusieurs fréquences d’utilisation. La donnée de l’aire du cycle d’hystérésis à saturation, quoique plus fondamentale car intrinsèque au matériau, est moins utile en électrotechnique, car elle ne prend pas en compte les conditions d’utilisation du matériau (champ magnétique maximal, fréquence). On trouve toutefois dans la Réf. [1] un ordre de grandeur des pertes par cycle par unité de masse Wm pour le fer doux de 0,01 J·kg−1 à 0,04 J·kg−1 , pour une amplitude maximale de champ magnétique de 1,5 T. En prenant la masse volumique du fer à ρ = 7,86 × 103 kg·m−3 , on mesure Wm = Wcycle /ρV = (0,11 ± 0,01) J·kg−1 . L’ordre de grandeur obtenu est acceptable, car notre échantillon de fer est certainement moins doux que ceux décrits dans la Réf. [1] : il n’est donc pas étonnant de mesurer des pertes plus élevées que celles évoquées dans cette référence. En tout
Aimantation à saturation µ0 Ms (T) Excitation coercitive HcB (A·m−1 ) Champ rémanent Br (T) Pertes par cycle Wcycle /V (J·m−3 )
Fer doux
Ferrite de nickel
1,45 ± 0,01 168 ± 2 1,11 ± 0,01 (9,0 ± 0,1) × 102
0,352 ± 0,002 66 ± 1 0,228 ± 0,002 95 ± 1
Tab. 1 Propriétés magnétiques du fer doux et du ferrite de nickel, mesurées à partir des cycles d’hystérésis à saturation représentés sur la Fig. 6.
138
Magnétisme
état de cause, les faibles pertes par cycle de ce matériau le classent bien dans la catégorie des matériaux ferromagnétiques doux (l’ordre de grandeur pour les pertes par cycle par unité de masse d’un fer dur est de 1,5 J·kg−1 [1]). Pour un petit transformateur de volume V ' 10−3 m3 constitué de fer doux et alimenté à une fréquence f = 50 Hz, ces pertes par hystérésis correspondent à une puissance dissipée de l’ordre de f Wcycle ' 50 W.
Par ailleurs, on constate que le ferrite de nickel possède une aimantation à saturation compatible avec l’ordre de grandeur de 0,35 T donné dans la Réf. [9]. Les grandeurs caractéristiques de son cycle sont inférieures à celles du fer doux. Malgré leur plus faible aimantation, l’usage de ferrites reste intéressant pour les applications à haute fréquence, grâce à leur très faible conductivité électrique [9] (voir la Sec. 4.5). L’aire ¸ du cycle d’hystérésis peut, en approximant celui-ci à un rectangle, être estimée par H dB ' 4µ0 Ms HcB . On peut vérifier à partir des données du Tab. 1 que cette relation est très bien vérifiée pour les deux matériaux utilisés.
4.4 Croissance des cycles Nous avons étudié dans la section précédente le cycle d’hystérésis à saturation, mais il est possible d’observer la croissance du cycle et l’apparition de la saturation. Désaimanter le matériau en suivant le protocole de la Sec. 4.2. Régler le GBF pour qu’il délivre une tension sinusoïdale de faible fréquence, par exemple 50 mHz. Choisir une amplitude faible (environ un dixième de l’amplitude permettant la saturation) afin d’observer un cycle du matériau sans saturation. Reproduire le protocole décrit en Sec. 4.3, pour des amplitudes de plus en plus grandes jusqu’à atteindre la saturation du matériau. Nous avons tracé sur la Fig. 7 l’ensemble des cycles obtenus pour l’échantillon de fer doux, ainsi que sa courbe de première aimantation issue de la Fig. 5. À différentes amplitudes d’excitation magnétique correspondent différents cycles d’hystérésis, tous inclus dans le cycle à saturation. Ainsi, tous les points inclus dans le cycle d’hystérésis à saturation d’un matériau sont des états magnétiques accessibles au matériau. On constate que l’hystérésis est présente même à faible excitation. Par ailleurs, les points extrêmes des cycles sont très proches de la courbe de première aimantation.
4.5 Effet de la fréquence d’excitation sur le cycle Afin d’étudier l’effet de la fréquence f de l’excitation sur la forme du cycle d’hystérésis, il suffit de reproduire le protocole de la Sec. 4.3 en choisissant d’autres valeurs de f , typiquement entre 10 mHz et 1 Hz. Il faut néanmoins prendre garde à ce que H (et donc vR ) ait la même amplitude pour toutes les fréquences employées. En effet, à tension égale délivrée par l’amplificateur de courant, le courant circulant au primaire diminue lorsque f augmente du fait de l’auto-inductance du bobinage primaire.
II.2 Cycle d’hystérésis d’un milieu ferromagnétique
139
1,5
B (T)
1,0 0,5 Vmax 0,6 Vmax 0,45 Vmax 0,3 Vmax 0,15 Vmax
0,0 -0,5 -1,0 -1,5 -700
-500
-300
-100 100 H (A.m−1 )
300
500
700
Fig. 7 Cycles d’hystérésis d’un échantillon de fer doux pour différentes amplitudes de tension de sortie du GBF, exprimées par rapport à la tension maximale Vmax pouvant être délivrée. La courbe noire correspond à la courbe de première aimantation du fer doux tracée sur la Fig. 5, ainsi que sa symétrique par rapport à l’origine.
Tracer sur l’oscilloscope un cycle d’hystérésis pour une fréquence faible (voir la Sec. 4.3) afin de se placer dans la limite quasi statique. Augmenter la fréquence de la tension délivrée par le GBF. Réajuster l’amplitude de sorte que vR ait la même amplitude qu’à la fréquence initiale. La Fig. 8 montre les cycles obtenus pour le fer doux à des fréquences de 50 mHz, 250 mHz et 1 Hz. On considère que le cycle à 50 mHz correspond au cycle dans la limite quasi statique car on trouve le même cycle pour des fréquences de travail inférieures. Pour les fréquences supérieures, on voit que le cycle se déforme : sa largeur augmente, sans que sa hauteur n’évolue significativement. On peut expliquer qualitativement cet élargissement. La mesure de H devient biaisée lorsque l’on augmente f . Le fer doux étant conducteur, la présence d’un champ magnétique B variable entraîne la circulation de courants de Foucault en son sein. Comme ce sont des courants libres, ils créent à leur tour une excitation magnétique orthoradiale HF = HF eθ (voir la Réf. [10] pour un modèle élaboré). L’excitation orthoradiale totale régnant dans le tore est Htot = H + HF , où H est l’excitation créée par le circuit primaire seul et que nous mesurons par l’intermédiaire de vR . Les courants de Foucault créent une excitation HF , opposée à ∂B/∂t en tout point du tore d’après la loi de Lenz. Sur la partie du cycle où B croît, on a HF < 0 donc Htot < H et notre mesure est supérieure à l’excitation réelle. À l’inverse, elle est inférieure à l’excitation réelle sur la partie du cycle où B décroît. L’erreur ainsi commise augmente avec |HF |, donc avec l’intensité des courants de Foucault, et finalement avec f . Par ailleurs, B étant mesuré par l’intermédiaire de son flux, on mesure bien le champ magnétique total régnant dans le milieu, et il n’y a sur B aucun biais de mesure. Les courants de Foucault peuvent donc expliquer en partie l’élargissement du cycle mesuré lorsque l’on augmente f , sans modification de sa hauteur. Pour tester cette hypothèse, il est intéressant de déterminer un ordre de
140
Magnétisme
1,5 1,0 B (T)
0,5 0,0 -0,5
50 mHz 250 mHz 1 Hz
-1,0 -1,5 -700
-500
-300
-100 100 H (A.m−1 )
300
500
700
Fig. 8 Cycles d’hystérésis du fer doux pour différentes fréquences d’excitationf . Le cycle obtenu à f = 50 mHz correspond au cycle d’hystérésis à la limite quasi statique.
grandeur de HF . Soit jF la densité de courants de Foucault et E le champ électrique d’induction. Pour une boucle de courants de Foucault de dimension caractéristique `F , on a d’après l’équation de Maxwell-Faraday E ' ω`F B. La loi d’Ohm locale jF = σE, pour un matériau de conductivité électrique σ, donne jF ' σω`F B. L’équation de Maxwell-Ampère entraîne finalement HF ' `F jF ' σω`F 2 B. En considérant `F ' 5 × 10−4 m, σ ' 107 S·m−1 (conductivité électrique du fer pur), ω = 2πf . 6 rad·s−1 et B ' Br ' 1 T, on trouve HF . 102 A·m−1 . Nous avons ici pris pour `F l’épaisseur typique d’une tôle d’un tore feuilleté, toutefois la longueur des boucles de courant peut légèrement dépasser cette épaisseur. Cela, associé au fait que HF présente une dépendance en `F 2 , explique que nous préférons donner une majoration de l’ordre de grandeur obtenu. Cette estimation grossière est du même ordre de grandeur que l’élargissement du cycle observé à f = 250 mHz et f = 1 Hz. Nous avons dans cette expérience traité le ferromagnétisme de manière phénoménologique, et n’avons pas détaillé l’origine physique de l’hystérésis. L’Exp. II.3, « Domaines de Weiss : origine de l’hystérésis ferromagnétique » permettra de relier la courbe de première aimantation et le cycle d’hystérésis d’un matériau ferromagnétique à sa structure mésoscopique.
Références [1]
M. Bertin, J.-P. Faroux et J. Renault, Électromagnétisme 4, milieux diélectriques et milieux aimantés. Dunod, 1996.
[2]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Physique statistique. Hermann, 1996.
[3]
N.-W. Ashcroft et N.-D. Mermin, Physique des solides. EDP Sciences, 2002.
II.2 Cycle d’hystérésis d’un milieu ferromagnétique
141
[4]
C. Garing, Magnétisme : statique, induction et milieux. Ellipses, 1999.
[5]
M. Bertin, J.-P. Faroux et J. Renault, Électromagnétisme 1, électrostatique, milieux conducteurs. Dunod, 1984.
[6]
C. Garing, Milieux magnétiques. Ellipses, 1995.
[7]
M. Krob, Électronique expérimentale. Ellipses, 2002.
[8]
R. Duffait et J.-P. Lièvre, Expériences d’électronique : agrégation de sciences physiques. Bréal, 1999.
[9]
E. Du Trémolet de Lacheisserie et Collectif PUG, Magnétisme (tome 2), matériaux et applications. EDP Sciences, 1999.
[10]
J. Szczygłowski, « Influence of eddy currents on magnetic hysteresis loops in soft magnetic materials, » J. Magn. Magn. Mater., 223 (1), p. 97-102, 2001.
II.3
Domaines de Weiss : origine de l’hystérésis ferromagnétique
Dans cette expérience, nous présentons un dispositif permettant de visualiser les domaines de Weiss d’un échantillon ferrimagnétique transparent possédant un pouvoir rotatoire. Les matériaux ferrimagnétiques étant identiques aux matériaux ferromagnétiques aux échelles macroscopique et mésoscopique, l’observation de la structure des domaines nous permet de comprendre l’origine du phénomène d’hystérésis des milieux ferromagnétiques, et l’irréversibilité liée au processus d’aimantation qui les caractérise.
Sommaire 1 2 3 4 5 6 7
Introduction . . . . . . . . . . . . . . . . . Ferromagnétisme à l’échelle microscopique . Visualisation optique des domaines de Weiss Protocole . . . . . . . . . . . . . . . . . . . Première aimantation et désaimantation . . . Cycle d’aimantation . . . . . . . . . . . . . Irréversibilité de la structure des domaines .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
142 143 150 154 158 161 162
Compléments A
Méthode d’analyse des images . . . . . . . . . . . . . . 164
1 Introduction La phase ferromagnétique de la matière se caractérise, entre autres, par la nonlinéarité de sa réponse magnétique et son hystérésis. Dans l’Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique », seule la réponse macroscopique a été étudiée. En particulier, nous n’avons pas discuté l’origine du phénomène d’hystérésis. L’interprétation microscopique de la réponse des corps ferromagnétiques est longtemps restée un mystère, les modèles en vigueur prédisaient notamment que l’aimantation ne pouvait pas être nulle à champ magnétique nul. C’est le physicien français P. Weiss qui postula en 1907 qu’un corps ferromagnétique se décompose en domaines d’aimantation uniforme et de directions opposées pour expliquer l’absence d’aimantation spontanée en champ magnétique nul [1]. Il a fallut attendre 1931 pour que F. Bitter apporte la première mise en évidence expérimentale de ces domaines, appelés dès lors domaines de Weiss [2]. Dans cette expérience, nous mettons en évidence les interactions qui gouvernent la formation des domaines et présentons leur évolution lorsqu’on applique un champ magnétique extérieur. À l’aide d’une 142
II.3 Domaines de Weiss : origine de l’hystérésis ferromagnétique
143
méthode optique permettant de les visualiser, nous étudions de manière qualitative l’irréversibilité de leur évolution, qui est à l’origine du phénomène d’hystérésis ferromagnétique.
2 Ferromagnétisme à l’échelle microscopique L’origine microscopique du ferromagnétisme réside dans l’existence d’une interaction de courte portée entre les spins, appelée interaction d’échange, et dont l’origine est quantique (voir l’Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique »). En nous restreignant à l’étude des cristaux ferromagnétiques, nous allons voir comment inclure cette interaction dans un bilan d’énergie qui tient compte de l’interaction dipolaire et de l’anisotropie du cristal (Sec. 2.2 et 2.3). La compétition entre ces différentes interactions permet de comprendre l’organisation des moments magnétiques de spin des entités du matériau en domaines d’aimantation homogène. Leur évolution lorsqu’on applique un champ magnétique extérieur est présentée en Sec. 2.5.
2.1 Énergie d’échange et interaction avec le champ magnétique On considère un volume V d’un cristal ferromagnétique constitué de N atomes placés aux nœuds d’un réseau, soumis à un champ magnétique extérieur uniforme et constant B0 et portant tous un moment magnétique de spin Mi = gµB Si , où µB désigne le magnéton de Bohr, g le facteur de Landé de l’électron et Si un spin adimensionné de norme S. On modélise l’interaction d’échange par une énergie de couplage J > 0 entre les spins plus proches voisins et on néglige l’interaction d’un spin i avec le champ magnétique d’un spin j (voir Sec. 2.2). Le hamiltonien de ce système est celui d’Heisenberg [3] H = −gµB B0 ·
N X i=1
Si − J
X hi,ji
Si · Sj ,
(1)
où hi, ji désigne l’ensemble des paires de plus proches voisins 1 . Le premier terme traduit le couplage des spins avec le champ magnétique extérieur ; il est minimal lorsque tous les spins sont alignés dans la direction de B0 . Le second terme, qui rend compte de l’interaction d’échange, tend à aligner les spins plus proches voisins. L’énergie associée est alors minimale lorsque les spins sont alignés et diminue lorsque le nombre de spins augmente (elle est extensive). L’état fondamental du système correspond donc à un matériau ayant tous ses spins orientés dans la même direction, celle du champ magnétique extérieur si celui-ci est non nul. En champ magnétique extérieur nul, l’énergie nécessaire pour décaler d’un angle θ deux spins voisins initialement alignés est donnée par l’Éq. (1) et vaut ∆EJ = S 2 J(1 − cos(θ)).
(2)
1. On somme sur toutes les paires d’atomes en prenant garde à ne pas compter deux fois chaque couple (i, j). Si p désigne le nombre de plus proches voisins d’un site donné, il y a donc N p/2 termes.
144
Magnétisme
Elle est maximale pour deux spins antiparallèles (θ = π). Pour exprimer l’aimantation du système à partir de l’Éq. (1), il est courant d’adopter l’approximation dite de « champ moyen », qui consiste à considérer que chaque spin baigne dans un champ magnétique moyen créé par tous les autres et qui est le même pour tous 2 [3]. Ce modèle prédit alors que le matériau acquiert une aimantation induite par le champ extérieur, ainsi que l’existence d’une aimantation à saturation Ms . Une autre prédiction forte est l’existence d’une aimantation spontanée en champ nul M = gµB SN/V , où S est la moyenne des Si , lorsque la température est inférieure à la température de Curie à laquelle la transition de phase ferromagnétique-paramagnétique a lieu (voir l’Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique » et les Réf. [3, 4]). Si la transition de phase est bien observée, ce n’est pas le cas de l’aimantation spontanée à champ magnétique nul. En champ nul, les corps ferromagnétiques présentent expérimentalement soit une aimantation nulle soit une aimantation spontanée différente de celle prédite par l’approximation de champ moyen. L’interaction d’échange seule ne permet donc pas d’expliquer complètement le comportement ferromagnétique.
2.2 Énergie dipolaire En plus de l’interaction d’échange, les spins sont soumis à l’interaction dipolaire magnétique : chaque moment magnétique de spin interagit avec le champ magnétique créé par les moments magnétiques environnants. Si l’on considère deux spins 1 et 2 de moments magnétiques coplanaires M1 et M2 , distants de r avec r = rer dirigé de 1 vers 2, l’énergie dipolaire associée s’écrit [5] Edip,1−2 = −M2 · Bdip,1 (r) =
µ0 [M2 · M1 − 3(M1 · er )(M2 · er )] , 4πr3
(3)
où Bdip,1 est le champ dipolaire créé par le spin 1 et µ0 la perméabilité du vide. À distance r fixée, deux configurations, dites polaire et équatorial, correspondent à des minima de l’énergie comme cela est montré sur la Fig. 1(a). On peut calculer un ordre de grandeur de Edip,1−2 /J ' 10−8 pour le fer en considérant deux spins voisins distants de r = a ' 0,3 nm, kMk ' µB = 10−25 A·m2 et J ' 3 × 10−21 J [6]. L’interaction dipolaire est donc bien plus faible que l’interaction d’échange à courte distance. Néanmoins, le nombre de moments intervenant dans l’énergie dipolaire totale augmente en r3 : cette interaction devient donc prépondérante à grande distance. Supposons que l’on décompose le matériau en tubes élémentaires uniformément aimantés le long de leur axe. L’énergie dipolaire totale de l’échantillon se décompose en deux contributions [5]. La première, dite intrinsèque, est l’énergie nécessaire pour aimanter séparément chacun de ces tubes élémentaires ; elle ne dépend donc pas de la distribution d’aimantation. La seconde, dite magnétostatique ou de champ démagnétisant, correspond à l’énergie d’interaction dipolaire de tous ces tubes, assemblés dans le matériau. Elle est donnée par ˚ µ0 Emag = − Hm · M dV, (4) 2 V 2. On néglige alors les corrélations des fluctuations des spins autour de la valeur moyenne S.
II.3 Domaines de Weiss : origine de l’hystérésis ferromagnétique (a)
(b)
M2
M2
(c)
M2
AAAC33icjVHLShxBFD22jxgTzWh2cdM4BLIauifjYxfBTTYBBUcFR4bqmlIbqx90VweGYSA7d+LWH3Cb/E3wD/QvPFX2gFlIrKarTp17z6m6daNcx6UJgrspb3pmdu7N/NuFd+8Xlz40llcOyqwqpOrKTGfFUSRKpeNUdU1stDrKCyWSSKvD6GLHxg9/qqKMs3TfDHN1koizND6NpTCk+o1PvSjTg3KYcBn1EmHOpdCjH+N+e9xvNINWsBl2wtAPWuudzkZ7gyD8GqwThK3AjSbqsZs1/qKHATJIVEigkMIQawiU/I4RIkBO7gQjcgVR7OIKYyxQWzFLMUOQveB8xt1xzabcW8/SqSVP0fwLKn18piZjXkFsT/NdvHLOln3Je+Q87d2GXKPaKyFrcE72f7pJ5mt1thaDU2y5GmLWlDvGVidrl8q9ir25/6wqQ4ecnMUDxgti6ZSTd/adpnS127cVLn7vMi1r97LOrfBgb8kGT7rovwwO2q2QXd/rNLe/1a2exyrW8IX93MQ2vmMXXXr/wi1+448nvEvvyrt+SvWmas1H/DO8m0fHIZr+
145
Hm
AAAC33icjVHLShxBFD22jxgTzWh2cdM4BLIauifjYxfBTTYBBUcFR4bqmlIbqx90VweGYSA7d+LWH3Cb/E3wD/QvPFX2gFlIrKarTp17z6m6daNcx6UJgrspb3pmdu7N/NuFd+8Xlz40llcOyqwqpOrKTGfFUSRKpeNUdU1stDrKCyWSSKvD6GLHxg9/qqKMs3TfDHN1koizND6NpTCk+o1PvSjTg3KYcBn1EmHOpdCjH+N+e9xvNINWsBl2wtAPWuudzkZ7gyD8GqwThK3AjSbqsZs1/qKHATJIVEigkMIQawiU/I4RIkBO7gQjcgVR7OIKYyxQWzFLMUOQveB8xt1xzabcW8/SqSVP0fwLKn18piZjXkFsT/NdvHLOln3Je+Q87d2GXKPaKyFrcE72f7pJ5mt1thaDU2y5GmLWlDvGVidrl8q9ir25/6wqQ4ecnMUDxgti6ZSTd/adpnS127cVLn7vMi1r97LOrfBgb8kGT7rovwwO2q2QXd/rNLe/1a2exyrW8IX93MQ2vmMXXXr/wi1+448nvEvvyrt+SvWmas1H/DO8m0fHIZr+
Hm
Hm
AAAC1XicjVHLSsNAFD2Nr1pfUZdugkVwFSZt8bGy4Malgm2FtpQkHTWYF5mJUEp34tYfcKu/JP6B/oV3xhR0UXRCZs6ce8+ZuXO9NAyEZOy9ZMzNLywulZcrK6tr6xvm5lZbJHnm85afhEl25bmCh0HMWzKQIb9KM+5GXsg73t2pinfueSaCJL6Uo5T3I/cmDq4D35VEDUyz5yXhUIwiWsZng2gyMKvMZgc1Vq9bzG4cNY4PHAUOCdQtx2Z6VFGM88R8Qw9DJPCRIwJHDEk4hAtBXxcOGFLi+hgTlxEKdJxjggppc8rilOESe0fzDe26BRvTXnkKrfbplJD+jJQW9kiTUF5GWJ1m6XiunRU7y3usPdXdRrR6hVdErMQtsX/pppn/1alaJK5xpGsIqKZUM6o6v3DJ9auom1s/qpLkkBKn8JDiGWFfK6fvbGmN0LWrt3V1/ENnKlbt/SI3x6e6JTV42kVrNmjXbIfZzkWj2jwpWl3GDnaxT/08RBNnOEeLvO/xjBe8Gh1jYjwYj9+pRqnQbOPXMJ6+ALg8lrc=
AAAC1XicjVHLSsNAFD2Nr1pfUZdugkVwFSZt8bGy4Malgm2FtpQkHTWYF5mJUEp34tYfcKu/JP6B/oV3xhR0UXRCZs6ce8+ZuXO9NAyEZOy9ZMzNLywulZcrK6tr6xvm5lZbJHnm85afhEl25bmCh0HMWzKQIb9KM+5GXsg73t2pinfueSaCJL6Uo5T3I/cmDq4D35VEDUyz5yXhUIwiWsZng2gyMKvMZgc1Vq9bzG4cNY4PHAUOCdQtx2Z6VFGM88R8Qw9DJPCRIwJHDEk4hAtBXxcOGFLi+hgTlxEKdJxjggppc8rilOESe0fzDe26BRvTXnkKrfbplJD+jJQW9kiTUF5GWJ1m6XiunRU7y3usPdXdRrR6hVdErMQtsX/pppn/1alaJK5xpGsIqKZUM6o6v3DJ9auom1s/qpLkkBKn8JDiGWFfK6fvbGmN0LWrt3V1/ENnKlbt/SI3x6e6JTV42kVrNmjXbIfZzkWj2jwpWl3GDnaxT/08RBNnOEeLvO/xjBe8Gh1jYjwYj9+pRqnQbOPXMJ6+ALg8lrc=
+ + ++ + + + + + AAACxHicjVHLSsNAFD2Nr1pfVZdugkUQhZC2tjW7giAuW7APqEWSdKqheZGZCKXoD7jVbxP/QP/CO2MKuig6Icmdc885M/deJ/Y9LkzzPactLa+sruXXCxubW9s7xd29Lo/SxGUdN/KjpO/YnPleyDrCEz7rxwmzA8dnPWdyIfO9B5ZwLwqvxTRmw8C+C72x59qCoPbpbbFkGpZVbdRrumnUrXrFlEHZqtZqll42TLVKyFYrKr7hBiNEcJEiAEMIQbEPG5yeAcowERM2xIywhCJP5RkeUSBtSixGDJvQCX3vaDfI0JD20pMrtUun+PQmpNRxRJqIeAnF8jRd5VPlLNFF3jPlKe82pb+TeQWECtwT+pduzvyvTtYiMMa5qsGjmmKFyOrczCVVXZE3139UJcghJkzGI8onFLtKOe+zrjRc1S57a6v8h2JKVO7djJviU96SBjyfor446FaMMk29fVZqnmSjzuMAhzimeTbQxBVa6CjvZ7zgVbvUfI1r6TdVy2Waffxa2tMXka6Pew== seuil_Sauvola
II.3 Domaines de Weiss : origine de l’hystérésis ferromagnétique
167
Références [1]
P. Weiss, « L’hypothèse du champ moléculaire et la propriété ferromagnétique, » J. Phys. Theor. Appl., 6 (1), p. 661-690, 1907.
[2]
F. Bitter, « On inhomogeneities in the magnetization of ferromagnetic materials, » Phys. Rev., 38 (10), p. 1903-1905, 1931.
[3]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Physique statistique. Hermann, 1996.
[4]
N.-W. Ashcroft et N.-D. Mermin, Physique des solides. EDP Sciences, 2002.
[5]
E. Du Trémolet de Lacheisserie et Collectif PUG, Magnétisme (tome 1), fondements. EDP Sciences, 1999.
[6]
J. Ye, A. J. Newell et R. T. Merrill, « A re-evaluation of magnetocrystalline anisotropy and magnetostriction constants, » Geophys. Res. Lett., 21 (1), p. 25-28, 1994.
[7]
M. Bertin, J.-P. Faroux et J. Renault, Électromagnétisme 4, milieux diélectriques et milieux aimantés. Dunod, 1996.
[8]
J.-D. Jackson, Classical electrodynamics. Wiley, 1998.
[9]
E. E. Anderson, « Molecular field model and the magnetization of YIG, » Phys. Rev., 134 (6A), A1581-A1585, 1964.
[10]
L. Soumah, « Pulsed laser deposition of substituted thin garnet films for magnonic applications, » Thèse, Université Paris-Saclay, 2019.
[11]
W. A. Crossley, R. W. Cooper, J. L. Page et R. P. van Stapele, « Faraday rotation in rare-Earth iron garnets, » Phys. Rev., 181 (2), p. 896-904, 1969.
[12]
G. Bertotti, Hysteresis in magnetism: for physicists, materials scientists, and engineers. Academic Press, 1998.
[13]
National Institutes of Health and Laboratory for Optical and Computational Instrumentation. (2014). ImageJ, image processing and analysis in Java, adresse : https://imagej.net/ (visité le 06/07/2019).
[14]
C. A. Schneider, W. S. Rasband et K. W. Eliceiri, « NIH Image to ImageJ: 25 years of image analysis, » Nat. Methods, 9 (7), p. 671-675, 2012.
[15]
J. Sauvola et M. Pietikäinen, « Adaptive document image binarization, » Pattern Recognit., 33 (2), p. 225-236, 2000.
II.4
Mesure du moment magnétique d’un aimant permanent
Un aimant permanent soumis à un champ magnétique variant linéairement avec la hauteur subit une force proportionnelle à son moment magnétique. En plaçant un aimant sur une balance et en contrôlant le gradient de la composante verticale du champ extérieur, nous montrons qu’une pesée permet une mesure précise de son moment magnétique.
Sommaire 1 2 3 4 5
Introduction . . . . . . . Les aimants permanents . Description de l’expérience Protocole et résultats . . Discussion . . . . . . . .
. . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
168 168 172 174 178
1 Introduction Dans l’Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique », nous avons décrit les caractéristiques des matériaux ferromagnétiques doux et durs. Les matériaux doux sont les plus utilisés dans l’industrie, car ils présentent de faibles pertes énergétiques lorsqu’ils sont soumis à des champs magnétiques variables. On les retrouve par exemple dans les machines tournantes (voir les Exp. III.1, « Machine à courant continu » et III.2, « Machine asynchrone ») ou les transformateurs électriques (Exp. III.3, « Transformateur électrique monophasé »). Loin de la saturation, leur aimantation est facilement modifiable par un champ extérieur. Les matériaux durs, au contraire, présentent une aimantation difficile à inverser, et sont donc majoritairement utilisés comme aimants permanents. Ceux-ci peuvent être employés en électrotechnique, comme sources de champ magnétique inducteur dans une machine à courant continu par exemple, ou dans des dispositifs comme les haut-parleurs. On peut évaluer la performance d’un petit aimant grâce à son moment magnétique M, qui caractérise le champ produit par l’aimant et son interaction avec un champ extérieur. Dans cette expérience, nous présentons un protocole permettant de mesurer le moment magnétique d’un petit aimant.
2 Les aimants permanents Nous cherchons à quantifier la notion de performance d’un aimant, en nous inspirant de la Réf. [1] et en poursuivant les discussions présentées dans les Exp. II.1, 168
169
II.4 Mesure du moment magnétique d’un aimant permanent
« Ascension d’un liquide paramagnétique » et II.2, « Cycle d’hystérésis d’un milieu ferromagnétique ».
2.1 Les aimants, sources de champ magnétique Les aimants permanents sont des matériaux présentant une aimantation M non nulle à excitation magnétique H nulle, et peu sensibles aux variations de H loin de l’excitation coercitive. Ils sont donc constitués de matériaux ferromagnétiques durs. On suppose que H, B et M sont alignés, et on notera dans la suite H, B et M leurs projections selon un vecteur unitaire commun. Ces matériaux sont caractérisés par une aimantation rémanente Mr et une excitation coercitive en aimantation HcM importantes. Leur cycle d’hystérésis en aimantation M (H) peut être considéré en première approximation comme rectangulaire, comme indiqué en Fig. 1(a). Ainsi, l’aimantation d’un aimant soumis à une excitation inverse reste constante jusqu’à se renverser lorsque l’excitation magnétique atteint ±HcM . Le cycle en champ B(µ0 H) est déduit de celui en aimantation par la relation B = µ0 (H + M ) (voir la Fig. 1(b)) [2]. On note alors HcB l’excitation coercitive en champ. Les aimants permanents sont utilisés industriellement comme sources de champ magnétique. Pour obtenir un champ le plus intense possible, à énergie magnétique disponible fixée, le volume à aimanter doit être le plus réduit possible. On insère donc généralement les aimants dans des circuits magnétiques (voir la Fig. 2), constitués de matériaux ferromagnétiques doux de perméabilité magnétique µr très élevée. La présence du matériau ferromagnétique doux permet, par sa perméabilité importante, (a)
(b)
M
B
Mr Br
−HcM
H
−µ0 HcB
Br /2 −Br /2
µ0 H
Fig. 1 (a) Cycle d’hystérésis en aimantation M (H) idéal, en ligne continue, et réel, en ligne tiretée, pour un matériau ferromagnétique dur. (b) Cycle d’hystérésis en champ B(µ0 H) idéal, en ligne continue, et réel, en ligne tiretée, dans le cas d’un matériau tel que HcM > Mr . Le cycle idéal dans le quadrant (µ0 H < 0, B > 0) est une droite de pente unité. Deux points de fonctionnement sont indiqués en bleu et jaune. Les aires des rectangles bleu et jaune sont égales aux produits énergétiques aux points de fonctionnement associés (voir la Sec. 2.2). Le point de fonctionnement bleu correspond au produit énergétique idéal maximal (BH)max = Br2 /4µ0 .
170
Magnétisme
Ferromagn´etique doux Aimant
M
Entrefer
Fig. 2 Circuit magnétique, constitué d’un matériau ferromagnétique doux, permettant d’augmenter la norme du champ magnétique dans un entrefer. Les lignes de champ produites par l’aimant permanent seul (de moment magnétique M), en absence du circuit magnétique, sont représentées schématiquement en lignes tiretées bleues. Celles contenues dans le circuit magnétique sont représentées par des lignes continues rouges.
de modifier la distribution spatiale du champ, afin d’augmenter considérablement son intensité sur les lignes de champ dirigées vers l’entrefer.
2.2 Produit énergétique Afin de juger des propriétés magnétiques d’un aimant, la donnée seule du champ rémanent ne suffit pas : le champ magnétique dans l’aimant dépend de l’excitation magnétique H, comme illustré par le cycle d’hystérésis. Une manière de quantifier cette variation est de considérer le produit BH, homogène à une énergie volumique. Notons qu’à la fois B et H sont a priori inconnus dans l’aimant. Le point de fonctionnement (H, B) est donné par l’intersection de la caractéristique B(µ0 H) de l’aimant (le cycle d’hystérésis) et la caractéristique du circuit magnétique dans lequel est placé l’aimant. Nous cherchons maintenant à relier quantitativement l’énergie magnétique maximale disponible dans l’entrefer aux caractéristiques de l’aimant et à son domaine de fonctionnement. En régime stationnaire, dans un domaine V de l’espace vide de courants libres, les équations de Maxwell dans les milieux s’écrivent ∇ × H = 0 et ∇ · B ´= 0. Si V est suffisamment grand, ces deux relations vectorielles impliquent 1 V B · H dV = 0, où dV est un élément infinitésimal de volume [2]. En supposant que B et H sont nuls en dehors du circuit magnétique {aimant, ferromagnétique doux, entrefer}, on a ˚ aimant
B · H dV +
˚ ferro doux
B · H dV +
˚ entrefer
B · H dV = 0.
(1)
1. Il faut également supposer une décroissance des champs au moins en l’inverse de la distance à l’aimant au carré. Cela est vérifié pour le champ créé par tout aimant.
II.4 Mesure du moment magnétique d’un aimant permanent
171
Dans un matériau ferromagnétique doux, que nous supposons linéaire 2 , l’excitation magnétique H est reliée à B par H = B/µ0 µr , alors que l’on a H = B/µ0 dans le vide de l’entrefer. Des valeurs de µr supérieures à 103 sont courantes pour des matériaux ferromagnétiques doux [2] ; on peut donc, dans la mesure où les volumes de chaque partie du circuit sont du même ordre de grandeur, négliger la contribution du fer doux dans l’Éq. (1) 3 . Cela conduit à ˚ ˚ 1 B 2 dV. (2) B · H dV = − µ0 entrefer aimant Le terme de droite correspond au double de l’opposé de l’énergie magnétique dans l’entrefer [2]. L’Éq. (2) a deux conséquences. • •
B et H sont de sens opposés à l’intérieur de l’aimant. On restreint donc l’étude au quadrant (µ0 H < 0, B > 0) du cycle d’hystérésis en champ. Le produit énergétique |BH| détermine l’énergie magnétique volumique disponible dans l’entrefer. Cette valeur dépend du point de fonctionnement sur le cycle d’hystérésis B(µ0 H).
La plupart des matériaux ferromagnétiques durs vérifiant HcM & Mr , la partie du cycle idéal B(µ0 H) située dans le quadrant (µ0 H < 0, B > 0) est une portion de droite d’équation B = Br + µ0 H (voir la Fig. 1(b)). La valeur maximale |BH|max du produit énergétique, indiquée par l’aire du rectangle bleu sur la Fig. 1(b), est dans ce cas atteinte pour (µ0 H = −Br /2, B = Br /2) et vaut |BH|max = Br2 /4µ0 . Pour un matériau réel, le cycle d’hystérésis est moins anguleux (courbes tiretées sur les Fig. 1(a) et 1(b)), et le produit énergétique maximal est inférieur à Br2 /4µ0 .
2.3 Caractéristiques d’un aimant On peut donc énumérer les caractéristiques principales d’un aimant permanent performant : • •
un produit énergétique maximal élevé, de sorte qu’il produise un champ magnétique intense dans un entrefer de volume donné ; une excitation coercitive en aimantation élevée et un cycle d’hystérésis en aimantation rectangulaire, afin qu’il ne se désaimante pas facilement et que son moment magnétique dépende peu des conditions d’utilisation.
Nous utilisons dans cette expérience des aimants à base de néodyme-fer-bore, de formule Nd2 Fe14 B. Ceux-ci possèdent un produit énergétique élevé (de l’ordre de 105 kJ·m−3 [3], contre 103 kJ·m−3 pour l’acier [2]), ce qui permet d’obtenir une mesure précise d’un moment magnétique important pour un aimant de petite taille. Cependant, ils sont sensibles à l’oxydation à l’air libre et nécessitent donc une protection de surface. Leur cycle en aimantation quasi rectangulaire leur confère un comportement idéal à température ambiante, même si leur domaine d’utilisation est restreint en température. Nous reviendrons sur ce point en Sec. 5.3. 2. Cette approximation est raisonnable, loin de la saturation, pour des matériaux très doux, dont la largeur du cycle en aimantation est très faible devant Ms . Cela revient à négliger l’hystérésis du milieu, et à ne garder du comportement ferromagnétique que la très forte réponse B(H). 3. Le champ magnétique est du même ordre de grandeur dans le circuit ferromagnétique et dans l’entrefer, car la composante normale de B se conserve d’après l’équation ∇ · B = 0.
172
Magnétisme
On peut citer d’autres types d’aimants. Les ferrites (céramiques ferromagnétiques à base d’oxyde de fer) ont un faible produit énergétique, mais sont particulièrement bon marché et résistants à l’oxydation [2]. Les aimants « AlNiCo » (à base d’aluminium, de nickel et de cobalt) sont plus chers mais utilisables à température plus élevée.
3 Description de l’expérience 3.1 Principe de la mesure De la même manière que la masse d’un objet peut être déterminée en mesurant son poids, le moment magnétique d’un aimant peut être obtenu par la mesure d’une force d’expression connue s’exerçant sur cet aimant. D’après le Comp. A de l’Exp. II.1, « Ascension d’un liquide paramagnétique », la force F subie par un moment magnétique M placé dans un champ magnétique extérieur Bext s’écrit F = ∇(M · Bext ),
(3)
où le gradient est pris à M constant. Dans une base orthonormée (ex , ey , ez ), la force F a pour composantes Fx = M ·
∂Bext , ∂x
Fy = M ·
∂Bext , ∂y
Fz = M ·
∂Bext . ∂z
(4)
Elle dépend du gradient des composantes du champ magnétique extérieur. Nous cherchons donc à produire un champ magnétique de gradient uniforme, afin de contrôler au mieux la force s’exerçant sur l’aimant. Pour cela, nous utilisons deux bobines placées dans une configuration particulière, décrite dans la Sec. 3.2. Une fois le gradient produit, on mesure M en déterminant la force subie par l’aimant. On note ez le vecteur unitaire vertical orienté vers le haut. On aligne les axes des bobines et le moment magnétique de l’aimant avec l’axe (Oz), de sorte que M = Mez . Le long de l’axe, le champ magnétique extérieur s’écrit Bext (z) = Bext (z)ez . La composante verticale de la force subie par l’aimant, placé sur l’axe (Oz), s’écrit alors, d’après l’Éq. (3), Fz = M
dBext . dz
(5)
Dans cette équation, Bext est le champ magnétique en l’absence de l’aimant. Une fois M connu et en le supposant indépendant de Bext , l’aimantation moyenne du matériau se déduit de M = M/V , où V est le volume de l’aimant. Nous utilisons une balance pour mesurer Fz . Le poids apparent de l’aimant est donné par la somme de son poids réel et de la force magnétique Fz qu’il subit. Une mesure de la masse apparente ∆m indiquée par une balance, préalablement tarée en l’absence de champ magnétique, permet alors de déduire Fz = g∆m, où g est l’accélération de la pesanteur. Une autre possibilité serait d’utiliser un fil de torsion afin de mesurer le couple Γ = M × Bext auquel est soumis l’aimant. Néanmoins, il faut pour cela être capable
II.4 Mesure du moment magnétique d’un aimant permanent
173
de mesurer précisément l’orientation de l’aimant, et disposer d’un fil de torsion bien calibré.
3.2 Obtention d’un gradient uniforme de champ magnétique Un gradient quasi uniforme de champ magnétique peut être obtenu en utilisant des bobines parcourues par des courants électriques d’intensités opposées et dans une géométrie particulière, que l’on cherche à déterminer. Considérons une bobine, assimilée à un ensemble de N spires de rayon R, d’épaisseur négligeable devant R, et d’axe de vecteur unitaire u, orienté dans le sens direct par rapport au sens de parcours du courant I. Le champ magnétique créé par cette bobine à une distance h le long de son axe vaut [4] Bbob (h) =
µ0 N I R3 u. 2R (R2 + h2 )3/2
(6)
On définit le champ magnétique maximal B0 = µ0 N I/2R et la fonction f définie par 1 f (x) = , (7) (1 + x2 )3/2 de sorte que Bbob (h) = B0 f (h/R) u. Considérons maintenant deux bobines identiques de rayon R et de même axe (Oz), l’une placée à z = d et parcourue par un courant d’intensité I > 0, l’autre à z = −d et parcourue par un courant d’intensité opposée, comme représenté en Fig. 3. Le champ magnétique total le long de l’axe (Oz) vaut Bext (z) = B0 f (z − d)/R − f (z + d)/R ez . (8)
Nous souhaitons créer un gradient de Bext le long de (Oz) aussi uniforme que possible autour d’un aimant placé en z = 0. Nous cherchons donc à déterminer une condition sur d pour que Bext soit linéaire en z avec une bonne approximation. 2d
R 0
ez
Fig. 3 Bobines en configuration dite « anti-Helmholtz ». Une bobine est placée à la hauteur z = d et parcourue par un courant d’intensité I, l’autre est placée à z = −d et parcourue par un courant d’intensité −I. Le sens de parcours du courant dans les bobines est indiqué sous celles-ci. L’axe commun des bobines, de même rayon R, est dirigé par le vecteur unitaire ez . L’origine est prise à équidistance des deux bobines.
174
Magnétisme
Pour cela, on effectue un développement limité de Bext autour de 0. La fonction Bext = Bext · ez étant impaire en z (puisque f est paire), les termes d’ordre pair sont nuls dans son développement limité au voisinage de z = 0. On obtient z 5 z 1 z 3 000 f (d/R) + O . (9) Bext (z) = −B0 2 f 0 (d/R) + R 3 R R Le gradient de Bext ne dépend donc de z/R qu’au deuxième ordre. Il est toutefois possible d’améliorer ce résultat en choisissant judicieusement la distance d. Les dérivées première et troisième de f ont pour expression −3x f 0 (x) = (1 + x2 )5/2 . (10) 2 f 000 (x) = 15x 3 − 4x (1 + x2 )9/2 Ainsi, f 000 (d/R) s’annule à condition que d=
√
3 R, 2
(11)
√ c’est-à-dire si les deux spires sont éloignées de 2d = 3R. Dans ce cas, le gradient de Bext est uniforme jusqu’au troisième ordre en z/R. Pour une séparation de 2d = √ 3R, le champ magnétique créé par les deux bobines sur l’axe est √ z 5 48 3 µ0 N I z +O Bext (z) = √ ez . R R R 49 7
(12)
Cette configuration est souvent dénommée « bobines anti-Helmholtz » en référence aux bobines de Helmholtz, dispositif similaire dans lequel les bobines sont parcourues par des courants de même sens [5]. Cette dernière configuration permet au contraire de produire un champ magnétique quasi uniforme en annulant les termes d’ordre 1, 2 et 3 dans le développement limité de Bext (z). Il faut pour cela choisir un écartement des bobines de 2d = R.
Pour mesurer le moment magnétique de l’aimant, il faut donc tout d’abord mesurer le gradient de Bext en fonction du courant imposé dans les bobines, en l’absence de l’aimant. On détermine ensuite M en mesurant la composante verticale de la force Fz à gradient de champ dBext /dz connu.
4 Protocole et résultats 4.1 Étalonnage du champ magnétique extérieur Disposer deux bobines √ de même rayon R l’une en face de l’autre le long d’un axe vertical, à distance 3R l’une de l’autre, comme schématisé sur la Fig. 4. Brancher ces bobines en configuration anti-Helmholtz, en série avec un ampèremètre
II.4 Mesure du moment magnétique d’un aimant permanent
√
3R 2 0 √ 3R − 2
ez
175
2R Bobine Aimant
Support Balance Fig. 4 Schéma du dispositif expérimental. Les bobines, de rayon √ R, sont parcourues par des courants de sens opposés et sont distantes de 3R selon l’axe ez . Le support non magnétique permet de placer l’aimant dans le gradient de champ magnétique en influençant le moins possible la balance, comportant éventuellement des éléments sensibles à un champ magnétique. L’origine de l’axe vertical (Oz) est prise dans le plan médiateur des deux bobines.
et une alimentation continue délivrant un courant d’intensité I, en prenant garde à ne pas dépasser le courant limite que les bobines peuvent admettre. Celles que nous avons utilisées supportent un courant maximal de 5 A. Le champ résultant est alors de l’ordre de 1 mT au maximum. Faire le zéro d’un teslamètre et l’utiliser pour mesurer le champ magnétique le long de l’axe des bobines ez en fonction de la hauteur z. Cette mesure doit s’effectuer en l’absence de l’aimant. Si l’on utilise une sonde à effet Hall, il faut faire deux mesures pour chaque hauteur, en retournant la sonde, afin de s’affranchir d’un éventuel mauvais alignement des soudures (voir le Comp. B de l’Exp. II.1, « Ascension d’un liquide paramagnétique »). En notant B (+) et B (−) les deux valeurs mesurées, le champ à la hauteur z corrigé de cette erreur systématique est alors (B (+) − B (−) )/2. Il faut également veiller à minimiser l’angle θ entre la normale à la sonde et l’axe des bobines, une sonde à effet Hall n’étant sensible qu’à la composante du champ orthogonale à sa plaquette semi-conductrice. On peut ajuster θ de manière à maximiser la valeur de champ magnétique affichée par le teslamètre.
Reproduire les mesures pour différentes intensités du courant I. Déduire des mesures de Bext en fonction de z le gradient à l’origine dBext /dz pour chaque intensité I. Nous avons utilisé des bobines constituées de N = 95 spires de rayon moyen R = (6,5 ± 0,2) √ cm. Nous avons placé les bobines à 2d = (11,4 ± 0,2) cm l’une de l’autre, car 3R = (11,3 ± 0,3) cm. Le champ magnétique a été mesuré à l’aide d’une sonde à effet Hall, ayant une incertitude de 0,02 B ± 0,01 mT pour le calibre utilisé 30 mT. Pour la mesure du courant, nous avons utilisé un ampèremètre de précision 0,005 I ± 0,001 A au calibre 5 A. La mesure du champ magnétique obtenu pour un courant I = (3,20 √ ± 0,02) A est représentée Fig. 5. Les bobines n’étant pas séparées d’exactement 3R, il est
176
Magnétisme
Bext (mT)
2 1 0 -1 -2 -0,75
-0,50
-0,25
0 z/d
0,25
0,50
0,75
Fig. 5 Champ magnétique créé par les bobines le long de leur axe e√ z , pour un courant I = (3,20 ± 0,02) A. L’altitude z est normalisée par d = 3R/2. Les points expérimentaux sont représentés par des disques et un ajustement affine pour les points entre z = −2 cm et z = 2 cm donne Bext = az + b avec a = (6,16 ± 0,02) × 10−2 T·m−1 et b = (−4,9 ± 0,3) × 10−5 T. Les lignes tiretées verticales bleues délimitent la zone considérée pour l’ajustement, et celles grises indiquent les dimensions de l’aimant.
possible que le champ magnétique Bext (z) possède un terme cubique dans son développement en z. Comme nous cherchons à mesurer le gradient de champ en l’origine, donné par l’Éq. (12), il faut évaluer l’intervalle sur lequel on peut négliger l’ordre trois dans le développement limité effectué. Pour cela, nous avons mesuré le coefficient du terme cubique de la fonction Bext grâce à un ajustement affine en fonction de (z/R)2 : Bext /(z/R) = c(3) (z/R)2 + c(1) . Celui-ci donne une pente c(3) ' 1 mT et une ordonnée à l’origine c(1) ' 4 mT. Ainsi, le terme linéaire c(1) × (z/R) de la fonction Bext domine la composante cubique c(3) × (z/R)3 d’un facteur 50 pour |z| ≤ 0,3R. La limite linéaire de l’Éq. (12) est donc une bonne approximation dans ce domaine, correspondant à |z| ≤ 2 cm pour les bobines utilisées. L’aimant choisi ayant une hauteur de 0,5 cm, le gradient sera homogène sur l’ensemble de l’aimant. Nous obtenons finalement un gradient de champ de (6,16 ± 0,02) × 10−2 T·m−1 . Nous vérifions maintenant l’Éq. (12), en mesurant l’évolution du gradient de champ magnétique avec le courant I parcourant les bobines. Les résultats expérimentaux sont présentés sur la Fig. 6. Un ajustement affine de la dérivée dBext /dz en fonction du courant I donne une ordonnée à l’origine (0 ± 4) × 10−4 T·m−1 et une pente (1,92 ± 0,02) × 10−2 T·m−1 ·A−1 . Les données expérimentales sont donc compatibles avec une loi linéaire, en accord avec l’expression donnée par l’Éq. (12). La pente attendue est de (1,8 ± 0,1) × 10−2 T·m−1 ·A−1 pour les bobines utilisées. Les valeurs mesurée et attendue sont donc compatibles. La proportionnalité entre Bext et I implique que le domaine de validité de l’approximation linéaire de Bext , évalué au paragraphe précédent pour un courant donné, ne dépend pas de l’intensité du courant.
II.4 Mesure du moment magnétique d’un aimant permanent
177
dBext /dz (10−2 T · m−1 )
6 5 4 3 2 1,0
1,5
2,0 I (A)
2,5
3,0
Fig. 6 Gradient de la composante verticale du champ magnétique en fonction du courant parcourant les bobines. Les points expérimentaux sont représentés par des disques, de taille supérieure aux incertitudes. L’ajustement affine dBext /dz = a0 I + b0 , représenté par une courbe continue, donne a0 = (1,92 ± 0,02) × 10−2 T·m−1 ·A−1 et b0 = (0 ± 4) × 10−4 T·m−1 .
4.2 Mesure du moment magnétique de l’aimant Placer l’aimant entre les bobines, si possible en le bloquant dans un matériau non ferromagnétique afin d’éviter les déplacements latéraux. L’aimant doit être sur l’axe des bobines, son moment selon ce même axe. Il faut placer l’aimant afin que la force qu’exerce le champ soit selon −ez , pour bien le plaquer contre le support. Dans le cas contraire, l’aimant, qui peut être en équilibre d’orientation instable selon le signe de M · ez , pourrait se retourner. Cela est d’autant plus significatif que l’aimant est léger et son moment magnétique important.
Mesurer la composante verticale Fz de la force exercée par le champ sur l’aimant grâce à une balance. Celle-ci, préalablement tarée avec le support et l’aimant, donne une variation de masse ∆m = Fz /g. En faisant varier dBext /dz par le biais de I, mesurer ∆m. Il n’est en général pas envisageable d’effectuer la mesure en posant directement l’aimant sur la balance, celle-ci comportant des matériaux magnétiques pouvant interagir avec l’aimant, faussant ainsi la mesure. On utilise donc un matériau non magnétique afin de surélever l’aimant et éviter cette interaction. Il est également utile de vérifier que le champ magnétique n’influence pas la balance en l’absence de l’aimant.
Nous avons utilisé un aimant Nd2 Fe14 B cylindrique de hauteur (0,50 ± 0,01) cm et de diamètre (0,99 ± 0,01) cm, mesurés au pied à coulisse 4 . Son volume est donc V = (3,85 ± 0,11) × 10−7 m3 . La mesure de la force a été effectuée avec une balance de précision ayant une incertitude-type de 5 mg. Un ajustement affine g∆m = 4. Le rayon de l’aimant est bien inférieur à celui des bobines. On peut donc négliger la variation radiale du champ magnétique sur le volume de l’aimant.
178
Magnétisme
22,5
g∆m (mN)
20 17,5 15 12,5 10,0 20
30
40 50 dBext /dz (mT · m−1 )
60
Fig. 7 Force mesurée par la balance en fonction du gradient du champ magnétique créé par les bobines. Un ajustement affine est représenté par la courbe continue, donnant g∆m = adBext /dz + b où a = (3,71 ± 0,05) × 10−1 A·m2 et b = (−2 ± 2) × 10−4 N.
a dBext /dz + b, présenté en Fig. 7, donne a = (3,71 ± 0,05) × 10−1 A·m2 et b = (−2 ± 2) × 10−4 N pour un χ2 réduit χ2red = 0,9. L’ordonnée à l’origine et la valeur de χ2red sont compatibles avec une loi linéaire, en accord avec l’Éq. (5). Nous obtenons donc un moment magnétique Mexp = (3,71 ± 0,05) × 10−1 A·m2 .
(13)
Mexp = (9,6 ± 0,3) × 105 A·m−1 .
(14)
En supposant que la couche protectrice de l’aimant possède un volume négligeable et que l’alliage Nd2 Fe14 B est aimanté de manière uniforme dans tout le volume de l’aimant, on obtient une estimation de l’aimantation moyenne
Le champ coercitif de l’aimant que nous avons utilisé est de l’ordre de µ0 HcM = 1,2 T [3]. Le champ créé par les bobines étant au maximum de l’ordre de 1 mT, il est trop faible pour modifier l’aimantation de l’aimant : Mexp est donc bien l’aimantation rémanente de l’aimant.
5 Discussion 5.1 Nature de l’aimant Les aimants au néodyme ne présentent pas tous les mêmes propriétés magnétiques : celles-ci dépendent de la qualité du procédé de fabrication. Les aimants orientés, tels que ceux que nous avons utilisés, sont composés de monocristaux d’aimantation fixe. Lors de la fabrication de l’aimant, les différents grains sont soudés par frittage (chauffage sans aller jusqu’à la fusion), figés dans une matrice non magnétique, puis le matériau est refroidi et aimanté. Ce procédé produit les aimants les plus performants [1].
II.4 Mesure du moment magnétique d’un aimant permanent
179
Les aimantations rémanentes de ce type d’aimants varient entre 8,7 × 105 A·m−1 et 1,2 × 106 A·m−1 [6]. Il n’est donc pas possible de comparer la valeur mesurée à une valeur tabulée pour le matériau composant l’aimant. Nous comparons donc la valeur de l’aimantation rémanente que nous avons mesurée à celle fournie par la fiche constructeur pour cet aimant spécifique : Mr,tab = (10,3 ± 0,1) × 105 A·m−1 [3]. L’accord est bon, mais la valeur mesurée est inférieure d’environ 7 % à la valeur tabulée. Nous cherchons à justifier cet écart. Pour aboutir à la mesure de l’aimantation du matériau composant l’aimant, nous avons initialement supposé l’aimant uniformément magnétisé. Il est possible que seule une fraction de l’aimant soit composée de matériau ferromagnétique saturé et contribue à l’aimantation. Cela peut d’abord provenir de la phase non magnétique liant les monocristaux de fer dur entre eux, mais son volume est difficilement estimable. L’écart peut aussi provenir de la couche protectrice anti-corrosion. Pour l’aimant utilisé, cette couche a, d’après le constructeur, une épaisseur de l’ordre de 10 µm et représente donc un volume d’environ 3 × 10−9 m3 , soit 1 % du volume total de l’aimant. Cela est inférieur à notre incertitude sur le volume de l’aimant, et ne suffit pas à expliquer l’écart observé.
5.2 Influence de l’orientation du moment La mesure réalisée n’est sensible qu’à la projection du moment magnétique selon la verticale. Cela nous conduit forcément à sous-estimer la valeur de l’aimantation rémanente de l’aimant. L’aimant a été placé au centre des deux bobines selon une orientation stable, qui correspond à un moment magnétique pointant dans le sens des Bext décroissants. La force magnétique et la gravité tendent toutes deux à plaquer l’aimant contre son support. Ainsi, même si le moment magnétique n’est pas exactement selon l’axe (Oz), l’aimant gardera sa face plane posée contre son support. Le moment magnétique de l’aimant étant par construction le long de l’axe du cylindre, l’erreur commise en supposant le moment selon l’axe (Oz) reste faible. Pour justifier un écart de 7 %, il faudrait que le moment magnétique s’écarte de l’axe (Oz) d’un angle d’environ 21◦ . Un tel écart n’a pas été observé durant l’expérience.
5.3 Influence de la température Comme mentionné en Sec. 2.3, le principal inconvénient des aimants néodymefer-bore est leur limitation en température 5 . Leur température de Curie est de l’ordre de 310 ◦ C, mais le constructeur déconseille leur utilisation à des températures supérieures à 80 ◦ C [3]. Lors de leur fabrication, les aimants sont soumis à des champs magnétiques très intenses pour saturer le matériau. Si l’aimant est plus tard soumis à un chauffage, son aimantation diminue. Lors du refroidissement ultérieur en l’absence de champ, l’aimant ne retrouve pas son aimantation initiale, et lorsque le refroidissement est terminé il ne se trouve plus sur le cycle d’hystérésis à saturation [1]. L’aimant ne peut retrouver une aimantation à saturation que s’il est soumis à une excitation magnétique très intense, qui le ramènera sur le cycle à saturation. Un chauffage de l’aimant, après sa fabrication, diminuera donc de manière permanente son aimantation rémanente. 5. L’origine de la décroissance de l’aimantation d’un matériau ferromagnétique avec la température est décrite dans l’Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique ».
180
Magnétisme
Il est possible que l’aimant utilisé pour l’expérience ait subi un tel chauffage. Afin de tester cette hypothèse, nous avons mesuré les aimantations de cinq aimants de même nature et même volume. En prenant ces nouvelles mesures en compte, nous aboutissons à une mesure de l’aimantation moyenne du matériau M = (9,85 ± 0,14) × 105 A·m−1 , l’incertitude indiquée provenant de la dispersion statistique des aimantations des cinq aimants. Puisque la dispersion statistique est du même ordre de grandeur que l’incertitude sur une mesure unique de M , l’hypothèse selon laquelle les aimants que nous avons utilisés ont pu subir un chauffage au cours de leur histoire est mise en doute. Si cela avait été le cas, certains aimants auraient plus été chauffés que d’autres, et la dispersion statistique aurait été plus grande. L’écart relatif entre les aimantations mesurée et tabulée a donc sans doute une cause systématique, indépendante du choix de l’aimant. Il est envisageable que tous les effets évoqués dans cette discussion s’ajoutent, et justifient l’écart observé. Il est aussi possible que les performances des aimants soient tout simplement moins bonnes que celles annoncées par le constructeur, ou que ceux-ci aient tous subi le même chauffage préalable à leur utilisation dans cette expérience. En pratique, la mesure de l’aimantation d’un échantillon peut se faire à partir de la mesure du champ magnétique qu’il produit. Une méthode plus élaborée est la « magnétométrie à échantillon vibrant », où l’échantillon est placé entre deux spires et mis en vibration, de sorte à induire un courant dans les spires [7]. À une toute autre échelle, la force subie par le moment magnétique de spin porté par un atome placé dans un gradient de champ magnétique est à la base de l’expérience de Stern et Gerlach, qui illustre la quantification du spin électronique [8].
Références [1]
E. Du Trémolet de Lacheisserie et Collectif PUG, Magnétisme (tome 2), matériaux et applications. EDP Sciences, 1999.
[2]
M. Bertin, J.-P. Faroux et J. Renault, Électromagnétisme 4, milieux diélectriques et milieux aimantés. Dunod, 1996.
[3]
Supermagnete. (2011). Fiche de données article S-10-05-N, adresse : https:// www.supermagnete.fr/data_sheet_S-10-05-N.pdf (visité le 02/01/2020).
[4]
C. Garing, Magnétisme : statique, induction et milieux. Ellipses, 1999.
[5]
J.-M. Donnini, L. Quaranta, D. Aubert, R. Payan et P. Renucci, Dictionnaire de physique expérimentale (tome 4), l’électricité. Pierron, 1996.
[6]
Supermagnete. (2019). Données physiques des aimants en néodyme, adresse : https://www.supermagnete.fr/physical-magnet-data (visité le 07/01/2020).
[7]
D. O. Smith, « Development of a vibrating-coil magnetometer, » Rev. Sci. Instrum., 27 (5), p. 261-268, 1956.
[8]
J.-L. Basdevant, J. Dalibard et M. Joffre, Mécanique quantique. Éditions École Polytechnique, 2002.
II.5
Freinage magnétique dans un tube conducteur
Un aimant lâché dans un tube conducteur fixe ne tombe pas en chute libre, car une force de freinage d’origine magnétique compense son poids, augmentant considérablement le temps de chute. Cette force de freinage est une manifestation du phénomène d’induction électromagnétique : le champ magnétique variable de l’aimant induit des courants, dits de Foucault, dans le tube conducteur, lesquels agissent à leur tour sur l’aimant. La vitesse de chute dépend des propriétés du tube, comme son épaisseur ou sa conductivité, mais aussi des propriétés magnétiques (aimantation) et géométriques (épaisseur, rayon) de l’aimant. Nous proposons plusieurs modèles pour décrire l’expérience sur différents niveaux de complexité.
Sommaire 1 2 3 4 5
Introduction à l’induction électromagnétique Chute d’un aimant dans un tube conducteur Mesure de la position de l’aimant . . . . . . Mesure de la vitesse limite de chute . . . . . Résultats . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
181 182 188 189 190
Compléments A
Calcul numérique de la vitesse limite de l’aimant . . . . 194
1 Introduction à l’induction électromagnétique Au cours des expériences précédentes, nous avons principalement considéré des champs magnétiques statiques, permettant de découpler les effets magnétiques et électriques. M. Faraday a pourtant montré expérimentalement en 1831 qu’une variation temporelle de flux magnétique à travers un circuit fermé engendre un champ électromoteur le long du circuit : il s’agit de l’induction électromagnétique. La circulation de ce champ sur tout le contour du circuit se nomme force électromotrice d’induction (f.é.m.) 1 ; nous la noterons e. Ainsi, la f.é.m. d’un circuit électrique fermé (orienté dans le sens direct) est induite par la variation du flux magnétique Φ traversant ce circuit, c’est la loi de Faraday [1] : e=−
dΦ . dt
(1)
Lorsque le flux traverse un circuit fixe, l’Éq. (1) est équivalente à la loi de MaxwellFaraday ∇ × E = −∂B/∂t, qui relie les champs électrique E et magnétique B. La 1. Cette appellation historique est malheureuse, puisque la f.é.m. n’est pas homogène à une force, exprimée en newton, mais à une tension, exprimée en volt.
181
182
Magnétisme
loi de Faraday est valable quelle que soit la cause de la variation de flux : il peut s’agir d’un circuit fixe dans un champ magnétique extérieur variable (induction de Neumann), d’un circuit se déplaçant ou se déformant dans un champ magnétique statique (induction de Lorentz), ou encore des deux à la fois. Le signe moins de l’Éq. (1) traduit la loi de modération de Lenz : le sens des courants induits dans le circuit est tel qu’ils s’opposent à la variation de flux qui leur donne naissance. Dans le cas de l’induction de Neumann, ces courants engendrent un champ magnétique opposé à la variation initiale de champ. Dans le cas de l’induction de Lorentz, ils sont à l’origine d’actions mécaniques qui s’opposent au mouvement initial du circuit. L’induction électromagnétique revêt une importance considérable. D’un point de vue fondamental, elle illustre le lien entre les champs électrique et magnétique, qui ne sont que deux facettes d’un seul objet physique fondamental : le champ électromagnétique. Il est impossible de les découpler dès lors que les champs varient dans le temps 2 . D’un point de vue pratique, l’induction est à la base des technologies de conversion électromagnétique. L’induction de Neumann sert ainsi à coupler magnétiquement deux circuits électriques : c’est le principe du transformateur (Exp. III.3, « Transformateur électrique monophasé »). L’induction de Lorentz permet une conversion électromécanique : c’est le principe des moteurs à courant continu et des alternateurs (Exp. III.1, « Machine à courant continu »). Nous illustrons dans cette expérience l’apparition de courants induits dans un tube conducteur soumis au champ magnétique variable d’un aimant permanent chutant dans le tube. L’expérience est spectaculaire, en ce que le temps de chute de l’aimant est beaucoup plus long que celui attendu pour une chute libre. Il s’agit d’un cas particulier de freinage magnétique, dispositif aujourd’hui utilisé sur de nombreux véhicules lourds en complément de freins classiques.
2 Chute d’un aimant dans un tube conducteur 2.1 Description qualitative La Fig. 1 schématise le principe de l’expérience. On lâche un aimant sans vitesse initiale dans un tube en cuivre de longueur L ' 50 cm. Le temps de chute mesuré est en général bien supérieur à la seconde, alors que pour une chute libre on aurait p Tlib = 2L/g ' 0,3 s (avec g l’accélération de la pesanteur). Ni les frottements solides contre la paroi interne du tube, ni les frottements fluides de l’air ne peuvent expliquer cet écart, car ils seraient presque identiques dans un tube non conducteur de même rayon, pour lequel le temps de chute est cohérent avec une chute libre. Du reste, on observe que le mouvement n’est pas uniformément accéléré. L’aimant atteint une vitesse limite dès les premiers instants de sa chute : la force de freinage magnétique que le tube conducteur exerce sur l’aimant compense son poids. Cette force de freinage magnétique est d’origine inductive. Considérons, comme sur la Fig. 1, un anneau constitué d’une section droite du tube, comprise entre les hauteurs z et z + dz, située sous l’aimant au début de sa chute. Que l’aimant s’approche ou s’éloigne de cet anneau, le flux magnétique à travers celui-ci varie. 2. Les inductions de Neumann et de Lorentz sont liées par un changement de référentiel. Une étude poussée de ce changement de référentiel amène à une incompatibilité entre la théorie électromagnétique de Maxwell et la relativité galiléenne [1, 2], qui ouvre la voie à la relativité restreinte.
II.5 Freinage magnétique dans un tube conducteur (a)
183
(b)
ez N M
S z + dz z
S N
eρ eϕ
R
v
w
d2i
N S r
N h S v
Fig. 1 Un aimant de moment magnétique M, orienté vers le haut, chute à la vitesse v dans un tube conducteur. Considérons un anneau, de hauteur dz, orienté dans le sens direct par rapport à ez . (a) Lorsque l’aimant s’en approche, le flux magnétique (positif) à travers l’anneau augmente. Le courant induit circule dans le sens indirect d’après la loi de Lenz (d2 i < 0). (b) Lorsque l’aimant s’en éloigne, le flux magnétique (positif) décroît. Le courant induit circule donc dans le sens direct (d2 i > 0). Une interprétation en termes de pôles magnétiques nord (N ) ou sud (S) de l’aimant et de la boucle de courant explique le freinage de l’aimant dans les deux cas.
Des courants induits, appelés courants de Foucault, se développent alors dans l’anneau. D’après la loi de modération de Lenz, ces courants produisent un champ magnétique dont le flux s’oppose à la variation du flux du champ créé par l’aimant, et ralentissent sa chute. En effet, le sens des courants induits permet de positionner les pôles nord et sud de la boucle de courant. Lorsque l’aimant est au-dessus de la boucle (Fig. 1(a)), les deux pôles de même polarité se font face, de sorte que la boucle repousse l’aimant. Lorsque l’aimant est au-dessous de la boucle (Fig. 1(b)), les deux pôles de polarités opposées se font face et la boucle attire l’aimant. Dans les deux cas, la force inductive freine l’aimant. Le freinage magnétique admet également une interprétation énergétique. Les courants induits sont en effet dissipés par effet Joule dans le tube conducteur, prélevant ainsi une partie de l’énergie mécanique de l’aimant, ce qui se traduit par son freinage. L’aimant atteint une vitesse limite lorsque les puissances dissipée par effet Joule et fournie par le poids se compensent.
2.2 Calcul de la force de freinage électromagnétique Le calcul présenté dans cette section est adapté des Réf. [3, 4]. Soit un aimant cylindrique de moment magnétique M, chutant à une vitesse v le long de l’axe
184
Magnétisme
de révolution (Oz) d’un tube de conductivité électrique σ, de rayon moyen R et d’épaisseur w. Le champ magnétique de l’aimant et la distribution des courants de Foucault sont invariants par rotation autour de (Oz). Nous exprimons le champ dans les coordonnées cylindriques (ρ, ϕ, z), de base orthonormée (eρ , eϕ , ez ), où ez est orienté selon la verticale ascendante, de sorte que g = −gez et v = −vez (Fig. 1). Nous nous plaçons dans l’approximation des régimes quasi stationnaires (ARQS) magnétique. Champ électromoteur Notons R le référentiel du laboratoire, lié au tube et dans lequel l’aimant est en mouvement, où règnent les champs électrique E et magnétique B. Notons également R0 le référentiel de l’aimant (dans lequel le tube est en mouvement), où règnent les champs E 0 et B 0 . On souhaite exprimer le champ E dans R en fonction de B. Soit V (resp. V 0 ) la vitesse d’un porteur de charge du tube dans R (resp. R0 ), et v R0 /R = v la vitesse de R0 par rapport à R, c’està-dire la vitesse de chute de l’aimant. En relativité galiléenne, la force subie par cette charge ne dépend pas du référentiel ; l’égalité des forces de Lorentz dans R et R0 donne E + V × B = E 0 + V 0 × B 0 . La composition galiléenne des vitesses V = V 0 + v conduit ensuite à B 0 = B et E 0 = E + v × B [1]. On suppose que le champ magnétique B 0 provient uniquement de l’aimant et ne dépend donc pas du temps. Ainsi, le champ électrique E 0 est nul : on en tire E = −v × B.
(2)
Expression générale de la force de freinage Considérons l’aimant à un instant donné, en z = 0. La symétrie axiale du problème, et en particulier de la distribution de courants, amène à écrire le champ magnétique sous la forme B(ρ, z) = Bρ (ρ, z)eρ +Bz (ρ, z)ez . D’après la loi d’Ohm locale, le courant élémentaire circulant dans un anneau C de hauteur dz, de rayon ρ et d’épaisseur dρ, s’écrit d2 i = σE · eϕ dρ dz = σvBρ dρ dz,
(3)
où l’on a injecté l’Éq. (2) dans la seconde égalité. La force élémentaire de Laplace exercée par l’aimant sur l’anneau a pour expression ˛ d2 F = (dl × B) d2 i, (4) C
où dl = ρ dϕeϕ désigne un élément de longueur infinitésimale de C. La composante radiale de cette force s’annule par symétrie de révolution, tandis que la composante verticale vaut ˆ 2π d2 F = d2 F · ez = dϕ (ρeϕ × Bρ eρ ) · ez d2 i = −2πρBρ d2 i. (5) 0
En combinant les Éq. (3) et (5), on trouve d2 F = −2πρσvBρ2 dρ dz. Si l’aimant est loin des extrémités du tube, celui-ci peut être considéré de hauteur infinie. La force de Laplace F qui s’exerce sur tout le volume du tube s’obtient par intégration : ! ˆ +∞ ˆ R+w/2 2 dρ 2πρBρ (ρ, z) v ez . (6) F =− σ dz −∞
R−w/2
II.5 Freinage magnétique dans un tube conducteur
185
En vertu du principe des actions réciproques, la force de freinage magnétique subie par l’aimant est l’opposée de la force de Laplace F = F ez ; elle est orientée en sens contraire de v = −vez et s’oppose ainsi au poids de l’aimant pendant sa chute. De plus, elle est proportionnelle à la vitesse v de l’aimant : c’est donc l’analogue magnétique d’une force de frottement fluides à bas nombre de Reynolds. Dorénavant, nous posons F = −αv, où α > 0 est le coefficient de freinage magnétique. L’objectif des paragraphes suivants est d’obtenir une expression plus explicite de α à partir d’approximations successives. Tube de faible épaisseur Si l’épaisseur w du tube est faible devant son rayon moyen R, on peut supposer Bρ uniforme sur cette épaisseur, et l’Éq. (6) donne ˆ +∞ α = 2πRwσ dzBρ2 (R, z). (7) −∞
Approximation dipolaire L’aimant est de forme cylindrique, de rayon r et de hauteur h négligeables devant la hauteur du tube. À une distance grande devant r et h, le champ magnétique produit par l’aimant s’approche du champ créé par un dipôle de même moment magnétique M, dont les composantes s’écrivent (en choisissant l’origine des coordonnées cylindriques au centre de l’aimant) [3] 3ρz µ0 M (8a) Bρ,dip (ρ, z) = 4π (ρ2 + z 2 )5/2 , µ0 M 2z 2 − ρ2 . Bz,dip (ρ, z) = 4π (ρ2 + z 2 )5/2 En injectant l’Éq. (8a) dans l’Éq. (7), on obtient 2 ˆ +∞ 3µ0 M x2 2 α = 2πR wσ , dx 4πR3 (1 + x2 )5 −∞
(8b)
(9)
où l’on a effectué le changement de variables x = z/R. L’intégrale de l’Éq. (9) vaut 5π/128, d’où l’on tire finalement α=
45µ20 σwM2 . 1024R4
(10)
Plus la conductivité σ est grande et le tube épais, et plus le champ magnétique est fort dans le tube (c’est-à-dire plus M est grand et R faible), plus l’intensité des courants est élevée, et le freinage efficace. Contribution du champ magnétique induit Nous avons supposé que la carte de champ magnétique n’est modifiée ni par la présence du tube, ni par les courants induits. Le matériau dont se compose le tube ne perturbe que très peu le champ magnétique si sa susceptibilité magnétique est négligeable devant 1 (voir l’Exp. II.1, « Ascension d’un liquide paramagnétique ») ; c’est le cas des conducteurs paramagnétiques comme l’aluminium ou diamagnétiques comme le cuivre, que nous utilisons dans cette expérience.
186
Magnétisme
Le champ magnétique est aussi modifié par les courants de Foucault induits, qui peuvent produire un champ du même ordre de grandeur que celui de l’aimant si la vitesse de chute est élevée [5]. D’après la loi de Lenz, ce champ s’oppose à celui de l’aimant et l’écrante. Le champ magnétique qui règne à l’intérieur du tube est alors plus faible : la force de freinage magnétique en est diminuée, et ne varie plus linéairement avec la vitesse de l’aimant [6]. Déterminons à quelle condition cet écrantage est négligeable. D’après l’Éq. (3), la densité linéique de courant dans le tube vaut di/dz ' σvBρ w, dans l’hypothèse w R. Le champ magnétique créé par les courants induits s’obtient par le théorème d’Ampère [3] ; il est vertical au centre du tube et de composante Bind ' µ0 di/dz ' µ0 σvBρ w, qui est négligeable devant le champ Bρ produit par l’aimant à condition que µ0 σvw 1. La distance δ = 1/µ0 σv s’interprète comme la profondeur de pénétration du champ magnétique dans le tube 3 . L’écrantage du champ par les courants induits est donc négligeable si δ w. Dans le cas le plus défavorable, nous avons utilisé un tube de conductivité σ ' 6 × 107 S·m−1 et d’épaisseur w ' 1 mm : cette condition donne v 13 m·s−1 . Elle sera toujours vérifiée dans la suite 4 .
2.3 Modèle de l’aimant cylindrique La hauteur h ' 1 cm et le rayon r ' 0,5 cm de l’aimant cylindrique que nous utilisons sont en fait du même ordre de grandeur que le rayon du tube R ' 0,7 cm. Le champ magnétique que produit l’aimant est donc loin d’être dipolaire au niveau du tube. Dans ce cas, l’expression de la force de freinage magnétique ne peut pas s’obtenir analytiquement, mais il est possible de calculer le coefficient de freinage (et donc la vitesse limite) par intégration numérique de l’Éq. (6), ou de l’Éq. (7) dans le cas d’un tube de faible épaisseur. L’expression de la composante radiale Bρ du champ magnétique produit par un cylindre uniformément aimanté selon son axe de symétrie est lourde, mais connue [8]. Elle est donnée dans le Comp. A, avec une proposition d’algorithme pour calculer la vitesse limite. Ce modèle est nécessaire 5 pour expliquer quantitativement les résultats expérimentaux (Sec. 5). L’effet de l’extension spatiale de l’aimant sur la vitesse limite se quantifie par le rapport d’aspect h/r. À partir d’une évaluation numérique de Bρ et Bz , nous avons représenté sur la Fig. 2 les lignes de champ d’un aimant de rapport d’aspect faible (Fig. 2(a)) et élevé (Fig. 2(c)), comparées aux lignes de champ d’un dipôle ponctuel (Fig. 2(b)). L’aimant étant uniformément aimanté, la distribution de courants d’une bobine de mêmes dimensions produit le même champ magnétique (voir le Comp. A). Dans les deux situations, le champ à grande distance de l’aimant s’assimile au champ dipolaire. Lorsque h/r est faible, le champ magnétique s’apparente à celui créé par une spire de courant plate. Lorsque h/r est élevé, le champ magnétique s’apparente au champ créé par un solénoïde de rayon r et de hauteur h. À moment magnétique fixé et près de l’aimant, la composante radiale du champ magnétique est d’autant plus faible que h/r est élevé. p
3. Cette distance s’identifie à l’épaisseur de peau δ = 2/µ0 σω dans le tube [7], qui est soumis au champ magnétique variable de l’aimant, dont la pulsation typique est de l’ordre de ω = 2v/δ. 4. La Réf. [6] calcule exactement la dépendance de la force en la vitesse de l’aimant lorsque l’écrantage n’est pas négligeable. 5. La Réf. [9] propose un modèle plus simple, mais pas assez précis dans notre cas, qui n’inclut que l’extension verticale de l’aimant.
II.5 Freinage magnétique dans un tube conducteur (a)
(b)
187
(c)
Fig. 2 Cartes bidimensionnelles des lignes de champ magnétique produites par (a) un aimant cylindrique (rectangle gris) de rapport d’aspect h/r = 1/50, (b) un dipôle magnétique ponctuel, et (c) un aimant cylindrique de rapport d’aspect h/r = 50. Le moment magnétique de l’aimant, indiqué par une flèche noire, est orienté dans notre expérience selon la verticale. Le champ magnétique est invariant par rotation autour de cet axe.
2.4 Vitesse limite de l’aimant En appliquant le principe fondamental de la dynamique à l’aimant dans le référentiel galiléen du laboratoire, et en supposant que l’aimant ne frotte pas contre le tube, on aboutit 6 à l’équation d’évolution de la vitesse de l’aimant : m
dv = mg − αv, dt
(11)
dont la solution s’écrit v(t) = vlim (1 − e−t/τ ). La vitesse limite vaut vlim =
mg , α
(12)
et s’atteint au bout d’un temps caractéristique τ = m/α. L’Éq. (12) est valable quelle que soit la géométrie du tube et de l’aimant, tant que le champ magnétique produit par les courants de Foucault est négligeable devant celui de l’aimant. En régime permanent, la puissance mécanique mgvlim fournie à l’aimant par le champ de pesanteur compense celle prélevée par la force de freinage magnétique, ˝ exactement égale à la puissance σE 2 dV dissipée par effet Joule dans le tube. On peut montrer l’Éq. (12) de cette façon, où le coefficient α est donné par l’Éq. (6).
Nous pouvons estimer vlim et τ à partir de l’Éq. (10), correspondant au modèle dipolaire. Pour un aimant de moment magnétique M ' 0,7 A·m2 et de masse m ' 6 g, chutant dans un tube en cuivre de hauteur L ' 50 cm, de rayon R ' 0,6 cm et de conductivité σ ' 6 × 107 S·m−1 , on trouve vlim ' 3 cm·s−1 et τ ' 4 ms. Cette valeur de la vitesse limite est cohérente avec le temps de chute T = L/vlim ' 17 s observé 6. La poussée d’Archimède et les frottements fluides sont négligeables dans notre cas.
188
Magnétisme
pour un lâcher sans vitesse initiale. Le régime transitoire est extrêmement bref et n’est pas observable dans notre expérience. En réalité, la durée caractéristique τ du régime transitoire est légèrement plus élevée suite aux effets de bord à l’entrée du tube, mais reste du même ordre de grandeur.
3 Mesure de la position de l’aimant La mesure de la vitesse de l’aimant au cours de sa chute pose problème, puisque le tube entoure complètement l’aimant, qui est alors inaccessible. Nous proposons de contourner ce problème en disposant une série de sondes de fluxmètre autour du tube pour repérer le passage de l’aimant à des positions données, comme illustré sur la Fig. 4. Les sondes que nous utilisons consistent en un bobinage de cuivre de rayon r0 , enroulé N fois, et d’épaisseur et de largeur négligeables. La sonde baigne dans un champ magnétique invariant par rotation autour de l’axe vertical (Oz) normal à la sonde, de composante normale Bz (ρ, z), produit par un aimant chutant à la vitesse v = −vez . Le flux magnétique à travers les N spires de la sonde vaut ˆ r0 dρ ρBz (ρ, vt), (13) Φ(t) = 2πN 0
où le centre de l’aimant passe par le plan médian de la sonde à t = 0. Ce flux induit une f.é.m. e = −dΦ/dt sur le bobinage, qui s’annule lorsque la fonction t 7→ Bz (ρ, vt) est maximale, c’est-à-dire au passage du centre de l’aimant dans le plan de la sonde. En disposant plusieurs sondes le long du tube, nous pouvons déterminer la position de l’aimant à différents instants, ce qui permet de mesurer la vitesse et de vérifier que cette dernière est constante au cours de la chute. Les sondes ne perturbent pas l’expérience puisque la f.é.m. se mesure quasiment en circuit ouvert, de sorte que le courant circulant dans le bobinage est négligeable devant les courants de Foucault dans le tube. Une sonde de fluxmètre sert généralement à mesurer un flux magnétique Φ (d’où son nom), et s’insère dans un circuit intégrateur pour déterminer Φ à partir de la f.é.m. (ce principe est utilisé dans l’Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique »).
Le rayon des fluxmètres que nous utilisons est suffisamment grand par rapport aux dimensions de l’aimant pour que le champ magnétique produit par celui-ci au niveau d’une sonde soit considéré comme dipolaire (mais il ne l’est pas au niveau du tube). Dans ce cas, l’Éq. (13) devient 7 " 2 #−3/2 µ0 N M vt Φdip (t) = 1+ . 2r0 r0
(14)
Un exemple de courbes de flux et de f.é.m. attendues pour un aimant dipolaire est montré en Fig. 3. La largeur temporelle de la courbe de flux est de l’ordre de r0 /v. Il serait donc possible de mesurer v par un ajustement non linéaire d’une acquisition 7. Ce calcul peut se réaliser en coordonnées cylindriques à partir de l’Éq. (8b), mais il est beaucoup plus simple en utilisant les coordonnées sphériques [3].
II.5 Freinage magnétique dans un tube conducteur
189
1,5 1,0
Signal
0,5 0,0 -0,5 et0 /Φ0 -1,0 -1,5
Φ/Φ0 -3
-2
-1
0 t/t0
1
2
3
Fig. 3 Courbes théoriques de f.é.m. e aux bornes de la sonde (ligne continue bleue) et de flux magnétique Φ (ligne tiretée rouge) en fonction du temps t, pour un aimant dipolaire de moment magnétique M chutant à vitesse constante v. Les grandeurs sont adimensionnées, avec t0 = r0 /v et Φ0 = µ0 N M/2r0 , où N est le nombre de spires de la sonde, de rayon r0 .
de f.é.m., mais cette méthode dépend de la modélisation du champ de l’aimant et est limitée par la précision sur r0 . Nous nous contentons de repérer les zéros de la tension, ce qui ne nécessite pas de connaître la forme précise du signal.
4 Mesure de la vitesse limite de chute Le dispositif expérimental est représenté sur la Fig. 4. Nous utilisons un aimant cylindrique de composition Nd2 Fe14 B, aimanté dans la direction de son axe de symétrie. Sa masse est m = (5,834 ± 0,001) g, son rayon vaut r = (0,50 ± 0,01) cm et sa hauteur h = (1,00 ± 0,02) cm. Nous avons mesuré son moment magnétique par la méthode décrite dans l’Exp. II.4, « Mesure du moment magnétique d’un aimant permanent », et trouvons M = (0,754 ± 0,012) A·m2 .
Fixer le long d’une potence un ensemble de sondes autour du tube conducteur, à distance suffisante des bords, à intervalles à peu près réguliers et à altitudes connues. Les aimants étant fragiles, placer un morceau de mousse ou d’étoffe sous le tube pour amortir leur chute. Relier les sondes en série, puis brancher les bornes de l’ensemble du circuit à une carte d’acquisition. Un temps d’échantillonnage inférieur à 10 ms est suffisant pour un repérage précis du passage de l’aimant. Brancher les sondes en série nécessite de les espacer suffisamment pour que les courbes de f.é.m. de chacune des sondes ne se superposent pas. Dans le cas contraire, il est préférable d’enregistrer les f.é.m. aux bornes de chaque sonde séparément, en synchronisant toutes les acquisitions.
Lancer l’acquisition, puis lâcher l’aimant dans l’axe du tube sans vitesse initiale. Réaliser plusieurs acquisitions pour chaque jeu de paramètres (nous en faisons quatre), et répéter l’expérience en faisant varier la masse de l’aimant par ajout
190
Magnétisme aimant sonde potence e pince tube
Fig. 4 Schéma du dispositif expérimental. Un aimant cylindrique tombe dans un tube conducteur creux, entouré d’un ensemble de fluxmètres connectés en série. Si les sondes des fluxmètres sont suffisamment espacées, la f.é.m. e s’annule à chaque passage de l’aimant dans le plan d’une sonde, ce qui permet de repérer son altitude à plusieurs instants, et de déterminer sa vitesse limite de chute.
de masselottes, et pour des tubes conducteurs de diamètres et de compositions variables (cuivre, aluminium, etc.). Empiler plusieurs aimants identiques permettrait de faire varier à la fois la masse et le moment magnétique, à rapport M/m constant. Sans prendre en compte la variation du rapport d’aspect h/r, la vitesse limite, proportionnelle à m/M2 en première approximation, décroîtrait donc en 1/M.
5 Résultats Nous disposons de trois tubes différents, dont le Tab. 1 présente les caractéristiques : deux sont en alliage de cuivre (tubes 1 et 2), et le dernier est en aluminium pur (tube 3). Ces trois tubes permettent d’étudier la dépendance de la vitesse limite de chute en fonction de la conductivité et du rayon du tube. De même, nous disposons de plusieurs masselottes pour étudier la dépendance avec la masse de l’aimant. Tube
R (mm)
σ (107 S·m−1 )
vlim (cm·s−1 )
1 (Alliage cuivre) 2 (Alliage cuivre) 3 (Aluminium pur)
6,45 ± 0,10 7,60 ± 0,10 7,60 ± 0,10
5,16 ± 0,05 5,16 ± 0,05 3,77
6,36 ± 0,03 11,35 ± 0,06 15,54 ± 0,13
Tab. 1 Propriétés des tubes étudiés dans cette expérience : rayon moyen R, conductivité électrique σ et vitesse limite de chute mesurée vlim , en l’absence de masselotte. Les trois tubes sont d’épaisseur w = (1,0 ± 0,1) mm. La conductivité de l’aluminium pur est tabulée [10], celle de l’alliage de cuivre est estimée à partir du rapport des vitesses limites des tubes 2 et 3, moyennées sur quatre réalisations de l’expérience. Les propriétés de l’aimant sont données en Sec. 4.
191
II.5 Freinage magnétique dans un tube conducteur
5.1 Exploitation de la courbe de tension Nous représentons sur la Fig. 5(a) la tension U aux bornes d’une association en série de sept sondes lors de la chute de l’aimant dans le tube 1. Lorsque l’aimant passe dans le plan d’une sonde, la tension s’annule et sa dérivée est ici positive. Les annulations de dérivée négative de la tension proviennent de la superposition des signaux de deux sondes adjacentes, et ne sont pas exploitables. Le signe de la tension dépend du sens de l’aimant et du branchement des fils. Le signe de la dérivée de la f.é.m. au passage de l’aimant dans les plans d’une sonde est donné par le signe de la dérivée lors de la première annulation du signal.
Connaissant les positions des sondes, on peut tracer la loi horaire z(t) pour l’aimant (Fig. 5(b)). Les données sont bien modélisées par des ajustements affines, ce qui montre que l’aimant a atteint une vitesse limite avant son passage par la première sonde. Les pentes des ajustements affines donnent les vitesses limites (Tab. 1). Les trois χ2red associés aux ajustements sont voisins de 0,5. Les vitesses limites s’ordonnent comme prévu par la théorie : vlim croît avec le rayon R et décroît avec la conductivité σ.
5.2 Estimation de la conductivité du tube de cuivre À température ambiante, les conductivités du cuivre et de l’aluminium purs valent σCu = 5,96 × 107 S·m−1 et σAl = 3,77 × 107 S·m−1 respectivement [10]. Bien que le tube d’aluminium étudié soit pur et donc de conductivité connue, ce n’est pas le cas des tubes de cuivre, qui sont vraisemblablement faits d’un alliage. Nous avons vérifié que les masses volumiques des tubes 1 et 2 sont en effet inférieures à celle du cuivre pur, ρCu = 8,96 × 103 kg·m−3 . Pour estimer la conductivité des tubes de cuivre, dont nous avons besoin pour calculer la vitesse de chute attendue, (a)
(b) 50
50 40 z (cm)
U (mV)
25 0 -25 -50
30 20
Tube 1 Tube 2 Tube 3
10 0 0
2
4 t (s)
6
8
0
1
2
3
4 5 t (s)
6
7
Fig. 5 (a) Acquisition de la tension aux bornes de sept sondes branchées en série (ligne continue bleue). Les zéros ascendants du graphe (disques noirs) marquent le passage de l’aimant dans le plan de chaque sonde. Chaque f.é.m. a une amplitude différente car les sondes n’ont pas le même nombre de spires. (b) Distance de chute z par rapport au haut du tube en fonction du temps t pour les trois tubes étudiés, et ajustements affines associés. Les résultats sont donnés dans le Tab. 1.
8
192
Magnétisme
nous pouvons mesurer le rapport des vitesses de chute dans les tubes 2 (en cuivre) et 3 (en aluminium), qui ont le même rayon aux incertitudes près. En effet, d’après les Éq. (6) et (12), la vitesse limite est inversement proportionnelle à la conductivité du tube (à masse de l’aimant et géométrie du tube fixées), et on a donc σ2 vlim,3 = , (15) vlim,2 σ3 où l’on note vlim,i la vitesse limite dans le tube i et σi sa conductivité. Cette relation est indépendante du champ magnétique de l’aimant, et en particulier, peut être appliquée dans des conditions éloignées de l’approximation dipolaire. Nos mesures, reportées dans le Tab. 1, donnent un rapport vlim,3 /vlim,2 = 1,369 ± 0,014. Ainsi, en supposant que σ3 = σAl , la conductivité du tube 2 en cuivre (et du tube 1, constitué du même matériau) vaut σ2 = σ1 = (5,16 ± 0,05) × 107 S·m−1 . Il est possible d’estimer la conductivité du tube de cuivre par une méthode plus directe et indépendante de la géométrie de l’aimant [11]. Il faut enrouler un fil électrique le long de la circonférence du tube, et mesurer la tension U (t) à ses bornes lors du passage de l’aimant. Dans la limite d’une faible épaisseur w de tube, le champ électrique induit dans le fil est le même que dans le tube. Par un bilan énergétique (Éq. (6) de la Réf. [11]), on montre que ˆ +∞ σw mg = U (t)2 dt, (16) 2πr0 N 2 −∞ où r0 ' R est le rayon de l’enroulement et N le nombre d’enroulements.
5.3 Influence du rayon du tube En faisant varier le rayon du tube, toutes choses étant égales par ailleurs, nous pouvons tester quel modèle du champ magnétique produit par l’aimant reproduit quantitativement les données. Pour les tubes 1 et 2, nous mesurons un rapport vlim,2 = 1,78 ± 0,02, (17) vlim,1 selon les données du Tab. 1. Dans l’approximation dipolaire, pour des tubes d’épaisatt att seur négligeable devant leurs rayons, les Éq. (10) et (12) prédisent vlim,2 /vlim,1 = 4 (R2 /R1 ) = 1,93 ± 0,16, ce qui est tout juste compatible avec notre mesure, mais peu concluant au vu de l’incertitude élevée qui affecte la valeur attendue. Sans aucune approximation sur l’aimant ou le tube, c’est-à-dire en intégrant numériquement l’expression de la force de freinage de l’Éq. (6) (Comp. A), nous trouvons att att vlim,2 /vlim,1 = 1,79 ± 0,08, en bien meilleur accord avec la valeur mesurée. L’incertitude sur αatt est estimée en utilisant la formule de propagation des incertitudes, où les dérivées partielles sont estimées numériquement à partir de l’Éq. (6). L’incertitude élevée sur le rapport des vitesses tient à la forte dépendance du champ en r, h (la taille de l’aimant), et plus particulièrement en R (le rayon moyen du tube). En conclusion, l’hypothèse d’un champ dipolaire n’est pas valable en pratique. Toujours en considérant le champ réel d’un aimant cylindrique, mais en négligeant cette fois-ci l’épaisseur des tubes devant leurs rayons, le coefficient de freinage s’obtient en intégrant l’Éq. (7) sur z à rayon ρ = R fixé. Ce modèle prédit att att vlim,2 /vlim,1 = 1,78 ± 0,08, là aussi en excellent accord avec la valeur mesurée.
II.5 Freinage magnétique dans un tube conducteur
193
L’intégration au rayon moyen du tube (plutôt qu’au rayon interne ou externe) rend l’approximation du tube de faible épaisseur bien meilleure, car le choix d’un intervalle d’intégration centré en ρ permet d’annuler l’erreur au premier ordre en w/R.
5.4 Influence de la masse D’après l’Éq. (12), la vitesse limite de chute vlim est proportionnelle à la masse m de l’aimant, tout autre paramètre étant fixé. Pour vérifier cette dépendance, nous réalisons l’expérience de chute avec le tube 1, en ajoutant une masselotte sur l’aimant à chaque répétition, comme décrit dans la Sec. 4. Les résultats sont présentés en Fig. 6. Un ajustement affine vlim = am + b donne a = (10,4 ± 0,3) m·s−1 ·kg−1 et b = (0 ± 2) × 10−3 m·s−1 , qui est compatible avec zéro. Le χ2red vaut 0,7 et est proche de l’unité. Le modèle linéaire est bien vérifié, ce qui confirme que la force est proportionnelle à v. La pente attendue est g/α, où α dépend de la conductivité électrique du tube et du profil de champ magnétique. La conductivité a été déterminée en Sec. 5.2 indépendamment du profil du champ généré par l’aimant, et l’intensité de la pesanteur est prise égale à g = 9,81 m·s−2 . Dans l’approximation dipolaire, et pour un tube d’épaisseur nulle, la pente vaut g/α = (8,3 ± 1,0) m·s−1 ·kg−1 , en désaccord avec la valeur mesurée. Le modèle de l’aimant cylindrique, que l’on prenne ou non en compte l’épaisseur du tube, prévoit g/α = (11,1 ± 0,6) m·s−1 ·kg−1 , ce qui est compatible avec la valeur mesurée. Le calcul numérique d’un profil réaliste de champ magnétique permet d’aller au-delà de la vérification de la linéarité de vlim avec la masse de l’aimant m en rendant compte quantitativement de la pente. Nos mesures montrent que la vitesse limite est plus petite dans le modèle dipolaire que dans celui de l’aimant cylindrique. On peut vérifier ceci en comparant les profils théoriques de champ magnétique radial au niveau du tube pour ces deux modèles, représentés en Fig. 7 en fonction de z, pour ρ = R1 fixé. On voit que le champ magnétique d’un aimant cylindrique s’écarte significativement du champ 25
vlim (cm · s−1 )
20 15 10 5 0
0
5
10
15
20
25
m (g)
Fig. 6 Vitesse limite vlim de chute de l’aimant en fonction de sa masse m, à moment magnétique fixé, pour le tube 1. La droite bleue représente l’ajustement affine vlim = am + b où a = (10,4 ± 0,3) m·s−1 ·kg−1 et b = (0 ± 2) × 10−3 m·s−1 .
194
Magnétisme 0,10
Bρ /B0
0,05
0,00
-0,05
-0,10
Bρ (R1 , z) Bρ,dip (R1 , z) -4
-3
-2
-1
0 z/R1
1
2
3
4
Fig. 7 Profils du champ magnétique Bρ (calculé numériquement avec l’Éq. (18), voir le Comp. A) et de Bρ,dip (donné par l’Éq. (8a)), pour ρ = R1 et en fonction de z/R1 . Les champs sont normalisés par B0 = µ0 M/R13 .
dipolaire, et sa composante radiale est globalement inférieure, en module, à celle du champ dipolaire. Le coefficient de freinage est donc bien plus faible dans le modèle dipolaire. Dans cette expérience, les courants de Foucault sont à l’origine de la force de freinage magnétique qui ralentit la chute de l’aimant. Ils posent un problème technologique en électrotechnique, car ils causent des pertes énergétiques, et on cherche en général à les minimiser, par exemple par un feuilletage du matériau ferromagnétique (voir l’Exp. III.3, « Transformateur électrique monophasé »). Ces courants induits sont en revanche à la base du fonctionnement des anciens compteurs électriques domestiques, dans lesquels un disque métallique entre en rotation à une vitesse proportionnelle à la puissance consommée par l’installation [12].
Complément A - Calcul numérique de la vitesse limite de l’aimant Nous détaillons dans ce complément le calcul numérique de la vitesse limite d’un aimant cylindrique uniformément aimanté selon son axe de symétrie, comme décrit en Sec. 2.3. En notant M = M/hπr2 l’aimantation de l’aimant, l’expression de la composante radiale Bρ du champ généré par l’aimant est [8] Bρ (ρ, z) =
µ0 M (β+ P (k+ ) − β− P (k− )) , π
(18)
où l’on a posé β± = r
"
h z± 2
2
2
+ (ρ + r)
#−1/2 ,
k± =
(z ± h/2)2 + (ρ − r)2 (z ± h/2)2 + (ρ + r)2
1/2 .
(19)
II.5 Freinage magnétique dans un tube conducteur
195
La fonction P est donnée par P (k) = K(k) − 2(K(k) − E(k))/(1 − k 2 ), où K et E s’expriment en fonction des intégrales elliptiques de première et seconde espèces : ˆ π/2 dθ q , (20a) K(k) = 0 1 − (1 − k 2 ) sin2 (θ) ˆ E(k) =
0
π/2
dθ
q
1 − (1 − k 2 ) sin2 (θ).
(20b)
Un cylindre d’aimantation uniforme M est équivalent à une distribution de courants orthoradiaux localisés sur sa surface, de densité surfacique js = M × n, où n est le vecteur unitaire normal à la surface extérieure [13]. L’Éq. (18) se démontre alors en appliquant la loi de Biot-Savart à cette distribution de courants.
L’Éq. (18) se réduit au champ dipolaire de l’Éq. (8a) dans la limite où r et h tendent vers 0. Le code Python ci-dessous intègre numériquement l’Éq. (20) pour obtenir le champ Bρ donné par l’Éq. (18), puis renvoie la vitesse limite pour les modèles de l’aimant cylindrique et dipolaire. 1
4
7
10
#coding: utf-8 import numpy as np import scipy.integrate as spi import scipy.special as spe #Paramètres mu0 = 4*np.pi*1e-7 #(m.kg.s^-2.A^-2) g = 9.81 #(m/s^2) R, w, r, h = 0.5*1.29e-2, 0.1e-2, 0.50e-2, 2*0.50e-2 #(m) m = 5.834e-3 #(kg) sigma = 51.6e6 #(S/m) Mmag = 0.754 #(A.m^2)
13
16
Rint, Rext = R-0.5*w, R+0.5*w ar = r/R br = 0.5*h/R B0 = mu0*Mmag/(R**3)
19
def P(k): return spe.ellipk(1-k*k)-2*(spe.ellipk(1-k*k)-spe.ellipe(1-k*k))/(1-k*k)
22
z = np.linspace(-10, 10, 500) #Hauteurs z/R de part et d'autre de l'aimant rho = np.linspace(Rint/R, Rext/R, 500) #Rayons rho/R à travers le tube Rho = rho[:,None]
25
28
#Facteurs définis dans l'Éq. (19) betap = 1/np.sqrt((z+br)**2+(Rho+ar)**2) betam = 1/np.sqrt((z-br)**2+(Rho+ar)**2) kp = np.sqrt(((z+br)**2+(Rho-ar)**2)/((z+br)**2+(Rho+ar)**2)) km = np.sqrt(((z-br)**2+(Rho-ar)**2)/((z-br)**2+(Rho+ar)**2))
196
Magnétisme
31
Brho = B0*(betap*P(kp)-betam*P(km))/(2*np.pi*np.pi*br*ar) #Éq. (18) 34
#Intégrale double de 2 pi rho B_\rho^2 Iz = 2*np.pi*rho*spi.simps(Brho**2, z) Imag = spi.simps(Iz, rho)
37
40
43
#Vitesse limite (aimant cylindrique, Éq. (12)) vmag = m*g/(sigma*(R**3)*Imag) #Vitesse limite (dipôle) vdip = 1024*m*g*(R**4)/(45*sigma*w*(Mmag*mu0)**2) print(f"Modèle de l'aimant cylindrique : {vmag:.3g}m/s") print(f"Modèle dipolaire : {vdip:.3g}m/s")
Références [1]
M. Bertin, J.-P. Faroux et J. Renault, Électromagnétisme 3, magnétostatique, induction, équations de Maxwell et compléments d’électronique. Dunod, 1993.
[2]
D. Tong. (2015). Lectures on electromagnetism. Consulté en novembre 2019, adresse : http://www.damtp.cam.ac.uk/user/tong/em.html.
[3]
C. Garing, Magnétisme : statique, induction et milieux. Ellipses, 1999.
[4]
G. Donoso, C. L. Ladera et P. Martin, « Damped fall of magnets inside a conducting pipe, » Am. J. Phys., 79 (2), p. 193-200, 2011.
[5]
A. Deiber, L. Markiewicz, O. Kempf et F. Paviet, « Phénomène d’induction associé au mouvement d’un aimant dans un tube de cuivre, » Bup, 94 (822 (1)), p. 487-509, 2000.
[6]
M. H. Partovi et E. J. Morris, « Electrodynamics of a magnet moving through a conducting pipe, » Can. J. Phys., 84, p. 253-271, 2006.
[7]
C. Garing, Ondes électromagnétiques dans le vide et les milieux conducteurs. Ellipses, 1998.
[8]
A. Caciagli, R. J. Baars, A. P. Philipse et B. W. Kuipers, « Exact expression for the magnetic field of a finite cylinder with arbitrary uniform magnetization, » J. Magn. Magn. Mat., 456, p. 423-432, 2018.
[9]
Y. Levin, F. L. da Silveira et F. B. Rizzato, « Electromagnetic braking: a simple quantitative model, » Am. J. Phys., 74 (9), p. 815-817, 2006.
[10]
W. Haynes, CRC handbook of chemistry and physics, 95e éd. CRC Press, 2014.
[11]
C. MacLatchy, P. Backman et L. Bogan, « A quantitative magnetic braking experiment, » Am. J. Phys., 61 (12), p. 1096-1101, 1993.
[12]
R. P. Feynman, R. B. Leighton et M. Sands, Le cours de physique de Feynman : électromagnétisme 1, 2e éd. Dunod, 2013.
[13]
M. Bertin, J.-P. Faroux et J. Renault, Électromagnétisme 4, milieux diélectriques et milieux aimantés. Dunod, 1996.
Machine à courant
III.1 continu
Nous étudions une machine à courant continu (MCC), nommée ainsi car elle réalise une conversion électromécanique de puissance, dans laquelle les grandeurs électriques sont continues. Nous proposons tout d’abord une étude théorique, allant de la présentation d’une MCC, de la constitution de son stator et de son rotor, jusqu’à l’établissement de ses équations électromécaniques de fonctionnement et au calcul de son rendement lorsqu’elle fonctionne en moteur. Nous présentons également son fonctionnement en génératrice de tension continue. Nous menons ensuite une étude expérimentale sur une MCC d’enseignement, avec pour but de caractériser la machine en modes moteur et générateur, et de mettre en exergue la notion de grandeurs nominales de fonctionnement.
Sommaire 1 2 3 4 5
Introduction . . . . . Présentation générale Approche théorique . Étude à vide . . . . . Étude en charge . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
199 200 204 211 214
1 Introduction La conversion électromécanique de puissance permet la production d’une grande partie de l’électricité mondiale, par conversion d’énergie mécanique en énergie électrique. Cette énergie mécanique peut être apportée par de la vapeur d’eau mise sous pression grâce à la chaleur dégagée soit par une réaction nucléaire, soit par la combustion d’hydrocarbures (charbon, pétrole, gaz naturel) ou de bioéthanol. Elle peut également être procurée par l’énergie potentielle d’une masse d’eau, qu’elle soit due au potentiel gravitationnel terrestre comme dans une usine hydroélectrique ou au potentiel de marée comme dans une usine marémotrice. À l’autre bout du réseau de transport de l’électricité, une grande part de l’énergie électrique est à nouveau convertie en énergie mécanique utile : citons les pièces mobiles des machines-outils dans les usines, les trains sur les lignes électrifiées, les cages d’ascenseurs, les appareils électroménagers, etc. Cette conversion électromécanique de puissance emploie quatre grandes familles de machines. On trouve principalement la machine à courant continu, la machine asynchrone, la machine synchrone et le moteur pas-à-pas [1-3]. La MCC constitue une technologie robuste et fiable, sa vitesse est aisément contrôlable et elle présente de hauts niveaux de rendement ainsi qu’une renversabilité facile. En effet, contrairement aux machines thermiques, le rendement d’une MCC n’est limité théoriquement que par 1, valeur maximale que l’on peut alors chercher 199
200
Électrotechnique
à atteindre. Ainsi, la MCC équipe des séries de locomotives de la SNCF depuis les années 1930 et des rames de métro dans différentes villes. Avant d’aborder l’étude expérimentale d’une MCC d’enseignement, nous présentons sa constitution et établissons les équations régissant son fonctionnement en modes moteur et générateur.
2 Présentation générale Une machine à courant continu comporte deux entités majeures : une partie fixe appelée stator et une partie mobile axisymétrique, libre de tourner autour de son axe, appelée rotor. Nous notons (Oz) l’axe de rotation en question. Une vue en coupe de la MCC est représentée sur la Fig. 1(a). Le stator est un système permettant de créer un champ magnétique constant tandis que le rotor est constitué de spires traversées par le flux magnétique statorique φ0 , aussi appelé flux excitateur ou inducteur. En fonctionnement moteur, l’interaction entre ce champ magnétique et les spires rotoriques, parcourues par un courant continu, engendre un couple de Laplace qui met le rotor en mouvement. C’est ici qu’apparaît la notion de conversion électromécanique de puissance pour la MCC. (a)
(b)
FLFL
Is Is
Is Is
AAAC4HicjVHLSsNAFD2Nr1pfVZfdBIvgqiQi6LIiiAsXFewDWilJOm1D82IyEUrowp07cesPuNWvEf9A/8I7YwpqEZ2QmTPn3nNm7lw78txYGMZrTpubX1hcyi8XVlbX1jeKm1uNOEy4w+pO6IW8ZVsx89yA1YUrPNaKOLN822NNe3Qi481rxmM3DC7FOGJXvjUI3L7rWIKobrHUsUOvF499WtLTbtrxLTHkfno+mUy6xbJRMdTQZ4GZgTKyUQuLL+ighxAOEvhgCCAIe7AQ09eGCQMRcVdIieOEXBVnmKBA2oSyGGVYxI5oHtCunbEB7aVnrNQOneLRz0mpY5c0IeVxwvI0XcUT5SzZ37xT5SnvNqbVzrx8YgWGxP6lm2b+VydrEejjSNXgUk2RYmR1TuaSqFeRN9e/VCXIISJO4h7FOWFHKafvrCtNrGqXb2up+JvKlKzcO1lugnd5S2qw+bOds6CxXzGNinlxUK4eZ63Oo4Qd7FE/D1HFGWqok/cNHvGEZ83WbrU77f4zVctlmm18G9rDByw9m4o=
AAAC0XicjVHLSsNAFD3GV62vqks3wSK4KokIuqy40V1F+4C2lmQ6bUPzYjIRSimIW3/Arf6U+Af6F94ZU1CL6IQkZ86958zce93Y9xJpWa9zxvzC4tJybiW/ura+sVnY2q4lUSoYr7LIj0TDdRLueyGvSk/6vBEL7gSuz+vu8EzF67dcJF4UXstRzNuB0w+9nsccSdTNRWfcChw5EME4mUw6haJVsvQyZ4GdgSKyVYkKL2ihiwgMKQJwhJCEfThI6GnChoWYuDbGxAlCno5zTJAnbUpZnDIcYof07dOumbEh7ZVnotWMTvHpFaQ0sU+aiPIEYXWaqeOpdlbsb95j7anuNqK/m3kFxEoMiP1LN838r07VItHDia7Bo5pizajqWOaS6q6om5tfqpLkEBOncJfigjDTymmfTa1JdO2qt46Ov+lMxao9y3JTvKtb0oDtn+OcBbXDkm2V7MujYvk0G3UOu9jDAc3zGGWco4IqeQs84gnPxpUxMu6M+89UYy7T7ODbMh4+AHhRlXY=
AAAC0XicjVHLSsNAFD3GV62vqks3wSK4KokIuqy40V1F+4C2lmQ6bUPzYjIRSimIW3/Arf6U+Af6F94ZU1CL6IQkZ86958zce93Y9xJpWa9zxvzC4tJybiW/ura+sVnY2q4lUSoYr7LIj0TDdRLueyGvSk/6vBEL7gSuz+vu8EzF67dcJF4UXstRzNuB0w+9nsccSdTNRWfcChw5EME4mUw6haJVsvQyZ4GdgSKyVYkKL2ihiwgMKQJwhJCEfThI6GnChoWYuDbGxAlCno5zTJAnbUpZnDIcYof07dOumbEh7ZVnotWMTvHpFaQ0sU+aiPIEYXWaqeOpdlbsb95j7anuNqK/m3kFxEoMiP1LN838r07VItHDia7Bo5pizajqWOaS6q6om5tfqpLkEBOncJfigjDTymmfTa1JdO2qt46Ov+lMxao9y3JTvKtb0oDtn+OcBbXDkm2V7MujYvk0G3UOu9jDAc3zGGWco4IqeQs84gnPxpUxMu6M+89UYy7T7ODbMh4+AHhRlXY=
I I AAACxHicjVLLSsNAFD2Nr1pfVZdugkVwVRIRdFkQRHct2AfUIsl0WkPzYmYilKK4d6vfJv6B/oV3pimoRXRCkjPn3nNm7tzx0zCQynHeCtbC4tLySnG1tLa+sblV3t5pySQTjDdZEiai43uSh0HMmypQIe+kgnuRH/K2PzrT8fYdFzJI4is1Tnkv8oZxMAiYp4hqXN6UK07VMcOeB24OKshHPSm/4hp9JGDIEIEjhiIcwoOkpwsXDlLiepgQJwgFJs5xjxJpM8rilOERO6LvkGbdnI1prj2lUTNaJaRXkNLGAWkSyhOE9Wq2iWfGWbO/eU+Mp97bmP5+7hURq3BL7F+6WeZ/dboWhQFOTQ0B1ZQaRlfHcpfMnIreuf2lKkUOKXEa9ykuCDOjnJ2zbTTS1K7P1jPxd5OpWT1neW6GD71LarD7s53zoHVUdZ2q2ziu1GqP01YXsYd9HFI/T1DDBepoGu8nPOPFOrdCS1rZNNUq5NdjF9+G9fAJIOKPzA== 0 absorbée par le primaire est intégralement transmise au secondaire, qui fournit une puissance instantanée u2 i2 > 0 à la charge en sortie (il n’y a pas d’énergie stockée dans le circuit magnétique). Comme ces deux puissances sont égales, on en déduit la relation suivante entre les courants au primaire et au secondaire : i2 N1 =− . i1 N2
(2)
Les Éq. (1) et (2) caractérisent entièrement le transformateur parfait, qui est un composant électrique linéaire. On définit le rapport de transformation m du transformateur par N2 m= . (3) N1 Ce rapport détermine le rôle abaisseur (m < 1) ou élévateur (m > 1) de tension du transformateur (et inversement pour le courant). Le cas m = 1 correspond à un transformateur d’isolement. On représente le modèle électrocinétique du transformateur parfait sur la Fig. 2. On peut également choisir le rapport de transformation pour réaliser une adaptation d’impédance. Si le secondaire débite dans une charge résistive Rc (voir la Fig. 2), on a u2 /i2 = Rc . Les Éq. (1) et (2) impliquent alors u1 /i1 = Rc /m2 . Ainsi, la source alimentant le primaire fonctionne comme si elle alimentait une charge de résistance Rc /m2 : on dit qu’on a « ramené » la charge du secondaire au primaire. En choisissant la valeur de m, on réalise une adaptation d’impédance entre la source alimentant le circuit primaire et la charge dans laquelle débite le secondaire. On peut de la même manière « transférer » une charge Rp du primaire au secondaire : vue de la source, l’impédance en aval transférée depuis l’amont vaut m2 Rp .
2.3 Modélisation du transformateur réel Le transformateur parfait est un modèle idéalisé, car il n’inclut ni les pertes, ni la non-idéalité du couplage magnétique. Nous présentons ici un modèle linéaire de transformateur prenant en compte ces différentes limitations, qui nous permettra
III.3 Transformateur électrique monophasé
251
d’interpréter les mesures. Dans cette section, on considérera les effets de chaque source de non-idéalité séparément, et on les modélisera par des composants électriques supplémentaires dans le schéma électrique équivalent du transformateur, donné en Fig. 3. Perméabilité magnétique finie du matériau Le flux magnétique dans le matériau n’est pas intégralement canalisé, car le matériau possède une perméabilité magnétique finie. Si on applique le théorème d’Ampère à une ligne de champ C contenue dans le circuit ferromagnétique (voir la Fig. 1), on obtient ˛ H · dl = ienlacé = N1 i1 + N2 i2 . (4) C
Le courant enlacé est indépendant de la ligne de champ choisie. Pour un matériau ferromagnétique idéal, la perméabilité relative µr est infinie. Puisque l’énergie magnétique volumique, proportionnelle en première approximation à µ0 µr H 2 , reste finie, l’excitation magnétique H est presque nulle partout dans le matériau : on retrouve alors la relation N1 i1 + N2 i2 = 0 attendue pour un transformateur parfait. En pratique, la perméabilité magnétique du matériau est cependant finie : l’excitation magnétique n’est pas rigoureusement nulle, et le courant enlacé non plus. On définit alors le courant magnétisant im comme N1 i1 + N2 i2 = N1 im .
(5)
Ce courant correspond au courant parcourant le primaire lorsque le secondaire est à vide (i2 = 0). Il permet d’aimanter le circuit magnétique, d’où son nom. Cet effet ne cause pas de chute de tension, mais prélève une partie du courant au primaire, diminuant le courant « utile », puisqu’on a désormais i1 − im = −mi2 , au lieu de i1 = −mi2 dans le cas idéal. Nous pouvons alors modéliser ce courant magnétisant en plaçant une inductance Lm entre les deux bornes du primaire. La tension au primaire s’écrit alors dim di1 di2 = Lm + mLm . (6) dt dt dt Nous décrivons dans le Comp. A un autre point de vue sur le transformateur, en considérant le transformateur comme deux circuits couplés par inductance mutuelle, ce qui justifie l’identification de l’inductance magnétisante Lm à l’inductance propre du circuit primaire. − e1 = Lm
Fuites de flux magnétique Seule une partie du champ magnétique induit par les bobinages primaire et secondaire sert à aimanter le matériau magnétique. Le flux engendré par le primaire (resp. par le secondaire) s’écrit donc comme la somme du flux commun et d’un flux de fuite, modélisé par une auto-inductance Lf1 (resp. Lf2 ) dite de « fuite », telle que Φ1 = N1 Φc + Lf1 i1 . Ces fuites de flux ne causent pas de dissipation d’énergie en valeur moyenne, mais sont responsables d’une diminution de la tension induite au secondaire. On représente donc les inductances de fuite au primaire et au secondaire comme des inductances traversées par i1 et i2 respectivement, en amont de l’inductance magnétisante Lm , car elles causent une chute de tension. Par exemple, la tension au primaire s’exprime
252
Électrotechnique
u1 =
dΦ1 dΦc di1 di1 = N1 + Lf1 = −e1 + Lf1 . dt dt dt dt
(7)
Pour limiter ces fuites de flux, on utilise souvent en pratique un circuit magnétique toroïdal sur lequel le bobinage secondaire est enroulé autour du bobinage primaire, et la distance entre les deux bobinages est choisie aussi faible que possible [2].
Pertes Joule dans le bobinage Les bobinages au primaire et au secondaire présentent des résistances électriques R1 et R2 , qui provoquent des pertes par effet Joule. Ces résistances sont placées de sorte à être traversées par les courants i1 et i2 respectivement, en série avec les inductances de fuite, car elles provoquent également une chute de tension entre la tension appliquée u1 et la tension « utile » −e1 . Pertes par courants de Foucault Le circuit ferromagnétique est le siège de pertes énergétiques par courants de Foucault 1 (voir les Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique » et III.1, « Machine à courant continu »). Le fer composant le circuit étant conducteur, des courants électriques volumiques sont induits par la variation temporelle du champ magnétique. Ces courants sont dissipés par effet Joule. Dans le cas d’un régime sinusoïdal de pulsation ω, les pertes par courants de Foucault représentent une puissance dissipée [4] 2 PF = kF ω 2 Bmax ,
(8)
où kF est une constante fixée par la géométrie du circuit magnétique, son feuilletage et le type de matériau qui le constitue, et Bmax est le champ magnétique maximal qui règne dans le circuit magnétique. On montre dans la Sec. 4.5 de l’Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique » que l’ordre de grandeur de la densité volumique de courants de Foucault jF dans un noyau magnétique soumis à un champ sinusoïdal est jF ' σ`ωBmax , où σ est la conductivité volumique du matériau et ` l’épaisseur typique d’une tôle et donc d’une boucle de courant. La puissance totale dissipée est PF ' V jF2 /σ, où V est le volume total du noyau magnétique. On retrouve le résultat de l’Éq. (8).
Le champ magnétique maximal Bmax dans le matériau est directement relié à la f.é.m. au primaire par la loi de Faraday. En √ notant E1 la valeur efficace de e1 et S la section du primaire, on obtient Φc,max = 2E1 /ωN1 = Bmax S, soit √ 2E1 Bmax = . (9) SωN1 Ainsi, la puissance totale dissipée par courants de Foucault peut s’écrire sous la forme PF = E12 /RF , où RF est homogène à une résistance, et dépend de la nature du matériau et de sa géométrie. Puisque ces pertes ne dépendent que de E1 , on les modélise par une résistance RF en parallèle de l’inductance magnétisante Lm . 1. Ces pertes sont réduites par l’emploi d’un circuit ferromagnétique feuilleté. Les transformateurs industriels fonctionnant à haute fréquence (& 5 kHz) comportent souvent un noyau en ferrite ferromagnétique, matériau isolant ne développant pas de courants de Foucault.
III.3 Transformateur électrique monophasé
253
Pertes par hystérésis Comme indiqué dans l’Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique », un noyau ferromagnétique soumis à un cycle d’aimantation et de désaimantation subit des pertes énergétiques par hystérésis. En régime sinusoïdal, un modèle empirique donne l’expression de la puissance perdue par hystérésis [3] au cours d’un cycle : γ Ph = kh ωBmax ,
(10)
où kh dépend de la géométrie du circuit magnétique et du matériau qui le constitue. Le coefficient γ, appelé coefficient de Steinmetz, dépend du matériau. Sa valeur se situe généralement entre 1,6 et 2 ; pour du fer elle est proche de 1,6 [5, 6]. Ces pertes ne dépendent quasiment que de la tension au primaire car Bmax ∝ E1 . De même que pour les pertes par courants de Foucault, on modélise ce phénomène par une résistance en parallèle avec l’inductance magnétisante Lm . La valeur de cette résistance dépend non seulement de la pulsation ω, mais aussi de E1 , car γ 6= 2. On désigne souvent l’ensemble des pertes par courants de Foucault et par hystérésis sous le nom de « pertes fer ». Nous les modéliserons dans la suite par une unique résistance Rf , dépendant de ω et E1 , en parallèle de Lm et parcourue par un courant if . Linéarité du modèle On se place désormais dans le cadre d’un modèle linéaire, et on suppose toutes les grandeurs électriques sinusoïdales de pulsation ω. On représente la modélisation électrocinétique complète de l’ensemble des phénomènes précédents sur la Fig. 3. Cette représentation n’a toutefois un sens rigoureux qu’en prenant les valeurs moyennes des grandeurs considérées, en particulier en l’interprétant en termes de puissance. Elle ne peut prédire exactement les valeurs instantanées des grandeurs électriques, à cause de la non-linéarité du matériau ferromagnétique. Notamment, la résistance Rf dépend de e1 , et l’inductance Lm dépend de im (de par la dépendance de µr en H). Ainsi, si l’on impose une tension u1 sinusoïdale, les courants i1 et i2 et la tension u2 ne le sont pas strictement et présentent une distorsion qui engendre des harmoniques. Pour un transformateur en régime nominal, ces harmoniques sont R1
u1
i1
Lf1
i01
Rf if
Lm
−e1
Lf2
e2
i2
R2
u2
im
Fig. 3 Schéma électrique équivalent du transformateur réel. On note Lf1 et Lf2 les inductances de fuite au primaire et au secondaire, Rf la résistance modélisant les pertes fer dans le circuit magnétique, Lm l’inductance magnétisante, et R1 et R2 les résistances des circuits primaire et secondaire. Les cercles imbriqués représentent la conversion d’un transformateur parfait et les orientations des tensions et des courants sont les mêmes que sur la Fig. 2.
Rc
254
Électrotechnique
toutefois de faible amplitude par rapport au fondamental, et à celles présentes dans le réseau électrique, dues à certains composants fortement non linéaires comme les redresseurs [7]. C’est pourquoi nous avons considéré le transformateur comme linéaire, et supposerons donc que tous les courants et tensions dans les circuits sont sinusoïdaux. On notera par exemple i1 l’amplitude complexe du courant sinusoïdal instantané i1 (t) = Re(i1 ejωt ). Le modèle représenté sur la Fig. 3 permet d’aboutir aux équations électrocinétiques suivantes : ( u1 = (R1 + jLf1 ω)i1 − e1 , (11) u2 = −(R2 + jLf2 ω)i2 + e2 où les tensions e1 = −jN1 ωΦc et e2 = −jN2 ωΦc vérifient la relation du transformateur parfait e2 = me1 , tandis que les courants vérifient i1 = i01 + im + if = −mi2 −
e1 e1 − , jLm ω Rf
(12)
où i01 et i2 vérifient la loi du transformateur parfait i01 = −mi2 . Nous résolvons ces équations dans les Sec. 4.1 et 5.1 pour les cas simples de l’étude à vide et en court-circuit.
2.4 Rendement d’un transformateur Il existe deux façons de déterminer le rendement d’un transformateur. Il est possible de mesurer directement, à l’aide de deux wattmètres, la puissance fournie au circuit primaire P1 et celle délivrée par le secondaire P2 , et d’en déduire le rendement η = P2 /P1 . Cette méthode est la plus facile à concevoir, car elle emploie directement la définition du rendement, mais présente des limitations en pratique à cause des incertitudes importantes sur les mesures réalisées par les wattmètres. Les rendements des transformateurs industriels de haute puissance étant très élevés (souvent supérieurs à 99 % [2]), l’écart entre P1 et P2 est proche de l’incertitude sur la mesure des puissances elles-mêmes. Une autre possibilité, dans le cas d’un transformateur linéaire utilisé en régime nominal, est la méthode des pertes séparées. Cette méthode repose sur la mesure des pertes fer et des pertes cuivre lors de deux fonctionnements distincts du transformateur. En supposant que la chute de tension due à la résistance du bobinage primaire R1 et à son inductance de fuite Lf1 est négligeable devant u1 , les pertes fer Pf = PF + Ph dépendent uniquement de u1 , qu’il y ait une charge ou non au secondaire. Elles peuvent donc être déterminées séparément lors d’une étude avec un secondaire à vide.
• Les pertes cuivre moyennes, qui s’écrivent Pc = R1 i21 + R2 i22 , ne dépendent que des courants au primaire et au secondaire. Lors d’une étude en court-circuit, les tensions au primaire et au secondaire sont faibles devant leurs valeurs nominales, alors les courants associés en sont proches. Les pertes fer sont dans ce cas négligeables devant les pertes cuivre, ces dernières pouvant donc être déterminées durant cet essai en court-circuit.
•
Finalement, en mesurant les pertes fer Pf à vide à la tension nominale, les pertes cuivre Pc en court-circuit au courant nominal, et la puissance fournie au primaire
III.3 Transformateur électrique monophasé
255
P1 , on en déduit le rendement du transformateur : η=
P1 − Pf − Pc . P1
(13)
Cette méthode présente en outre l’avantage d’effectuer des tests à une puissance utile bien plus faible que la puissance nominale du transformateur, qui sont donc moins coûteux et plus faciles à mettre en œuvre.
3 Montage Nous choisissons de mener l’étude expérimentale sur un transformateur constitué de deux bobines isolées et d’un cadre ferromagnétique feuilleté amovible afin de mieux visualiser ses différents constituants. Ces éléments sont couramment disponibles dans le matériel d’enseignement. Cette étude est néanmoins réalisable sur un transformateur du commerce, présentant de meilleures performances. Nous proposons le protocole suivant, illustré par la Fig. 4. Se munir d’un circuit ferromagnétique, si possible feuilleté. Un des quatre côtés du cadre doit être amovible afin d’insérer les bobines dans le circuit magnétique. Choisir deux bobines de nombres de tours connus, capables d’accueillir un noyau ferromagnétique de même section que le cadre. On pourra choisir deux nombres de tours différents pour construire un transformateur abaisseur ou élévateur de tension. Il est également important que les bobines choisies puissent admettre des courants d’intensité de l’ordre de quelques ampères, en vue d’une étude en court-circuit.
Cadre ferromagn´etique AAAC83icjVG7TtxAFD0YCBtCwkKKFDRWVkhUK5sm0CHRUIKUBSRAkT0MMMJrO+Mx0grxF3R0iJYfoIV/QPmD8BecuWskHkLJXFm+c+49Z+4jLTNTuSj6MxKMjo1/mGh9nPw09fnLdHtmdrMqaqt0TxVZYbfTpNKZyXXPGZfp7dLqpJ9meis9XvXxrRNtK1PkP92g1Hv95DA3B0YljlDR/oZVJNiHhcYubRIH9CytQJ+RQ+R4gIPBb9TQv9qdqBvJCd86ceN00Jz1on1P0X2KKdL7lM4pppBRuqLtIEaEktgeTolZecrHNc5YzC5ZFf2SMYVjKUiTNURz3r1mJWzFVzJ+lswQ8+QUzLP0/WuhxGtR9uh72qei6Wsb8J82Wn4UDkdE/8V7yvxfnu/FcehL0oNhT6UgvjvVqNQyFV95+KwrR4VSlhVywkZWqIT5NOdQOJX07mebSPyvZHrU31WTW3PNrJILjl+v862zudiNo268sdhZWW5W3cIcvmOB+/yBFaxhHT1qn+MGt7gL6uAiuAyuhqnBSMP5ihcnuH4ErHSaWQ==
TSV AAACxnicjVHLSsNAFD2Nr1pfVZdugkVwVZJudGfBTZeVvoRaJJlO69C8mEyUUgR/wK1+mvgH+hfeGVNQi+iEJGfOvefM3Hv9JBCpcpzXgrW0vLK6VlwvbWxube+Ud/e6aZxJxjssDmJ56XspD0TEO0qogF8mknuhH/CePznX8d4tl6mIo7aaJnwQeuNIjATzFFGtdqt7Xa44VccsexG4OaggX824/IIrDBGDIUMIjgiKcAAPKT19uHCQEDfAjDhJSJg4xz1KpM0oi1OGR+yEvmPa9XM2or32TI2a0SkBvZKUNo5IE1OeJKxPs008M86a/c17Zjz13ab093OvkFiFG2L/0s0z/6vTtSiMcGpqEFRTYhhdHctdMtMVfXP7S1WKHBLiNB5SXBJmRjnvs200qald99Yz8TeTqVm9Z3luhnd9Sxqw+3Oci6Bbq7pO1b2oVepn+aiLOMAhjmmeJ6ijgSY65D3GI57wbDWsyMqsu89Uq5Br9vFtWQ8f8gGQEQ==
Rc AAACz3icjVHLSsNAFD3GV62vqks3wSK4KokIurPgxmUr9gFtKcl02obmxWSilFJx6w+41b8S/0D/wjtjCmoRnZDkzLn3nJl7rxv7XiIt63XBWFxaXlnNreXXNza3tgs7u/UkSgXjNRb5kWi6TsJ9L+Q16UmfN2PBncD1ecMdXah444aLxIvCazmOeSdwBqHX95gjiWpfdduBI4cimLBpt1C0SpZe5jywM1BEtipR4QVt9BCBIUUAjhCSsA8HCT0t2LAQE9fBhDhByNNxjinypE0pi1OGQ+yIvgPatTI2pL3yTLSa0Sk+vYKUJg5JE1GeIKxOM3U81c6K/c17oj3V3cb0dzOvgFiJIbF/6WaZ/9WpWiT6ONM1eFRTrBlVHctcUt0VdXPzS1WSHGLiFO5RXBBmWjnrs6k1ia5d9dbR8TedqVi1Z1luind1Sxqw/XOc86B+XLKtkl09KZbPs1HnsI8DHNE8T1HGJSqokXeMRzzh2agat8adcf+Zaixkmj18W8bDB8OmlGE=
Fig. 4 Assemblage du transformateur à partir d’un cadre ferromagnétique (en gris) et de deux bobines. La résistance Rc représente la charge dont la nature change dans chacune des études qui suit. Le circuit primaire est alimenté par un transformateur à secondaire variable (TSV), présenté en Sec. 4.2.
256
Électrotechnique
Séparer le côté amovible du circuit, et placer chaque bobine autour d’une des deux branches du U formé par les 3 autres côtés. Remettre ensuite le côté amovible du cadre pour refermer le circuit magnétique, en serrant fermement les deux pièces l’une contre l’autre à l’aide de serre-joints. Il est important de bien fixer les pièces amovibles du cadre magnétique l’une à l’autre. En effet, la présence d’un léger entrefer diminue considérablement les performances du transformateur. De plus, des vibrations gênantes peuvent alors avoir lieu lorsque la tension d’alimentation est élevée.
Nous avons assemblé un transformateur avec une bobine de 1000 tours au primaire et une autre de 500 tours au secondaire. Dans toute la suite, nous ne mesurerons que les valeurs efficaces des grandeurs électriques (notées avec une majuscule) en régime alternatif établi, sans considérer leur phase. Toute l’étude est effectuée à la fréquence d’alimentation du secteur f = ω/2π = 50 Hz.
4 Essai à vide 4.1 Modèle électrocinétique Nous décrivons ici un essai à vide du transformateur, c’est-à-dire lorsque le secondaire est en circuit ouvert (pas de charge). Le courant y est donc nul : on a i2 = 0 et ainsi u2 = e2 . On souhaite déterminer le rapport des valeurs efficaces des tensions au primaire et au secondaire pour un transformateur réel modélisé sur la Fig. 3 dans la limite où la charge Rc est de résistance infinie (circuit ouvert). L’Éq. (12) donne i1 = −e1 (1/Rf + 1/jLm ω). On tire alors de l’Éq. (11) 1 1 e1 − e1 u1 = −(R1 + jLf1 ω) + Rf jLm ω (14) R1 Lf1 Lf1 ω R1 =− 1+ e1 . + +j − Rf Lm Rf Lm ω En utilisant la loi du transformateur parfait e2 = me1 , on aboutit au rapport des tensions u2 1 , = −m (15) R1 Lf1 Lf1 ω R1 u1 1+ + +j − Rf Lm Rf Lm ω qui prédit que le rapport des valeurs efficaces des tensions au primaire et au secondaire U2 /U1 est strictement inférieur à m. Il s’approche d’autant plus de la valeur m prévue pour le transformateur parfait que les variables R1 et ωLf1 causant la chute de tension sont petites devant Rf et ωLm , qui causent la chute de courant. L’inductance magnétisante Lm s’assimilant approximativement à l’inductance du circuit primaire, on peut prouver que Lm ∝ N12 [3]. Il est donc préférable pour un transformateur de tension d’avoir un nombre de spires au primaire élevé.
4.2 Protocole Se munir d’un transformateur à secondaire variable (TSV), parfois nommé « alternostat » par abus de langage. Cet appareil est en fait un transformateur possédant un contact mobile sur le secondaire qui permet de faire varier le nombre de
III.3 Transformateur électrique monophasé
257
spires du secondaire parcourues par le courant, et donc la tension délivrée, tout en travaillant à tension fixée au primaire. Le TSV sert à alimenter le transformateur étudié. Choisir, sur le transformateur étudié, quelles bobines utiliser comme primaire et comme secondaire. Nous choisissons N1 > N2 : c’est le cas d’un transformateur abaisseur de tension. Si les bobines ne supportent qu’un courant faible (inférieur à 1 A), on privilégiera plutôt m > 1 pour minimiser le courant au secondaire. Relier les bornes du secondaire à un voltmètre, réglé sur le mode AC. La résistance RV de celui-ci (telle que Rc = RV sur la Fig. 3) étant très grande devant celle du secondaire (que l’on peut mesurer à l’ohmmètre pour s’en convaincre), on peut considérer que le secondaire est en circuit ouvert (à vide). Relier les fiches de sortie du TSV aux bornes du primaire. Insérer dans ce branchement un wattmètre en longue dérivation (voir le Comp. B) afin de mesurer les valeurs efficaces U1 , I1 et la puissance moyennée sur une période en entrée du primaire notée P1 . Le secondaire alimente une résistance égale à la résistance RV du voltmètre utilisé. Comme m = 1/2, l’impédance vue au primaire est du même ordre de grandeur. Un montage longue dérivation est donc préférable.
Brancher le TSV au secteur monophasé, vérifier qu’il est réglé pour une tension d’amplitude nulle en sortie, puis le mettre sous tension. Cela √ a pour effet d’alimenter le primaire du TSV sous une tension u0 (t) = U0 2 cos (2πf t + ϕ0 ) où U0 = 230 V et f = 50 Hz. Augmenter la tension de sortie du TSV jusqu’à ce que la valeur de U1 affichée par le wattmètre atteigne 10 V par exemple. Relever U1 , U2 et P1 . En anticipant légèrement sur les résultats, on pourra vérifier que l’on a bien U2 /U1 ' N2 /N1 . Après avoir vérifié que la valeur de I1 est admissible par les bobines, il est inutile de surveiller la valeur de I1 tout au long de l’étude : celle-ci se faisant à vide, il n’y a aucun risque d’atteindre le courant maximal admissible par les bobines.
Relever les valeurs de P1 , I1 , U1 et U2 pour plusieurs valeurs de U1 régulièrement espacées, jusqu’au maximum délivrable par le TSV (environ 230 V) sans toutefois dépasser la tension maximale mesurable par les voltmètres. Ramener enfin la tension délivrée par le TSV à zéro, et couper son alimentation.
4.3 Résultats Il est possible de déterminer le rapport de transformation m à partir de l’étude à vide. Si le transformateur est parfait, le rapport des tensions au secondaire U2 et au primaire U1 doit vérifier U2 /U1 = m, d’après l’Éq. (1). Le rapport de transformation attendu est m = N2 /N1 = 1/2. Nous avons utilisé pour la mesure des tensions un voltmètre de précision 0,005 U ± 0,02 V. Le résultat est représenté sur la Fig. 5(a). Un ajustement affine U2 = aU1 + b donne une ordonnée à l’origine b = (0,00 ± 0,02) V, compatible avec 0, et une pente a = 0,491 ± 0,001. Ainsi, à vide, le transformateur utilisé transforme fidèlement les tensions, avec un rapport de proportionnalité toutefois légèrement inférieur à celui prévu pour le transformateur parfait, en adéquation avec l’Éq. (15).
258
Électrotechnique
À l’inverse, un transformateur à vide ne se comporte pas comme un transformateur parfait pour les courants, puisque I2 I1 . La puissance absorbée par le primaire est entièrement dissipée dans le circuit ferromagnétique (pertes fer). En effet, aux intensités employées dans cet essai (de l’ordre de 0,1 A) et en surévaluant légèrement les résistances des bobines (de l’ordre de 10 Ω), les pertes cuivre restent bien négligeables : R1 I12 ' 0,1 W P1 , où P1 est la puissance au primaire (voir la Fig. 5(b)). Elles seront déterminées dans l’essai en court-circuit présenté en Sec. 5. Puisqu’à vide le courant au primaire est faible, la chute de tension au primaire est faible (R1 I1 ' 1 V U1 ) et E1 ' U1 . D’après l’Éq. (9), Bmax est alors approximativement proportionnel à U1 . Les pertes par courants de Foucault ont donc une dépendance en U12 (voir l’Éq. (8)) et celles par hystérésis une dépendance en U1γ (voir l’Éq. (10)). Si la dépendance de P1 en U1 est P1 ∝ U1n , on s’attend à ce que ln (P1 /1W) soit une fonction affine de ln(U1 /1V) de pente n, et on peut ainsi déterminer quel type de pertes domine dans la gamme de tension que nous avons explorée. Nous avons mesuré la puissance au primaire à l’aide d’un wattmètre de précision 0,01 P ± 0,1 W. On réalise un ajustement affine ln(P1 /1W) = a0 ln(U1 /1V) + b0 des données, représenté dans l’encart de la Fig. 5(b). On voit que les pertes fer sont bien modélisées par une loi de puissance de la tension, bien que P1 (U1 ) soit a priori la somme de deux lois de puissances d’exposants différents (voir les Éq. (8) et (10)). La pente expérimentale obtenue nexp = 1,66 ± 0,10 est compatible avec les coefficients de Steinmetz mesurés pour du fer doux aux fréquences étudiées [5, 6], mais n’est pas compatible avec 2, valeur attendue pour les pertes par courants de Foucault. On en déduit que les pertes par hystérésis dominent probablement ces dernières dans notre transformateur ; il pourrait toutefois en être autrement avec un circuit magnétique non feuilleté. On peut également obtenir un ordre de grandeur de Rf = U12 /P1 sur (a)
(b)
6 P1 (W)
U2 (V)
120 90 60
4
4 0 -4
0 2 4 ln(U1 /1V)
2
30 0
ln(P1 /1W)
8
150
0
60
120 180 U1 (V)
240
300
0
0
60
120 180 U1 (V)
240
300
Fig. 5 (a) Tension au secondaire en fonction de la tension au primaire pour une étude à vide. Un ajustement affine U2 = aU1 + b donne une ordonnée à l’origine b = (0,00 ± 0,02) V et une pente a = 0,491 ± 0,001 représentant le rapport de transformation m. (b) Puissance absorbée par le primaire (dissipée entièrement en pertes fer) en fonction de la tension U1 . L’encart représente les mesures de ln(P1 /1W) en fonction de ln(U1 /1V), ainsi qu’un ajustement affine ln(P1 /1W) = a0 ln(U1 /1V) + b0 , avec b0 = −7,6 ± 0,6 et a0 = 1,66 ± 0,10. La courbe continue bleue est tracée à partir des paramètres de cet ajustement.
III.3 Transformateur électrique monophasé
259
une gamme de tensions allant de 0 à 250 V, bien que celle-ci dépende de U1 . On mesure Rf ' 104 Ω. En effectuant la même étude avec un circuit magnétique non feuilleté, les pertes par courants de Foucault dominent largement les pertes par hystérésis, et Rf & R1 : le circuit magnétique fait office de secondaire. Nous ne sommes alors plus dans le cas d’un transformateur à vide, et l’approximation de la loi du transformateur idéal U2 /U1 ' m n’est plus vérifiée.
Finalement, il est possible de déterminer une estimation de l’inductance magnétisante à partir de ces mesures. En effet, en négligeant les pertes cuivre et les inductances de fuite, tout se passe dans cette étude à vide comme si le TSV alimentait l’association en parallèle de la résistance Rf et de l’inductance Lm (voir la Fig. 3). On peut obtenir l’impédance Zfm = (Rf−1 + (jLm ω)−1 )−1 de cette association en parallèle en mesurant les valeurs efficaces U1 et I1 , reliées par U1 = |Zfm | I1 . En mesurant de cette manière |Zfm | et en utilisant l’ordre de grandeur de Rf ' 104 Ω déjà déterminé, on obtient Lm ω ' 103 Ω, soit Lm ' 5 H à une fréquence de 50 Hz (ω ' 314 rad·s−1 ). Cela est un ordre de grandeur raisonnable pour l’auto-inductance du circuit primaire, c’est-à-dire d’une bobine d’inductance environ égale à 10 mH entourant un circuit ferromagnétique de perméabilité magnétique µr ' 103 . En toute généralité, Zfm dépend toutefois de U1 .
5 Essai en court-circuit 5.1 Modèle électrocinétique Pour un essai en court-circuit du transformateur, on relie les bornes du secondaire par un fil (sur la Fig. 3, Rc est très faible devant toutes les autres résistances). La tension au secondaire u2 est donc négligeable devant les autres tensions du circuit. Pour que l’intensité du courant au secondaire ne soit pas trop élevée, il est alors nécessaire que la tension appliquée au primaire soit très basse. D’après les équations présentées en Sec. 2.3, on a e2 = (R2 + jLf2 ω)i2 = me1 . Le courant au primaire est donné par i1 = −mi2 − e1 /Zfm . On en déduit que le rapport des courants est donné par i2 1 =− i1 m
1 . R2 + jLf2 ω 1+ m2 Zfm
(16)
Le rapport des valeurs efficaces I2 /I1 est donc strictement inférieur à 1/m pour un transformateur réel. On voit dans l’Éq. (16) que ce rapport s’approche de la valeur prévue pour le transformateur parfait 1/m lors d’un essai en court-circuit, si l’inductance de fuite et la résistance des bobinages au secondaire sont faibles devant m2 Lm et m2 Rf . Puisque l’inductance magnétisante vérifie approximativement Lm ∝ N12 , le produit m2 Lm est proportionnel à N22 . Il est donc préférable pour un transformateur de courant d’avoir un nombre de spires au secondaire élevé. Dans un essai en court-circuit, le courant magnétisant im et le courant if sont faibles devant i1 : on peut donc transférer l’impédance R1 + jLf1 ω au secondaire, comme illustré sur la Fig. 6. Tout se passe alors comme si on alimentait par
260
Électrotechnique i01
i1 u1
Rf if
Lm
−e1
Ls
i2
e2
Rs
u2 = 0
A
im
Fig. 6 Schéma électrique équivalent du transformateur pour l’étude en courtcircuit où l’on a réalisé un transfert d’impédance du primaire au secondaire.
une tension e2 ' mu1 , un circuit électrique équivalent au secondaire, constitué de l’association série d’une résistance et d’une bobine d’impédance Rs + jLs ω, où Rs = R2 + m2 R1 et Ls = Lf2 + m2 Lf1 . Avec un secondaire en court-circuit, la puissance absorbée par le primaire P1 est à nouveau entièrement dissipée au sein du transformateur. Pour les tensions utilisées dans cet essai, les pertes fer (déterminées durant l’essai à vide, en Sec. 4) sont négligeables devant la puissance absorbée par le primaire. Par exemple, à U1 ' 200 V, les pertes fer sont de l’ordre de 3 W, et sont faibles devant les pertes cuivre à la même tension, de l’ordre de 30 W (voir les Fig. 7(b) et 8). La dissipation est donc essentiellement due aux pertes cuivre dans la résistance équivalente Rs au secondaire : P1 ' R1 I12 + R2 I22 ' (m2 R1 + R2 )I22 = Rs I22 .
(17)
La deuxième approximation est justifiée par le fait que I2 /I1 ' 1/m (voir la Fig. 7(a)).
5.2 Protocole Nous repartons ici de la situation expérimentale à la fin de l’étude à vide (voir la Sec. 4.2). Le TSV doit être éteint. Retirer les fils alimentant le primaire puis le voltmètre aux bornes du secondaire. Mesurer la résistance du primaire et du secondaire à l’ohmmètre : cela sera utile pour estimer les pertes cuivre. Relier les bornes du secondaire à un ampèremètre mesurant le courant I2 . La résistance de l’ampèremètre étant faible devant celle du secondaire, on pourra considérer que ce dernier est en court-circuit (voir la Fig. 6). Relier les fiches de sortie du TSV aux bornes du primaire. Insérer dans ce branchement un wattmètre en courte dérivation cette fois-ci (voir le Comp. B). Le secondaire alimente une impédance égale à la résistance RA de l’ampèremètre utilisé. Comme on a m = 1/2, l’impédance vue au primaire sera aussi de l’ordre de RA . Un montage courte dérivation est donc préférable.
Vérifier que le TSV est réglé pour une tension d’amplitude nulle en sortie, puis le mettre sous tension.
III.3 Transformateur électrique monophasé
261
Augmenter la tension de sortie du TSV jusqu’à ce que la valeur de I1 atteigne 0,1 A par exemple. En anticipant sur les résultats, on pourra vérifier que l’on a bien I1 /I2 ' N2 /N1 . Relever les valeurs de P1 , I1 et I2 . Il est cette fois-ci primordial de surveiller les valeurs de I1 et I2 : l’étude se faisant en court-circuit, les courants augmentent rapidement avec U1 .
Relever les valeurs de P1 , U1 , I1 et I2 pour plusieurs valeurs de I1 régulièrement espacées, jusqu’à atteindre la limite en courant du primaire ou du secondaire (pour m < 1, c’est le secondaire qui est limitant). Ramener enfin la tension délivrée par le TSV à zéro, et couper son alimentation.
5.3 Résultats Lors de l’étude en court-circuit du transformateur, la situation est inversée par rapport à l’étude à vide. La tension au secondaire est négligeable devant U1 . Le transformateur en court-circuit ne se comporte donc pas comme un transformateur parfait pour les tensions. Nous avons utilisé pour la mesure des courants un ampèremètre de précision 0,005 I ± 0,02 A. Un ajustement affine I2 = aI1 + b, représenté sur la Fig. 7(a), donne une ordonnée à l’origine b = (−2 ± 3) mA, compatible avec 0, et une pente a = 1,956 ± 0,008. Le transformateur en court-circuit transforme donc fidèlement les courants. Le rapport des courants est toutefois légèrement inférieur à la pente attendue 1/m = 2 dans le modèle du transformateur parfait (voir l’Éq. (2)). Cet écart à l’idéalité est cohérent avec la prédiction du modèle électrocinétique (voir la Sec. 5.1). On trace sur la Fig. 7(b) la puissance dissipée au primaire P1 en fonction de I22 . Un ajustement affine P1 = a0 I22 + b0 donne une ordonnée à l’origine b0 = (b) 3,0
50
2,4
40 P1 (W)
I2 (A)
(a)
1,8 1,2
20 10
0,6 0,0 0,0
30
0
0,3
0,6 0,9 I1 (A)
1,2
1,5
0
2
4 I22 (A2 )
6
Fig. 7 (a) Courant au secondaire en fonction du courant au primaire pour une étude en court-circuit. Un ajustement affine I2 = aI1 + b donne une ordonnée à l’origine b = (−2 ± 3) mA et une pente a = 1,956 ± 0,008 représentant l’inverse du rapport de transformation 1/m. (b) Puissance absorbée par le primaire (dissipée presque entièrement en pertes cuivre) en fonction du carré du courant au secondaire I22 . Un ajustement affine P1 = a0 I22 + b0 donne une ordonnée à l’origine b0 = (0,2 ± 0,2) W et une pente a0 = (6,46 ± 0,11) Ω.
8
262
Électrotechnique 120
mU1 (V)
100 80 60 40 20 0 0,0
0,5
1,0
1,5
2,0
2,5
I2 (A)
Fig. 8 Tension mU1 en fonction du courant au secondaire I2 pour une étude en court-circuit, avec m = 1/2. Un ajustement affine mU1 = aI2 + b donne une ordonnée à l’origine b = (−0,1 ± 0,5) V et une pente a = (44,1 ± 0,4) Ω.
(0,2 ± 0,2) W, compatible avec 0, et une pente a0 = (6,46 ± 0,11) Ω. Les pertes lors de l’essai en court-circuit sont donc majoritairement dues à l’effet Joule, et a0 s’identifie à la résistance ramenée au secondaire Rs d’après l’Éq. (17). La pente a0 est toutefois supérieure à Rs = (5,0 ± 0,1) Ω, obtenue en mesurant les résistances des bobines à l’aide d’un ohmmètre. Cette différence peut s’expliquer par la présence de résistances parasites aux contacts électriques et à la présence de deux ampèremètres dans le circuit. On peut également déterminer l’inductance de fuite ramenée au secondaire Ls . p Les valeurs efficaces U1 et I2 sont reliées par mU1 ' E2 ' Rs2 +p (Ls ω)2 I2 (voir la Fig. 6). Les résultats sont tracés sur la Fig. 8, et on mesure Rs2 + (Ls ω)2 = (44,1 ± 0,4) Ω. À partir de la valeur précédemment obtenue de Rs , on obtient Ls = (0,139 ± 0,003) H. On constate que les impédances Rf et Lm ω sont grandes devant Rs et Ls ω, comme attendu. Cela confirme a posteriori qu’en court-circuit, les courants im et if sont bien négligeables devant le courant au primaire, justifiant qu’on peut, d’une part, négliger les pertes fer devant les pertes cuivre, et, d’autre part, transférer les impédances du primaire au secondaire.
6 Étude en charge Dans les deux sections précédentes, nous avons mené deux études permettant d’estimer la valeur des composants du modèle électrocinétique développé dans la Sec. 2.3. En pratique, le secondaire est branché sur une charge à alimenter. En faisant varier l’impédance de cette charge, on peut déterminer les caractéristiques du transformateur (rapports des courants et tensions, rendement), et déterminer ses conditions nominales de fonctionnement. Afin de déterminer complètement les quatre grandeurs du quadripôle U1 , U2 , I1 et I2 , quatre équations sont nécessaires. Deux sont fournies par le modèle électrocinétique du transformateur, les deux autres étant données par les caractéristiques de l’alimentation et de la charge.
III.3 Transformateur électrique monophasé
263
6.1 Protocole Nous repartons de la situation expérimentale à la fin de l’étude en court-circuit (voir la Sec. 5.2). Le TSV doit être éteint. Remplacer l’ampèremètre branché au secondaire par un rhéostat pouvant admettre le courant maximal au secondaire, tout en permettant d’explorer une gamme de valeurs de résistance la plus large possible (jusqu’à 100 Ω par exemple, afin que l’intensité minimale des courants soit d’environ 0,1 A). Placer ce rhéostat, nommé par la suite « rhéostat de charge », à son maximum de résistance. Bien que nous étudions ici une charge purement résistive, il est également possible de considérer une charge d’impédance complexe, qui induit un déphasage ϕ entre les signaux d’entrée et de sortie. Les résultats qui suivent (notamment les courbes de rendement) sont alors modifiés, et on doit renouveler l’étude pour chaque valeur de ϕ.
Insérer un wattmètre en courte dérivation pour mesurer la tension U2 aux bornes du secondaire, le courant I2 qui le traverse, et la puissance P2 qu’il délivre au rhéostat. Mettre le TSV sous tension après avoir vérifié qu’il est réglé pour une tension d’amplitude nulle en sortie. Augmenter progressivement la tension de sortie du TSV jusqu’à atteindre une valeur de U1 préalablement choisie, par exemple U1 = 100 V. Relever les valeurs de I1 , P1 , U2 , I2 et P2 . Diminuer la résistance du rhéostat et relever les nouvelles valeurs de I1 , P1 , U2 , I2 et P2 . Vérifier que le TSV maintienne U1 constante tout au long de l’étude. Répéter l’opération jusqu’à ce que I1 atteigne le courant maximal admissible par les composants du primaire, ou I2 le courant maximal admissible par ceux du secondaire, incluant le rhéostat de charge. Ramener enfin la tension délivrée par le TSV à zéro, et couper son alimentation.
6.2 Résultats 6.2.1 Rapports des courants et des tensions Nous avons effectué deux études en charge : dans l’une la tension au primaire est maintenue constante à U1 = 100 V, dans l’autre à U1 = 200 V. Nous choisissons de représenter les rapports des valeurs efficaces des tensions U2 /U1 et des courants I1 /I2 en fonction de I2 , qui est une grandeur de sortie du transformateur. Les résultats de l’étude à U1 = 100 V et 200 V sont représentés respectivement sur les Fig. 9(a) et 9(b). La ligne tiretée bleue correspond au rapport des tensions mesuré à vide U2,vide /U1,vide ' 0,49, tandis que la ligne tiretée rouge correspond à l’inverse du rapport des courants mesuré en court-circuit I1,cc /I2,cc = 1/1,956 ' 0,51. Les résultats sont cohérents avec l’analyse effectuée dans les Sec. 4 et 5. Le rapport des tensions U2 /U1 tend vers le rapport à vide lorsque I2 tend vers 0, c’està-dire lorsque l’impédance de la charge devient très supérieure aux résistances R1 et R2 . Lorsque le courant I2 au secondaire augmente, la chute de tension au primaire augmente, de sorte que le rapport U2 /U1 chute. De la même manière, le rapport des
264
Électrotechnique
(a)
(b) 0,7
0,7
0,6
0,6
0,5
0,5
0,4
0,4
0,3
0,3
U2 /U1
0,2
I1 /I2
0,1 0,0
0,3
0,6 0,9 I2 (A)
1,2
1,5
U2 /U1
0,2
I1 /I2
0,1 0,0
0,3
0,6 0,9 I2 (A)
1,2
1,5
Fig. 9 Rapport des tensions U2 /U1 et des courants I1 /I2 pour une étude en charge du transformateur à U1 fixée à (a) 100 V et (b) 200 V. Les lignes tiretées représentent les valeurs des rapports de transformation déterminés expérimentalement dans l’étude à vide pour les tensions (en bleu) et en court-circuit pour les courants (en rouge).
intensités tend vers le rapport mesuré en court-circuit lorsque l’intensité du courant augmente, c’est-à-dire lorsque l’impédance de charge devient négligeable devant R1 et R2 . Lorsque le courant au secondaire diminue, le courant au primaire ne diminue pas dans les mêmes proportions puisqu’une partie est prélevée comme courant magnétisant (voir la Sec. 2.3) et parcourt les impédances Lm ou Rf . Le rapport I1 /I2 augmente donc. Ce transformateur se comporte donc comme un bon transformateur de tension pour des charges résistives importantes et un bon transformateur de courant pour des charges faibles. Le comportement du transformateur réel est qualitativement le même dans les deux études en charge, la principale différence étant que le rapport U2 /U1 (et le rendement) chute beaucoup plus rapidement pour U1 = 100 V. La chute de tension au primaire est principalement due aux pertes cuivre, qui augmentent avec le courant absorbé par le rhéostat de charge. Si ce courant est du même ordre de grandeur pour les deux valeurs de U1 , la chute de tension relative est plus grande pour U1 = 100 V que pour U1 = 200 V. Ce raisonnement est valable tant que les pertes fer ne sont pas trop élevées : en réalité, le rendement chute lorsque la tension au primaire est bien supérieure à 200 V. 6.2.2 Rendement La performance d’un transformateur est principalement déterminée par son rendement, donné par l’Éq. (13). Nous avons mesuré à l’aide de deux wattmètres les puissances moyennes au primaire P1 et au secondaire P2 . Dans cette étude en charge, une partie de la puissance absorbée par le primaire est transmise au secondaire, contrairement aux études à vide et en court-circuit. Nous avons utilisé des wattmètres de précision 0,01 P ± 0,2 W pour le calibre utilisé. Les rendements du transformateur pour deux tensions U1 sont tracés sur la Fig. 10 en fonction
III.3 Transformateur électrique monophasé
265
1,0
η
0,9
0,8
0,7
0,6 0,0
100 V 200 V 0,2
0,4
0,6 0,8 I2 (A)
1,0
1,2
1,4
Fig. 10 Rendement du transformateur obtenu par une étude en charge, en fixant la tension au primaire U1 à 100 V et 200 V.
de I2 : les deux courbes possèdent une forme de cloche concave. On en extrait un point de fonctionnement nominal, correspondant au rendement maximal, qui dépend de la tension au primaire. Le rendement maximal obtenu pour U1 = 100 V vaut ηmax,100 = (90 ± 3) % ; il vaut ηmax,200 = (91,8 ± 1,7) % pour U1 = 200 V. Ces rendements, bien qu’inférieurs à ceux de transformateurs industriels (de l’ordre de 99 %), sont toutefois typiques pour ce type de transformateur. Les rendements nominaux sont assez proches pour les deux tensions au primaire testées, mais le transformateur présente des performances acceptables sur une bien plus grande gamme d’intensités I2 pour U1 = 200 V. On peut également lire approximativement les valeurs nominales sur la Fig. 9 : elles correspondent à l’écart minimal entre les courbes bleue et rouge, lorsqu’à la fois les rapports des tensions et des courants sont proches du rapport théorique.
Il est courant que les courbes de rendement des machines électrotechniques aient une forme de cloche (voir l’Exp. III.1, « Machine à courant continu »). À courant au secondaire trop élevé, les pertes cuivre deviennent prohibitives, tandis qu’à courant trop faible la majeure partie de la puissance au primaire est dissipée dans le circuit magnétique. Le rendement maximal est atteint entre ces deux cas limites, lorsque les pertes fer et cuivre sont du même ordre de grandeur. Cela peut se vérifier à l’aide d’un bilan détaillé de puissance, sur lequel est fondée la méthode des pertes séparées discutée dans la Sec. 2.4. Le point de fonctionnement nominal à U1 = 200 V est situé à I2,n = (0,60 ± 0,06) A et P1,n = (60,2 ± 0,6) W. Les pertes fer à cette tension valent Pf,n = (3,2 ± 0,2) W (voir la Fig. 5(b)) tandis que les pertes cuivre pour ce courant valent Pc,n = (2,4 ± 0,1) W (voir la Fig. 7(b)). La puissance transmise au secondaire au point de fonctionnement nominal mesurée par le wattmètre P2,n = (55,3 ± 0,8) W est compatible avec P1,n − Pf,n − Pc,n = (54,6 ± 0,6) W (voir l’Éq. (13)). On voit par ailleurs que proche du point de fonctionnement nominal, les pertes cuivre et fer sont bien du même ordre de grandeur. Cependant, les incertitudes sur le rendement sont ici significatives à cause de la précision limitée
266
Électrotechnique
des wattmètres utilisés, et il est difficile de déterminer le point de fonctionnement nominal avec précision. La majeure partie du réseau électrique étant triphasée, on utilise dans la pratique des transformateurs regroupant les trois phases, appelés transformateurs triphasés, qui réduisent les coûts par rapport à l’utilisation de trois transformateurs monophasés (notamment au niveau du circuit magnétique). Fonctionnant sur le même principe que les transformateurs monophasés, ils permettent également de transférer de la puissance d’une phase à une autre en les couplant de manière astucieuse. Pour de très hautes puissances, l’utilisation de trois transformateurs monophasés distincts est toutefois plus commode pour diverses raisons pratiques [8].
Complément A - Inductance magnétisante Pour comprendre ce que représente Lm , on peut adopter un autre point de vue, en considérant le transformateur comme deux circuits d’auto-inductances L1 et L2 , couplés par une inductance mutuelle M . Les tensions aux bornes de ces deux circuits s’écrivent di1 di2 u1 = L1 dt + M dt . (18) di di u2 = − L2 2 + M 1 dt dt Ainsi, en comparant les Éq. (6) et (18), on obtient M = mLm et L1 = Lm . On interprète donc Lm comme l’auto-inductance du circuit primaire, qui est finie si le matériau est de perméabilité magnétique finie. Appliquer ce point de vue au transformateur idéal décrit en Sec. 2.2 est délicat, car il est composé d’un matériau de perméabilité infinie, impliquant que M , L1 et L2 le sont aussi.
En écrivant l’expression de la tension au secondaire −e2 , on trouverait de la même manière L2 = m2 Lm , ce qui permet d’écrire M 2 = L1 L2 . On peut prouver que l’on a toujours M 2 ≤ L1 L2 pour deux circuits électriques couplés magnétiquement, l’égalité étant atteinte pour un couplage parfait [4]. Notons qu’en présence d’une inductance magnétisante Lm , la relation entre les tensions instantanées u2 /u1 = m est toujours valable. En revanche, l’Éq. (2) reliant les courants instantanés n’est plus valable qu’en moyenne. Un transformateur réel ne vérifie toutefois pas M 2 = L1 L2 , à cause des fuites de flux mentionnées en Sec. 2.3. On peut montrer que le circuit électrique représenté en Fig. 3, privé de ses résistances, est encore équivalent à deux circuits couplés par inductance mutuelle. Les expressions de leurs auto-inductances sont toutefois modifiées par rapport au cas idéal : on a cette fois L1 = Lf1 + Lm et L2 = Lf2 + m2 Lm , bien que la relation M = mLm est toujours valable. Ainsi, les fuites de flux diminuent l’efficacité du couplage : on tire des expressions précédentes que M2 =
L1 L2 < L1 L2 . (1 + mLf1 /M )(1 + Lf2 /mM )
(19)
III.3 Transformateur électrique monophasé
267
Complément B - Montages courte et longue dérivations En électronique comme en électrotechnique, il est nécessaire pour mesurer la puissance transmise à un dipôle ou un quadripôle de mesurer à la fois la tension U à ses bornes et le courant I le traversant, à l’aide d’un voltmètre et d’un ampèremètre. Il existe deux façons de les brancher, représentées sur la Fig. 11, dans le cas où le dipôle est un résistor de résistance R. Sur la Fig. 11(a), représentant le « montage courte dérivation » ou « montage aval », le voltmètre mesure exactement la tension U aux bornes du dipôle d’intérêt. En revanche, l’ampèremètre ne mesure pas exactement I, mais un courant d’intensité I 0 = I + IV où IV est le courant de fuite dans le voltmètre. En notant RV la résistance de celui-ci, on a IV = U/RV . On commet donc sur la mesure de I une erreur relative ∆I/I donnée par I0 − I IV R ∆I = = = . I I I RV
(20)
En revanche, sur la Fig. 11(b), représentant le « montage longue dérivation » ou « montage amont », l’ampèremètre mesure exactement le courant I traversant le dipôle d’intérêt. Par contre, le voltmètre ne mesure pas exactement U , mais une tension U 0 = U + UA où UA est la tension aux bornes de l’ampèremètre. En notant RA la résistance de celui-ci, on a UA = RA I. On commet donc sur la mesure de U une erreur relative ∆U/U donnée par ∆U U0 − U UA RA = = = . (21) U U U R Afin de minimiser le biais sur les mesures, √ on préférera le montage courte dérivation si R/RV < RA /R, c’est-à-dire R < RA RV . Cette condition se lit aussi : « R est plus proche de RA que de RV ». Un multimètre numérique présente généralement des valeurs RA ' 1 Ω et RV ' 106 Ω, impliquant qu’il vaut mieux utiliser le montage courte dérivation si R < 103 Ω, et le montage longue dérivation dans le cas contraire. Néanmoins, pour des valeurs de résistances allant de 100 Ω à 10 kΩ, on a à la fois R RA et R RV et le type de montage importe peu. Cela se généralise au cas d’une impédance complexe Z, en considérant |Z| au lieu de R. (a)
(b)
V
V
IV I
R A U
I
R A U
UA
Fig. 11 Schéma électrique pour un branchement (a) en courte dérivation et (b) en longue dérivation.
268
Électrotechnique
Références [1]
L. Lasne, Électrotechnique et énergie électrique, 2e éd. Dunod, 2013.
[2]
T. Wildi et G. Sybille, Électrotechnique, 4e éd. De Boeck, 2015.
[3]
J.-M. Brébec, T. Desmarais, A. Favier, M. Ménétrier et al., Electronique II, PSI. Hachette, 1997.
[4]
C. Garing, Magnétisme : statique, induction et milieux. Ellipses, 1999.
[5]
A. Mahajan et A. A. Rangwala, Electricity and magnetism. McGraw-Hill, 2001.
[6]
P.-K. Lee, K.-C. Kuo, C.-J. Wu, Z.-T. Wong et J.-Y. Yen, « Prediction of iron losses using the modified Steinmetz equation under the sinusoidal waveform dans » : 8th Asian Control Conference (ASCC), IEEE, 2011, p. 579584.
[7]
J.-M. Donnini, L. Quaranta, D. Aubert, R. Payan et P. Renucci, Dictionnaire de physique expérimentale (tome 4), l’électricité. Pierron, 1996.
[8]
J. Lignon et G. Fuchs, Nouveau cours d’électricité pratique. Delagrave, 1978.
IV.1
Mesure du module de Young par méthode acoustique
Dans cette expérience de mécanique, nous mesurons le module de Young d’un matériau en étudiant la réponse acoustique en flexion d’une poutre (ici un réglet métallique) constituée de ce matériau. Après avoir introduit la théorie décrivant la flexion d’un milieu continu déformable encastré à l’une de ses extrémités, nous présentons le protocole expérimental. Enfin les limitations de cette expérience pour de faibles longueurs de poutre sont discutées, notamment la présence de modes de déformation distincts de ceux de flexion, diverses sources d’amortissement et des non-linéarités dans la réponse vibrationnelle.
Sommaire 1 2 3 4 5
Introduction . . . . . . . . . . . . . Étude théorique de la vibration d’une Protocole expérimental . . . . . . . Résultats . . . . . . . . . . . . . . . Discussion . . . . . . . . . . . . . .
. . . . poutre . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
271 273 277 279 280
Compléments A B
Calcul du moment fléchissant Calcul des pulsations propres
. . . . . . . . . . . . . . 283 . . . . . . . . . . . . . . 285
1 Introduction Les ondes acoustiques sont le résultat de déformations de la matière [1]. Par exemple, la propagation d’ondes sonores longitudinales repose sur une succession spatio-temporelle de compressions et dilatations. Dans les solides, les déformations sont beaucoup plus riches que dans les fluides : aux compressions s’ajoutent des mouvements de torsion, c’est-à-dire le vrillage selon un axe, ou de flexion, autrement dit la courbure sous l’application d’une force. La dynamique associée à ces comportements est variée, par exemple la propagation des ondes de compression n’est pas dispersive, tandis que celle des ondes de flexion l’est. Les champs d’application de l’étude des vibrations des solides sont divers. En musique, comme les poutres sont plus pures en fréquence que les cordes 1 , elles sont utilisées pour fabriquer des étalons comme le diapason [2]. En sismologie, les tremblements de terre 1. Les pulsations propres des modes de flexion des poutres sont plus espacées que celles des cordes. De ce fait exciter des harmoniques d’amplitude fixée est beaucoup plus coûteux énergétiquement.
271
272
Mécanique
correspondent à la propagation de deux types d’ondes acoustiques, les ondes primaires P qui sont des ondes longitudinales de compression, et les ondes secondaires S qui sont des ondes transversales de cisaillement [3]. Enfin, dans la construction de bâtiments, les vibrations éventuelles se propageant dans l’ensemble d’une structure peuvent la fragiliser. C’est le cas de l’accident du pont de Tacoma [4] : le pont a adopté un mouvement de torsion à cause du vent. Ce mouvement a entretenu des tourbillons dans l’air, qui en retour ont amplifié la torsion, jusqu’à l’effondrement. Pour décrire les déformations des solides 2 , la théorie de l’élasticité linéaire combine les lois générales de la mécanique de Newton avec des relations phénoménologiques qui relient les déformations aux forces appliquées. En particulier, pour des matériaux isotropes, deux coefficients indépendants [5] sont introduits : le module de Young (ou de compression) E et le module de cisaillement µ, tous deux homogènes à des pressions. Le module de Young est défini lorsqu’on réalise une traction (voir Fig. 1(a)). Imaginons un solide de forme parallélépipédique, de dimensions (`x , `y , `z ) selon les trois directions orthogonales de l’espace associées au trièdre direct (ex , ey , ez ), tracté selon la direction x avec des forces ±T ex exercées uniformément sur les surfaces de normale extérieure unitaire ±ex . On définit alors la contrainte σxx = T /`y `z , s’exprimant en Pa et représentant la force exercée par unité de surface. L’allongement résultant ∆`x selon cette même direction s’exprime linéairement en fonction de la force exercée selon la loi phénoménologique de Hooke : ∆`x T σxx = = , (1) xx = `x E`y `z E où la déformation xx est une quantité adimensionnée qui quantifie la variation relative de longueur. De la même manière, le module de cisaillement µ est défini lorsque le parallélépipède est cisaillé selon la direction x en exerçant des forces ±T ex uniformément sur les deux surfaces de normale extérieure unitaire ±ey (voir Fig. 1(b)). L’angle de cisaillement xy est une fonction linéaire de T : xy =
T σxy = . µ`x `z µ
(2)
Cette expérience vise à mesurer le module de Young d’un matériau. Une majorité de méthodes repose sur des mesures purement mécaniques. Par exemple, l’essai (a)
(b)
T `y −T
T `z
`x
xy
y −T
z
x
Fig. 1 (a) Traction et (b) cisaillement d’un parallélépipède selon la direction x lorsqu’un opérateur extérieur exerce des forces opposées ±T ex uniformément sur les surfaces colorées. Pour le cisaillement, nous avons représenté en bleu le solide après déformation, ainsi que l’angle de cisaillement xy . 2. Pour étudier une déformation tridimensionnelle quelconque, il faut introduire des tenseurs d’ordre 2 [5] : le tenseur des déformations ab et celui des contraintes σab , pour a, b = x, y, z.
IV.1 Mesure du module de Young par méthode acoustique
273
en traction se fonde sur l’Éq. (1) et consiste à dilater un solide cylindrique selon son axe de révolution et à quantifier la contrainte avec un capteur de force, ainsi que la déformation [6]. Néanmoins, cette technique nécessite un appareillage spécifique capable de supporter des pressions de l’ordre du GPa, ou des matériaux très minces, mais qui sont plus susceptibles de casser [7]. D’autres méthodes ont recours à l’optique, comme la photoélasticimétrie [8] : un matériau optiquement isotrope mis sous contrainte devient optiquement anisotrope et les variations d’indice de réfraction dans le matériau, mesurées par interférences en lumière polarisée, permettent de visualiser la distribution des contraintes. Cependant, pour que la mesure soit quantitative, des simulations numériques sont nécessaires pour ajuster les constantes élastiques qui reproduisent au mieux la figure d’interférence observée expérimentalement. Enfin, il existe des méthodes acoustiques, dont le principe repose, par exemple, sur la mesure de la vitesse des ondes P et S dans un échantillon [9]. Là encore, cela requiert un appareillage particulier et de gros échantillons. Dans cette expérience, nous présentons une autre méthode acoustique, facilement réalisable avec du matériel d’enseignement. Nous étudions les ondes acoustiques émises dans l’air par une poutre fléchie en mouvement afin de déterminer le module de Young du matériau qui la compose.
2 Étude théorique de la vibration d’une poutre Nous présentons dans cette section la théorie nécessaire à la compréhension de l’expérience, l’objectif étant de détailler la résolution analytique qui mène à l’Éq. (13), qui seule est nécessaire à l’interprétation des manipulations. Nous considérons une poutre parallélépipédique homogène, d’épaisseur e, de largeur b et de masse volumique ρ. La section A = eb est supposée constante. La poutre est encastrée à l’une de ses extrémités (voir Fig. 2) de telle sorte que les mouvements transversaux (selon la verticale) ou de torsion sont supposés nuls à l’encastrement, le bord de ce dernier marquant l’origine de l’axe des abscisses x. L’autre extrémité de la poutre est libre et n’est donc soumise à aucune contrainte. La longueur de la
vers le syst`eme d’acquisition y b e `
x z
Fig. 2 Schéma du dispositif expérimental. La poutre est encastrée à l’une de ses extrémités, à l’aide de cales et d’un serre-joint, tandis que l’autre extrémité est libre. Elle est d’épaisseur e, de largeur b et de longueur libre `. Lorsqu’elle est en mouvement dans l’air, elle émet des ondes acoustiques, qu’on enregistre avec un microphone placé au-dessus de l’extrémité libre de la poutre.
274
Mécanique
partie non encastrée de la poutre est notée `. Nous allons étudier les vibrations de cette poutre dans le référentiel du laboratoire, supposé galiléen.
2.1 Équation du mouvement Pour établir l’équation du mouvement, nous allons isoler un élément de poutre centré sur l’abscisse x et de longueur infinitésimale dx, comme représenté Fig. 3. Celui-ci est délimité par deux sections transverses orthogonales à l’axe de symétrie de la poutre quand cette dernière n’est pas déformée. Nous allons faire plusieurs hypothèses sur lesquelles nous reviendrons par la suite 3 . • Dimensions de la poutre Nous nous plaçons dans le cas où ` b pour restreindre l’étude à deux dimensions (x, y), où y désigne la verticale ascendante. La poutre est entièrement caractérisée par l’équation y(x, t) de la déformée de son axe de symétrie, appelée « ligne neutre » (voir Comp. A). Enfin, la poutre est supposée d’épaisseur très faible devant ses autres dimensions : e b, `. • Déformées des sections transverses Nous supposons que les sections transverses restent orthogonales à la ligne neutre quand la poutre se déforme. • Forces en présence Nous négligeons le poids, la poussée d’Archimède, les forces de frottements fluides exercées à l’interface air-poutre et solides au niveau de l’encastrement, ainsi que toute dissipation interne. Les seules actions à considérer sont donc celles exercées par le reste de la poutre sur l’élément dx isolé. Le poids et la poussée d’Archimède étant des forces constantes et indépendantes du temps, elles ne déterminent que le profil de la poutre à l’équilibre mais pas ses propriétés vibratoires. Cela revient à dire que y(x, t) n’est pas le profil de la poutre quand elle vibre, mais la différence de profil par rapport au profil stationnaire.
• Faibles déformations Nous considérons l’hypothèse des faibles déformations, ce qui revient à supposer que |∂y/∂x| 1. Cela permet, en particulier, de se placer dans le cadre de l’élasticité linéaire rappelé dans l’introduction. Appliquons le théorème du centre d’inertie à l’élément infinitésimal de poutre en projection selon la verticale. Si nous notons F (x, t) l’effort tranchant exercé par la partie droite de la poutre sur la partie gauche en x (voir Fig. 3) à l’instant t, l’équation de la dynamique s’écrit : dx dx ∂2y ,t − F x − ,t . (3) ρdxA 2 (x, t) = F x + ∂t 2 2 La longueur dx étant par définition infinitésimale, on obtient en divisant membre à membre par dx et en passant à la limite dx → 0 : ρA
∂2y ∂F (x, t) = (x, t). 2 ∂t ∂x
(4)
Pour exprimer F (x, t), appliquons maintenant le théorème du moment cinétique au même élément infinitésimal de poutre en son centre de gravité G et en projection selon l’axe (Gz) : 3. Ce modèle est parfois dit d’Euler-Bernoulli [10].
IV.1 Mesure du module de Young par méthode acoustique
275
G y z
x− dx −F x − , t ey 2 dx −M x − , t ez 2
dx dx x x+ 2 2
x
ψ(x, t) n G
dx M x+ , t ez 2 dx F x+ , t ey 2
Fig. 3 Schéma de la poutre non déformée (haut) et déformée (bas). Nous avons représenté les forces et moments exercés par le reste de la poutre sur un élément infinitésimal de longueur dx délimité par des sections normales à l’axe de symétrie de l’élément de poutre. On note que F et M sont tous deux négatifs sur le schéma. Y figurent également le vecteur unitaire n tangent à la déformée de la section \ transverse, l’angle de rotation des sections transverses ψ = (e y , n) par rapport à la verticale, ainsi que la déformée de l’axe de symétrie de la poutre, appelée « ligne neutre » (ligne tiretée).
∂dL dx dx dx (x, t) = F x + ,t + F x − ,t ∂t 2 2 2 dx dx +M x+ ,t − M x − ,t , 2 2
(5)
où dL(x, t) désigne le moment cinétique de l’élément de poutre par rapport à l’axe (Gz) et M (x, t) le moment fléchissant, projeté sur ce même axe, exercé au centre de la section d’abscisse x par la partie droite de la poutre sur la partie gauche. En utilisant l’expression du moment d’inertie 4 de l’élément par rapport à l’axe (Gz) [11] et en notant ψ(x, t) l’angle que fait, à l’instant t, la section transverse à l’abscisse x par rapport à la verticale, il vient dL(x, t) = ρ
e3 b ∂ψ dx (x, t). 12 ∂t
(6)
Par la suite, nous notons I = e3 b/12 le moment quadratique. Quand la poutre se déforme, nous supposons que les sections transverses restent orthogonales à la ligne 4. Voir le Comp. A de l’Exp. IV.2, « Dynamique d’un gyroscope déséquilibré » pour de plus amples détails sur la notion de tenseur d’inertie.
276
Mécanique
neutre, ce qui revient à dire que le vecteur n, défini Fig. 3, est un vecteur unitaire normal à la ligne neutre au point G. Ainsi, dans l’hypothèse des faibles déformations ∂y (x, t) = tan(ψ(x, t)) ' ψ(x, t). ∂x
(7)
En associant les résultats des Éq. (5), (6) et (7), nous obtenons ρI
∂3y ∂M (x, t) = F (x, t) + (x, t). ∂t2 ∂x ∂x
(8)
Pour fermer le système constitué des Éq. (4) et (8), nous exprimons le moment fléchissant en fonction de l’amplitude de vibration de la poutre, toujours dans l’hypothèse des faibles déformations (voir Comp. A) : M (x, t) ' EI
∂2y (x, t). ∂x2
(9)
Finalement, en utilisant les résultats des Éq. (4), (8) et (9), et en omettant le couple de variables (x, t), nous obtenons l’équation différentielle vérifiée par l’amplitude de flexion transverse ∂4y ∂4y ∂2y (10) ρA 2 = −EI 4 + ρI 2 2 . ∂t ∂x ∂t ∂x
2.2 Recherche des modes propres Afin de résoudre l’Éq. (10), il convient tout d’abord de préciser les conditions aux limites. D’une part, l’extrémité en x = 0 est encastrée horizontalement, de sorte que y(0, t) = 0 . (11) ∂y (0, t) = 0 ∂x D’autre part, l’autre extrémité en x = ` est libre : l’effort tranchant et le moment fléchissant s’y annulent. En utilisant les Éq. (8) et (9), nous obtenons : 2 ∂ y 0 2 (`, t) = ∂x . (12) 3 3 ∂ y (`, t) = ρ ∂ y (`, t) ∂x3 E ∂x∂t2 Dans le Comp. B, nous montrons que la solution générale de l’Éq. (10) est une superposition de modes propres de pulsations propres ωn (`) (n ∈ N), chacun étant solution de l’Éq. (10) et vérifiant les conditions aux limites des p Éq. (11) et (12). √ Par la suite, nous introduisons les variables adimensionnées ε = I/A`2 = e/2 3` p et Ω = ω/ω` , où ω` = E/ρ/` et nous représentons Fig. 4 l’évolution de Ω0 et Ω1 en fonction de ε. Pour les grandes valeurs du rapport `/e (ε 1), les pulsations propres ont l’expression approchée Cn Ωn (ε) ' Cn ε ⇐⇒ ωn (`) ' 2 `
s
s EI E ⇐⇒ ωn (`)` ' Cn ε , ρA ρ
(13)
IV.1 Mesure du module de Young par méthode acoustique
277
√ où les √ Cn sont √ les solutions positives classées dans l’ordre croissant de l’équation cos( Cn ) ch( Cn ) = −1. En particulier, on a : C0 ' 3,516 et C1 ' 22,035. L’hypothèse ε 1 menant à l’Éq. (13) revient à négliger la dérivée temporelle du moment cinétique de la poutre dans l’Éq. (5), et donc le second terme du membre de droite dans l’Éq. (10). En effet, la comparaison des ordres de grandeur des termes provenant du moment cinétique et de l’accélération donne 4 ρI ∂ y ∂t2 ∂x2 I ' = ε2 . (14) 2 ∂2y A` ρA ∂t2 L’Éq. (13) montre que la mesure des pulsations des modes propres d’une poutre en vibration permet de remonter aux propriétés élastiques du matériau qui compose la poutre, en particulier à son module de Young.
3 Protocole expérimental Lorsque la poutre vibre, elle joue le rôle de forçage extérieur pour l’air dans lequel se propagent des ondes acoustiques de même pulsation que celle à laquelle vibre la poutre. Nous proposons donc le protocole suivant afin de déterminer le spectre en amplitude du signal acoustique émis par la poutre, défini comme le module de sa transformée de Fourier rapide (FFT) 5 , et finalement mesurer le module de Young du matériau. 101
Ω
100 10−1 Ω0 (ε) Ω1 (ε) C0 ε C1 ε
10−2 10−3 10−3
10−2
10−1
100
101
102
ε
Fig. 4 Évolution de la pulsation adimensionnée des deux premiers modes de vibration Ω0,1 (ε) en fonction de l’inverse de la longueur adimensionnée de la poutre ε (les deux axes sont en échelle logarithmique). À grandes longueurs de poutre (` e, ε 1), les pulsations propres vérifient l’Éq. (13).
5. Pour plus de détails sur la FFT, nous renvoyons au Comp. B de l’Exp. I.5, « Spectroscopie par transformée de Fourier ».
278
Mécanique
Mesurer la masse et les caractéristiques géométriques de la poutre. En déduire la masse volumique ρ du matériau la composant. Par la suite, nous avons utilisé deux réglets en acier inoxydable (« inox ») et en aluminium dont les caractéristiques sont présentées Tab. 1. L’épaisseur e est mesurée au micromètre Palmer et la largeur b au pied à coulisse. Nous rappelons que l’épaisseur de la poutre doit être faible devant ses autres dimensions pour se placer dans le cadre théorique développé précédemment.
Réaliser un encastrement de la poutre (voir schéma Fig. 2). Nous avons utilisé un serre-joint associé à deux cales pour nous assurer du maintien ferme de la poutre. Pour que le dispositif soit simple d’utilisation, la position de l’encastrement (et donc la longueur de la poutre) doit être facile à modifier. Mesurer la longueur libre ` de la poutre au mètre ruban. Le dispositif de serrage ne doit pas être fait avec un matériau dont les propriétés acoustiques sont similaires à celles du matériau constituant la poutre. Si les impédances acoustiques de la poutre et de la cale sont très différentes, la perte d’énergie par transmission au dispositif de serrage est minimisée (voir Sec. 5.3). Pour un réglet métallique, les cales peuvent être en bois ou en plastique.
Installer le microphone au-dessus de l’extrémité libre de la poutre. Faire vibrer la poutre en lui donnant un coup sec et vérifier que le déplacement engendré par l’excitation ne provoque pas de contact avec la membrane du microphone. L’exciter au milieu de sa largeur limite la présence de modes de vibrations différents de ceux de flexion unidimensionnelle (voir Sec. 5.1). La fréquence de vibration de la poutre doit être comprise dans la bande passante du microphone. De plus, la réponse du microphone doit être linéaire de sorte qu’elle soit à la même pulsation que l’onde de pression sur sa membrane (voir Sec. 5.3). En outre, il doit être positionné au-dessus ou au-dessous de l’extrémité de la poutre afin que le signal soit le plus intense possible. Il ne doit pas être cependant trop près de l’extrémité de la poutre, pour qu’il ne sature pas.
Relier le microphone à une carte d’acquisition ou à un oscilloscope, enregistrer le signal à ses bornes et calculer son spectre de Fourier. Pour que le spectre soit bien résolu, on choisira un temps d’acquisition suffisamment long pour que le pas de quantification en pulsation soit petit devant la largeur des pics de la transformée de Fourier. Nous avons réalisé des acquisitions d’environ 6 s, ce qui donne une résolution en pulsation d’environ 1 rad·s−1 .
Grandeur (unité)
Réglet inox
Réglet aluminium
Épaisseur e (mm) Largeur b (cm) Masse volumique ρ (kg·m−3 )
0,45 ± 0,01 2,03 ± 0,01 (8,9 ± 0,2) × 103
0,49 ± 0,01 3,82 ± 0,01 (2,59 ± 0,05) × 103
Tab. 1 Caractéristiques des poutres utilisées dans notre expérience.
279
IV.1 Mesure du module de Young par méthode acoustique
4 Résultats Un exemple de signal de tension aux bornes du microphone pour une longueur ` ' 6 cm de poutre en aluminium est présenté Fig. 5(a). Nous en calculons le spectre de Fourier, représenté Fig. 5(b), et mesurons la pulsation ω0 du pic fondamental. Ce dernier a une certaine largeur, que nous utilisons pour quantifier l’incertitude sur la mesure de pulsation fondamentale de vibration. Cette procédure est ensuite répétée pour différentes longueurs libres ` de poutre. Il est plus difficile de faire de même avec le premier partiel (fréquence de résonance du premier harmonique) de flexion : pour l’observer, il faut exciter violemment la poutre, mais sa réponse devient fortement non linéaire et le spectre est par conséquent plus difficile à interpréter, du fait de la distorsion qui engendre des harmoniques (voir Sec. 5.3).
Les résultats sont présentés Fig. 6 où nous avons représenté ω0 ` en fonction de ε. Nous modélisons les données expérimentales par une loi affine selon l’Éq. (13). L’accord entre la modélisation et les mesures expérimentales n’est correct que pour des valeurs de ε suffisamment faibles (et donc des valeurs de longueur ` de poutre suffisamment élevées), l’ajustement final est donc réalisé sur les 11 premiers points, excluant les dernières valeurs pour ε > 2,5 × 10−3 pour l’inox et ε > 8 × 10−3 pour l’aluminium. Les résultats des ajustements sont donnés dans la légende de la Fig. 6. Pour l’aluminium, la valeur de l’ordonnée à l’origine est compatible avec 0. Pour l’acier inoxydable, bien que non nulle, elle est d’un ordre de grandeur inférieur aux valeurs de ω0 ` mesurées. Elle s’explique par une légère concavité des données, qui sera discutée dans la section suivante. Ainsi, l’accord entre nos données et l’Éq. (13) est bon. De plus, la valeur de la pente nous permet de remonter à la valeur du module de Young, et nous trouvons Einox = (194 ± 15) GPa et Ealu = (49 ± 5) GPa. Nous pouvons comparer aux valeurs tabulées dans la littérature [6, 12, 13]. Pour (a)
(b) 8
1,0 |TF[U ]|/|TF[U ]|max
0,8
4 U (V)
0,10
0,05
0,6
0
0,4
-4 -8 0,0
0,00 1000
0,2
0,2
0,4 0,6 t (s)
0,8
1,0
0,0
0
2000
1000 2000 ω (rad.s−1 )
3000
3000
Fig. 5 (a) Signal de tension enregistré aux bornes du microphone et (b) module de sa transformée de Fourier rapide normalisée. L’encart représente un agrandissement du tracé de la transformée de Fourier pour mieux apprécier la présence de pics secondaires. Ce signal a été obtenu pour une longueur ` ' 6 cm de poutre en aluminium.
280
Mécanique
ω0 ` (rad.m.s−1 )
170 60 130
90
35 10 0,000
0,002
0,004
50
10 0,000
Inox Aluminium 0,002
0,004
0,006 ε
0,008
0,010
0,012
Fig. 6 Produit de la pulsation du mode fondamental de flexion ω0 par la longueur √ ` en fonction de ε = e/2 3`. Pour de faibles valeurs de ε, les données sont bien modélisées par une loi affine ω0 ` = aε+b avec ainox = (1,64 ± 0,06) × 104 rad·m·s−1 et binox = (1,8 ± 0,7) rad·m·s−1 pour le réglet en inox et aalu = (1,53 ± 0,07) × 104 rad·m·s−1 et balu = (1,0 ± 1,5) rad·m·s−1 pour celui en aluminium. L’encart montre un agrandissement des données de l’acier inoxydable pour ε ≤ 0,004.
l’acier, on y trouve des valeurs diverses, dépendant du type particulier d’acier inoxydable considéré, mais elles sont concentrées dans un intervalle [195 GPa, 203 GPa]. La valeur mesurée est donc en très bon accord avec ce qui est référencé. En ce qui concerne l’aluminium, la valeur attendue est d’environ 70 GPa, supérieure à la valeur que nous mesurons. Plusieurs facteurs permettent d’expliquer cet écart. Premièrement, nous ne savons pas si le réglet que nous avons utilisé est composé d’aluminium pur ou s’il s’agit d’un alliage. Par exemple, il est connu que l’ajout de zinc ou de magnésium lors du processus de fabrication permet d’abaisser le module de Young [14]. Cela est cohérent avec le fait que la masse volumique du matériau constituant le réglet est inférieure à celle de l’aluminium pur ρ = 2,7 × 103 kg·m−3 . Deuxièmement, durant le processus de fabrication, des cycles thermiques spécifiques appliqués au matériau permettent de modifier ses propriétés élastiques. Malgré ces réserves, la valeur obtenue est cohérente, notamment elle est bien inférieure à celle que nous mesurons pour l’acier.
5 Discussion 5.1 Autres modes de vibration Le modèle théorique développé dans la Sec. 2 ne décrit que des modes de déformation unidimensionnels de flexion. D’éventuels modes de torsion ou de compression unidimensionnels de la poutre pourraient s’établir 6 . Tous deux sont solutions 6. Il existe également des modes de compression bidimensionnels, mais ceux-ci ont une pulsation fondamentale comparable à celle des modes de compression unidimensionnels [5].
IV.1 Mesure du module de Young par méthode acoustique
281
d’une équation de d’Alembert et il est p possible de montrer que leur mode fondamental a pour pulsation ω0 = (π/2`) K/ρ, où K = 3µ/2 dans le cas de la torsion et K = E pour la compression [5]. L’application numérique pour une longueur torsion ` ' 6 cm et µ ' 75 GPa 7 donne des valeurs (ω0 `) ' 5,6 × 103 rad·m·s−1 et compression 3 −1 (ω0 `) ' 7,3 × 10 rad·m·s pour l’acier inoxydable, de deux ordres de grandeur supérieures aux valeurs mesurées pour la flexion. De plus, le modèle de la Sec. 2 repose sur l’hypothèse ` b. Quand ` devient de l’ordre de b, des modes de vibration bidimensionnels présents dans les plaques et d’énergie comparable à ceux de flexion peuvent apparaître [5], et ne peuvent pas être exclus par la présente étude.
5.2 Déformée des sections transverses Pour établir l’Éq. (9), nous avons considéré que les sections transverses restaient orthogonales à la ligne neutre quand la poutre se déformait. En négligeant ensuite le moment cinétique de la poutre, nous avons pu obtenir une approximation analytique des fréquences propres des modes de vibration, donnée par l’Éq. (13). L’écart relatif entre cette approximation et le résultat exact de la Fig. 4 est de l’ordre de 3 % pour ε . 10−2 . De plus, l’hypothèse d’orthogonalité des sections transverses néglige une éventuelle rotation supplémentaire de ces sections. Or, les efforts tranchants internes à la poutre sont des forces de cisaillement, ce qui induit nécessairement de la rotation (voir la Fig. 1 et l’Éq. (2)). Il existe une modélisation plus réaliste du comportement en flexion des poutres, appelée théorie de Timoshenko [10], dans laquelle la rotation des sections transverses due au cisaillement est prise en compte. Il est possible à partir des équations de la Réf. [10] de déterminer les nouvelles pulsations propres en fonction de ε. Pour ε . 10−2 , la variation relative de pulsation du mode fondamental est estimée à 0,1 %. On peut en conclure que l’écart entre la modélisation théorique et les données expérimentales ne peut pas être expliqué par la rotation des sections transverses. En effet, la variation relative de pulsation fondamentale entre les données expérimentales et la modélisation théorique (voir l’Éq. (13)) est de l’ordre de 14 % pour ε . 10−2 pour le réglet en aluminium. De plus, l’écart entre les données et le modèle semble plus prononcé pour l’acier inoxydable que l’aluminium, à ε égal. Si l’hypothèse d’orthogonalité des sections transverses était en défaut, la déviation devrait uniquement dépendre de ε et être la même pour les deux expériences.
5.3 Amortissement et non-linéarités Le signal de tension aux bornes du microphone représenté Fig. 5(a) paraît sinusoïdal amorti. Cet amortissement provient des sources de dissipation que nous avons négligées dans le modèle théorique. Une première source d’amortissement est la perte d’énergie à l’encastrement. Nous avons considéré la poutre comme encastrée dans un étau immobile, mais l’impédance acoustique des cales constituant l’étau n’étant pas infinie, l’onde acoustique se propageant dans la poutre perd de 7. Nous avons utilisé la valeur ν ' 0,29 du coefficient de Poisson de l’acier [15], et nous rappelons que µ = E/2(1 + ν).
282
Mécanique
l’énergie à chaque réflexion sur le dispositif d’encastrement. Une seconde source d’amortissement provient de l’émission de l’onde acoustique dans l’air. Même en négligeant tout effet de la viscosité du fluide, la poutre émet des ondes de pression dans l’air, cédant ainsi de l’énergie acoustique. Tenir compte de ces deux sources de perte d’énergie revient à considérer que la poutre se comporte comme un oscillateur harmonique amorti de pulsation propre ω0 et de facteur de qualité Q. Ce facteur de qualité peut être mesuré par la méthode du décrément logarithmique, et l’on trouve Q & 50 pour toutes les longueurs de poutre en aluminium (Q ' 80 pour le signal de la Fig. 5(a)). La perte d’énergie par transmission dans les cales tendrait donc à diminuer la pulsation du pic fondamental de 1/8Q2 . 0,035 % en valeur relative 8 . Cet effet est trop faible pour expliquer l’écart observé aux petites valeurs de `. D’autres sources de dissipation associées à la poutre et aux cales, plus difficiles à quantifier, peuvent aussi contribuer à diminuer la pulsation fondamentale : les frottements solides au niveau de l’étau, les interactions entre l’onde acoustique dans la poutre et les défauts du matériau [5, 16, 17] ou encore l’échauffement du solide lorsqu’il est déformé [18]. En outre, nous devons considérer d’éventuels frottements visqueux à l’interface air-solide [19]. Afin de les modéliser, nous estimons le nombre de Reynolds par Re ' y02 ω/νf , où y0 est l’amplitude de vibration de l’extrémité de la poutre et νf = 1,5 × 10−5 m2 ·s−1 la viscosité cinématique de l’air, donnée ici à température ambiante et à la pression atmosphérique [13]. Nous estimons y0 ' 2 cm à partir de nos expériences, ce qui donne Re ' 4 × 103 1. L’écoulement a donc un haut nombre de Reynolds, il est ainsi légitime de supposer que la force d’amortissement exercée par l’air sur un élément de poutre est proportionnelle au carré de sa vitesse [20]. Pour tenir compte de cet effet, il faudrait ajouter un terme proportionnel 3 à (∂y/∂t) /|∂y/∂t| dans l’Éq. (10). L’équation du mouvement de la poutre devient alors non linéaire, ce qui exclut la possibilité de rechercher les modes propres comme nous l’avons fait en Sec. 2 et dans le Comp. B. Néanmoins, dans l’hypothèse où l’amortissement est négligeable devant les autres forces en présence (ce qui semble vérifié ici vu le grand facteur de qualité, ou le nombre important d’oscillations qu’on observe Fig. 5(a)), on s’attend à ce que la réponse linéaire soit accompagnée d’une distorsion responsable de pics harmoniques aux multiples entiers de la pulsation fondamentale 9 [5]. On constate effectivement la présence de pics multiples du mode fondamental dans le spectre de la Fig. 5(b), distincts des modes excités de flexion, le premier mode excité de flexion étant attendu à ω1 ' 3,8 × 103 rad·s−1 pour ` ' 6 cm. Ces harmoniques ne peuvent pas raisonnablement être imputés au microphone : l’amplitude du premier harmonique représente ici 6 % du mode fondamental alors que la majorité des microphones du commerce ont un taux de distorsion inférieur à 1 %. Ces non-linéarités peuvent aussi être causées par le fait que l’hypothèse des faibles déformations n’est plus raisonnable. Cette dernière nous a permis de nous placer dans le cadre de l’élasticité linéaire, et notamment de simplifier les Éq. (7) et (9). L’amplitude relative de déplacement de la poutre variant comme y0 /`, l’hy8. Cette estimation s’obtient par un développement limité auppremier ordre en 1/Q de la pseudo-pulsation de l’oscillateur harmonique amorti, qui s’écrit ω0 1 − 1/4Q2 . 9. Pour plus de détails, nous renvoyons à l’Exp. VI.2, « Résonance paramétrique d’un circuit RLC ».
IV.1 Mesure du module de Young par méthode acoustique
283
pothèse des faibles déformations devient moins légitime aux petites longueurs de poutre. Pour tenir compte de déformations plus importantes, il faudrait poursuivre le développement limité des Éq. (7) et (9) à l’ordre suivant (voir Comp. A) : 3 ∂y 1 ∂y + ... − ψ (x, t) ' ∂x 3 " ∂x # 2 2 2 . (15) 2 ∂ y 3 ∂ y ∂y M (x, t) ' EI 2 1 − + ... + ... + η ∂x 2 ∂x ∂x2 Dans la seconde équation, le premier terme provient du développement limité à l’ordre suivant du rayon de courbure, tandis que le second introduit une relation non linéaire entre les contraintes et les déformations, avec η un coefficient qui dépend du matériau et de la géométrie de la poutre. Les équations du système (15) donnent des mécanismes supplémentaires pour la génération de pics harmoniques aux multiples entiers de la pulsation fondamentale, comme observés Fig. 5(b), et interdisent d’utiliser les résultats de la Sec. 2. Nous avons présenté une expérience qui permet de remonter au module de Young d’un matériau par méthode acoustique. La dissipation et les non-linéarités deviennent limitantes aux petites longueurs de poutre, même si la présence d’autres modes ne peut pas être exclue. Nous aurions également pu mesurer la fréquence du mode fondamental de flexion en plaçant un aimant à l’extrémité libre de la poutre. Lorsque cette dernière vibre, l’aimant se déplace verticalement sinusoïdalement et crée un champ magnétique variable. Si l’on place en regard une sonde de fluxmètre, d’après la loi de Faraday (voir l’Exp. II.5, « Freinage magnétique dans un tube conducteur »), une force électromotrice non nulle apparaît à ses bornes, de même pulsation que celle du mouvement de l’aimant. Cette méthode a l’inconvénient de modifier la dynamique de la poutre, du fait de la masse de l’aimant. Il serait également intéressant de comparer la méthode présentée ici à celle utilisant une jauge de déformation placée directement sur la poutre, dont la résistance électrique varie quand la poutre vibre [21].
Complément A - Calcul du moment fléchissant Dans ce complément, nous détaillons le calcul du moment de flexion (Éq. (9)) d’une poutre. Initialement, celle-ci est non déformée et donc horizontale si l’on néglige l’influence de la pesanteur. Si maintenant la poutre est déformée, il existe une ligne appelée « ligne neutre » dont la longueur ne varie pas malgré la déformation. Pour un matériau isotrope, la ligne neutre se confond avec la déformée de l’axe de symétrie (voir Fig. 3). Nous isolons une portion de la ligne neutre (voir Fig. 7) autour du point O à l’abscisse x balayant un angle dθ orienté selon l’axe (Oz). Son rayon de courbure algébrique est noté R(x, t) = OC, où C désigne le centre de courbure, compté positivement si l’ordonnée de C est supérieure à celle de O. La longueur de l’élément de ligne neutre considéré vaut donc ds = |R(x, t)dθ|. On introduit un repère (O, n, t, ez ), où n = CO/ kCOk et t = ez × n désignent respectivement les vecteurs normal et tangent à la ligne neutre en x à l’instant t. La coordonnée dans la direction portée par n est notée r. Considérons maintenant une ligne à l’altitude
284
Mécanique
(a)
(b)
y
y x
z
C
x
dFs (r) tn O
dθ
O dθ
n
t
dFs (r)
z C
x
x
Fig. 7 Schéma d’une poutre fléchie pour le calcul du moment fléchissant. La ligne jaune représente une portion de la ligne neutre de rayon de courbure R(x, t) = OC (a) négatif ou (b) positif, de centre de courbure C et balayant un angle dθ orienté selon l’axe (Oz). La ligne verte est une ligne « parallèle » à la ligne neutre ayant subi une dilatation, de même angle balayé. Nous avons représenté une section orthogonale à la ligne neutre par une ligne bleue, et en rouge les forces supplémentaires exercées par la partie droite sur la partie gauche de cette section. Les vecteurs n et t désignent respectivement les vecteurs normal et tangent à la ligne neutre au point O, de sorte que (n, t, ez ) soit un trièdre direct.
r 6= 0 dont toutes les normales sont communes à celles de la ligne neutre, de sorte que les deux lignes balaient le même angle. Par rapport à la ligne neutre, celle-ci est alors dilatée (si r > 0) ou comprimée (si r < 0) du fait des forces de compression et de dilatation internes, sa longueur étant égale à ds0 = (|R(x, t)| + r) |dθ|. Ainsi, une ligne parallèle à la ligne neutre à l’altitude r a une déformation supplémentaire (ds0 − ds) /ds = r/ |R(x, t)|, et la force supplémentaire exercée sur la surface d’aire bdr par la partie droite de la section d’abscisse x sur la partie gauche de la section s’écrit, dans le cadre de l’élasticité linéaire (voir l’Éq. (1)), dFs (r) =
Er bdr t. R(x, t)
(16)
Ces forces supplémentaires se compensent par symétrie lorsqu’elles sont sommées sur toute l’épaisseur de la poutre, néanmoins l’ensemble des forces supplémentaires dFs (r) induit un moment non nul M (x, t) = M (x, t)ez calculé au niveau de la ligne neutre [22, 23], M (x, t) = ez ·
ˆ épaisseur
OM × dFs (r) =
ˆ
e/2
−e/2
Ebr2 EI dr = , R(x, t) R(x, t)
(17)
IV.1 Mesure du module de Young par méthode acoustique
285
avec I = e3 b/12 le moment quadratique, déjà introduit plus haut. En exprimant le rayon de courbure en fonction de l’équation de la déformée de la ligne neutre : ∂2y 1 ∂2y ∂x2 (x, t), =" ' # 2 3/2 R(x, t) ∂x2 ∂y 1+ ∂x
(18)
la dernière approximation étant une conséquence de l’hypothèse des faibles déformations, nous obtenons l’expression simplifiée du moment fléchissant donnée par l’Éq. (9).
Complément B - Calcul des pulsations propres Nous détaillons ici le calcul des modes propres de l’Éq. (10) vérifiant les conditions aux limites des Éq. (11) et (12). Premièrement, comme l’Éq. (10) est linéaire, l’analyse de Fourier indique qu’elle admet une base de solutions constituée d’ondes planes monochromatiques de la forme exp(i(ωt − kx)) où k et ω sont liés par la relation de dispersion des ondes de flexion dans le milieu k4 −
ρ 2 2 ρA 2 ω k − ω = 0. E EI
(19)
L’Éq. (19) est une équation du second degré pour la variable k 2 dont on obtient deux solutions notées (k 2 )± (ω) : ρω 2 1 k ± (ω) = ± 2E 2 2
r
ρ2 ω 4 4ρAω 2 + , E2 EI
soit en utilisant les notations introduites dans l’expérience s 2 2 Ω 2 . k 2 ± (ω) = 2 1 ± 1 + 2` Ωε On observe alors que k 2
(20)
(21)
(ω) est toujours positive, ce qui donne pour k deux q solutions réelles qui sont ±k+ (ω) = ± (k 2 )+ (ω). Par contre, k 2 − (ω) est toujours négative, ce qui correspond q à deux solutions imaginaires pures conjuguées pour k, ±ik− (ω) avec k− (ω) = − (k 2 )− (ω). Ainsi, toute onde plane stationnaire monochromatique de flexion s’écrit génériquement :
+
y(x, t) = [α(ω) ch(k− (ω)x) + β(ω) sh(k− (ω)x)
+γ(ω) cos(k+ (ω)x) + δ(ω) sin(k+ (ω)x)] exp(iωt),
(22)
les constantes α(ω), β(ω), γ(ω), δ(ω), a priori complexes, étant déterminées par le profil initial y(x, 0) et les conditions aux limites. La fonction de l’Éq. (22) vérifie
286
Mécanique
les conditions aux limites (11) et (12) si et seulement si le quadruplet de constantes intervenant dans la décomposition est solution du système α+γ =0 βν− + δν+ =0 , 2 2 ν− =0 [α ch(ν− ) + β sh(ν− )]−ν+ [γ 2cos(ν+2) + δ sin(ν+ )] 2 2 ν− ν− + Ω [α sh(ν− ) + β ch(ν− )]+ν+ ν+ − Ω [γ sin(ν+ ) − δ cos(ν+ )] = 0 (23) où ν± (Ω) = k± (ω)`, et en omettant maintenant les dépendances en ω pour davantage de lisibilité. En utilisant les deux premières équations, on peut exprimer γ et δ en fonction de α et β. Le système se réécrit alors en un système linéaire de deux équations à deux inconnues qui sont les variables α et β : 2 2 cos(ν ) + ν+ sin(ν ν+ α ν− ch(ν + ) + βν− [ν− sh(ν− −) + + )] = 0 2 2 2 α ν− ν − + Ω2 sh(ν ) − ν ν − Ω sin(ν ) . (24) + + + − 2 2 +βν− ν− + Ω2 ch(ν− ) + ν+ − Ω2 cos(ν+ ) =0 Pour qu’il y ait d’autres solutions que (α, β) = (0, 0), il faut annuler le déterminant de la matrice associée à ce système. En utilisant les propriétés des solutions de l’équation bicarrée (19), 2 Ω 2 2 ν+ ν− = , (25) ε 2 2 = Ω2 ν+ − ν− et après quelques manipulations algébriques, ce déterminant doit vérifier Ω2 ε 2 |Ω|ε 1+ 1+ cos(ν+ (Ω)) ch(ν− (Ω)) − sin(ν+ (Ω)) sh(ν− (Ω)) = 0, 2 2
(26)
où nous rappelons que v s u 2 u 2 u1 ν± (Ω) = Ωt 1 + ± 1. 2 Ωε
(27)
p p Dans la limite ε 1, l’Éq. (26) se réduit à 1 + cos( Ω/ε) ch( Ω/ε) = 0. Ainsi, seules les ondes planes stationnaires monochromatiques dont la pulsation réduite Ω est solution de l’Éq. (26) peuvent s’établir dans la poutre. Cette équation admet un nombre infini de solutions positives Ωn (ε) classées par ordre croissant. Du fait des propriétés de parité des fonctions intervenant dans le membre de gauche de l’Éq. (26) et de l’imparité de ν± (Ω), les solutions Ωn (ε) sont les pulsations propres des modes de flexion (car ±Ωn (ε) sont solutions de l’Éq. (26)). Ces dernières ne peuvent pas être exprimées analytiquement de façon simple, néanmoins l’Éq. (26) peut être résolue numériquement et le résultat des pulsations propres des deux premiers modes propres est représenté Fig. 4. Nous concluons de ce complément que toute solution de l’Éq. (10) vérifiant les conditions aux limites (11) et (12) est une superposition des modes propres, donnés par yn (x, t) = [α(ωn ) ch(k− (ωn )x) + β(ωn ) sh(k− (ωn )x)
+γ(ωn ) cos(k+ (ωn )x) + δ(ωn ) sin(k+ (ωn )x)] cos(ωn t),
(28)
où les constantes α(ωn ), β(ωn ), γ(ωn ) et δ(ωn ) sont solutions du système (23).
IV.1 Mesure du module de Young par méthode acoustique
287
Références [1]
F. S. Crawford, Berkeley : cours de physique (tome 3), ondes. Dunod, 1998.
[2]
J. Adloff, A. Deiber, L. Markiewicz et O. Kempf, « Résonance aiguë et auto-oscillation d’un diapason, » Bup, 92 (801), p. 283-297, 1998.
[3]
J. Coulomb et G. Jobert, Traité de géophysique interne (tome 1), sismologie et pesanteur. Masson et Cie, 1973.
[4]
J.-M. Courty et E. Kierlik, « Pont de Tacoma : la contre-enquête, » Pour la science, 364, p. 98-99, 2008.
[5]
L. Landau et E. Lifchitz, Théorie de l’élasticité, 2e éd. Mir, 1990.
[6]
J.-P. Michel, « Propriétés mécaniques des matériaux, » Bup, 95 (836), p. 11311149, 2001.
[7]
D. Descoles, « Étude de l’allongement d’un fil par traction (Spéciales), » Bup, 4 (29), p. 76-80, 1910.
[8]
M. Fruchart, P. Lidon, E. Thibierge, M. Champion et A. Le Diffon, Physique expérimentale. De Boeck Supérieur, 2016.
[9]
M.-F. Salles et M.-R. Rozier, « Détermination du module d’élasticité longitudinal des fils de faible diamètre, » Bup, 60 (489), p. 533-544, 1966.
[10]
K. F. Graff, Wave motion in elastic solids. Dover Publications, 1991.
[11]
L. Landau et E. Lifchitz, Mécanique, 4e éd. Mir, 1982.
[12]
R. T. Metchunzin, G. E. Ntamack, K. Mansouri et S. C. D’Ouazzane, « Determination of the equivalent elastic coefficients of the composite materials by the vibratory analysis, » IJERT, 02 (07), p. 1056-1059, 2013.
[13]
W. Haynes, CRC handbook of chemistry and physics, 95e éd. CRC Press, 2014.
[14]
B. Noble, S. Harris et K. Dinsdale, « The elastic modulus of aluminiumlithium alloys, » J. Mater. Sci., 17 (2), p. 461-468, 1982.
[15]
N. Harhad, A. Abbas, A. Mabtouche et al., « Caractérisation mécanique de l’acier inox par microscopie acoustique simulée dans » : Congrès français de mécanique, 2007.
[16]
A. Guinier, « Propriétés mécaniques des solides, » Bup, 55 (456), p. 400-415, 1961.
[17]
P. Oswald, Rhéophysique : ou comment coule la matière. Belin, 2005.
[18]
M. Schmitt, « Expérience de traction adiabatique d’un fil métallique, » Bup, 71 (589(1)), p. 315-319, 1976.
[19]
J. E. Sader, « Frequency response of cantilever beams immersed in viscous fluids with applications to the atomic force microscope, » J. Appl. Phys., 84 (1), p. 64-76, 1998.
[20]
E. Guyon, J.-P. Hulin et L. Petit, Hydrodynamique physique, 3e éd. EDP Sciences, 2012.
[21]
G. Asch, Les capteurs en instrumentation industrielle, 7e éd. Dunod, 2010.
288
Mécanique
[22]
M. Soutif et Y. Rocard, Vibrations, propagation, diffusion. Dunod, 1970.
[23]
Y. Rocard, Dynamique générale des vibrations. Masson et Cie, 1971.
Dynamique d’un
IV.2 gyroscope déséquilibré Nous étudions dans cette expérience le mouvement d’un gyroscope déséquilibré. Au cours de ce mouvement, l’axe de révolution du rotor tourne à vitesse et inclinaison constantes autour de la verticale. Ce mouvement, dit de précession, est ici causé par le moment du poids d’une masselotte, déséquilibrant le gyroscope. Nous commençons par interpréter qualitativement ce phénomène, puis montrons que la vitesse de précession est inversement proportionnelle à celle de rotation propre. Nous vérifions ensuite cette prédiction sur un gyroscope d’enseignement.
Sommaire 1 2 3 4
Introduction . . . . . . . . . . . Théorie de la précession . . . . . Mesures préliminaires . . . . . . Vérification de la loi de précession
Compléments A
Rappels sur le tenseur d’inertie
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
289 290 296 302
. . . . . . . . . . . . . 305
1 Introduction Un gyroscope désigne un solide pouvant effectuer une rotation libre selon ses trois degrés de liberté en rotation. L’utilisation des gyroscopes en tant qu’instruments, et non simplement comme curiosités ludiques, date du xixe siècle. Citons ainsi les premiers gyrocompas, instruments dérivés du gyroscope qui permettent d’indiquer le nord avec précision [1, 2]. Par ailleurs, L. Foucault a mis en évidence la rotation de la Terre, d’abord avec son célèbre pendule, puis de façon plus claire encore avec un gyroscope [3], dont la période de rotation de 24 h est indépendante de la latitude. L’avènement des moteurs électriques à la fin du xixe siècle a ensuite propagé leur usage : un moteur permet de maintenir une vitesse de rotation constante en luttant contre les frottements, ce qui améliore sensiblement, comme on le verra, la performance des gyroscopes. Les besoins grandissants de la marine, de l’aviation (avec l’horizon artificiel par exemple, qui permet de connaître l’orientation de l’horizon à tout instant) et de l’aérospatiale ont intensifié leur utilisation. Ils sont présents aujourd’hui dans de nombreux appareils électroniques (smartphones, centrales inertielles 1 ) à des fins d’orientation dans l’espace. La toupie constitue l’exemple le plus familier de gyroscope. Comme le centre de masse d’une toupie ne coïncide pas avec son point d’appui au sol, la somme des moments du poids et de la force de contact avec le sol est non nulle. Cependant, alors 1. Une centrale inertielle est un instrument, utilisé en navigation, qui estime l’orientation, la vitesse et la position d’un mobile. Contrairement au GPS, elle n’utilise aucune information extérieure au mobile.
289
290
Mécanique
qu’un objet immobile basculerait vers le sol, une toupie en rotation suffisamment rapide, même si elle est initialement penchée, reste stable (elle peut même se redresser sous l’effet des frottements avec le support [4]). C’est cet effet contre-intuitif que l’on nomme effet gyroscopique. Dans cette expérience, nous nous intéressons à la réponse d’un gyroscope d’enseignement, visible sur la photographie en Fig. 4(a), à un moment appliqué sur son axe de rotation. Le gyroscope libre, quant à lui, fait l’objet de l’Exp. IV.3, « Dynamique d’un gyroscope libre ».
2 Théorie de la précession Nous discutons dans cette section la dynamique d’un solide quelconque en rotation, et traiterons les spécificités du gyroscope en Sec. 3.1. L’objectif de la Sec. 2.1 est d’acquérir une intuition sur l’effet gyroscopique. Ce résultat est formalisé et discuté en Sec. 2.2. La Sec. 2.3 traite de la dynamique d’un gyroscope déséquilibré, discussion que nous approfondissons en Sec. 2.4. Seul le résultat final (9) de la Sec. 2.3 est nécessaire pour l’exploitation des données expérimentales. Cette partie suppose acquises les bases de la dynamique du solide, pour lesquelles on pourra consulter le Comp. A, la Réf. [5], ainsi que les Réf. [6, 7] pour des aspects plus avancés.
2.1 Explication qualitative L’origine de l’effet gyroscopique peut se comprendre à partir de principes physiques simples, que nous décrivons ici en nous inspirant de la Réf. [8]. Soit une base orthonormée (ex , ey , ez ). Considérons un disque homogène, de rayon R et de centre O, en rotation propre autour de son axe de révolution (Oz). Ce disque homogène peut représenter la partie mobile, en rotation propre, d’un gyroscope (le rotor). Le moment cinétique LO du disque en O est dirigé selon ez , et est de norme constante en l’absence de dissipation. On suppose qu’une force est exercée sur l’axe du rotor, de sorte qu’il est soumis à un couple Γ = Γey . Si le disque est initialement immobile, de moment cinétique nul, l’effet de ce couple est de faire tourner l’axe du disque autour de l’axe (Oy), comme attendu. En revanche, si celui-ci est déjà en rotation propre rapide, nous allons justifier que l’axe du disque acquiert un mouvement de rotation autour de l’axe (Ox) : c’est l’effet gyroscopique (voir la Fig. 1(a)). On nomme précession ce mouvement de rotation de l’axe de rotation propre du solide autour d’une direction fixe. On considère l’effet du couple constant Γ pendant un intervalle de temps infinitésimal dt. Pendant dt, le moment cinétique du disque LO = LO ez varie de dLO = Γ dt = dLO ey , par application du théorème du moment cinétique (TMC) au point O dans le référentiel du laboratoire, supposé galiléen. Pour Γ dt suffisamment petit devant LO , la perturbation due au couple est faible devant le moment cinétique initial. Puisque dLO est orthogonal à LO , et celui-ci étant de norme constante, le moment cinétique effectue un mouvement de rotation autour de −ex (Fig. 1(a)). Si on suppose qu’après l’intervalle de temps dt, le moment cinétique LO est toujours aligné avec l’axe de rotation propre du disque, cela signifie que l’axe de rotation du disque a effectué une rotation dans le sens horaire autour de l’axe (Ox) (une précession), d’un faible angle δθ = dLO /LO 1. L’effet du couple sur le
291
IV.2 Dynamique d’un gyroscope déséquilibré (a)
(b)
dLO LO ω
dLO
δθ
ez
F
δθ
LO Γ
Γ ey
O
ex
ey −F
ex
Fig. 1 (a) Illustration de l’effet gyroscopique. Un solide initialement en rotation propre autour de l’axe (Oz), de moment cinétique LO , sur lequel est appliqué un couple Γ = Γey voit son moment cinétique précesser autour de l’axe (Ox) (avec pour vitesse angulaire de précession ω = −ωex ). (b) Interprétation physique de l’effet gyroscopique. Une particule en rotation voit son impulsion (flèche grise) varier sous l’effet de la force F , ce qui a pour effet de faire tourner le plan de l’orbite de la particule, et son moment cinétique, autour de l’axe (Ox).
disque n’est donc pas de le faire tourner autour de (Oy) mais bien précesser autour de (Ox). Supposer que le moment cinétique est toujours aligné avec l’axe de rotation propre du disque revient à exiger que la composante selon l’axe de rotation propre (Oz) du moment cinétique domine celle due à la précession autour de (Ox). C’est l’approximation gyroscopique, qui sera définie de manière plus quantitative en Sec. 2.3 et 2.4. On peut acquérir une intuition sur ce comportement en considérant que le couple Γ est équivalent à l’action de deux forces opposées, l’une F = F ez appliquée au point de coordonnées (−R, 0, 0) et l’autre −F appliquée au point (R, 0, 0), comme indiqué sur la Fig. 1(b). L’effet de ces deux forces, appliquées durant un intervalle de temps dt, va être d’incliner le plan du disque autour de (Ox).
2.2 Couple gyroscopique On peut formaliser l’explication décrite à la section précédente en utilisant les théorèmes de la mécanique, appliqués à un disque en rotation propre rapide, qu’on suppose suspendu au niveau de son centre de masse O. Soient R le référentiel du laboratoire, supposé galiléen, et R0 un référentiel dont les axes sont fixes par rapport au solide. On suppose à nouveau l’absence de dissipation, de sorte que la vitesse de rotation propre du disque est constante. En notant LO |R le moment cinétique du solide dans R par rapport à O, fixe dans R, la formule de dérivation en référentiel mobile permet d’écrire [7] dLO |R dLO |R = + ΩS/R × LO |R , dt R dt R0
(1)
292
Mécanique
où ΩS/R désigne le vecteur rotation du solide (et donc de R0 ) par rapport à R. Dans le terme (dLO |R / dt)|R0 , la dérivée est effectuée dans R0 , donc par rapport à des axes fixes dans le référentiel du solide. Supposons à présent qu’un opérateur applique au gyroscope un couple Γ op→gy perpendiculairement au moment cinétique du solide LO |R (puisque la norme de celui-ci est supposée constante). Le TMC appliqué au gyroscope en O dans R s’écrit dLO |R = Γ op→gy . (2) dt R Nous nous plaçons désormais dans le cadre de l’approximation gyroscopique : le moment cinétique du solide est toujours dirigé par l’axe de révolution du rotor, et est donc fixe dans R0 . On a alors [5] dLO |R = 0. (3) dt R0
En combinant les Éq. (1), (2) et (3), on obtient Γ op→gy = ΩS/R × LO |R .
(4)
Ainsi, en présence d’un couple non nul, le vecteur rotation du solide ne peut être aligné avec LO |R , qui ne représente dans l’approximation gyroscopique que la rotation propre. Cela se traduit par une précession de l’axe de rotation propre du solide, ce qui confirme le résultat de la Sec. 2.1. La composante de ΩS/R orthogonale à LO |R correspond à la vitesse angulaire de précession, décrite par le vecteur ω en Fig. 1(a). On verra dans la Sec. 2.3 que la direction de la vitesse de précession ω est donnée par celle de la force appliquée sur l’axe du gyroscope, à l’origine du couple (dans cette expérience, par le poids d’une masselotte). Deux situations se présentent en régime stationnaire. Si un opérateur exerce un couple sur un gyroscope en rotation propre constante, son axe de rotation propre (donc son moment cinétique LO |R ) précesse autour d’une direction fixe (voir les Fig. 1(a) et 2). Inversement, si un opérateur impose une rotation à l’axe de rotation propre du gyroscope, celui-ci exerce par principe des actions réciproques un couple, dit gyroscopique, donné par Γ gy→op = −Γ op→gy . Ce couple gyroscopique permet d’expliquer certains phénomènes courants. Ainsi, l’axe de rotation d’une toupie inclinée précesse autour de la verticale plutôt que tomber. À une toute autre échelle, la précession des équinoxes provient du couple gravitationnel exercé par les astres du système solaire sur le bourrelet équatorial de la Terre. L’axe de rotation de la Terre précesse donc sur une période de 25 800 ans [9], si bien que chaque saison commence un peu plus tard chaque année.
L’Éq. (4) montre par ailleurs qu’un gyroscope est d’autant moins sensible aux perturbations (quantifiées par Γ op→gy ) que sa vitesse de rotation propre, et donc la norme de LO |R , est importante. Dans la limite d’un couple nul, le gyroscope préserve son orientation vis-à-vis du référentiel galiléen R : on parle de stabilité gyroscopique. Par exemple, un frisbee vole avec d’autant plus de stabilité qu’il tourne vite, de même qu’une moto roulant à vive allure est si stable qu’elle devient difficile
IV.2 Dynamique d’un gyroscope déséquilibré
293
à manœuvrer 2 . Notons que dans l’approximation gyroscopique, c’est la vitesse de précession qui est proportionnelle à Γ op→gy , au lieu de l’accélération angulaire pour un solide initialement au repos. Un gyroscope réel, dont la vitesse de rotation n’est pas asservie par un moteur, ne satisfait pas tout à fait à la relation (3), à cause de frottements fluides et solides ou d’un défaut d’équilibrage. Les performances d’un gyroscope réel sont d’autant meilleures que la direction de LO |R varie peu. En aéronautique, on tolère une dérive (vitesse angulaire de précession) de l’axe du moment cinétique de l’ordre de 0,01 ° par heure, pour une rotation propre de l’ordre de 103 tours par minute. Pour plus de détails sur les performances des gyroscopes, voir les Réf. [13, 14].
2.3 Gyroscope soumis au moment du poids Considérons le rotor d’un gyroscope S, dont le centre de masse O est au repos dans le référentiel du laboratoire R, de repère (O, x, y, z). Soit un repère principal d’inertie du solide, noté (O, x0 , y 0 , z 0 ) (des rappels sur les notions de repère principal et de moment principal d’inertie sont fournis dans le Comp. A). Pour exercer un moment sur le solide, nous supposons dans cette section qu’une masselotte m est ajoutée à un point M sur l’axe de rotation propre (Oz 0 ) (de vecteur unitaire ez0 ), à une distance ` de O (voir la Fig. 2). Le moment d’inertie de S par rapport à l’axe de rotation propre est noté C ; ceux par rapport aux axes orthogonaux à l’axe de rotation propre sont notés A et B. Le moment cinétique de S dans R par rapport ez ω LO,z |R M
LO |R g
OM × mg `
θ ez0 Ω
O ey
ex Fig. 2 Rotor en rotation, soumis au moment du poids de la masse m. Dans le cadre de l’approximation gyroscopique, son moment cinétique LO |R est aligné avec l’axe principal ez0 . Son centre de masse O est fixe dans le référentiel R, de repère (O, x, y, z). Le moment cinétique précesse autour de ez , et donc garde une projection constante selon ez .
2. La stabilité d’un vélo, en revanche, n’est que très partiellement imputable à l’effet gyroscopique [10]. On pourra consulter les Réf. [11, 12] pour des détails sur la stabilité du vélo.
294
Mécanique
à O, noté LO |R , est relié linéairement au vecteur rotation du solide ΩS/R par le tenseur d’inertie [IS (O)] via LO |R = [IS (O)] ΩS/R . Exprimé dans la base composée des axes principaux d’inertie, ce dernier est diagonal : A 0 0 (5) [IS (O)] = 0 B 0 . 0
0
C
En l’absence de frottement, le TMC appliqué à S dans R au point O fixe s’écrit dLO |R = OM × (−mgez ). (6) dt R
Cette équation, difficile à résoudre dans le cas général 3 , se simplifie dans l’approximation gyroscopique, introduite en Sec. 2.1 et 2.2, qui revient à négliger les composantes orthogonales du moment cinétique par rapport à la composante principale, soit C |Ωz0 | A |Ωx0 | , B |Ωy0 | . (7)
Si ces approximations sont vérifiées, le moment cinétique se simplifie en LO |R ' CΩ ez0 , avec Ω = Ωz0 la vitesse angulaire de rotation propre. La masselotte m étant placée sur l’axe d’inertie (Oz 0 ), OM et LO |R sont colinéaires. On peut réexprimer OM = (`/CΩ)LO |R , et l’Éq. (6) se met donc sous la forme d’une équation de précession : dLO |R = ω × LO |R , (8) dt R
où la vitesse angulaire de précession ω s’écrit ω=−
m` g. CΩ
(9)
Cette équation a deux conséquences remarquables. Premièrement, elle implique la conservation de la norme du moment cinétique, puisque d(LO |R )2 dLO |R = 2L | · = 0, (10) O R dt dt R R
ce qui implique que la vitesse de rotation propre Ω est constante. Deuxièmement, le moment cinétique garde une projection constante selon l’axe ez : dLO |R dLO,z |R = · ez = 0. dt dt
(11)
L’angle entre l’axe de rotation ez0 et ω = ω ez , noté θ et fixé par les conditions initiales, est alors constant au cours du mouvement. Ces deux conséquences caractérisent la précession : en régime établi, l’axe de rotation propre du gyroscope est en rotation à vitesse et inclinaison constantes autour de ω (voir la Fig. 2). 3. Ces difficultés apparaissent clairement dans l’Exp. IV.3, « Dynamique d’un gyroscope libre », les équations gouvernant les trois degrés de liberté en rotation d’un solide étant intrinsèquement non linéaires.
IV.2 Dynamique d’un gyroscope déséquilibré
295
2.4 Aspects avancés de la précession La démonstration de l’Éq. (9) est très simplifiée : l’influence de la nutation, définie comme une variation de l’angle θ, n’est pas considérée (voir la Fig. 3). Nous présentons ci-dessous quelques résultats issus d’une approche rigoureuse [6, 7], obtenus sans avoir besoin de l’approximation gyroscopique. Solide en précession constante Pour un solide axisymétrique, d’axe de révolution (Oz 0 ), il n’existe qu’une seule solution de l’équation du mouvement au cours de laquelle la vitesse de précession est constante, et où celle-ci s’effectue sans nutation. Elle vérifie la condition mg` = CΩω − Aω 2 cos (θ0 ),
(12)
où θ0 est l’angle constant entre ez0 et ez , ω la vitesse de précession, Ω la vitesse angulaire de rotation propre et A = B le moment d’inertie associé à un axe orthogonal à (Oz 0 ). L’Éq. (12) est du second degré en ω et n’admet de solution réelle qu’à condition que son discriminant soit positif, ce qui implique que la vitesse de rotation propre vérifie 4 4mg`A cos (θ0 ) Ω2 > . (13) C2 Cette condition permet de donner une vision plus quantitative de l’approximation gyroscopique, qui consiste simplement à supposer Aω CΩ. Elle revient en effet à négliger le terme quadratique en ω dans l’Éq. (12), si bien que l’on retrouve ω = mg`/CΩ. Rôle des frottements On constate expérimentalement un lent basculement de l’axe principal du gyroscope suite aux frottements fluides et de liaison. En effet, ceux-ci causent une diminution de Ω, de sorte que la condition (13) n’est plus vérifiée : une précession constante sans nutation n’est plus possible. On peut interpréter ce basculement grâce à la proportionnalité de ω à 1/Ω en régime permanent. Si Ω diminue, la vitesse de précession requise pour compenser la pesanteur augmente. Le gyroscope ne précesse pas assez vite momentanément, et le moment du poids tend à le faire basculer. Cela augmente sa vitesse de précession, en convertissant son énergie potentielle de pesanteur en énergie cinétique, et le stabilise. Conditions initiales réalistes Le paragraphe précédent décrivait le cas d’une précession à vitesse uniforme. Cependant, nous ne donnons aucune impulsion initiale à l’axe de rotation propre du gyroscope dans cette expérience. Le solide vérifie donc initialement θ˙ = 0 et ω = 0 : la précession ne peut pas être strictement uniforme. L’axe de rotation propre subit en réalité une nutation, représentée sur la Fig. 3. Pour un solide axisymétrique, on peut montrer que : • l’amplitude de nutation de l’axe de rotation propre vaut cos (θmin ) − cos (θmax ) =
2A mg` sin2 (θmin ), C CΩ2
(14)
4. Une autre solution à l’Éq. (12) existe. Elle correspond à une précession rapide difficile à réaliser en pratique, qui est celle observée pour un gyroscope libre, c’est-à-dire lorsque l’influence de la masse m est négligeable.
296
Mécanique ez
θmin g
LO |R θmax
Fig. 3 Mouvement de nutation de l’axe de révolution d’un solide axisymétrique en rotation propre rapide, qu’on lâche sans lui donner d’impulsion : les conditions initiales de son mouvement sont θ = θmin , θ˙ = 0 et ω = 0.
où θmin est aussi l’angle initial de l’axe d’inertie par rapport à la verticale ; •
la vitesse de précession suit la loi horaire C mg` 1 − cos Ωt , ω(t) = CΩ A
(15)
dont la moyenne ω sur une période de nutation vérifie l’Éq. (9). On parle de précession pseudo-régulière. Dans le cadre de l’approximation gyroscopique CΩ Aω, l’amplitude de nutation tend vers zéro (Éq. (14)) et la vitesse de précession oscille à une pulsation bien supérieure à mg`/CΩ (Éq. (15)), de sorte que la nutation est imperceptible et seule la précession moyenne est observable 5 . Le choix des conditions initiales pour θ˙ et ω n’est donc pas critique pour la réalisation de l’expérience.
3 Mesures préliminaires 3.1 Présentation du gyroscope Nous utilisons un gyroscope pédagogique composé d’un rotor axisymétrique (la partie massive que l’on met en rotation) fixé par un axe rigide sur un cadre intérieur, lui-même maintenu par un cadre extérieur sur un support fixe (voir la Fig. 4(a)). On parle d’une suspension à cardans extérieurs. Les trois degrés de liberté de rotation propre (rotation du rotor), nutation (rotation du cadre intérieur) et précession (rotation du cadre extérieur autour de la verticale) sont ainsi permis. 5. C’est pourtant l’existence de cette nutation qui permet d’amorcer la précession du gyroscope, puisque c’est elle qui engendre un couple gyroscopique selon l’Éq. (4).
IV.2 Dynamique d’un gyroscope déséquilibré
297
Les suspensions doivent assurer une totale liberté de mouvement au rotor, et ne sont donc pas faciles à réaliser. Les systèmes à suspension à cardans extérieurs sont peu utilisés pour les applications de précision, parce que les cadres ont une inertie non négligeable (voir l’Exp. IV.3, « Dynamique d’un gyroscope libre »).
Une manivelle permet d’initier la rotation propre du rotor. Sur le modèle utilisé, nous pouvons atteindre une vitesse de rotation propre de 1300 tr·min−1 ' 136 rad·s−1 . Cela est suffisant pour pouvoir se placer dans le cadre de l’approximation gyroscopique (voir l’Éq. (18) en Sec. 4.1). Pour des raisons pratiques, nous plaçons une masselotte non pas sur l’axe de révolution du rotor, mais sur le cadre intérieur, comme indiqué sur la Fig. 4(b). Nous allons voir en quoi cela modifie la théorie exposée dans la Sec. 2.3. On note M le point de fixation de cette masse, H le projeté orthogonal de M sur l’axe de révolution, β l’angle entre OM et ez0 , et ` la distance OM . Pour β non nul, le cadre intérieur tend à basculer du côté de la masse, et le TMC (6) doit être modifié pour prendre en compte le moment Γc,O exercé par le cadre extérieur pour empêcher ce basculement. En effet, le TMC appliqué en O au système {cadre intérieur, rotor} dans le référentiel R donne dLO |R = OM × mg + Γc,O = OH × mg + HM × mg + Γc,O . dt R
(16)
Le cadre extérieur exerce le moment de réaction Γc,O = −HM × mg, de sorte que la projection selon ez0 du moment total subi par le système est nulle. On retrouve donc une équation de précession similaire à l’Éq. (9), mais dont le vecteur vitesse (a)
(b)
θ0
ω
ez cadre int´erieur
Ω H ez0
O
rotor
M β
mg
cadre ext´erieur
Fig. 4 (a) Photographie du gyroscope pédagogique utilisé pour les expériences. (b) Un gyroscope, représenté ici avec θ0 = π/2, est déséquilibré par une masse m disposée au point M , dont le poids exerce un couple OM × mg, qui entraîne une précession à la vitesse ω. Les trois degrés de liberté (rotation propre, précession et nutation) sont permis par la suspension à cardans.
298
Mécanique
de précession vaut ω=−
m` cos (β) g. CΩ
(17)
La loi (17) implique que le gyroscope précesse dans le sens direct vu de dessus, puisque ω est opposée à g. Le moment d’inertie C du rotor peut s’estimer à partir de l’Éq. (34) du Comp. A. Pour un disque homogène d’épaisseur h ' 3 cm, de rayon R ' 6 cm et constitué d’acier de masse volumique ρ ' 8 × 103 kg·m−3 , on trouve C = ρπhR4 /2 ' 5 × 10−3 kg·m2 . En prenant ` ' 5 cm pour la longueur de l’axe du gyroscope, β = 45◦ , Ω ' 100 rad·s−1 et une masselotte de masse m ' 500 g, on trouve ω ' 0,4 rad·s−1 . Vérifions que le gyroscope peut être mis en mouvement à des vitesses de rotation propre suffisamment élevées pour que l’approximation gyroscopique soit valable. Sachant que A est du même ordre de grandeur que C/2 (voir le Comp. A), on a Aω ' 2 × 10−3 1. CΩ
(18)
L’approximation gyroscopique est bien satisfaite dans cette expérience.
Avant de commencer les mesures sur le gyroscope, il faut s’assurer que celuici est équilibré, c’est-à-dire que le centre de masse du système en l’absence de la masselotte se situe bien au centre géométrique du rotor. Le gyroscope que nous avons utilisé est doté de bagues pesantes pouvant coulisser le long de l’arbre du rotor. La position des bagues est ajustée de façon à ce que le gyroscope libre, une fois mis en rotation, pointe dans une direction fixe, ce qui indique qu’aucun moment pesant ne s’exerce dessus (voir la Sec. 2.2).
3.2 Mesure du moment d’inertie Pour vérifier expérimentalement l’Éq. (17), nous devons d’abord mesurer le moment d’inertie C associé à l’axe de révolution du rotor. Contrairement aux moments d’inertie associés aux axes orthogonaux, qui sont modifiés par l’inertie des cadres intérieur et extérieur, le moment principal du gyroscope est simplement celui du rotor seul. Une méthode simple consiste à mesurer la période des petites oscillations du rotor autour de son axe de révolution, en ajoutant une masselotte m0 supposée ponctuelle à une distance d de son axe d’inertie, de façon à le déséquilibrer, comme illustré en Fig. 5. En l’absence de frottements et en supposant la masselotte ponctuelle, l’angle ϕ entre la verticale et la droite joignant O et le barycentre de la masselotte oscille avec une période s C + m0 d2 . (19) T = 2π m0 gd Cette relation s’obtient en appliquant le TMC au système {masse, rotor} au point
299
IV.2 Dynamique d’un gyroscope déséquilibré ez
rotor
O• d
e0z
ϕ
laser
ABC
photodiode Fig. 5 Pour mesurer le moment d’inertie principal C, les oscillations du rotor déséquilibré par une masselotte autour de son axe de révolution (dirigé par ez0 ) sont suivies par une méthode optique. Un laser émet un faisceau lumineux (en rouge), qui est réfléchi vers la photodiode par un miroir (carré blanc) uniquement lorsque celui-ci passe par le point le plus bas de la trajectoire. L’acquisition des pics de tension aux bornes de la photodiode permet de mesurer la période T des oscillations, et ainsi de remonter à C.
de fixation O du gyroscope : C + m0 d2
d2 ϕ dt2
= −m0 gd sin (ϕ).
(20)
L’angle ϕ obéit à l’équation du pendule pesant. Aux petits angles, elle se réduit à l’équation de l’oscillateur harmonique, de période T donnée par l’Éq. (19).
Pour des masses modérées telles que m0 d2 C, la période T est d’autant plus petite que m0 est grande. La masse doit donc être suffisamment importante pour que l’expérience se fasse en un temps raisonnable, et surtout pour minimiser l’influence des frottements sur la durée de l’expérience. Toutefois, la sensibilité de la période par rapport à C croît lorsque la masse diminue. Le choix de m0 résulte donc d’un compromis entre précision et faisabilité de l’expérience. Pour les faibles vitesses de rotation du gyroscope dans ces mesures, les frottements sont principalement solides, au niveau de l’axe de rotation du rotor. Leur présence ne modifie pas sa période d’oscillation [15].
Le protocole suivi pour mesurer la période est le suivant. Maintenir le cadre intérieur du gyroscope à l’horizontale à l’aide d’une pince fixée à une potence et d’un niveau à bulle. Fixer une masselotte à l’aide de pâte adhésive sur le bord du rotor, puis fixer de façon similaire un petit miroir sur la masselotte. La masse m0 , préalablement pesée, est celle de l’ensemble {miroir, masselotte, pâte adhésive}. Le rotor pivote et atteint sa position d’équilibre lorsque la masselotte se retrouve au plus bas. Placer un laser et une photodiode à une dizaine de centimètres du gyroscope, de sorte qu’en position d’équilibre du rotor, le faisceau émis atteigne le miroir avec
300
Mécanique
un léger angle et soit réfléchi en direction de la cellule photoréceptrice, comme indiqué sur la Fig. 5. Il est préférable de maintenir fermement laser et photodiode par deux potences différentes, pour les orienter et les déplacer facilement. Nous utilisons une photodiode (avec circuit intégré), pour son faible temps de réponse (de l’ordre de la microseconde) [16].
Relier les bornes de la photodiode à une carte d’acquisition. Le temps d’échantillonnage Te doit être suffisamment faible pour repérer le passage du faisceau lumineux sur le miroir, qui se manifeste par un pic très bref de tension délivrée par la photodiode. Si l est la distance, à la surface du miroir, sur laquelle le faisceau est bien réfléchi en direction de la photodiode, et ϕ0 l’amplitude angulaire du mouvement, la durée de passage du faisceau lumineux sur la cellule photosensible est δt '
Tl . 2πdϕ0
(21)
On en tire δt ' 4 ms avec l ' 1 mm, ϕ0 ' 45 ◦ , une période T ' 1 s et une distance d ' 4 cm entre miroir et axe de révolution du rotor. Il faut choisir Te < δt pour mesurer au moins un point à chaque pic d’intensité lumineuse. Nous avons choisi Te = 2 ms pour une durée d’acquisition de 10 s, au-delà de laquelle le solide cesse d’osciller à cause des frottements au niveau des liaisons.
Tourner le rotor à l’équilibre d’un angle ϕ0 de quelques dizaines de degrés, puis le lâcher et acquérir la tension aux bornes de la photodiode. L’amplitude des oscillations doit être suffisamment importante, sans trop s’éloigner du régime linéaire [16]. La première correction relative à la période d’un pendule due aux non-linéarités vaut ϕ20 /16 d’après la formule de Borda [15]. Pour une amplitude angulaire ϕ0 ' 45 ◦ , l’erreur relative est de 6 %. Cette erreur n’est pas négligeable et peut être prise en compte dans l’incertitude sur la période.
Les pics de tension qui traduisent le passage du faisceau laser sur le miroir, et donc sa réflexion sur la photodiode, sont aisément visibles (on obtient un graphe similaire à celui présenté en Fig. 7). Il faut ensuite repérer les positions des maxima. L’intervalle de temps séparant deux pics correspond à une demi-période, puisque le rotor passe par sa position d’équilibre lors d’un aller et d’un retour. En traçant les temps tmax correspondant aux maxima d’intensité en fonction du nombre N de périodes écoulées (Fig. 6(a)), une régression affine permet d’obtenir la période des oscillations, qui est la pente de la droite. Le moment principal C se déduit de la période en inversant la relation (19). L’intensité de la pesanteur est prise égale à g = 9,807 m ·s−2 . Nous trouvons une période T = (2,95 ± 0,02) s, et donc avec d = (42,5 ± 0,5) mm et m0 = (51,23 ± 0,01) g, un moment d’inertie C = (4,61 ± 0,08) × 10−3 kg·m2 ,
(22)
en accord avec l’estimation donnée précédemment.
3.3 Décroissance de la vitesse de rotation propre Pour quantifier l’influence des frottements sur la vitesse de rotation, nous mesurons l’évolution temporelle de celle-ci à l’aide d’un tachymètre numérique [17]. Cet
301
IV.2 Dynamique d’un gyroscope déséquilibré (a)
(b)
Ω (103 tr.min−1 )
tmax (s)
16 12 8 4 0
1,1 1,0 0,9
1
2
3 N
4
5,0 4,5
0
0,8
1 2 t (min)
0,7 0,6
0
ln(Ω/1 rad/s)
1,2
20
0
30
60
90
120
150
t (s)
Fig. 6 (a) Instants correspondant aux maxima de tension tmax en fonction du nombre N de périodes d’oscillation. L’incertitude sur tmax est estimée par la demi-largeur des pics, soit ∆tmax = 30 ms. Un ajustement affine (courbe bleue) permet d’en déduire la période T = (2,95 ± 0,02) s. (b) Vitesse de rotation propre Ω du rotor mesurée par le tachymètre en fonction du temps t. Les données sont compatibles avec une décroissance exponentielle (courbe rouge et encart), soit ln (Ω/Ω0 ) = −γt, de coefficient γ = (4,09 ± 0,02) × 10−3 s−1 .
appareil fonctionne sur le même principe que le dispositif à laser décrit en Sec. 3.2. Le tachymètre émet un faisceau lumineux en direction de la tranche du rotor, sur laquelle est collée une bande réfléchissante, et détecte à intervalles réguliers la lumière réfléchie par cette bande, ce qui permet une mesure de la vitesse de rotation propre du rotor. Un tachymètre est bien plus compact que le dispositif à laser, mais n’est toutefois pas adapté pour la mesure de trop faibles vitesses de rotation. C’est la raison pour laquelle nous avons préféré le dispositif à laser en Sec. 3.2, et en Sec. 4.1 pour la mesure de la vitesse de précession. Le temps de rafraîchissement τ ' 3 s de ce type d’appareil est malheureusement assez long, ce qui introduit un biais dans notre mesure de Ω. Nous souhaitons donc estimer l’incertitude associée à ce temps de réponse, en calibrant la décroissance de Ω au cours du temps sur l’intervalle exploré au cours des expériences, soit grossièrement Ω ∈ [600, 1100] tr·min−1 . Enlever la masselotte servant à la mesure du moment d’inertie, et s’assurer que le gyroscope est toujours équilibré.
Coller une fine bande réfléchissante en travers de la tranche du rotor pour que le tachymètre puisse déterminer sa vitesse de rotation. Lancer le rotor à grande vitesse à l’aide de la manivelle. Ensuite, lancer le chronomètre. Relever à la fois la vitesse de rotation propre sur le tachymètre et le temps correspondant affiché par le chronomètre. On peut s’arrêter lorsque la vitesse a diminué de moitié, au bout d’environ 2 min dans notre cas. La décroissance de la vitesse de rotation propre peut avoir deux origines. La première est les frottements au niveau des liaisons entre l’axe du gyroscope et le
302
Mécanique
cadre. Ce type de dissipation entraîne généralement une décroissance linéaire de la vitesse [15]. L’autre est les frottements fluides au contact de l’air. Les données expérimentales de la Fig. 6(b) sont bien ajustées par une décroissance exponentielle (ce qui suggère que les frottements solides ne dominent pas) de la forme Ω(t) = Ω0 e−γt ,
(23)
avec γ = (4,09 ± 0,02) × 10−3 s−1 . L’incertitude relative sur la vitesse de rotation propre est ainsi estimée à ∆Ωfrot /Ω ' γτ ' 1 %. Nous prendrons cette erreur en compte dans l’incertitude sur la vitesse de rotation propre.
4 Vérification de la loi de précession 4.1 Protocole Pour étudier la dynamique du gyroscope pesant, on ajoute une masselotte sur le cadre intérieur (voir la Fig. 4(b)) ; le gyroscope est alors déséquilibré et effectue une lente précession autour de la verticale, dont il est possible de mesurer la vitesse avec le même dispositif optique que celui décrit en Sec. 3.2. La vitesse de rotation propre Ω est mesurée avec un tachymètre. Coller avec de la pâte adhésive un ou plusieurs miroirs d’environ 1 cm de côté sur le cadre extérieur du gyroscope. Pour obtenir les résultats expérimentaux de la Sec. 4.3, nous avons disposé deux miroirs diamétralement opposés sur le cadre extérieur. Placer le laser et la photodiode comme en Sec. 3.2, puis brancher la photodiode sur la carte d’acquisition. Si le miroir est sur le cadre intérieur, la vitesse angulaire de précession est modifiée, mais de façon négligeable si sa masse est petite devant m.
S’assurer que le gyroscope est bien équilibré (voir la Sec. 3.1). Fixer le tachymètre à une potence, verticalement et à quelques centimètres audessus du rotor. Lancer le rotor avec la manivelle, puis accrocher une masse au cadre intérieur du gyroscope à l’aide d’un fil ou d’une tige. La masse est fixée en un point du cadre intérieur, comme montré sur la Fig. 4(b). Le cadre dont nous disposons est perforé par endroits de trous d’environ 1 mm de diamètre, auxquels nous suspendons un fil, puis fixons une masse à son extrémité. L’expérience est plus visuelle et plus précise lorsque la vitesse de précession est grande, ce qui requiert une masse importante. Cependant, la masse m doit être suffisamment faible pour que l’approximation gyroscopique soit valable. En pratique, une masse m suffisamment importante pour sortir du domaine de validité de cette approximation donnera lieu à une nutation visible de l’axe du rotor.
De manière synchrone, lancer un chronomètre et démarrer une acquisition. Nous choisissons le temps d’échantillonnage selon le critère discuté en Sec. 3.2. Mesurer à une vingtaine de reprises la vitesse de rotation propre au tachymètre tout en notant le temps écoulé.
IV.2 Dynamique d’un gyroscope déséquilibré
303
4.2 Traitement des données et perLes pics du signal de la photodiode se situent à une série d’instants tmax i mettent de calculer la vitesse de précession ω, comme illustré sur la Fig. 7. Chaque pic traduit la réflexion du faisceau laser sur l’un des deux miroirs diamétralement disposés sur le cadre extérieur, et l’intervalle de temps séparant deux pics consécutifs à tmax et tmax i i+1 correspond à une demi-période de précession. La vitesse de max max s’obtient par précession au temps moyen ti = (tmax i−1 + ti+1 )/2 ' ti ωi = ω(ti ) =
tmax i+1
2π . − tmax i−1
(24)
La rotation propre Ω est mesurée au tachymètre, mais à d’autres d’instants t0j : on obtient une série de mesures Ω0j . Pour représenter ω(t) en fonction de Ω(t)−1 aux mêmes instants ti , une liste {ti , Ωi } de valeurs de Ω est construite à partir de {t0j , Ω0j } par une interpolation linéaire : Ωi = Ω(ti ) = Ω0j + (ti − t0j )
Ω0j − Ω0j−1 , t0j − t0j−1
(25)
où les instants t0j−1 et t0j sont les deux instants les plus proches de ti vérifiant t0j−1 < ti < t0j . Le second ordre que nous avons négligé dans l’Éq. (25) donne une bonne estimation de l’incertitude sur chaque valeur Ωi issue de ce traitement numérique : (∆t)2 ∆Ω0 , (26) ∆Ωnum = 2(∆t0 )2 où ∆t est l’écart-type de |ti − t0j |, ∆t0 l’écart-type de t0j+1 − t0j−1 , et ∆Ω0 l’écart-type de Ω0j+1 + Ω0j−1 − 2Ω0j . Le rapport ∆Ω0 /(∆t0 )2 donne, en effet, une estimation de la dérivée seconde numérique de Ω par rapport au temps. 3,5 3,0
U (V)
2,5 2,0 1,5 1,0 0,5 0,0
0
10
20
30
40 t (s)
50
60
70
80
Fig. 7 Tension U aux bornes de la photodiode en fonction du temps t. Chaque intervalle entre deux pics correspond à une demi-période de précession.
304
Mécanique
4.3 Analyse des résultats Dans cette expérience, nous plaçons la masselotte à β = 45 ° par rapport à l’axe de révolution du rotor. D’après l’Éq. (17), la constante de proportionnalité attendue entre ω et Ω−1 vaut mg` aatt = √ = (47,6 ± 1,0) rad2 ·s−2 , 2C
(27)
où la masse vaut m = (421,95 ± 0,05) g, tandis que la distance entre le centre du gyroscope et la masselotte vaut ` = (75 ± 1) mm. L’incertitude sur aatt provient de la difficulté à repérer précisément les positions du point d’application de la force et du centre de l’axe. L’incertitude sur la vitesse de rotation propre s’obtient par composition de ∆Ωnum et ∆Ωfrot , et a pour ordre de grandeur ∆Ω ' 1 rad·s−1 ; celle sur la vitesse de précession provient uniquement du traitement numérique, et vaut ∆ω ' 10−3 rad·s−1 . Les données expérimentales, représentées en Fig. 8, sont compatibles avec une loi affine, d’ordonnée à l’origine b = (3,2 ± 0,9) × 10−2 rad·s−1 , et de pente a = (47,5 ± 0,8) rad2 ·s−2 .
χ2red
(28)
Nous trouvons ' 0,2, ce qui est faible devant 1, et ne permet pas a priori d’exclure une autre loi que celle attendue, donnée par l’Éq. (17). Cependant, l’inspection de la Fig. 8 ne dévoile aucune structure claire de la répartition des points expérimentaux autour de la droite d’ajustement ; ainsi la petitesse du χ2 indique plus probablement que les incertitudes (visiblement celles portant sur la vitesse de rotation propre) sont surévaluées. L’adéquation entre a et aatt est excellente, mais l’ordonnée à l’origine n’est pas compatible avec zéro. La raison probable est l’absence de données pour des vitesses de précession proches de zéro, qui rend la 0,70
ω (rad · s−1 )
0,65 0,60 0,55 0,50 0,45
9
10 Ω
−1
11 12 −3 (10 s · rad−1 )
13
14
Fig. 8 Vitesse de précession ω en fonction de l’inverse de la vitesse de rotation propre Ω. Les disques bleus sont les points expérimentaux, et la droite continue une régression affine ω = aΩ−1 + b avec a = (47,5 ± 0,8) rad2 ·s−2 et b = (3,2 ± 0,9) × 10−2 rad·s−1 .
IV.2 Dynamique d’un gyroscope déséquilibré
305
détermination de l’ordonnée à l’origine très sensible à la position des points expérimentaux. On pourrait également imaginer que le zéro du tachymètre n’est pas bien calibré. Si tel était le cas, la relation (17) serait modifiée par l’erreur systématique Ωerr du tachymètre, selon ω ' aΩ−1 − aΩerr Ω−2 . L’erreur systématique aurait donc pour estimation |Ωerr | ' bΩ2 /a ' 12 rad·s−1 . Cette erreur est bien trop élevée pour un tachymètre non défectueux, et cette explication n’est donc pas satisfaisante.
Il serait intéressant de réaliser cette expérience avec un gyroscope motorisé, dont la vitesse de rotation propre reste constante au cours du temps. En plus d’éliminer certains biais de l’expérience proposée, il serait possible de mettre en évidence la rotation propre de la Terre. Dans l’Exp. IV.3, « Dynamique d’un gyroscope libre », nous étudierons la dynamique libre d’un gyroscope équilibré. Cette dynamique est plus complexe, car l’approximation gyroscopique ne s’y applique pas, et les mouvements de précession et nutation sont fortement couplés.
Complément A - Rappels sur le tenseur d’inertie Considérons un solide indéformable S, de vecteur vitesse angulaire Ω, tournant autour d’un point O fixe dans un référentiel galiléen R auquel on associe le repère (O, x, y, z). Par définition d’un solide indéformable, la vitesse instantanée d’un point M du solide est donnée par v = Ω × r, où r = OM . Cela provient de la formule de dérivation en référentiel mobile [7]. Le moment cinétique du solide en O est alors défini comme ˚ ˚ ˚ LO = dm r × v = dm r × (Ω × r) = dm (r2 Ω − (r · Ω)r), (29) S
S
S
où dm désigne un élément de masse infinitésimal du solide, et où l’intégrale est effectuée sur tout le volume du solide. Le moment cinétique dépend donc linéairement du vecteur rotation, et on peut réécrire cette équation sous forme matricielle : LO = [IS (O)]Ω,
(30)
où [IS (O)] est le tenseur d’inertie du solide pris au point O. Il est important de noter que le tenseur d’inertie est une matrice et non un scalaire : le moment cinétique n’est pas systématiquement colinéaire à Ω. Les composantes du tenseur d’inertie sont données par ˚ ˚ Ixx = dm (y 2 + z 2 ), Iyy = dm (x2 + z 2 ), ... (31) S S ˚ ˚ Ixy = Iyx = − dm xy, Ixz = Izx = − dm xz, ... (32) S
S
En particulier, le tenseur d’inertie est réel et symétrique. Il est donc diagonalisable à valeurs propres réelles, et on note ui trois vecteurs propres unitaires qui forment une base orthonormée. Les trois vecteurs ui définissent les axes principaux du solide,
306
Mécanique
qui composent le repère principal d’inertie. Dans cette base, le tenseur d’inertie est diagonal et s’écrit [6] A 0 0 [IS (O)] = 0 B 0 . (33) 0 0 C Les trois valeurs propres A, B et C sont les moments d’inertie principaux du solide 6 ; ils s’expriment en kg·m2 . Les propriétés cinématiques d’un corps en rotation sont entièrement déterminées par la donnée des axes principaux et des moments d’inertie associés. Les moments d’inertie principaux sont tous positifs d’après l’Éq. (31). Ils déterminent l’inertie d’un solide lorsqu’un opérateur tente de le mettre en rotation ; plus sa masse est distribuée loin de l’axe de rotation, plus son moment d’inertie vis-à-vis de cet axe est grand. On peut déterminer le système d’axes principaux en exploitant une éventuelle symétrie de la répartition de masse dans le solide. Par exemple, si (O, x, y) est un plan de symétrie de la distribution de masse du solide, les coefficients Ixz = Izx et Iyz = Izy du tenseur d’inertie sont nuls (voir l’Éq. (32)). Ainsi, dans le cas d’un solide de révolution, l’axe de révolution est un axe principal, et tout axe orthogonal à l’axe de révolution est également axe principal. Une propriété utile est que lorsqu’un solide est en rotation autour d’un de ses axes principaux, son moment cinétique est parallèle au vecteur rotation. À titre d’exemple, calculons les moments d’inertie d’un disque épais homogène, C étant le moment d’inertie associé à son axe de révolution (Oz). On note M0 sa masse, R son rayon et h son épaisseur. Sa masse volumique est ρ = M0 /(πR2 h). p 2 L’Éq. (31) donne, en notant r = x + y 2 , ¨ ˆ R 1 C = ρh (x2 + y 2 ) dx dy = ρh 2πr3 dr = M0 R2 . (34) 2 S 0 ˝ ˝ 2 Les moments A = y 2 + z 2 dm et B = x + z 2 dm sont égaux. On reS ´ ˝ h/2 ´ R marque que A+B+C = 2 S x2 + y 2 + z 2 dm = 4πρ −h/2 0 r2 + z 2 r dr dz = 2 C + M0 h2 /12 . Puisque A et B sont égaux, on en tire d’après l’Éq. (34) A=B=
1 1 M0 R2 + M0 h2 . 4 12
(35)
Références [1]
R. P. Feynman, R. Leighton et M. Gottlieb, Physique : les astuces de Feynman, 4 cours inédits. Pearson, 2018.
[2]
R. P. Feynman, R. B. Leighton et M. Sands, Le cours de physique de Feynman : mécanique 1, 2e éd. Dunod, 2018.
[3]
L. Foucault, « Sur les phénomènes d’orientation des corps tournants entraînés par un axe fixe à la surface de la terre – nouveaux signes sensibles du mouvement diurne, » Comptes rendus hebdomadaires des séances de l’Académie des Sciences (Paris), 35, p. 424-427, 1852.
6. Par abus de langage, nous les appellerons moments d’inertie, car nous n’exprimerons le tenseur d’inertie que dans une base d’inertie du solide.
IV.2 Dynamique d’un gyroscope déséquilibré
307
[4]
H. K. Moffatt et Y. Shimomura, « Spinning eggs – a paradox resolved, » Nature, 416 (6879), p. 385-386, 2002.
[5]
J.-P. Pérez, Mécanique : fondements et applications, 5e éd. Masson, 1997.
[6]
D. Tong. (2005). Lecture notes on classical dynamics. Consulté en novembre 2019, adresse : http://www.damtp.cam.ac.uk/user/tong/dynamics.html.
[7]
H. Goldstein, C. Poole Jr. et J. Safko, Classical mechanics, 3e éd. Pearson, 2012.
[8]
P. Dourmaschkin, Classical mechanics, MIT 8.01 course notes. John Wiley & Sons, 2013.
[9]
R. Fitzpatrick, An introduction to celestial mechanics. Cambridge University Press, 2012.
[10]
B. Portelli et J. Barthes, La physique par la pratique. H & K, 2005.
[11]
D. E. H. Jones, « The stability of the bicycle, » Phys. Today, 23 (4), p. 34-40, 1970.
[12]
J. P. Meijaard, J. M. Papadopoulos, A. Ruina et A. L. Schwab, « Linearized dynamics equations for the balance and steer of a bicycle: a benchmark and review, » Proc. R. Soc. A, 463 (2084), p. 1955-1982, 2007.
[13]
J.-P. Radix, « Aspects modernes des gyroscopes, » Bup, 71 (587), p. 85-110, 1976.
[14]
V. M. N. Passaro, A. Cuccovillo, L. Vaiani, M. De Carlo et C. E. Campanella, « Gyroscope technology and applications: a review in the industrial perspective, » Sensors, 17 (10), 2017.
[15]
J.-P. Faroux et J. Renault, Mécanique 2, cours et 73 exercices corrigés, 2ème année MP-PC. Dunod, 1997.
[16]
M. Fruchart, P. Lidon, E. Thibierge, M. Champion et A. Le Diffon, Physique expérimentale. De Boeck Supérieur, 2016.
[17]
G. Asch, Les capteurs en instrumentation industrielle, 7e éd. Dunod, 2010.
Dynamique d’un
IV.3 gyroscope libre
Nous nous intéressons au mouvement d’un gyroscope libre, c’est-à-dire qui n’est soumis à aucun moment d’origine extérieure, une fois le rotor mis en rotation. Nous décrivons les principales caractéristiques du mouvement libre, observé depuis le référentiel du laboratoire, et montrons que dans ce référentiel l’axe de révolution du rotor précesse autour d’un axe fixe. Nous mesurons la vitesse de précession au moyen d’une méthode optique.
Sommaire 1 2 3
Introduction . . . . . . . . . . . . . . . . . . . . . . . 308 Dynamique du gyroscope libre . . . . . . . . . . . . . . 309 Étude expérimentale de la dynamique libre . . . . . . . 314
Compléments A
Dynamique d’un gyroscope faiblement asymétrique . . . 319
1 Introduction Nous avons étudié dans l’Exp. IV.2, « Dynamique d’un gyroscope déséquilibré », le mouvement d’un gyroscope en rotation propre, auquel était appliqué un couple constant. En revanche, si un gyroscope en rotation propre perturbé par une brève percussion n’est, par la suite, soumis au moment d’aucune force, il suit une dynamique différente : c’est le mouvement du gyroscope libre, que nous étudions dans cette expérience. L’étude du gyroscope déséquilibré fut grandement simplifiée par l’approximation gyroscopique, qui permit de négliger deux des trois composantes du moment cinétique du gyroscope. Cette simplification n’est pas possible dans le cas du gyroscope libre. Même s’il existe une solution analytique au mouvement général d’un solide totalement asymétrique 1 , celle-ci est complexe [1]. En particulier, la trajectoire du vecteur rotation du solide n’est généralement pas périodique. Pour un solide axisymétrique, cependant, le mouvement est périodique et peut être décrit analytiquement de façon simple. Nous utilisons ici le gyroscope à suspension à cardans extérieurs de l’expérience précédente. La dynamique du gyroscope fait intervenir non seulement le rotor, qui est axisymétrique, mais aussi les cadres massifs intérieur et extérieur. L’inertie des cadres complique la description du solide : le gyroscope, formé de l’ensemble {rotor, cadres}, est déformable et légèrement asymétrique. Nous présentons donc les équations du mouvement du gyroscope libre axisymétrique, puis montrons comment une faible asymétrie affecte ce mouvement. 1. Un solide est totalement asymétrique si ses trois moments d’inertie principaux sont distincts.
308
IV.3 Dynamique d’un gyroscope libre
309
Bien que cette étude puisse être menée indépendamment, une partie du protocole de cette expérience et certains prérequis théoriques ont été décrits dans l’expérience précédente et ne sont pas rappelés ici.
2 Dynamique du gyroscope libre Nous décrivons dans cette section le mouvement libre d’un solide indéformable en rotation, projeté dans une base associée au référentiel du solide, puis au référentiel du laboratoire, supposé galiléen. Il est possible d’aborder directement la partie expérimentale (Sec. 3) en admettant le résultat de l’Éq. (10).
2.1 Équations du mouvement projetées dans le référentiel du solide On considère un solide quelconque S en rotation libre (sur lequel aucun moment n’est appliqué) autour de son centre de masse O, ce dernier étant fixe dans le référentiel du laboratoire R de base orthonormée B = (ex , ey , ez ). Soit B 0 = (ex0 , ey0 , ez0 ) une base principale d’inertie orthonormée du solide, et R0 le référentiel dont les axes sont alignés avec les axes principaux d’inertie du solide, qui suit S dans sa rotation. Le tenseur d’inertie exprimé dans B 0 est diagonal : A 0 0 [IS (O)] = 0 B 0 , (1) 0 0 C où A, B et C sont les moments d’inertie associés aux axes principaux (Ox0 ), (Oy 0 ) et (Oz 0 ) respectivement. Le moment cinétique de S, par rapport au référentiel R et pris au point O, est lié linéairement au vecteur rotation de S par rapport à R, noté ΩS/R , selon LO |R = [IS (O)]ΩS/R . Comme le point O est le centre de masse du solide, LO |R est aussi le moment cinétique barycentrique L∗ , notation que nous utilisons dorénavant. À l’exception d’un solide ayant ses trois moments d’inertie égaux, le tenseur d’inertie n’est pas proportionnel à l’identité : le moment cinétique et le vecteur rotation du solide par rapport à R ne sont donc pas colinéaires en général. Le théorème du moment cinétique en O dans R, et la formule de dérivation en référentiel mobile [2], conduisent à dL∗ dL∗ = + ΩS/R × L∗ = 0. (2) dt R dt R0
L’Éq. (2) permet d’établir les équations d’évolution des composantes Ωx0 , Ωy0 , Ωz0 du vecteur rotation ΩS/R , exprimées dans la base d’inertie B 0 . Ces équations, dites d’Euler, s’expriment ainsi : ˙ (3a) AΩx0 + (C − B)Ωy0 Ωz0 = 0, B Ω˙ y0 + (A − C)Ωz0 Ωx0 = 0, (3b) C Ω˙ 0 + (B − A)Ω 0 Ω 0 = 0. (3c) z
x
y
Elles sont très générales et décrivent complètement les mouvements de rotation d’un solide libre. Ces équations sont couplées et non linéaires, et de fait difficiles
310
Mécanique
à résoudre, alors même qu’elles décrivent le mouvement en l’absence de moment extérieur [3]. La résolution du système (3) est simple dans le cas particulier d’un solide axisymétrique, c’est-à-dire un solide de révolution autour d’un axe de symétrie, que nous choisissons comme étant l’axe (Oz 0 ). Ce solide peut être assimilé au rotor du gyroscope. Tous les axes orthogonaux à (Oz 0 ) sont alors équivalents, de sorte que A = B. L’Éq. (3c) impose ainsi que la rotation du solide autour de l’axe de révolution se fasse à vitesse angulaire constante Ωz0 . Les Éq. (3a) et (3b) se mettent alors sous la forme Ω˙ x0 = −ω0 Ωy0 , (4) Ω˙ y0 = +ω0 Ωx0 avec ω0 = Ωz0 (C − A)/A. Le système (4) conduit, pour chaque composante transverse, à l’équation d’un oscillateur harmonique de pulsation |ω0 | : la projection du q
vecteur rotation sur le plan (x0 , y 0 ) décrit un cercle de rayon Ω⊥ = Ω2x0 + Ω2y0 , comme l’illustre la Fig. 1. Ainsi, le vecteur rotation ΩS/R précesse à la pulsation ω0 autour de l’axe de révolution, porté par ez0 , mais nous ne savons pas à ce stade comment il se positionne par rapport au moment cinétique. Soit α l’angle positif et constant (car ΩS/R · ez0 est constant) que fait le vecteur ΩS/R avec ez0 (Fig. 1), et Ω sa norme. Il vient alors Ωz0 = Ω cos (α) et Ω⊥ = Ω sin (α). Nous pouvons relier α à l’angle Θ que forme le moment cinétique L∗ avec ez0 . En effet le moment cinétique, de norme constante L, a pour projections Lz0 = CΩz0 = L cos(Θ) et L⊥ = AΩ⊥ = L sin(Θ), d’où l’on tire pour Θ < π/2 et α < π/2 tan (Θ) =
ez0
Θ
A tan (α). C
L∗ α
ΩS/R
O
e x0
(5)
ey0 Ω⊥
Fig. 1 Les vecteurs moment cinétique L∗ et rotation ΩS/R précessent autour de l’axe de symétrie dirigé par ez0 . Pour un solide oblate (C > A), le vecteur moment cinétique est plus proche de l’axe que le vecteur rotation ; par ailleurs, les deux vecteurs précessent dans le sens trigonométrique.
IV.3 Dynamique d’un gyroscope libre
311
De plus, les trois vecteurs L∗ , ΩS/R et ez0 sont coplanaires, parce que le produit mixte ez0 ·(L∗ ×ΩS/R ) = Lx0 Ωy0 −Ly0 Ωx0 = (A−B)Ωx0 Ωy0 s’annule pour A = B. Le moment cinétique, vecteur constant dans R, précesse autour de l’axe de révolution à la pulsation ω0 lorsqu’il est observé depuis R0 . La position relative et le sens de précession des vecteurs L∗ et ΩS/R dépendent de la répartition de masse du solide. Pour un solide oblate (aplati selon son axe de révolution), on a C > A, et donc ω0 > 0 avec α > Θ : L∗ est plus proche de l’axe de symétrie que ΩS/R , et les deux vecteurs tournent dans le sens trigonométrique. La situation est inversée pour un solide oblong (étiré selon son axe de révolution), pour lequel C < A.
2.2 Paramétrisation par les angles d’Euler Au cours de l’expérience, le gyroscope est observé non pas depuis le référentiel du solide R0 , mais depuis le référentiel du laboratoire R. Il est donc nécessaire de paramétriser le mouvement dans R, au moyen d’une rotation du système de coordonnées. Nous choisissons de travailler avec les angles d’Euler (ψ, θ, ϕ), couramment utilisés en mécanique du solide [1], et qui définissent une série de trois rotations représentées sur la Fig. 2(a). La base principale d’inertie B 0 s’obtient à partir de la base B de R en appliquant successivement : (i) une rotation d’angle ψ autour de ez (ex est envoyé sur u et ey sur w) ; (ii) une rotation d’angle θ autour de u (ez est envoyé sur ez0 et w sur v) ; (iii) une rotation d’angle ϕ autour de ez0 (u est envoyé sur ex0 et v sur ey0 ). On a ici défini la base directe orthonormée (u, v, ez0 ), liée au solide, mais ne le suivant (a)
(b)
ez L∗ = Lez
ey 0 v
ez0
ez 0
ϕ
C0
w
θ
ψ ϕ ex
ΩS/R
ey
C1
ex0
ψ u O
Fig. 2 (a) Définition des angles d’Euler (ψ, θ, ϕ), et des bases B = (ex , ey , ez ) et B0 = (ex0 , ey0 , ez0 ). (b) Le mouvement des vecteurs ez , ez0 et ΩS/R est représenté par le roulement sans glissement d’un cône C1 , dirigé par ez0 , sur un cône immobile C0 dirigé par ez . Le vecteur rotation se situe à l’intersection des deux cônes. Dans le cas d’un solide oblate, le cône C1 contient C0 .
312
Mécanique
pas dans sa rotation propre. ψ décrit l’angle de précession autour de ez , θ l’angle de nutation, autrement dit d’inclinaison entre ez et ez0 , et ϕ l’angle de rotation propre. D’après la définition des angles d’Euler, le vecteur rotation s’écrit 2 ˙ + ψe ˙ z + ϕe ΩS/R = θu ˙ z0 .
(6)
Par projection de l’Éq. (6) sur la base principale d’inertie B 0 , nous pouvons exprimer les composantes de ΩS/R dans B 0 selon Ωx0 = ψ˙ sin (θ) sin (ϕ) + θ˙ cos (ϕ) (7) Ω 0 = ψ˙ sin (θ) cos (ϕ) − θ˙ sin (ϕ) . y Ωz0 = ϕ˙ + ψ˙ cos (θ) Notons que la vitesse de précession du vecteur ΩS/R autour de ez0 (fixe dans le référentiel du solide) vaut −ϕ, ˙ alors que celle autour de ez (fixe dans le référentiel ˙ du laboratoire) vaut ψ.
2.3 Mouvement dans le référentiel du laboratoire ˙ qui est la vitesse angulaire de précession du solide Nous voulons déterminer ψ, mesurée depuis le référentiel du laboratoire R. Comme L∗ est constant dans R, on peut choisir la base B de sorte que ez est aligné avec L∗ = Lez . L’angle d’Euler θ < π/2 est alors égal à Θ, défini dans la Sec. 2.1. Les composantes de L∗ dans la base d’inertie B 0 s’obtiennent en fonction des angles d’Euler et de L par projection : Lx0 = L sin (θ) sin (ϕ) Ly0 = L sin (θ) cos (ϕ) . (8) Lz0 = L cos (θ) Par ailleurs, le moment cinétique conserve une inclinaison constante avec ez0 (voir ˙ = 0. En la Sec. 2.1), ce qui implique que la vitesse de nutation est nulle, soit θ˙ = Θ injectant l’Éq. (7) dans les relations Lx0 = AΩx0 , Ly0 = AΩy0 et Lz0 = CΩz0 , et en comparant à l’Éq. (8), on trouve L C Ωz 0 1 1 C −A ˙ ψ= = , ϕ˙ = L cos (θ) − = −Ωz0 . (9) A A cos (θ) C A A La différence entre ψ˙ et ϕ˙ est particulièrement marquée lorsque C est proche de A. Dans le référentiel du laboratoire R, l’axe de symétrie du solide ez0 précesse autour du moment cinétique fixe L∗ . La vitesse de précession ψ˙ du solide autour de L∗ est proportionnelle à la vitesse de rotation propre Ωz0 , et est de même signe, alors que ϕ˙ dépend du signe de C − A. Ainsi, dans R, le solide précesse toujours dans le sens trigonométrique si Ωz0 > 0. Le vecteur ΩS/R précesse à des vitesses différentes autour de ez0 et ez . Ce mouvement de précession peut s’interpréter comme le mouvement relatif de deux cônes solides C0 (dirigé par ez ) et C1 (dirigé par ez0 ), roulant sans glisser l’un dans l’autre, et dont l’intersection porte le vecteur ΩS/R . Ainsi, ΩS/R , L∗ et ez0 sont bien coplanaires à tout instant. Ce mouvement est illustré sur la Fig. 2(b). Au cours d’une révolution 2. Cette expression simple a peu d’intérêt pratique : la base (u, ez , ez0 ) n’est pas orthonormée.
IV.3 Dynamique d’un gyroscope libre
313
complète de C1 , et donc du solide, autour de l’axe porté par ez , le cône C0 effectue plusieurs tours sur lui-même, puisque son ouverture angulaire est plus faible. La vitesse de précession de ez0 autour de l’axe ez mesurée par un observateur fixe sur C0 (dans R) est donc supérieure à celle mesurée par un observateur fixe sur C1 (dans R0 ).
2.4 Application au gyroscope Prise en compte des cadres Les résultats précédents sont valables pour un solide axisymétrique et indéformable. Cependant, un gyroscope présente une constitution plus complexe. En particulier, le gyroscope à suspension à cardans extérieurs que nous utilisons se compose d’un rotor, d’un cadre extérieur et d’un cadre intérieur. D’une part, les cadres massifs contribuent au tenseur d’inertie du gyroscope, qui est donc totalement asymétrique. D’autre part, ces cadres sont mobiles : le tenseur d’inertie dépend donc de leur orientation. Les moments d’inertie principaux ne sont pas constants au cours du mouvement. Pour surmonter cette difficulté, nous choisissons de travailler avec une configuration particulière du gyroscope, dans laquelle le cadre intérieur se situe dans le plan horizontal (voir la Fig. 3), et l’axe de révolution du rotor fait un angle de 90◦ avec la verticale. De la sorte, il est possible de définir une base principale d’inertie B 0 commune au rotor et aux cadres si l’on choisit l’axe ez0 comme étant l’axe de révolution du rotor, et l’axe ex0 de sorte qu’il passe par les points de fixation des cadres intérieur et extérieur. Lors de son mouvement libre, l’axe de révolution du rotor précesse autour du moment cinétique L∗ du gyroscope, qui est à l’horizontale. Si l’angle θ entre ez0 et L∗ est faible, le gyroscope s’éloigne peu de cette configuration et on peut supposer le tenseur d’inertie constant.
Effet de l’asymétrie Exprimé dans la base B 0 ainsi définie, le tenseur d’inertie du gyroscope est diagonal, mais les trois moments d’inertie principaux du gyroscope A, B et C (constants dans la configuration adoptée) sont distincts, en raison de l’inertie des cadres. Comme le rotor domine l’inertie du gyroscope, nous supposons que l’asymétrie est faible et posons B = A(1 + ε), où ε 1 est le coefficient d’asymétrie. Nous montrons dans le Comp. A qu’au premier ordre en ε et dans l’hypothèse |θ| 1, la vitesse de rotation propre Ωz0 reste constante et la vitesse de précession moyenne de l’axe de révolution s’écrit C ε ψ˙ ' 1− Ωz 0 . A 2
(10)
Le gyroscope est d’autant moins perturbé par une percussion que le rotor tourne vite. Il est ainsi préférable de percuter faiblement le gyroscope et d’imposer des vitesses de rotation propre les plus élevées possibles pour se placer dans le régime |θ| 1 et assurer la validité de l’Éq. (10). Nous vérifierons la validité de cette hypothèse au cours de l’expérience.
314
Mécanique ey0
cadre int´erieur O ez 0
axe de rotation propre ex0 cadre ext´erieur support
Fig. 3 Configuration d’utilisation du gyroscope. Les trois axes principaux d’inertie du gyroscope sont portés par ex0 , ey0 , et ez0 , ce dernier dirigeant l’axe de révolution du rotor, et sont respectivement associés aux moments d’inertie A, B et C. Dans cette configuration, le cadre intérieur est dans le plan horizontal. Le support est fixe dans R.
Expression des moments d’inertie On se place dans la configuration particulière du gyroscope décrite sur la Fig. 3. Le moment d’inertie C du gyroscope, associé à l’axe ez0 , ne contient que la contribution du rotor, contrairement aux moments d’inertie A et B du gyroscope, respectivement associés aux axes ex0 et ey0 , qui comprennent également la contribution des cadres. Comme il est difficile de mesurer B, nous préférons exprimer le coefficient d’asymétrie en fonction de A et de la seule contribution des cadres. Notons Ii,k le moment d’inertie du cadre intérieur associé à ey0 , Ii,⊥ le moment d’inertie du cadre intérieur selon tout axe orthogonal à ey0 et Ie,⊥ le moment d’inertie du cadre extérieur associé à ey0 . Soit Ar,⊥ le moment d’inertie du rotor seul associé à tout axe orthogonal à ez0 . Par définition, on a A = Ar,⊥ + Ii,⊥ et B = Ar,⊥ + Ii,k + Ie,⊥ . Le cadre intérieur a la forme d’un cerceau. On peut montrer, en suivant les techniques exposées dans le Comp. A de l’Exp. IV.2, « Dynamique d’un gyroscope déséquilibré », que pour un cerceau de masse M et d’épaisseur négligeable devant son rayon R, le moment d’inertie selon son axe de révolution s’écrit Ik = M R2 , et un moment d’inertie associé à un axe orthogonal s’écrit I⊥ = M R2 /2. On a donc en particulier Ii,k = 2Ii,⊥ . Ainsi, on trouve que B − A = Ie,⊥ + Ii,⊥ = Ic s’identifie au moment d’inertie total des deux cadres selon un axe orthogonal à leurs axes de révolution. Le coefficient d’asymétrie ε = (B − A)/A s’écrit finalement ε=
Ic . A
(11)
3 Étude expérimentale de la dynamique libre Nous utilisons le même gyroscope que dans l’expérience précédente, et le matériel nécessaire est identique. Certains points du protocole y ont déjà été décrits et ne sont pas répétés ici.
IV.3 Dynamique d’un gyroscope libre
315
3.1 Mesure des moments d’inertie Nous cherchons à mesurer les moments d’inertie A, B et C du gyroscope, associés à la base principale d’inertie B 0 et définis pour la configuration de la Fig. 3, en utilisant la méthode des oscillations détaillée dans la Sec. 3.2 de l’Exp. IV.2, « Dynamique d’un gyroscope déséquilibré ». Nous utilisons la valeur de C précédemment mesurée : C = (4,61 ± 0,08) × 10−3 kg·m2 . (12)
Nous pouvons mesurer le moment d’inertie A associé à l’axe ex0 en plaçant une masse sur le bas du cadre intérieur (voir la Fig. 4(a)). Le cadre extérieur est maintenu immobile, et le rotor n’est pas en rotation propre. La période des oscillations autour de l’axe ex0 du cadre intérieur permet de remonter à A. Il est difficile de mesurer directement B, associé à l’axe ey0 , avec la méthode des oscillations, mais il est possible de mesurer le moment d’inertie orthogonal des deux cadres Ic en basculant le pied du gyroscope à 90◦ , de sorte que l’axe de rotation du cadre extérieur est horizontal, comme sur la Fig. 4(b). On accède à Ic en faisant osciller les deux cadres dans un même plan, autour du rotor maintenu immobile. La période d’oscillation TI dépend de la masse m de la masselotte, située à une distance d du centre du rotor et supposée ponctuelle, et du moment d’inertie I = A ou Ic , via la relation s I + md2 , (13) TI = 2π mgd où g est l’intensité de la pesanteur. Les résultats sont présentés sur la Fig. 5. Nous utilisons dans les deux cas une masse m = (51,23 ± 0,01) g, avec d = (56 ± 1) mm pour la mesure de A, et d = (92 ± 1) mm pour la mesure de Ic . Un ajustement affine (a)
(b)
ez0
ey0
ex0 g
e x0
ey 0
g
Fig. 4 (a) Pour mesurer A, la masselotte (en jaune) se place au point de fixation du cadre intérieur et de l’axe de révolution du rotor. (b) Pour mesurer le moment Ic des deux cadres autour de ez0 et mesurer Ic , la masselotte (en jaune) se place au point de fixation des cadres intérieur et extérieur. Dans cette configuration, les deux cadres sont coplanaires, et le rotor est maintenu immobile.
316
Mécanique 12 A Ic
tmax (s)
10 8 6 4 2 0
0
1
2
3
4
5
N
Fig. 5 Instants tmax correspondant aux maxima de tension, en fonction du nombre de périodes d’oscillation N , pour les moments d’inertie A (disques bleus) et Ic (triangles rouges). L’origine des temps est choisie à zéro pour les deux courbes. Des ajustements affines donnent les périodes d’oscillation TA = (2,277 ± 0,009) s et TIc = (0,94 ± 0,01) s respectivement.
donne les périodes TA = (2,277 ± 0,009) s et TIc = (0,94 ± 0,01) s pour les moments A et Ic respectivement. Nous en déduisons les moments d’inertie A = (3,53 ± 0,07) × 10−3 kg·m2 ,
(14)
ε = 0,17 ± 0,01,
(15)
et Ic = (6,0 ± 0,2) × 10−4 kg·m2 , soit
Le coefficient d’asymétrie, bien que petit devant 1, n’est pas négligeable : l’inertie des cadres a un effet mesurable sur le mouvement du gyroscope. Nous rappelons que cette mesure de ε repose sur certaines hypothèses simplificatrices (forme et répartition de masse présumées des cadres) et ne nous permet d’obtenir qu’une estimation raisonnable (d’où l’incertitude volontairement élargie dans l’Éq. (15)).
3.2 Protocole La dynamique du gyroscope libre s’étudie en mettant le rotor en rotation, puis en donnant une faible percussion au cadre intérieur du gyroscope. La vitesse de précession de l’axe du rotor est mesurée avec le même dispositif optique que celui décrit dans la Sec. 4.1 de l’Exp. IV.2, « Dynamique d’un gyroscope déséquilibré ». Nous utilisons un tachymètre pour mesurer la vitesse de rotation propre du rotor, et une photodiode conditionnée comme photorécepteur. Son faible temps de réponse (de l’ordre de 1 µs) permet de suivre les oscillations rapides du gyroscope. En effet, l’Éq. (10) prédit un mouvement de précession dont la pulsation est très rapide, du même ordre que la vitesse de rotation propre du rotor Ωz0 (car A ' C). S’assurer que le gyroscope est équilibré. Placer un miroir d’environ 1 cm de côté sur le cadre intérieur. Disposer le laser et la photodiode de sorte que, le gyroscope étant au repos, le faisceau laser se
IV.3 Dynamique d’un gyroscope libre
317
réfléchisse sur le miroir vers la cellule photosensible. Lancer le rotor à une vitesse de rotation aussi élevée que possible (dans notre cas, environ 1300 tr·min−1 ), dans la configuration représentée en Fig. 3 (cadre intérieur à l’horizontale). Donner un léger coup (une percussion) sur le cadre intérieur du gyroscope. L’axe de révolution du rotor effectue des oscillations rapides et de faible amplitude. Déplacer éventuellement le laser et la photodiode afin que la cellule photosensible soit éclairée périodiquement par le faisceau lumineux. Lancer l’acquisition de la tension aux bornes de la photodiode, et mesurer la vitesse de rotation propre au tachymètre. L’oscillation de l’axe de révolution du rotor du gyroscope est rapidement atténuée et il est donc difficile d’obtenir un signal exploitable sur plus de quelques secondes. Répéter l’étape précédente pour différentes valeurs de Ωz0 , en tirant profit de la lente décroissance de la rotation propre par frottements. Pour que l’Éq. (10) soit vérifiée, il faut s’assurer que l’angle θ entre le moment cinétique du gyroscope et l’axe de révolution du rotor est petit devant 1. En remplaçant la photodiode par un écran (Fig. 6), situé à une distance D du miroir, la trace du faisceau laser décrit une ellipse de rayon moyen r, d’où l’on tire θ ' r/2D. Nous avons mesuré r ' 1 cm et D ' 50 cm, ce qui donne θ ' 10−2 : l’approximation de faible percussion est vérifiée.
3.3 Résultats À partir de l’évolution temporelle de la tension aux bornes de la photodiode, nous détectons les pics du signal qui caractérisent le passage du miroir par une position donnée, puis calculons la vitesse de précession moyenne ψ˙ de l’axe (Oz 0 ) autour de L∗ par une régression affine. Nous effectuons une acquisition pour plusieurs valeurs de la vitesse de rotation propre Ωz0 . L’incertitude sur ψ˙ provient de la régression affine ; celle sur Ωz0 est issue de la précision du tachymètre et de la
ey0
r
D
θ L∗ ex0
Fig. 6 Estimation de l’angle θ entre l’axe de révolution du rotor et son moment cinétique. Si le rayon moyen de la trace du laser sur l’écran est r et la distance de l’écran au miroir est D, une estimation de θ (aux effets de projection près) est donnée par θ ' r/2D. Le cadre extérieur n’est ici pas représenté.
318
Mécanique 200
ψ˙ (rad·s−1 )
175 150 125 100 75 50
50
70
90
110 130 Ωz0 (rad·s−1 )
150
170
Fig. 7 Vitesse de précession moyenne ψ˙ en fonction de la vitesse de rotation propre Ωz0 . Un ajustement affine ψ˙ = aΩz0 + b (courbe continue) donne a = 1,23 ± 0,04 et une ordonnée à l’origine b = (0 ± 4) rad·s−1 .
décroissance de la rotation propre, due aux frottements. Un ajustement affine des données ψ˙ = aΩz0 + b, représenté sur la Fig. 7, donne une ordonnée à l’origine b = (0 ± 4) rad·s−1 , compatible avec zéro, et une pente a = 1,23 ± 0,04. La valeur du χ2 réduit est χ2red = 0,5, ce qui valide le modèle linéaire de l’Éq. (10). Dans l’hypothèse |θ| 1, qui a été vérifiée plus haut, la pente attendue pour un solide axisymétrique (en négligeant l’inertie des cadres) est C/A cos (θ) ' C/A d’après l’Éq. (9). Or les mesures de la Sec. 3.1 donnent C/A = 1,31 ± 0,03 : cette valeur n’est que marginalement compatible avec la valeur mesurée. En tenant compte de l’inertie des cadres, l’Éq. (10) prédit une pente (C/A)(1 − ε/2) = 1,20 ± 0,05, qui est cohérente avec la valeur mesurée. L’effet de l’asymétrie du gyroscope est donc observable à la précision de notre expérience, bien que l’estimation du coefficient d’asymétrie soit approximative. La théorie du gyroscope libre s’applique aussi à l’échelle astrophysique, comme au mouvement de la Terre, si l’on néglige l’influence des autres astres pour considérer son mouvement comme libre. De par sa rotation propre, la Terre est aplatie aux pôles et constitue donc un solide approximativement axisymétrique et oblate (C > A). La théorie, initialement décrite par I. Newton et L. Euler, prédit alors que le vecteur rotation de la Terre parcourt dans le référentiel terrestre un cercle autour d’un axe fixe. Sa période de précession doit valoir 2π/ω0 ' (2π/Ω)A/(C − A) ' 306 jours sidéraux [4], avec 2π/Ω = 24 h. Cette précession de l’axe de rotation terrestre, qui se traduit par exemple par une variation périodique des latitudes des étoiles de la sphère céleste, a été effectivement observée par S. C. Chandler au xixe siècle. Cependant, la période de précession mesurée est en réalité de 434 jours [5]. De plus, l’absence d’amortissement de ces oscillations, dites « de Chandler », indique la présence d’un mécanisme d’excitation. Celui-ci est encore mal compris, mais il est probable que des fluctuations de pression océanique et atmosphérique, ou que l’élasticité du manteau terrestre, soient à l’origine de ce mécanisme [5]. En tout état
IV.3 Dynamique d’un gyroscope libre
319
de cause, l’hypothèse d’une Terre rigide et indéformable est en défaut.
Complément A - Dynamique d’un gyroscope faiblement asymétrique La rotation autour de tout axe principal d’inertie est stable pour un solide axisymétrique : l’angle θ reste constant et le mouvement du vecteur rotation du solide est périodique. Une légère asymétrie peut a priori faire disparaître cette stabilité. On peut déterminer un critère de stabilité grâce aux équations d’Euler. Considérons une faible perturbation de la rotation par rapport au mouvement du solide axisymétrique : on pose Ωz0 = Ω et Ωx0 ,y0 = ωx0 ,y0 avec Ω constant et |ωx0 ,y0 ,z0 | |Ω|. En injectant ces expressions dans les équations d’Euler (3), et en ne conservant que les termes du premier ordre, on trouve ω ¨ x0 ,y0 +
(C − B)(C − A) 2 Ω ωx0 ,y0 = 0. AB
(16)
La rotation du solide autour de (Oz 0 ) est donc stable si (C − B)(C − A) > 0. Autrement dit, C doit être le plus petit ou le plus grand moment d’inertie. Nous supposerons par la suite qu’il s’agit du plus grand moment d’inertie (le solide est oblate), en accord avec notre expérience. La rotation d’un solide autour de l’axe associé au moment d’inertie intermédiaire est instable. On peut facilement s’en rendre compte en lançant un livre fermé en l’air, solide totalement asymétrique. La rotation propre est instable autour d’un seul de ses trois axes principaux d’inertie, et la rotation du livre devient irrégulière.
Revenons à une situation générale, sans plus supposer a priori Ωx0 ,y0 petits devant Ωz0 . Les angles d’Euler (ψ, θ, ϕ) déterminent entièrement l’orientation d’un solide, et sont donc choisis comme variables dynamiques pour décrire la rotation. ˙ θ˙ et ϕ, On peut appliquer la même méthode qu’à la Sec. 2.3 pour isoler ψ, ˙ avec ˙ cette fois θ 6= 0. Pour un solide totalement asymétrique, les équations du mouvement s’écrivent alors comme [3] : 1 1 ˙ − L sin (θ) sin (ϕ) cos (ϕ), (17a) θ = A B 2 sin (ϕ) cos2 (ϕ) ψ˙ = + L, (17b) A B 1 sin2 (ϕ) cos2 (ϕ) ϕ ˙ = − − L cos (θ), (17c) C A B où le moment cinétique constant du solide est L∗ = Lez . Ces équations se réduisent bien à θ˙ = 0, ψ˙ = L/A et ϕ˙ = L cos (θ)(1/C −1/A) dans le cas axisymétrique A = B, en accord avec les résultats de la Sec. 2.3. Pour simplifier la résolution du système (17), nous nous plaçons dans le cas d’un solide de faible asymétrie, en posant B = A(1 + ε), avec ε 1. On suppose également que A et C sont du même ordre de grandeur, ce qui est le cas pour le
320
Mécanique
gyroscope d’enseignement étudié (voir la Sec. 3.1). D’après l’Éq. (17b), la vitesse de précession ψ˙ se réduit, au premier ordre en ε, à L ψ˙ ' 1 − ε cos2 (ϕ) . A
(18)
La vitesse de précession n’est pas constante. Toutefois, la vitesse estimée à partir d’une acquisition de durée grande devant la période de rotation propre s’approche ˙ En moyennant pour ϕ variant de la moyenne temporelle sur une période, notée hψi. entre 0 et 2π, on trouve ˙ = L 1− ε . (19) hψi A 2 Cela prouve l’Éq. (10) pour cos (θ) ' 1, la norme du moment cinétique L étant liée à la vitesse de rotation propre Ωz0 par la relation L cos (θ) = CΩz0 . Justifions à présent que la vitesse de rotation propre reste (quasi) constante au premier ordre en ε. Ce n’est a priori pas le cas, mais ses variations sont en réalité faibles si |θ| 1. En effet, en utilisant l’Éq. (17a), la dérivée temporelle de la vitesse de rotation propre s’écrit L L2 Ω˙ z0 = − θ˙ sin (θ) ' −ε sin2 (θ) sin (ϕ) cos (ϕ). (20) C AC On peut alors comparer le temps τ au bout duquel Ωz0 varie significativement sur une période de rotation propre T = 2π/Ωz0 : 2π Ω˙ z0 C T ' ' 2πε tan2 (θ) sin (ϕ) cos (ϕ). (21) τ Ωz 0 Ωz 0 A Si le gyroscope n’est que faiblement perturbé, l’axe de révolution du rotor fait un petit angle avec le moment cinétique, et donc |tan (θ)| 1. Le temps τ est alors très grand devant T : Ωz0 peut être considérée comme constante sur plusieurs périodes de précession du vecteur rotation, même au premier ordre en ε, pourvu que θ soit faible. De plus, le facteur sin (ϕ) cos (ϕ) = sin (2ϕ)/2 oscille autour de 0, et n’introduit donc pas de biais.
Références [1]
D. Tong. (2005). Lecture notes on classical dynamics. Consulté en novembre 2019, adresse : http://www.damtp.cam.ac.uk/user/tong/dynamics.html.
[2]
H. Goldstein, C. Poole Jr. et J. Safko, Classical mechanics, 3e éd. Pearson, 2012.
[3]
D. Garanin, Classical mechanics. Arcus, 2016.
[4]
R. Fitzpatrick, An introduction to celestial mechanics. Cambridge University Press, 2012.
[5]
K. Lambeck, The Earth’s variable rotation : geophysical causes and consequences. Cambridge University Press, 1980.
V.1
Thermométrie à gaz
Cette expérience étudie un thermomètre primaire : le thermomètre à gaz. La pression d’un gaz contenu dans un ballon hermétiquement clos et immergé dans un milieu permet de déterminer la température de ce dernier de façon absolue, c’est-à-dire sans étalonnage préalable. Le lien entre la pression et la température se fait par l’équation d’état du gaz. Après quelques généralités sur les capteurs de température, nous présentons le principe du thermomètre à gaz en déterminant à l’équilibre sa caractéristique pression-température et sa sensibilité. Nous étudions ensuite le comportement dynamique du capteur en proposant une modélisation puis une mesure de son temps de réponse. Nous discutons enfin des sources d’erreurs qui limitent la justesse du thermomètre.
Sommaire 1 2 3 4
Introduction à la thermométrie . . . . . . . . Étude statique du thermomètre à gaz . . . . . Étude dynamique du thermomètre à gaz . . . Limites à la justesse du capteur . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
323 326 329 333
1 Introduction à la thermométrie La thermométrie désigne la science de la mesure de la température. Cette introduction a pour but de rappeler la notion de température et d’étudier sa mesure à l’aide de capteurs thermométriques, couramment appelés thermomètres.
1.1 Définition et détermination de la température La température est une grandeur thermodynamique macroscopique et intensive, qui quantifie l’énergie d’agitation moyenne des particules à l’échelle microscopique [1, 2]. Elle est définie à l’équilibre thermodynamique comme l’inverse de la dérivée de l’entropie par rapport à l’énergie interne, toute autre variable extensive étant maintenue constante (volume, nombre de particules, etc.). La température trouve une définition encore plus précise en physique statistique, où elle joue un rôle essentiel dans l’ensemble canonique [3]. Avant de s’imposer comme grandeur mesurable au milieu du xixe siècle, la température fut souvent confondue avec la notion de chaleur, c’est-à-dire d’énergie thermique échangée [4]. La température était en effet ressentie – un corps est chaud ou froid – sans être mesurée. Selon la précision recherchée, la détermination d’une température peut se faire par [5] : • repérage, en établissant une relation d’ordre (tel corps est plus chaud que tel autre) ; • indication, en déterminant dans quel intervalle se situe la température du corps ; 323
324
Thermodynamique •
mesure, en déterminant la valeur d’une grandeur physique, appelée grandeur thermométrique, dont la connaissance permet de remonter à la température du corps. Cette grandeur thermométrique peut être de nature thermodynamique (pression, volume), mécanique (fréquence de vibration), électrique (résistance, tension), ou encore optique (longueur d’onde, luminance).
Un morceau de fer chauffé observé à l’œil nu constitue par exemple un indicateur de température, parce que sa couleur indique (à la sensibilité de l’œil près) le maximum du spectre d’émission. Dans l’approximation du corps noir, la loi de Wien affirme que la longueur d’onde associée au maximum de la densité spectrale de puissance est inversement proportionnelle à la température. Pour le fer, la couleur va du rouge sombre (600 °C) au blanc (1500 °C). Toutefois, on peut effectuer une mesure de température grâce au même phénomène si le maximum du spectre d’émission est déterminé précisément par un capteur optique ; c’est d’ailleurs le principe d’un pyromètre optique [6].
1.2 Les différents types de thermomètres Nous nous intéresserons uniquement à la mesure de la température. Les capteurs thermométriques se divisent en deux catégories : les thermomètres primaires, qui sont des capteurs absolus, et les thermomètres secondaires, qui nécessitent d’être étalonnés. Le thermomètre à gaz, que nous étudions dans cette expérience, est un exemple de thermomètre primaire. Les thermomètres secondaires sont plus courants ; citons notamment les thermomètres électriques, comme les thermistances à coefficient de température négatif ou positif, respectivement CTN ou CTP, ou encore les sondes de platine et les thermocouples, tous trois étudiés dans l’Exp. V.2, « Thermométrie électrique ». L’étalonnage se fait idéalement en utilisant des points fixes, c’est-à-dire des valeurs uniques de pression et de température pour lesquelles une transition de phase a lieu (Fig. 1). La grandeur thermométrique (résistance ou tension) d’un thermomètre électrique varie avec la température selon une loi complexe qui dépend du mécanisme de conduction, et dont les paramètres sont mal connus, d’où la nécessité de les déterminer par étalonnage.
1.3 Les caractéristiques d’un thermomètre En tant que capteur, un thermomètre possède les caractéristiques suivantes [5]. •
•
La gamme d’utilisation est l’intervalle sur lequel le thermomètre est un bon outil de mesure (Fig. 1). Elle dépend du phénomène physique liant la grandeur thermométrique à la température, mais aussi de la précision désirée et des contraintes pratiques. Les thermomètres à dilatation de liquide, par exemple, sont limités aux températures comprises entre les températures de fusion et de vaporisation du liquide (−114 °C et 78 °C pour l’éthanol). Les thermistances CTP, quant à elles, voient leur résistance augmenter avec la température entre 0 °C et 100 °C, et diminuer en dehors de cette plage [5]. Or une grandeur thermométrique doit être une fonction monotone de la température afin d’éviter toute ambiguïté du résultat de mesure. La gamme d’utilisation des thermistances CTP se limite donc à l’intervalle [0 ◦C, 100 ◦C]. La sensibilité s désigne la variation de la grandeur thermométrique mesurée
325
V.1 Thermométrie à gaz
thermoc. K Pt, CTN thermoc. T quartz mercure
secondaire ´ethanol CTP
hydrog`ene h´elium 100
T (◦ C)
500 1000
+961,78
+630,63
+444,61
+419,53
Ga H2 O(g) Sn Zn S(g) Sb Ag Au +231,93
H2 O
30
+100,00
−38,83
−182,95
−218,79
−259,35
He(g) H2 (tr)O2 (tr) O2 (g) Hg
0
+29,76
−30
+0,00
−273 −100
+1064,18
primaire
−268,93
pyrom`etre
Fig. 1 Gamme d’utilisation de capteurs électriques (en rouge), électromécaniques (en jaune), à dilatation de liquides (en vert), optiques (en gris) et à gaz (en bleu). Seuls les thermomètres à gaz sont des capteurs primaires ; tous les autres sont secondaires. Les températures de quelques points fixes usuels sont indiquées en ◦C sous un axe logarithmique [7]. En l’absence de précision, il s’agit d’un point de fusion à la pression atmosphérique patm = 1013,25 hPa. Dans le cas contraire, (g) indique un point d’ébullition sous cette même pression, et (tr) un point triple, dont la pression diffère de la pression atmosphérique et n’est pas indiquée.
M par unité de température T , soit s(T ) =
dM (T ). dT
(1)
Un thermomètre est dit linéaire lorsque sa sensibilité est indépendante de T . •
•
La justesse est l’écart entre la valeur mesurée et la valeur vraie, et la précision la dispersion des résultats de mesure autour de la valeur moyenne. Un capteur est dit fidèle lorsqu’il est à la fois juste et précis. Pour les capteurs secondaires, un bon étalonnage permet d’améliorer la justesse. Le temps de réponse quantifie la durée nécessaire au capteur pour atteindre l’équilibre thermodynamique après la mise en contact avec le milieu. Un temps de réponse à x % indique la durée pour que la grandeur thermométrique atteigne x % de sa valeur d’équilibre. Le temps de réponse dépend fortement des propriétés du capteur et de son conditionnement, en particulier son enveloppe (capacité calorifique, conductivité thermique, volume, etc.), mais aussi des propriétés physiques du milieu dont on souhaite mesurer la température (Sec. 3.1).
326
Thermodynamique •
Enfin, la finesse quantifie l’influence de la présence du capteur sur la grandeur thermométrique. Un capteur fin perturbe très peu le milieu à étudier, alors qu’un capteur peu fin conduit à d’importantes erreurs systématiques, c’est-à-dire identiques à chaque répétition de l’expérience dans les mêmes conditions. La finesse est d’autant meilleure que le capteur est petit.
2 Étude statique du thermomètre à gaz La mesure d’une température se fait en régime statique, autrement dit une fois l’équilibre thermodynamique atteint. Nous détaillons le principe général d’un thermomètre à gaz avant de nous restreindre au thermomètre à gaz d’enseignement sur lequel nous réalisons les mesures. Nous déterminons la caractéristique (p, T ) du thermomètre et vérifions sa linéarité.
2.1 Principe d’un thermomètre à gaz Le fonctionnement des thermomètres à gaz repose soit sur la dilatation à pression constante, soit sur l’augmentation de pression à volume constant d’un gaz dont les propriétés physiques sont connues. La grandeur thermométrique est le volume dans le premier cas et la pression dans le second. Nous nous pencherons exclusivement sur le second type pour deux raisons : sa mise en œuvre moins contraignante et son intérêt historique. En effet, le premier thermomètre ayant permis de définir la température absolue est un thermomètre à hydrogène [8], qui repose sur le même principe que le thermomètre à gaz d’enseignement de cette expérience, même si le matériel est plus sophistiqué pour le premier (Fig. 2(a)). Un thermomètre à gaz contient un gaz piégé dans un récipient hermétique immergé dans un milieu dont on veut déterminer la température Tm . La température Tc du capteur (ici, le gaz) diffère de Tm à cause des inévitables pertes thermiques, discutées en Sec. 4.1. Si le gaz utilisé se comporte en bonne approximation comme un gaz parfait sur la gamme de température à mesurer, la pression et la température à l’équilibre sont liées par la loi des gaz parfaits p=
nRTc , V
(2)
où Tc s’exprime en kelvin, R = 8,3145 J·mol−1 ·K−1 est la constante des gaz parfaits, n la quantité de matière du gaz et V le volume du récipient. Les corrections à l’équation du gaz parfait sont discutées en Sec. 4.2.
2.2 Le thermomètre à gaz d’enseignement Un thermomètre à gaz d’enseignement est relativement simple à construire, comme illustré en Fig. 2(b). Il se compose d’un récipient hermétique indilatable (un ballon en verre par exemple), relié à un manomètre. Le récipient est rempli d’air, qui fait office de gaz thermométrique, initialement à la pression patm et à la température Tatm . Nous supposons que l’air dans le ballon se comporte comme un gaz parfait sur la gamme de température explorée (de −10 ◦C à 100 ◦C), et obéit
327
V.1 Thermométrie à gaz (a)
(b)
C
manom`etre H2
h Hg A
B
réservoir Hg
tuyau Tatm
atmosph`ere milieu (eau) ballon air
Tm p, Tc
Fig. 2 (a) Thermomètre à hydrogène. Le mercure Hg qui remplit les colonnes A et B est de masse volumique ρ constante sur la gamme de pression atteignable, et provient d’un réservoir commun aux deux colonnes, non montré ici. La surface libre dans la colonne B est au contact du dihydrogène H2 contenu dans un réservoir de platine. La colonne A donne sur une chambre barométrique C de pression quasiment nulle (pression de vapeur saturante de Hg). La hauteur h de mercure entre les deux chambres donne la pression p = ρgh du gaz, d’où l’on déduit la température par l’équation d’état. (b) Thermomètre d’enseignement. De l’air est enfermé dans un ballon muni d’un bouchon percé relié à un manomètre. Le ballon plonge dans le milieu (ici de l’eau) jusqu’au col.
donc à l’Éq. (2). Dans l’hypothèse où les fuites thermiques (échanges avec l’atmosphère au niveau du tuyau et du bouchon) sont négligeables et après établissement de l’équilibre, Tc = Tm et la pression p est proportionnelle à la température Tm du milieu : le capteur est donc linéaire, ce que nous vérifions en Sec. 2.3. Nous prenons pour récipients deux ballons en pyrex (marque de verre borosilicate), l’un de volume 500 mL et l’autre de 100 mL. Plus le ballon est volumineux, plus l’équilibre thermique s’établit lentement, mais plus le flux thermique avec le milieu est grand par rapport aux fuites thermiques. Un tube en plastique relie le ballon muni d’un bouchon au manomètre. Le milieu dont on souhaite mesurer la température est un bain d’eau chauffé par un thermoplongeur de température réglable. L’eau de la cuve est brassée afin d’homogénéiser plus rapidement sa température Tm . Une bouilloire et un mélange eau-glace permettent de déterminer la température des points d’ébullition de l’eau et de fusion de la glace. L’idéal pour illustrer le fonctionnement d’un thermomètre primaire comme le thermomètre à gaz serait de déterminer la pression pour différents points fixes. Nous utilisons le point de fusion de la glace et celui de l’ébullition de l’eau, qui sont les seuls points atteignables avec le matériel utilisé. Pour obtenir d’autres points de mesure, nous devons recourir à un thermomètre auxiliaire préalablement étalonné (voir l’Exp. V.2, « Thermométrie électrique »). Cette méthode est moins satisfaisante conceptuellement, mais plus simple à mettre en œuvre.
328
Thermodynamique
2.3 Linéarité et sensibilité En supposant que le capteur est infiniment juste (Tc = Tm ) et en utilisant l’Éq. (2), la pression p du gaz, qui constitue la grandeur thermométrique, varie linéairement avec la température Tm du milieu. La sensibilité attendue ne dépend que du conditionnement du gaz et vaut s=
nR patm = , V Tatm
(3)
d’où l’on tire s = (3,40 ± 0,05) hPa·K−1 dans les conditions de l’expérience où patm = (993 ± 14) hPa et Tatm = (19,3 ± 1,9) °C. Les incertitudes-types sont données par la précision des appareils indiquée par le constructeur, soit ∆p = 0,01 p + 4 hPa et ∆Tm = 0,003 Tm + 1 K. Nous proposons le protocole suivant pour vérifier la linéarité et déterminer la sensibilité du capteur. Relier le manomètre au ballon par un tube en plastique et immerger le ballon jusqu’au col (Fig. 3). Il est inutile d’immerger le bouchon du ballon car les fuites thermiques sont négligeables près du col (Sec. 4.1). Prendre garde à l’étanchéité du tube qui relie le manomètre et le ballon ; une relaxation (potentiellement lente) vers la pression ambiante à toute température signale généralement une fuite d’air.
Régler la température du thermoplongeur puis attendre l’équilibre thermique (environ 1 min). Mesurer la température de l’eau à l’aide du thermomètre auxiliaire puis la pression dans le ballon, typiquement tous les 10 °C à 20 °C. La Fig. 4 présente les mesures pour deux ballons de 100 mL et 500 mL préparés dans les mêmes conditions atmosphériques. La température Tm est mesurée par le thermomètre auxiliaire, sauf pour les points fixes correspondant à la fusion de la glace (0 °C) et à l’ébullition de l’eau (100 °C), que nous incluons également dans l’ajustement des données. L’ordonnée à l’origine vaut p100 = (−30 ± 40) hPa pour le ballon de 100 mL et p500 = (−40 ± 40) hPa pour le ballon de 500 mL. La pente de
manomètre tuyau
thermomètre auxiliaire thermoplongeur
cuve ballon
Fig. 3 Un ballon contenant de l’air à la température Tc est immergé dans le bain d’eau à la température Tm . Un manomètre permet de mesurer la pression pour chaque température Tm imposée à l’aide d’un thermoplongeur et mesurée par un thermomètre auxiliaire. Lors de la détermination du temps de réponse, la pression est suivie au cours du temps par une carte d’acquisition (non représentée ici) reliée à la sortie analogique du manomètre.
V.1 Thermométrie à gaz
1300
p (hPa)
1200
329
Mesures a ` 500 mL Points fixes a ` 500 mL Mesures a ` 100 mL Points fixes a ` 100 mL
1100 1000 900 250
270
290
310 330 Tm (K)
350
370
390
Fig. 4 Pression p en fonction de la température Tm du milieu. Deux séries de mesures ont été réalisées, l’une avec un ballon de 500 mL (triangles rouges), l’autre avec un ballon de 100 mL (disques bleus). Les points fixes correspondant à la fusion de la glace et à l’ébullition de l’eau sont également indiqués sur le graphe (losanges jaunes pour le ballon de 500 mL, carrés verts pour celui de 100 mL). Enfin les régressions affines associées sont représentées par une droite continue : 100 mL, p = s100 Tm + p100 avec s100 = (3,48 ± 0,12) hPa·K−1 et p100 = (−30 ± 40) hPa ; et une droite pointillée : 500 mL, p = s500 Tm + p500 avec s500 = (3,52 ± 0,12) hPa·K−1 et p500 = (−40 ± 40) hPa.
la régression affine donne pour sensibilités s100 = (3,48 ± 0,12) hPa·K−1 et s500 = (3,52 ± 0,12) hPa·K−1 respectivement. Les données sont donc compatibles avec une loi linéaire. L’écart entre s100 et s500 s’explique surtout par les incertitudes de mesure, car l’effet des fuites thermiques induit une erreur négligeable (Sec. 4.1). L’accord avec la sensibilité attendue s est acceptable. Néanmoins, χ2red = 0,03 1, ce qui trahit des incertitudes expérimentales trop importantes pour exclure d’autres lois de modélisation, prenant par exemple en compte l’écart à l’équation du gaz parfait, comme discuté en Sec. 4.2.
3 Étude dynamique du thermomètre à gaz Lorsqu’on plonge soudainement un thermomètre dans un milieu de température différente, la température mesurée par le thermomètre n’est pas immédiatement celle du milieu. Le temps de réponse du capteur correspond au temps typique que met le gaz pour atteindre la température du milieu. Il dépend de nombreux paramètres mentionnés en Sec. 1.3. Nous proposons une étude dynamique du thermomètre à gaz d’enseignement, afin de déterminer son temps de réponse. Les résultats expérimentaux sont ensuite présentés.
3.1 Bilans thermiques Définition du système Considérons la situation où le ballon, dont le gaz est initialement à la température de l’atmosphère Tatm , est plongé dans le milieu à l’instant t = 0. Nous négligeons pour le moment les fuites thermiques : la tempéra-
330
Thermodynamique
ture d’équilibre du gaz tend vers celle du milieu Tm . La pression p(t) du gaz enfermé dans le ballon est uniforme au vu de la petitesse du ballon par rapport à la distance caractéristique de variation de la pression atmosphérique. Par contre, le profil de température T (M, t) dans le ballon dépend de la position M , de même que la masse volumique de l’air ρa (M, t), toutefois il est possible de définir une température du capteur homogène. En effet, l’énergie interne Ea (t) de l’air dans le ballon de volume V et assimilé à un gaz parfait diatomique de masse molaire Ma vaut ˚ ˚ 5 5 5Rρa (M, t) p(t) dV = p(t)V. (4) T (M, t) dV = Ea (t) = 2M 2 2 a V V Les volumes du goulot et du bouchon du ballon étant négligeables, ce dernier est quasi sphérique, de volume V = πD3 /6, avec D le diamètre interne. Ainsi, Ea (t) =
5πD3 p(t) = CV,a Tc (t), 12
(5)
ce qui définit la température du capteur Tc (t), qui est la température mesurée. La grandeur CV,a = 5πρa RD3 /12Ma désigne la capacité calorifique à volume constant de l’air contenu dans le ballon, et ρa la masse volumique de l’air, moyennée dans le volume du ballon. La température mesurée Tc (t) n’est stationnaire qu’après un temps suffisamment long pour que l’équilibre thermique avec le milieu de température Tm soit établi. Déterminer rigoureusement l’évolution temporelle de Tc (t) nécessite de résoudre l’équation de la chaleur pour le système global {gaz + ballon} en tenant compte du couplage entre l’évolution de la température du gaz dans le ballon et celle de la paroi de verre, qui dépend de la profondeur dans le verre et du temps. Nous considérons dans la suite un modèle simplifié qui ne tient pas compte de ce couplage, mais qui explique de façon satisfaisante les résultats observés. Nous mesurons la température d’un fluide dense (l’eau), ainsi les échanges au niveau de la paroi externe du ballon sont essentiellement diffusifs 1 et très rapides. Nous supposons donc que la température de la surface externe du verre prend instantanément la valeur Tm au moment où le ballon est immergé. Cette approximation est bonne pour un petit ballon (100 mL), mais elle l’est moins pour un ballon plus large (500 mL), où nous observons un temps de latence initial de quelques secondes nécessaire pour que la surface externe de la paroi de verre atteigne l’équilibre thermique.
Loi d’évolution de la température du capteur Soit Φa (t) le flux thermique de la paroi en verre vers le gaz. Le ballon constitue un espace clos de faibles dimensions et maintenu à température constante sur tout son pourtour : les échanges thermiques au sein du gaz sont donc majoritairement diffusifs plutôt que convectifs. La loi de Fourier donne Φa (t) = Ga (Tv (t) − Tc (t)), où Tv (t) désigne la température de la surface interne du verre, et Ga la conductance thermique de l’interface entre le gaz et la paroi interne du ballon, supposée constante. Les échanges thermiques 1. On réserve généralement le terme de conduction au mécanisme de transport de chaleur sans transport de matière dans un solide, et on parle de diffusion pour les fluides (gaz ou liquides).
V.1 Thermométrie à gaz
331
ont lieu sur une longueur caractéristique δ, reliée à l’épaisseur de la couche limite thermique, qu’il est difficile d’évaluer précisément. Ainsi, Ga = πD2 λa /δ, avec λa la conductivité thermique de l’air [9]. Le bilan d’énergie interne appliqué au gaz dans le ballon s’écrit dEa (t)/dt = Φa (t), soit CV,a
dTc (t) = Ga (Tv (t) − Tc (t)). dt
(6)
Il est tentant d’identifier dans l’Éq. (6) un temps caractéristique τa = CV,a /Ga . Ce temps ne correspond pas au temps de réponse du capteur, parce que la température de la paroi interne du verre Tv (t) évolue elle-même dans le temps. En fait, deux phases se distinguent, ce qui facilite la résolution de l’Éq. (6). Première phase L’onde thermique traverse d’abord par conduction la paroi en verre d’épaisseur ev D et de conductivité thermique λv . Le temps caractéristique de cette phase transitoire est donné par τv = e2v ρv cv /λv ' 7 s (Tab. 1), avec ρv la masse volumique de la paroi en verre et cv sa capacité calorifique massique. Pendant ce temps, la température du gaz à l’intérieur du ballon commence à varier. Pour obtenir l’épaisseur ev de la paroi en verre, on peut mesurer au pied à coulisse le diamètre extérieur D + 2ev du ballon, puis remplir d’eau sa partie sphérique pour en déduire D = (6m/πρ)1/3 , où m est la masse d’eau introduite et ρ sa masse volumique.
Seconde phase Un régime quasi permanent s’établit dans le verre, et même si la température dans le verre varie au cours du temps (et donc de même pour la paroi interne Tv (t)), il est possible d’utiliser la loi d’Ohm thermique pour déterminer cette −1 évolution. Soit Gtot = 1/(G−1 a + Gv ) la conductance de l’ensemble constitué de la paroi en verre, de conductance Gv ' πD2 λv /ev en régime stationnaire, et du gaz, qui sont disposés en série vis-à-vis de l’onde thermique. Dans cette seconde phase, l’évolution de la température du capteur obéit à CV,a
dTc (t) = Gtot (Tm − Tc (t)). dt
(7)
Dans l’expression de Ga (et donc de Gtot ) intervient la longueur caractéristique de la diffusion thermique dans le gaz. Dans la limite où cette longueur δ est de l’ordre Grandeur
Valeur
Grandeur
Valeur
λa ρa Ma D
2,5 × 10−2 W·m−1 ·K−1 1,2 kg·m−3 29 g·mol−1 (6,0 ± 0,2) cm
λv ρv cv ev
1,2 W·m−1 ·K−1 2,2 × 103 kg·m−3 8,3 × 102 J·kg−1 ·K−1 (2,1 ± 0,1) mm
Tab. 1 Valeurs numériques des paramètres de l’air et du ballon (à gauche), et du verre (à droite). Les propriétés du verre en pyrex et de l’air sont tabulées [10].
332
Thermodynamique
du diamètre D du ballon (ce que suggère l’expérience, voir Sec. 3.2), on a alors au vu des valeurs numériques Gv Ga et donc Gtot ' Ga . La diffusion au sein du gaz contrôle donc cette deuxième phase des échanges thermiques, dont le temps caractéristique vaut 5ρa RD2 , (8) τa = CV,a /Ga = 12λa Ma soit τa ' 21 s (Tab. 1). Finalement, la température du capteur converge exponentiellement vers la température du milieu, mais selon deux temps caractéristiques différents, égaux en très bonne approximation à τa et τv . Ils diffèrent suffisamment pour que la réponse dynamique en température se sépare en deux phases distinctes de décroissance exponentielle. Nous définissons le temps de réponse du thermomètre à gaz comme la somme de ces deux temps caractéristiques, soit τ = τv + τa ' 28 s. Si le milieu n’est pas dense (de l’air par exemple), le temps de réponse est contrôlé par les échanges conducto-convectifs au niveau de la paroi externe du ballon, qui sont beaucoup plus lents. Une fois le régime quasi stationnaire établi dans le verre, on a −1 −1 2 cette fois Gtot = 1/(G−1 a + Gv + Ge ), où Ge ' πD h est la conductance de la paroi −2 −1 externe du verre, et h ' 1 W·m ·K le coefficient de conducto-convection pour de la convection naturelle dans l’air. Le temps de réponse du capteur avoisine alors la minute, ce que l’on peut observer expérimentalement (Sec. 3.2).
3.2 Mesure du temps de réponse Pour déterminer le temps de réponse avec une résolution temporelle inférieure à la seconde, il est préférable d’utiliser une carte d’acquisition reliée à la sortie analogique du manomètre numérique plutôt que de prendre des points à la main. L’étalonnage du manomètre n’est pas nécessaire si sa réponse est affine sur la gamme de pression explorée. Le ballon étant hors du bain, faire varier la température du bain en réglant la consigne du thermoplongeur, ou préparer un mélange glace-sel. Attendre l’équilibre thermique du bain en contrôlant la température de l’eau avec le thermomètre auxiliaire. Maintenir le ballon au-dessus de la cuve d’eau à une potence. Relier la sortie analogique du manomètre à une carte d’acquisition, et choisir une durée d’acquisition d’environ 5 min pour un pas de temps d’environ 100 ms. Lancer l’acquisition puis plonger rapidement le ballon dans l’eau jusqu’au col. Reproduire le protocole pour d’autres températures, en attendant que le ballon s’équilibre avec l’atmosphère entre chaque expérience. Un exemple d’acquisition est présenté en Fig. 5, pour une température de −8,6 ◦C. Comme expliqué en Sec. 3.1, deux régimes se distinguent : un régime de conduction dans la paroi en verre dont la durée est d’environ 4 s, puis un régime de diffusion dans le gaz d’environ 20 s. Ces temps sont obtenus par ajustement affine du logarithme de la tension réduite Ured (t) = (U (t) − U∞ )/(U0 − U∞ ) sur un intervalle de temps adapté, où U (t) est la tension délivrée par la sortie analogique, U0 la tension initiale, et U∞ la tension atteinte au bout d’un temps infini. Cet ajustement
V.1 Thermométrie à gaz
333
0,0 1 − Ured
1,0 0,8 0,6 0,4 0,2 0,0
ln(Ured )
-0,5 -1,0 -1,5
0
10
15 t (s)
20
20
30
-2,0 -2,5 -3,0
0
5
10
25
30
Fig. 5 Évolution temporelle du logarithme de la tension réduite Ured (t) après lissage (moyenne glissante sur dix points), pour un ballon de 100 mL plongé subitement dans une eau salée à −8,6 °C. Seul un point expérimental sur trente (disque bleu) est montré pour des raisons de visibilité. On distingue une première phase avec une décroissance exponentielle de temps caractéristique de 4 s (ajustement en rouge) puis une seconde phase de temps caractéristique de 20 s (ajustement en vert). Encart : 1 − Ured en fonction du temps t.
correspond à une convergence exponentielle de la température vers la valeur d’équilibre. Pour d’autres températures initiales, ces temps caractéristiques sont du même ordre de grandeur mais peuvent varier jusqu’à 20 %. Aucune dépendance claire du temps de réponse en l’écart en température ne se dégage, suite à l’imprécision et au manque de reproductibilité de l’expérience. La manipulation peut aussi être conduite en sortant subitement le ballon du bain thermostaté puis en enregistrant la relaxation vers la température ambiante au contact de l’atmosphère. Le temps de réponse est alors bien plus long (de l’ordre de 200 s), parce que la convection de l’air autour du ballon est bien moins efficace que la diffusion au contact de l’eau.
4 Limites à la justesse du capteur Divers phénomènes limitent la justesse du capteur. Les fuites thermiques modifient la température du gaz par rapport à la valeur attendue lorsque la température du bain diffère de la température atmosphérique (Sec. 4.1). Nous détaillons ensuite d’autres sources d’erreurs spécifiques au thermomètre à gaz : déviation à l’équation du gaz parfait, pureté du gaz, etc. (Sec. 4.2).
4.1 Fuites thermiques La partie sphérique du ballon plonge dans le milieu de température Tm mais le tube qui le relie au manomètre se trouve au contact de l’environnement, ici l’atmosphère de température Tamb . Ce contact parasite induit des fuites thermiques,
334
Thermodynamique
de sorte que la température mesurée Tc (celle du capteur) diffère de la température à mesurer Tm . En conséquence, la mesure est entachée d’une erreur systématique. Bien qu’ayant une influence minime dans l’expérience proposée, nous montrons dans cette section comment prendre en compte cet effet à l’aide d’un modèle simple pour illustrer comment la justesse d’un thermomètre peut être améliorée. La Fig. 6 schématise la situation : le ballon est plongé dans le bain d’eau thermostaté à la température Tm tandis que le tuyau de raccord au manomètre est au contact de l’atmosphère de température Tatm . Nous faisons les hypothèses suivantes : •
•
les échanges thermiques au niveau des parois du ballon et du tuyau ont atteint un régime stationnaire ; la température du gaz dans le capteur, c’est-à-dire dans le ballon mais aussi dans le tuyau, est uniforme et égale à Tc . Ainsi, la diffusion thermique au sein du gaz n’intervient plus ; seule la paroi en verre contrôle l’intensité des échanges thermiques avec le milieu.
Dans ces conditions, les flux thermiques Φm avec le milieu et Φatm avec l’atmosphère vérifient ( Φm = Gv (Tm − Tc ) , (9) Φatm = Gt (Tatm − Tc ) où Gv = πD2 λv /ev a été introduit en Sec. 3.1. Les flux sont ici comptés positivement lorsque le transfert thermique se fait vers le capteur. La conductance Gt de l’interface tuyau-atmosphère dépend de la conductivité λt des parois du tuyau mais également du coefficient de Newton ht des échanges conducto-convectifs entre la paroi externe du tuyau et l’atmosphère. En revanche, le gaz à l’intérieur du tuyau est confiné dans un espace de quelques millimètres, de sorte que la convection ne peut avoir lieu. En supposant le tuyau cylindrique de longueur Lt , de diamètre dt
Tatm Φatm Φm Tc
Tm
Fig. 6 Représentation schématique des fuites thermiques. Le milieu (bain d’eau thermostaté) est à la température Tm , le gaz du ballon est à Tc et le milieu ambiant (l’atmosphère du laboratoire) à Tatm . Les flux thermiques à l’interface ballon-eau Φm et tuyau-atmosphère Φatm sont comptés positivement dans le sens reçu par le capteur.
V.1 Thermométrie à gaz
335
et d’épaisseur et dt , on a Gt =
πdt Lt . 1/ht + et /λt
(10)
La somme 1/ht + et /λt provient de l’additivité des résistances thermiques de l’interface atmosphère-paroi et de la paroi du tuyau, qui sont disposées en série [9]. Traduisons à présent la constance de l’énergie interne du ballon (gaz et paroi de verre) en régime stationnaire : Gt (Tatm − Tc ) + Gv (Tm − Tc ) = 0.
(11)
La température du capteur se déduit directement de l’Éq. (11), soit Tc =
Gv Tm + Gt Tatm = Tm + α(Tatm − Tm ), Gv + Gt
(12)
où le coefficient correctif vaut α = 1/(1+Gv /Gt ). La température mesurée Tc diffère ainsi de la température du milieu Tm par un terme correctif α(Tatm − Tm ). Ce biais est d’autant plus faible que : • •
l’écart entre la température du milieu et celle de l’atmosphère est faible ; le rapport des conductances thermiques Gt /Gv est petit (les échanges avec l’atmosphère se font difficilement, et ceux avec le milieu se font facilement).
Avec le matériel utilisé, nous trouvons un coefficient correctif α100 ' 2 × 10−2 pour un ballon de volume 100 mL et α500 ' 6 × 10−3 pour un ballon de volume 500 mL. Les caractéristiques du tuyau en plastique sont ht ' 20 W·m−2 ·K−1 , λt ' 1 W·m−1 ·K−1 [10] ; Lt = (325 ± 1) mm, et = (1,0 ± 0,1) mm et dt = (5,5 ± 0,1) mm sont mesurés au pied à coulisse. La condition et dt n’est pas strictement valable ici, mais nous ne cherchons qu’à établir un ordre de grandeur du biais en pression. Ce dernier croît avec la pression, et est plus important pour le ballon de plus faible volume : s100 α100 (Tm − Tatm ) ' 5 hPa pour Tm = 100 ◦C, ce qui est petit devant l’incertitude constructeur du manomètre de l’ordre de 16 hPa. Nous concluons que les incertitudes de mesure de l’expérience dominent ; l’effet des fuites thermiques peut être négligé en très bonne approximation.
4.2 Sources d’erreur spécifiques au thermomètre à gaz Correction à la loi du gaz parfait Nous avons considéré que l’air dans le ballon se comporte comme un gaz parfait, mais les interactions moléculaires et les effets de volume exclu sont observables par des mesures suffisamment précises. Ces phénomènes modifient l’équation d’état, qu’il est possible de représenter par un développement en puissances de la densité, appelé développement du viriel [1, 2] : " 2 !# nV0 p n n = 1 + B1 (T ) + O , (13) RT V V V avec V0 = NA v0 , où v0 désigne le volume molaire et NA le nombre d’Avogadro. Les coefficients du viriel Bi (T ) dépendent de la température T et sont tabulés pour
336
Thermodynamique
B1 (cm3 · mol−1 )
100 0
-100 H2 N2 O2
-200 -300
0
100
200
300 400 T (K)
500
600
700
Fig. 7 Valeurs tabulées du coefficient du viriel B1 du développement en densité en fonction de la température T pour les gaz H2 , N2 et O2 [10]. Les lignes brisées servent simplement de guide pour l’œil.
de nombreux gaz. C’est le cas du dihydrogène H2 , utilisé dans le thermomètre à hydrogène, mais également des constituants principaux de l’air, le diazote N2 et le dioxygène O2 (voir Fig. 7). Le premier coefficient du viriel B1 est de l’ordre de ±10 cm3 ·mol−1 sur la gamme de température explorée dans cette expérience pour le diazote et le dioxygène. Puisque V /n ' 2 × 104 cm3 ·mol−1 à température ambiante, le premier terme correctif donné par le développement du viriel est 2000 fois plus faible que le terme dominant. Cet effet est donc indétectable dans l’expérience proposée, et justifie l’utilisation de l’équation d’état du gaz parfait. La thermométrie de précision utilise le dihydrogène parce qu’il se comporte en très bonne approximation comme un gaz parfait sur une gamme de température plus large que d’autres gaz. Malgré cela, les laboratoires de métrologie prennent en compte cette déviation à la loi du gaz parfait, en particulier à basse température, en vue d’obtenir des mesures précises. Composition du gaz Déterminer de façon absolue la température d’un gaz à partir de sa pression requiert de connaître sa composition. Or l’air contient une faible proportion de vapeur d’eau. En assimilant l’air humide à un mélange idéal de gaz parfaits, le gaz à l’intérieur du ballon vérifie l’Éq. (2), mais la quantité de matière n désigne alors la somme de la quantité ns d’air sec et celle nvap de vapeur d’eau. De même, la pression totale est la somme des pressions partielles en air sec ps et en vapeur d’eau pvap , soit p = ps + pvap . Si l’air humide de température T est enfermé dans un récipient de volume V connu, la loi des gaz parfaits se réécrit p=
(ns + nvap ) RT . V
(14)
Pour que le thermomètre puisse servir de capteur absolu, il faut déterminer la quantité de matière en mesurant la masse de gaz m = ns Ms + nvap Mvap , où Ms et Mvap désignent les masses molaires de l’air sec et de vapeur, respectivement. Or,
V.1 Thermométrie à gaz
337
si l’on croyait peser de l’air sec, dont la quantité de matière serait m/Ms , on en déduirait à tort la température Ms pV Ms nvap (Ms − Mvap ) Teff = =T (ns + nvap ) = T 1 + . (15) m R m m Pour indiquer la quantité de vapeur d’eau dans l’air, il est courant d’utiliser le degré hygrométrique, ou humidité relative ϕ = pvap /psat , où psat désigne la pression de vapeur saturante de la vapeur d’eau. Une humidité relative nulle indique un air sec, tandis qu’une humidité relative égale à 1 indique de l’air saturé. En faisant apparaître ϕ dans l’expression de nvap = pvap V /RT , on peut montrer que l’erreur commise sur l’estimation de la température se met sous la forme ϕ psat Mvap ϕ psat V (Ms − Mvap ) ' 1− . (16) Teff − T = mR s Ms L’humidité relative et la pression de vapeur saturante dépendent des conditions atmosphériques au moment du remplissage du ballon. Pour une température de 20 ◦C, psat = 23,4 hPa [10], et pour une humidité typique ϕ = 0,7 nous obtenons une erreur systématique sur la température d’environ 2 K. Une mesure absolue de température (sans étalonnage) doit prendre en compte cet effet. L’humidité de l’air n’est donc pas un problème en soi si le thermomètre est étalonné, ou si la valeur absolue de la température est corrigée, connaissant psat et ϕ. Dans le cas contraire, il en résulte une erreur systématique sur la mesure. C’est pourquoi la composition des thermomètres de précision est parfaitement contrôlée, comme dans le cas du thermomètre à hydrogène [8]. Le dihydrogène, issu de l’électrolyse de l’eau, est purifié par catalyse sur palladium ou charbon actif [11]. Constitution du capteur La constitution du thermomètre contribue également aux sources d’erreur. Dans les thermomètres normaux à hydrogène, la dilatation ou la contraction des parois du récipient ne sont pas contrôlables, et contribuent à l’incertitude de mesure. L’existence de zones mortes, c’est-à-dire de volumes de gaz dans les tubes de jonction dont la température diffère de celle du reste du gaz, conduit aussi à des erreurs de mesure. Les incertitudes associées restent en général inférieures à quelques dizaines de millikelvins [11]. Le thermomètre à gaz est un exemple de thermomètre primaire, dont la justesse limitée – que ce soit par les fuites thermiques, l’écart à l’idéalité du gaz, etc. – peut être améliorée par étalonnage. Dans ce cas, il est utilisé comme thermomètre secondaire, tout comme les thermomètres électriques, bien plus courants dans les applications industrielles et pratiques ; ces derniers sont aussi moins encombrants et fonctionnent sur une plus grande plage de température. Nous étudions ce type de thermomètres dans l’Exp. V.2, « Thermométrie électrique ».
Références [1]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Thermodynamique. Hermann, 2007.
338
Thermodynamique
[2]
M. Bertin, J.-P. Faroux et J. Renault, Thermodynamique. Dunod, 1976.
[3]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Physique statistique. Hermann, 1996.
[4]
L. Quaranta et J. Donnini, Dictionnaire de physique expérimentale (tome 2), thermodynamique et applications. Pierron, 1997.
[5]
G. Asch, Les capteurs en instrumentation industrielle, 7e éd. Dunod, 2010.
[6]
F. Cabannes, « Pyrométrie optique, » Techniques de l’ingénieur. Mesures et contrôle, (R2610), 1990.
[7] Bureau International des Poids et Mesures. (1990). Échelle Internationale de Température de 1990, adresse : https://www.bipm.org/utils/ common/pdf/ITS-90/EIT-90.pdf. [8]
G. Bruhat et A. Kastler, Thermodynamique. Masson et Cie, 1968.
[9]
C. Garing, Ondes mécaniques et diffusion. Ellipses, 1998.
[10]
W. Haynes, CRC handbook of chemistry and physics, 95e éd. CRC Press, 2014.
[11]
S. Aoyama et E. Kanda, « Determination of fixed points in the low temperature with a hydrogen thermometer, » Bull. Chem. Soc. Jap., 10 (10), p. 472-481, 1935.
V.2
Thermométrie électrique
Dans cette expérience, nous étudions trois thermomètres secondaires de type électrique : une sonde de platine, une thermistance et un thermocouple. Pour chaque thermomètre, nous détaillons le mécanisme physique sur lequel repose la mesure indirecte de température à partir d’une grandeur électrique (variation de la résistance de la sonde de platine et de la thermistance, et variation de la tension aux bornes du thermocouple), puis nous déterminons sa caractéristique et son temps de réponse. Nous montrons également comment corriger l’auto-échauffement lors d’une mesure de résistance, afin d’améliorer la justesse du capteur. Pour une introduction à la thermométrie, on consultera l’Exp. V.1, « Thermométrie à gaz ».
Sommaire 1 2 3
Sonde de platine et thermistance . . . . . . . . . . . . 339 Thermocouples . . . . . . . . . . . . . . . . . . . . . . 347 Temps de réponse . . . . . . . . . . . . . . . . . . . . 352
1 Sonde de platine et thermistance 1.1 Description des capteurs Les thermomètres à variation de résistance sont des capteurs passifs qui tirent profit de la dépendance en température de la résistivité d’un matériau. La résistance peut se mesurer à l’ohmmètre, ce qui en fait des capteurs pratiques et simples d’utilisation. Nous étudions deux types de thermomètres à variation de résistance : la sonde de platine Pt100 et la thermistance CTN. 1.1.1 La sonde de platine Description Une sonde Pt100 (illustrée sur la Fig. 1) est constituée d’un fil de platine, enroulé dans une gaine protectrice en céramique (ou en verre) et une enveloppe métallique qui assure la conduction thermique sur toute la longueur du capteur. Les dimensions du fil sont ajustées de sorte que sa résistance soit de 100 Ω à 0 °C. Cette valeur est purement conventionnelle : la Pt100 est la plus courante mais il existe également des Pt1000 et des Pt25. La résistance d’un métal varie généralement de façon monotone sur un large intervalle de température : c’est le cas du platine dont la résistance peut servir de grandeur thermométrique sur une large gamme d’utilisation, qui dépend de la précision recherchée, mais s’étend typiquement de −200 °C à 800 °C. Le platine est préféré aux autres métaux parce qu’il peut être obtenu très pur, de sorte que sa résistivité ne varie pas d’un échantillon à un autre, et qu’il est inerte chimiquement, ce qui permet de fixer ses propriétés électriques durablement et avec précision [1]. 339
340
Thermodynamique
enveloppe m´etallique
fils de connexion
gaine (c´eramique) fil de platine
Fig. 1 Schéma d’une sonde de platine, inspiré de la Réf. [1]. La gaine protectrice sert de matrice dans laquelle le fil de platine s’enroule à une extrémité du tube. De l’autre extrémité partent les fils de connexion (deux ou quatre suivant le modèle).
D’autres métaux sont parfois utilisés, notamment le nickel qui possède une meilleure sensibilité mais s’oxyde facilement ; ou le cuivre, dont la linéarité est excellente mais qui souffre d’une faible résistivité et d’une forte sensibilité à la corrosion [1, 2].
Plusieurs phénomènes limitent la performance d’une sonde de platine. La faible conductivité thermique de la gaine protectrice augmente sensiblement le temps de réponse du capteur. Du fait de sa taille (10 cm de long pour 1 cm de diamètre), ce type de capteur est peu fin et peut perturber le milieu étudié. Les laboratoires d’enseignement utilisent couramment des sondes de classe C, dont la tolérance industrielle est de 0,6 °C + 0,01 T . Cette dernière est de 0,15 °C + 0,002 T pour les sondes les plus précises (classe A) [3]. La tolérance industrielle correspond à un intervalle de confiance élargi par rapport à l’incertitude-type (99 % au lieu de 68 %). Mécanisme de conduction La résistivité d’un métal provient du « freinage » des électrons de conduction, d’une part, par absorption d’ondes de déformation du réseau cristallin (les phonons), d’autant plus nombreuses que l’agitation thermique est élevée ; d’autre part, par diffusion sur les impuretés, ou autres défauts cristallins [4]. Ces deux effets s’ajoutent : la résistivité totale ρ(T ) s’écrit donc ρ(T ) = ρp (T ) + ρi ,
(1)
où ρp (T ) et ρi sont les contributions des phonons et des impuretés, respectivement (loi de Matthiessen). Les échantillons de qualité industrielle sont suffisamment purs pour que ρi ne dépende pas de la température. À très basse température (au-dessous de 10 K), la contribution des impuretés domine, de sorte que ρ(T ) ' ρi ne dépend pas de T . Le comportement de la résistivité à plus haute température est dominé, au contraire, par les phonons, et dépend fortement de l’intensité des liaisons atomiques. L’énergie maximale ED des phonons définit une température caractéristique TD = ED /kB , appelée température de Debye [5], qui sépare deux régimes. À basse température (T < TD ), la contribution des phonons varie comme ρp (T ) ∝ T 5 (loi de Grüneisen). À haute température (T > TD ), le théorème d’équipartition de l’énergie conduit à une dépendance linéaire, soit ρp (T ) ∝ T . Or, la température de Debye du platine (−33 ◦C) est inférieure aux températures que nous explorons. La résistance R ∝ ρ s’écrit donc R = R0 (1 + aθ),
(2)
V.2 Thermométrie électrique
341
où θ désigne la température exprimée en degrés Celsius et R0 = 100 Ω pour une Pt100. L’Échelle internationale pratique des températures préconise la valeur a = 3,9083 × 10−3 (◦ C)−1 pour la sensibilité relative [3]. Des corrections à l’Éq. (2) d’ordres supérieurs en θ sont aussi proposées dans la Réf. [3] pour un étalonnage plus précis sur une large gamme de température. Elles proviennent de l’écart à la variation affine de la résistivité avec la température et de la dilatation thermique du métal. Toutefois, l’Éq. (2) inclut l’influence de la dilatation thermique à l’ordre le plus bas, puisqu’un échantillon de résistivité ρ = ρ0 (1 + αθ), de longueur l = l0 (1 + λθ) et de section S = S0 (1 + λθ)2 , où λ désigne le coefficient de dilatation linéaire, possède une résistance R = ρl/S ' R0 (1 + (α − λ)θ) avec R0 = ρ0 l0 /S0 .
1.1.2 Les thermistances Description Les thermistances sont des pastilles d’oxydes semi-conducteurs dopés dont la résistance dépend sensiblement de la température. En fonction de la nature du matériau, on en distingue deux types. • Les CTN (pour coefficient de température négatif) ont une sensibilité négative, ce qui signifie que la résistance décroît avec la température. La forte décroissance de la résistance à basse température fait des thermistances CTN des capteurs très sensibles. • Les CTP (pour coefficient de température positif) ont une sensibilité positive sur un domaine étroit de température, typiquement entre 0 °C et 100 °C. Celles au titanate de baryum sont principalement utilisées comme capteurs ; celles au polymère-carbone comme fusibles. L’échauffement par effet Joule de ces pastilles, qui sont de petite taille (quelques millimètres), induit des erreurs systématiques importantes suite au passage du courant de mesure, lors d’une mesure unique 1 : les thermistances sont donc peu utilisées comme thermomètres de précision. La Fig. 2(a) montre l’allure de la courbe résistance-température des deux types de thermistances [3]. Mécanisme de conduction Dans un semi-conducteur, tout comme dans un isolant de bande, une bande interdite de largeur énergétique Eg (de l’anglais gap) sépare la bande de conduction de la bande de valence, comme représenté sur la Fig. 2(b). Au zéro absolu, la bande de valence est complètement remplie et celle de conduction complètement vide. À température non nulle, des électrons sont excités vers le bord inférieur de la bande de conduction (d’énergie Ec ), laissant la place à des trous au bord supérieur de la bande de valence (d’énergie Ev ). Les valeurs de Eg = Ec − Ev pour quelques semi-conducteurs sont données dans le Tab. 1. Le nombre de porteurs de charge (électrons de conduction et trous) augmente avec l’énergie d’agitation thermique kB T . En effet, la probabilité qu’un électron occupe un état d’énergie E à la température T , au potentiel chimique µ (indéterminé pour l’instant) suit la loi de Fermi-Dirac [5] 1 fe (E) = . (3) (E−µ)/k BT 1+e 1. On s’affranchit de cet échauffement en effectuant plusieurs mesures à des courants différents (Sec. 1.2.1).
342
Thermodynamique
(a)
(b)
R
E CTN
CTP Ec
conduction Eg
Ev 0
valence
T (◦ C)
100
kB T 0
1
fe
Fig. 2 (a) Allure de la caractéristique résistance-température d’une CTN (rouge) et d’une CTP (bleue). (b) Bandes d’énergie d’un semi-conducteur. Les électrons occupent presque entièrement la bande inférieure (de valence), tandis que la bande supérieure (de conduction) ne contient qu’une faible proportion d’électrons excités thermiquement, répartis selon la distribution de Fermi-Dirac fe de l’Éq. (3). Les porteurs de charge, figurés par le dégradé rose, sont d’autant plus nombreux dans la bande de conduction que kB T est proche de l’énergie de gap Eg (Tab. 1).
Déterminons maintenant la loi d’évolution de la résistance d’un semi-conducteur, moyennant quelques hypothèses simplificatrices. Notons ne et nh les concentrations (nombres par unité de volume) d’électrons de conduction et de trous, respectivement. En présence d’un champ électrique, les trous (de charge positive) se déplacent dans le sens du champ, et les électrons (de charge négative), dans le sens opposé. Seuls ces deux types de porteurs contribuent à la conductivité, qui s’écrit σ = qe (ne µe + nh µh ),
(4)
où qe désigne la charge élémentaire et µe,h (à ne pas confondre avec le potentiel chimique µ) sont les mobilités des électrons et des trous, c’est-à-dire le rapport de la vitesse moyenne de déplacement et du champ électrique [4]. Pour déterminer comment évolue la résistance de ces matériaux avec la température, nous devons comprendre comment la concentration en porteurs de charge, d’une part, et leur mobilité, d’autre part, varient avec la température. Puisqu’un trou se définit par l’absence d’un électron dans la bande de valence, la distribution en trous vaut fh = 1 − fe . Au voisinage de Ec et de Ev , l’énergie Élément
InSb
PbTe
Ge
Si
GaAs
ZnSe
C (diamant)
Eg (eV) µe (cm2 ·V−1 ·s−1 ) µh (cm2 ·V−1 ·s−1 )
0,16 78000 750
0,63 2100 840
0,67 3600 1700
1,12 1200 250
2,58 8800 400
1,35 540 28
5,4 1800 1400
Tab. 1 Énergie de gap Eg , et mobilité des électrons de conduction µe et des trous µh pour divers isolants de bande et semi-conducteurs à T = 300 K [4, 6]. À titre de comparaison, l’énergie d’agitation thermique vaut kB T ' 0,025 eV.
V.2 Thermométrie électrique
343
se développe au second ordre en vecteur d’onde : E(k) = Ec,v ± ~2 k 2 /2me,h , ce qui définit les masses effectives me,h . Introduisons la densité d’états, c’est-à-dire le nombre d’états √ accessibles aux porteurs par unité d’énergie, qui vaut √ρe (E) = 4π(2me /h2 )3/2 E − Ec pour les électrons et ρh (E) = 4π(2mh /h2 )3/2 Ev − E pour les trous. En multipliant la densité d’états de chaque type de porteur par sa distribution fe,h et en intégrant sur la bande de conduction (resp. de valence), il vient 2 ( ne ' 2[λe (T )]−3 e−(Ec −µ)/kB T . (5) nh ' 2[λh (T )]−3 e−(µ−Ev )/kB T
où λe,h (T ) = h(2πme,h kB T )−1/2 est la longueur de de Broglie du porteur de masse effective me,h , et h la constante de Planck. En effet, l’énergie d’agitation thermique kB T s’échelonne de 24 meV à 32 meV sur une gamme de mesure de 0 °C à 100 °C : elle est donc faible devant Eg , si bien que la distribution des porteurs de charge de l’Éq. (3) se réduit à celle de Boltzmann dans les bandes de conduction et de valence 3 , soit fe (E) ' e−(E−µ)/kB T et fh (E) ' e−(µ−E)/kB T . Le facteur 2 de l’Éq. (5) tient compte de la dégénérescence de spin. Les masses effectives des porteurs varient énormément d’un matériau à l’autre, et s’échelonnent de une à vingt fois la masse de l’électron [4]. Il reste à relier la concentration en électrons de conduction à celle en trous. L’équilibre chimique entre les atomes qui cèdent des électrons et ceux qui en captent impose la loi d’action de masse ne nh = n2i , où la concentration intrinsèque ni est une propriété du matériau pur. Dans le cas d’un semi-conducteur dépourvu d’impuretés, qualifié d’intrinsèque, chaque électron promu dans la bande de conduction laisse un unique trou dans la bande de valence, d’où l’on tire ne = nh = ni . En supposant en outre que me = mh , le potentiel chimique se situe alors au milieu des bandes (ce qui justifie a posteriori l’utilisation de la distribution de Boltzmann), soit Ec − µ = µ − Ev = Eg /2.
(6)
Si les masses effectives diffèrent, le potentiel chimique dépend de la température, suivant la relation µ(T ) = Ev + Eg /2 + (3/4)kB T ln(mh /me ) [4].
Ainsi, on a ni (T ) = 2[λe,h (T )]−3 exp(−Eg /2kB T ). Enfin, dans un matériau pur, l’absorption des phonons domine les autres mécanismes de freinage des porteurs, de sorte que la mobilité varie comme T −3/2 et compense exactement la variation de [λe,h (T )]−3 [4]. La résistance R ∝ σ −1 d’un semi-conducteur intrinsèque s’écrit finalement R(T ) = R∞ eEg /2kB T .
(7)
La grandeur R∞ est constante si l’on néglige la dilatation thermique. En contrôlant la présence d’impuretés par ajout d’une faible quantité d’atomes étrangers, soit donneurs d’électrons (dopage N), soit accepteurs d’électrons (dopage P), il est possible d’améliorer les propriétés conductrices [4]. Le semi-conducteur est alors qualifié d’extrinsèque. La diffusion sur les impuretés chargées engendre cette fois une ´ √ 2 2. On donne pour β > 0, 0∞ x2 e−βx dx = π/4β 3/2 . 3. Comme montré plus loin, le potentiel chimique se situe au milieu des bandes.
344
Thermodynamique
dépendance en T 3/2 dans la mobilité [7]. Pour les CTP (formées de semi-conducteurs extrinsèques), R∞ dépend fortement de T , contrairement aux CTN, très peu dopées.
1.2 Étude expérimentale Les sondes de platine Pt100 et les thermistances CTN sont deux capteurs à variation de résistance ; nous mesurerons donc leurs caractéristiques à l’aide du même montage. Nous montrons comment compenser l’erreur systématique induite par l’effet Joule afin d’améliorer la justesse de la mesure. Puis, nous présentons le protocole commun et vérifions que les Éq. (2) et (7) décrivent correctement les caractéristiques expérimentales. 1.2.1 Compensation de l’auto-échauffement Mesurer une résistance nécessite d’imposer un courant d’intensité I dans le composant et de mesurer la tension à ses bornes. Il en résulte un échauffement du capteur par effet Joule : la température Tc (I) du capteur n’est pas égale à la température T du milieu. L’erreur systématique ∆T = Tc (I)−T s’obtient par un bilan de puissance sur la partie conductrice du capteur (fil ou pastille) en régime stationnaire : ∆T = Rth RI 2 ,
(8)
où Rth est la résistance thermique de l’interface entre le capteur et le milieu (généralement mal connue), et RI 2 la puissance dissipée par le capteur de résistance R. La température d’une sonde Pt100 de résistance thermique Rth ' 70 K·W−1 [1] augmente de ∆T ' 0,7 K pour un courant d’intensité I = 10 mA.
Réduire I permet d’atténuer l’auto-échauffement et donc d’augmenter la justesse du capteur. Malheureusement, plus le courant envoyé est faible, plus l’incertitude sur la température mesurée est élevée. En effet, supposons pour simplifier que la précision soit uniquement limitée par la résolution δI sur l’intensité que débite le générateur, de sorte que l’incertitude sur la résistance se réduise à δR = RδI/I. En notant δT l’incertitude sur T , et s = δR/δT la sensibilité, il vient δT = RδI/Is, puis en utilisant l’Éq. (8), (δT )2 ∆T =
Rth R3 (δI)2 . s2
(9)
Pour un capteur et une résistance thermique donnés, le terme de droite de l’Éq. (9) est indépendant de l’intensité du courant. Améliorer la justesse (diminuer ∆T ) se fait donc au détriment de la précision (δT augmente), ce qui impose une limite fondamentale sur la fidélité du capteur. Il est possible de contourner ce problème en mesurant la résistance pour deux intensités I1 et I2 différentes [1]. Soit R(T, I) la résistance du capteur parcouru par un courant d’intensité I au contact du milieu de température T , et R(T ) = R(T, 0) cette même résistance en l’absence de courant (lorsque températures du capteur et du milieu coïncident). Au premier ordre en ∆T /T , il vient R(T, I) − R(T ) ' s∆T ' sRth R(T, I)I 2 .
(10)
V.2 Thermométrie électrique
345
À partir de deux mesures aux intensités I1 et I2 = αI1 , on peut éliminer l’inconnue sRth pour obtenir la résistance à courant nul [8] R(T ) =
(α2 − 1)R(T, I2 )R(T, I1 ) . α2 R(T, I2 ) − R(T, I1 )
(11)
L’Éq. (11) corrige le biais induit par l’auto-échauffement, en estimant la résistance R(T ) qu’aurait le capteur dans un milieu de température T en l’absence de courant. 1.2.2 Choix du circuit et protocole La résistance d’un thermomètre électrique peut se mesurer soit directement à l’ohmmètre (mais alors il n’est pas possible de contrôler le courant envoyé), soit par mesure simultanée de l’intensité et de la tension aux bornes du composant. Nous utilisons la seconde méthode puisque corriger l’auto-échauffement nécessite de mesurer deux intensités I1 et I2 connues et stables. Le thermomètre est directement alimenté par un générateur continu de courant. Nous intégrons le composant dans le montage 4 fils de la Fig. 3(b). Facile à mettre en œuvre, ce circuit permet une mesure précise en s’affranchissant des résistances du câblage [2]. Il comprend deux paires indépendantes de bornes reliées au thermomètre : la première sert à mesurer la tension, et la deuxième l’intensité imposée par le générateur. D’autres circuits sont envisageables. Si le thermomètre ne possède qu’une paire de bornes, on branchera le voltmètre en parallèle du thermomètre. Ce montage, dit 2 fils à courte dérivation, est moins précis parce que la résistance des câbles (d’environ 1 mΩ) s’ajoute à celle du thermomètre, ce qui induit une erreur systématique [2]. Bien que négligeable pour la Pt100, cet effet se voit aisément sur une CTN à haute température. Le montage à pont de Wheatstone permet une mesure précise de la tension en ajustant la résistance variable d’un pont à trois ou quatre résistances pour annuler la tension différentielle [9]. Le câblage n’induit pas d’erreur systématique mais les résistances parasites de contact subsistent.
Le protocole s’appuie sur le montage de la Fig. 3. Préparer le bain thermostaté comme en Fig. 3(a). Un thermoplongeur chauffe l’eau, dont la température T est mesurée par un thermomètre étalon. Plonger la Pt100 et la CTN dans le bain thermostaté, et monter le circuit 4 fils 4 comme en Fig. 3(b). Si un des thermomètres ne possède pas les quatre bornes nécessaires à une mesure 4 fils (comme la CTN dans notre cas), le brancher simplement dans un montage à deux fils. Une fois la température de consigne atteinte, brancher à tour de rôle la Pt100 et la CTN dans le circuit. Mesurer aux multimètres les tensions U1 et U2 aux bornes du thermomètre pour deux intensités I1 ' 1 mA et I2 ' 5 mA. En négligeant le courant de fuite dans le voltmètre (sa résistance étant de l’ordre de 1 MW), on détermine ensuite les résistances R(T, I1 ) = U1 /I1 et R(T, I2 ) = U2 /I2 . Faire varier la température de consigne pour réaliser un point tous les 5 °C ou 10 °C environ. 4. On choisira un montage courte dérivation parce que les valeurs des résistances des capteurs sont inférieures à 1 kW (voir le Comp. B de l’Exp. III.3, « Transformateur électrique monophasé »).
346
Thermodynamique
(a)
(b)
A
thermomètre étalon thermoplongeur Pt100 CTN
I
V U
a
R(T, I) milieu
Fig. 3 (a) Montage de mesure de la caractéristique de la Pt100 et de la CTN. (b) Circuit 4 fils dans lequel s’insère chaque thermomètre (rectangle central) pour mesurer sa résistance R(T, I) en fonction de la température T du milieu. La tension aux bornes d’une résistance de 100 Ω parcourue par un courant de 5 mA est de 500 mV. Cette valeur peut être mesurée directement au voltmètre. Il est donc suffisant d’imposer des intensités de quelques milliampères.
Pour obtenir des températures inférieures à 0 °C, réaliser les mêmes mesures dans un cristallisoir contenant un mélange eau-glace avec une forte proportion en NaCl 5 . 1.2.3 Résultats et discussion La résistance R est déterminée par l’Éq. (11) et représentée en fonction de la température du bain thermostaté sur les Fig. 4(a) et 4(b) pour la Pt100 et la CTN, respectivement. Le thermomètre étalon est de précision 0,003 θ + 1 °C, avec θ la température en ◦C. L’incertitude sur les grandeurs électriques est dominée par les fluctuations de la valeur affichée, soit ∆U = 0,1 mV pour la tension et ∆I = 0,01 mA pour l’intensité. Nous ajustons les données par une droite, selon l’Éq. (2) pour la Pt100, et selon l’Éq. (7) pour la CTN par passage au logarithme. La résistance de la Pt100 vaut R0 = (102,5 ± 0,6) Ω à 0 °C, pour une sensibilité relative a = (3,82 ± 0,19) × 10−3 (◦C)−1 , en accord avec la valeur tabulée de la Sec. 1.1.1. La CTN a une résistance à température infinie R∞ = (2,8 ± 0,2) mΩ et une énergie de gap Eg = (508 ± 4) meV proche de celui du germanium (Tab. 1). La composition exacte de la pastille semi-conductrice est inconnue, d’où l’impossibilité de comparer à une valeur d’énergie de gap tabulée. La sensibilité relative d’une Pt100 dépend peu de la température, et vaut srel Pt100 ' 4 × 10−3 (◦C)−1 à température ambiante. Les thermistances CTN ont une sensibi2 lité relative dix fois plus élevée dans les mêmes conditions : srel CTN = −Eg /2kB T ' −2 ◦ −1 −4 × 10 ( C) , et qui croît rapidement en valeur absolue vers les basses températures. Elles sont en contrepartie moins précises que les sondes métalliques. Les thermistances sont de plus des thermomètres fins (quelques millimètres de diamètre), qui sont donc peu sensibles aux fuites thermiques. Les sondes de platine sont plus volumineuses, et des erreurs systématiques importantes peuvent entacher 5. L’eutectique NaCl-eau se situe vers −21 ◦C, pour un titre massique en sel d’environ 0,23 [6].
V.2 Thermométrie électrique (b) 300 250
120 RCTN (Ω)
RPt100 (Ω)
130
110 100
200 150 100
ln(RCTN /1 Ω)
(a)
347
6 5 4 3 3 3,5 4 T −1 (10−3 K−1 )
50
90 -20 -10 0 10 20 30 40 50 60 70 θ (◦ C)
0 -20 -10 0 10 20 30 40 50 60 70 θ (◦ C)
Fig. 4 Résistance R du capteur à courant nul, en fonction de la température θ = T − 273,15 (en ◦C). (a) Pt100 : la courbe pleine est la régression affine RPt100 = aPt θ + bPt avec aPt = (0,392 ± 0,017) Ω·(◦C)−1 et bPt = (102,5 ± 0,6) Ω. (b) CTN : la courbe pleine est la régression affine présentée en encart ln(RCTN /1 Ω) = aCTN T −1 + bCTN , avec aCTN = (2,94 ± 0,02) × 103 K et bCTN = −5,87 ± 0,07.
la mesure si elles ne plongent pas suffisamment dans le milieu. C’est pourquoi les sondes sont enrobées d’une couche métallique, qui assure une bonne conduction thermique vers la partie haute non immergée ; en pratique il suffit de plonger le modèle de sonde que nous utilisons sur 2 cm pour avoir une erreur inférieure à 0,5 % sur la température mesurée.
2 Thermocouples Un thermocouple désigne une série de jonctions entre métaux de natures différentes, dont la tension aux bornes dépend de la différence de température entre les jonctions par effet Seebeck [8]. Contrairement à la sonde de platine et aux thermistances, la grandeur thermométrique d’un thermocouple est une tension, et non une résistance. Nous expliquons l’effet Seebeck puis déterminons expérimentalement la caractéristique d’un thermocouple de type K à deux soudures.
2.1 Effet Seebeck Dans un métal de conductivité σ soumis à des gradients de potentiel électrique V et de température T , la densité de courant électrique a pour expression [8] je = −σ∇V − εσ∇T.
(12)
Si le premier terme vient de la loi d’Ohm, le second est plus inhabituel : il s’explique par la dépendance du potentiel chimique des porteurs de charge en la température, qui induit un déplacement (et donc un courant) des régions de fort potentiel chimique vers les régions de bas potentiel chimique, lorsque la température est inhomogène. L’intensité de cet effet est donnée par le coefficient Seebeck ε, qui dépend
348
Thermodynamique
Type Matériaux Gamme (°C) Précision
K
T
E
J
NiCr/NiAl −200 à 1000 0,1 ◦C < 200 °C 1 °C au-delà
Cu/CuNi −200 à 350 0,1 ◦C
NiCr/CuNi −200 à 870 0,1 °C < 300 ◦C 1 ◦C au-delà
Fe/CuNi 0 à 760 0,5 °C < 300 ◦C 2 ◦C au-delà
Tab. 2 Thermocouples couramment utilisés avec leur désignation internationale, couple de matériaux A et B utilisé, gamme d’utilisation en usage continu, et précision correspondante [3]. Les alliages NiCr, NiAl et CuNi se nomment respectivement chromel, alumel et constantan.
de T . En circuit ouvert (je = 0), un gradient de température engendre un champ électrique − ∇V = ε∇T. (13)
Ce phénomène thermoélectrique se nomme effet Seebeck. D’après l’Éq. (13), une tension peut émerger entre deux points de même température, si ces points appartiennent à des matériaux A et B de coefficients Seebeck εA et εB différents. Cet effet peut être mis à profit pour réaliser un capteur de température, appelé thermocouple, dont les plus courants sont présentés dans le Tab. 2. Plusieurs façons de réaliser un thermocouple existent en fonction du nombre de soudures, c’est-à-dire du nombre de jonctions entre matériaux différents maintenues à la température, soit du milieu, soit de référence, comme illustré en Fig. 5. On pourra consulter la Réf. [8] pour plus de détails sur la discussion qui suit. Le thermocouple à une soudure constitue le montage le plus simple (Fig. 5(a)). La soudure A-B est à la température T à mesurer, la jonction A-voltmètre J1 est à la température TJ1 et la jonction B-voltmètre J2 est à la température TJ2 . La (a)
(b)
(c)
V
V
Tamb
Tamb
TJ1 •
• TJ2
A
B •
V
T milieu
Tamb
TJ1 •
• TJ2
B
A •
T0 r´ef.
A
A •
T milieu
•
T0 r´ef.
B •
T milieu
•
T0 r´ef.
Fig. 5 Principe d’un thermocouple à (a) une, (b) deux et (c) trois soudures. Le milieu est à la température T , la soudure de référence à la température fixe T0 . Les cercles noirs représentent les jonctions entre les matériaux A et B du thermocouple, ou le cuivre des câbles de raccord au voltmètre (en noir).
V.2 Thermométrie électrique
349
´J tension e = J12 dV mesurée par le voltmètre (que l’on appelle force électromotrice, ou f.é.m.) s’écrit en toute généralité ˆ TJ1 ˆ T ˆ TJ2 ˆ Tamb 0 0 0 e= −εCu dT + −εA dT + −εB dT + −εCu dT 0 Tamb
=
ˆ
TJ2
TJ1
TJ1
(εCu − εA ) dT 0 +
ˆ
T
T
TJ2
TJ2
(14)
(εB − εA ) dT 0 ,
avec εCu le coefficient Seebeck du cuivre (câbles du voltmètre). Si TJ1 6= TJ2 , la première intégrale dans la dernière égalité de l’Éq. (14) induit une tension parasite. Pour un écart de température aussi élevé que 1 ◦C autour de 25 ◦C, cette tension parasite (de l’ordre du microvolt) est faible devant les tensions mesurées (de l’ordre du millivolt). Même lorsque TJ1 = TJ2 = Tamb , la tension, et donc la température mesurée, dépend de la température ambiante, qui peut fluctuer entre deux mesures. Un étalonnage est donc nécessaire avant chaque utilisation. Le thermocouple à deux soudures résout le problème de dépendance avec la température ambiante en imposant une température de référence fixe T0 à une des soudures, l’autre étant à la température T à mesurer (Fig. 5(b)). La soudure de référence plonge en général dans un bain eau-glace à T0 = 0 °C. La f.é.m. s’écrit alors ˆ T ˆ TJ2 (εCu − εA ) dT 0 + (εA − εB ) dT 0 . (15) e= T0
TJ1
Le problème de tension parasite, bien que négligeable en pratique, est résolu par le thermocouple à trois soudures. Celui-ci possède deux soudures à la température de référence T0 , et une soudure centrale à la température T (Fig. 5(c)). La f.é.m s’exprime dans ce cas ˆ T e= (εB − εA ) dT 0 . (16) T0
Dans la suite nous choisissons le montage à deux soudures, qui offre un compromis appréciable entre simplicité et précision. De plus, nous utiliserons un thermocouple de type K, qui possède une bonne linéarité entre 0 °C et 1000 °C (le coefficient Seebeck est quasiment constant) [1]. Nous plongeons la soudure de référence dans un bain eau-glace à T0 = 0 ◦ C, de sorte que T − T0 = θ s’identifie à la température exprimée en degrés Celsius. Un développement limité à l’ordre deux de l’Éq. (15) donne, en supposant l’existence d’une éventuelle f.é.m. parasite e0 , e(θ) = e0 + ε0 θ + qθ2 ,
(17)
où ε0 = (εA − εB )(T0 ) est le coefficient Seebeck de la jonction A-B à la température de référence, et q un coefficient de correction à la linéarité. Le coefficient quadratique q est relié au coefficient Thomson Γ = T d(εA − εB )/dT , par la relation Γ0 = 2T0 q, où Γ0 désigne Γ évalué en T0 . L’effet Thomson correspond à l’absorption d’une puissance volumique P = Γje · ∇T par un matériau homogène parcouru par une densité de courant électrique je et soumis à un gradient de tem-
350
Thermodynamique
pérature [10, 11]. Cet effet s’ajoute à la puissance Joule je 2 /σ cédée au matériau de conductivité σ.
Un thermocouple a de nombreux avantages par rapport aux sondes de platine et aux thermistances [1]. Comme la soudure est petite, le thermocouple est un capteur fin avec un temps de réponse faible (Sec. 3). De plus, le thermocouple n’a pas besoin d’être corrigé de l’auto-échauffement, puisque la tension à ses bornes se mesure à courant nul. L’inconvénient majeur provient de la température de la soudure de référence, dont l’incertitude se reporte sur celle de la température à mesurer.
2.2 Protocole Nous utilisons un thermomètre étalon pour mesurer la température, un millivoltmètre pour mesurer la f.é.m, ainsi qu’un vase Dewar et de l’azote liquide pour explorer une large gamme de température, typiquement entre −50 °C et 100 °C, de sorte à estimer le coefficient quadratique de l’Éq. (17). La Fig. 6 schématise le montage. Pour toute manipulation d’azote liquide, il faut porter des gants de protection adaptés et des lunettes de sécurité.
Préparer un mélange eau-glace pour la soudure de référence, et attendre l’équilibre au point de fusion. Relier les deux soudures comme en Fig. 5(b), en veillant à bien brancher l’alliage B d’une soudure sur l’alliage B de l’autre (à l’aide d’un cavalier ou d’un câble court), puis les deux bornes de l’alliage A sur le millivoltmètre en calibre mV. Pour s’assurer que le branchement est correct, vérifier que le millivoltmètre affiche zéro lorsque les deux soudures sont dans le bain eau-glace. millivoltmètre e thermomètre étalon
A B
gaine isolante bain eau-glace
vase Dewar glace
•
T (< T0 ) T (> T0 )
•
référence
T0
Fig. 6 Montage pour la mesure de la caractéristique du thermocouple à deux soudures. La soudure de référence plonge dans un bain eau-glace à T0 = 0 °C ; l’autre plonge soit dans de l’eau chaude, soit dans de la glace refroidie à l’azote liquide dans un vase Dewar. Un multimètre de précision mesure la f.é.m. e pour différentes températures T données par le thermomètre étalon. Les bornes de type A (bleu) et B (rouge) permettent de relier les deux soudures entre elles, et au millivoltmètre. Une gaine isolante (verte) entoure les câbles A et B.
V.2 Thermométrie électrique
351
Les soudures doivent tremper dans l’eau sans toucher directement la glace, dont la température est inférieure à 0 °C. En effet le bain n’est pas exactement à l’équilibre thermodynamique, la glace fond lentement et reçoit donc de la chaleur.
Pour les points à haute température (entre 0 °C et 100 °C) : plonger la soudure libre dans un bécher contenant de l’eau bouillante, puis relever la température T et la f.é.m. e tous les 5 °C environ, au fur et à mesure que l’eau se refroidit. Cette méthode permet de suivre fidèlement la température si les thermomètres étalon et d’étude (ici, le thermocouple) ont tous deux un temps de réponse négligeable devant le temps typique de refroidissement de l’eau du bécher (Sec. 3).
Pour les points à basse température (entre −50 °C et 0 °C) : plonger la soudure libre et le thermomètre étalon dans quelques centimètres d’eau au fond d’un vase Dewar, puis verser prudemment de l’azote liquide pour solidifier l’eau surnageante. Relever T et e tous les 5 °C environ, au fur et à mesure que la glace se réchauffe.
2.3 Résultats et discussion Les résultats obtenus sont représentés sur la Fig. 7. L’incertitude sur la différence de température est donnée par le constructeur du thermomètre étalon, soit ∆θ = 0,003 θ + 1 °C. Lorsque les deux soudures A-B du thermocouple sont placées dans le bain eau-glace, une f.é.m parasite peut apparaître si la température n’est pas homogène. L’incertitude sur la f.é.m. est dominée par les fluctuations de la valeur affichée par le millivoltmètre, soit ∆e = 0,02 mV. Nous ajustons les données à la loi quadratique de l’Éq. (17). Le coefficient Seebeck, et surtout le coefficient quadratique, dépendent fortement de la gamme de température (positive ou négative). Les valeurs tabulées du coefficient Seebeck pour les thermocouples de type K sont en effet de 3,945 × 10−2 mV·(◦C)−1 3,5 2,5 e (mV)
1,5 0,5 -0,5 -1,5 -2,5 -60
-40
-20
0 20 θ (°C)
40
60
80
Fig. 7 F.é.m. e en fonction de la différence de température θ = T −T0 avec le bain eau-glace. Les disques bleus sont les points expérimentaux et la courbe continue un ajustement quadratique e = e0 + ε0 θ + qθ2 , pour e0 = (6 ± 3) × 10−3 mV, ε0 = (3,78 ± 0,06) × 10−2 mV·(◦C)−1 , et q = (3,4 ± 1,4) × 10−5 mV·(◦C)−2 .
352
Thermodynamique
entre −270 °C et 0 °C, et 3,892 × 10−2 mV·(◦C)−1 entre 0 °C et 1372 °C ; ainsi que 2,362 × 10−5 mV·(◦C)−2 et 1,856 × 10−5 mV·(◦C)−2 pour le coefficient quadratique dans les mêmes intervalles [3]. En comparaison, la région que nous explorons est bien plus restreinte et centrée autour de zéro. Aussi il est plus pertinent de ne réaliser qu’un seul ajustement sur toute la région étudiée. Une régression non linéaire d’ordre deux conduit à une tension parasite e0 = (6 ± 3) × 10−2 mV dont l’origine est due à la faible inhomogénéité de la température au sein du mélange eau-glace ; un coefficient Seebeck ε0 = (3,78 ± 0,06) × 10−2 mV·(◦C)−1 à 0 ◦C pour la jonction chromel-alumel ; et un coefficient quadratique q = (3,4 ± 1,4) × 10−5 mV·(◦C)−2 . L’incertitude élevée sur le coefficient quadratique provient de la gamme réduite de température explorée. Or, la pente issue de l’ajustement est sensible à la valeur précise du coefficient quadratique, ce qui peut expliquer qu’elle soit sous-évaluée dans notre cas. La sensibilité sth d’un thermocouple s’identifie au coefficient Seebeck ε0 proche de T0 ; il est donc difficile de mesurer les variations de tension aux bornes d’un thermocouple (de l’ordre de la dizaine de microvolts) sans amplification.
3 Temps de réponse Dans cette dernière section, nous estimons les temps de réponse des trois thermomètres : sonde Pt100, thermistance CTN, et thermocouple de type K, et vérifions qu’ils s’ordonnent de façon croissante avec la taille du capteur. Un exemple d’analyse théorique de la réponse temporelle d’un thermomètre est proposé dans l’Exp. V.1, « Thermométrie à gaz ».
3.1 Protocole Préparer le bain thermostaté comme en Fig. 8(a). Un thermoplongeur chauffe l’eau à la température θ ' 60 °C, mesurée par le thermomètre étalon. (a)
(b)
thermomètre étalon thermoplongeur Pt100 CTN soudure
•
T
milieu T•
A
T0 • réf.
A
+ •
-
B R2 •
R1
U
•
Pt100 •
U I
Fig. 8 (a) Montage de mesure du temps de réponse des trois capteurs : sonde Pt100, thermistance CTN et thermocouple de type K. (b) Circuit électrique pour le thermocouple (haut) et les thermomètres à variation de résistance (Pt100 et CTN, bas). La tension aux bornes du thermocouple est amplifiée par montage à amplificateur opérationnel non inverseur de gain G = 1 + R1 /R2 ' 100, tandis qu’un courant constant d’intensité I ' 50 mA permet de suivre la résistance R en visualisant la tension de sortie U = RI, dans le cas de la Pt100 et de la CTN.
V.2 Thermométrie électrique
353
Fixer séparément les trois capteurs (Pt100, CTN et thermocouple) sur une potence afin de pouvoir les plonger dans le bain thermostaté avec facilité. Relier les soudures du thermocouple à un amplificateur de gain G ' 100, puis alimenter la Pt100 et la CTN par une source de courant continu d’intensité I ' 50 mA, comme illustré sur la Fig. 8(b). Les tensions en sortie, de l’ordre de 100 mV à plus de 1 V, sont enregistrées par une carte d’acquisition. Le but de l’expérience est ici d’obtenir une estimation du temps de réponse ; on peut donc se contenter d’un montage 2 fils pour la Pt100 et la CTN. Entre 20 ◦C et 60 ◦C, les variations de f.é.m du thermocouple sont de l’ordre du millivolt. La variation de résistance de la Pt100 est de l’ordre de 10 W, celle de la CTN de quelques dizaines d’ohms : nous choisissons une intensité de 50 mA. Pour chaque capteur, on mesure ainsi une variation de tension supérieure à 100 mV.
Une fois la température de consigne atteinte, et les paramètres d’acquisition configurés, lancer l’acquisition puis plonger rapidement un des capteurs dans le bain thermostaté. Les temps de réponse des différents capteurs s’échelonnent sur plusieurs ordres de grandeur : nous réalisons plusieurs acquisitions avec une fréquence d’échantillonnage adaptée à chacun, mais pour une même variation de température.
3.2 Résultats et discussion Le temps de réponse τ du capteur précise la convergence de la grandeur mesurée (ici la tension U (t) aux bornes du thermomètre) vers sa valeur finale déterminée par la température de consigne. Comme les capteurs ne sont pas tous linéaires, la tension ne converge pas exponentiellement vers sa valeur finale, contrairement à la température. Nous assimilerons τ à la durée nécessaire pour atteindre un écart de 10 % par rapport à la tension finale. On représente en Fig. 9 la tension normalisée 1,0 (U∞ − U )/(U∞ − U0 )
Pt100 CTN K
0,8 0,6 0,4 0,2 0,0 10−2
10−1
100 t (s)
101
102
Fig. 9 Tension U normalisée en fonction du temps t (axe logarithmique), pour la Pt100 (disques bleus), la CTN (triangles rouges) et le thermocouple de type K (carrés verts), où U0 et U∞ sont les tensions initiale et finale. Les conditions d’acquisition sont identiques, mais la fréquence d’échantillonnage est adaptée à chaque capteur.
354
Thermodynamique Capteur Auto-échauffement Linéarité Sensibilité (à 25 ◦C) Précision [3] Coût [13] Temps de réponse
Pt100
CTN
Thermocouple K
faible bonne moyenne 4 mW·(◦C)−1 0,05 ◦C 3 e (C) - 50 e (A) variable
élevé mauvaise excellente −40 mW·(◦C)−1 0,1 ◦C 1-5 e court
absent bonne faible 0,04 mV·(◦C)−1 0,1-1 ◦C 10 e très court
Tab. 3 Caractéristiques des thermomètres électriques : sonde Pt100, thermistance CTN et thermocouple de type K, au voisinage de la température ambiante. Le temps de réponse dépend de la taille de capteur et du circuit de conditionnement.
(U∞ − U (t))/(U∞ − U0 ), U0 et U∞ étant les tensions initiale et finale, et t le temps écoulé depuis l’immersion du capteur. La tension finale s’obtient par une moyenne sur les dix derniers points. Nous trouvons, pour la sonde Pt100, τPt100 ' 17 s, pour la thermistance CTN, τCTN ' 1 s, et pour le thermocouple de type K, τK ' 40 ms. Les temps de réponse s’ordonnent comme attendu en raison du volume du capteur (voir l’Exp. V.1, « Thermométrie à gaz »), du plus grand (la sonde de platine) au plus petit (le thermocouple), et varient ainsi de plusieurs ordres de grandeur. Les sondes de platine de qualité industrielle sont toutefois moins volumineuses (quelques millimètres de diamètre) que le modèle utilisé ici. Les sondes de platine, les thermistances et les thermocouples sont omniprésents dans les applications industrielles, mais leurs utilisations diffèrent suivant les spécificités de chaque capteur, résumées dans le Tab. 3. La découverte de nouveaux matériaux thermoélectriques et l’amélioration de leurs performances font d’ailleurs l’objet d’actives recherches [12]. D’autres thermomètres électriques existent, comme les diodes et les transistors, pour lesquels l’intensité dépend de la tension selon une loi d’Arrhenius [9]. Ces thermomètres peuvent explorer de très basses températures (quelques kelvins), et sont très fins (50 µm). Une autre méthode électrique consiste à mesurer le bruit thermique d’une résistance. Pour les thermomètres électromécaniques (oscillateur à quartz), la fréquence de résonance varie avec la température [1].
Références [1]
G. Asch, Les capteurs en instrumentation industrielle, 7e éd. Dunod, 2010.
[2]
M. Fruchart, P. Lidon, E. Thibierge, M. Champion et A. Le Diffon, Physique expérimentale. De Boeck Supérieur, 2016.
[3] BIPM. (1990). Techniques for approximating the international temperature scale of 1990, adresse : https://www.bipm.org/utils/common/pdf/ITS90/EIT-90.pdf (visité le 16/04/2020). [4]
C. Kittel, Physique de l’état solide, 8e éd. Dunod, 2007.
V.2 Thermométrie électrique
355
[5]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Physique statistique. Hermann, 1996.
[6]
W. Haynes, CRC handbook of chemistry and physics, 95e éd. CRC Press, 2014.
[7]
E. Conwell et V. Weisskopf, « Theory of impurity scattering in semiconductors, » Phys. Rev., 77 (3), p. 388, 1950.
[8]
L. Quaranta et J. Donnini, Dictionnaire de physique expérimentale (tome 2), thermodynamique et applications. Pierron, 1997.
[9]
R. Duffait et J.-P. Lièvre, Expériences d’électronique : agrégation de sciences physiques. Bréal, 1999.
[10]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Thermodynamique. Hermann, 2007.
[11]
D. Calecki, B. Diu, C. Guthmann, D. Lederer et B. Roulet, Exercices et problèmes de thermodynamique. Hermann, 2010.
[12] S. Hébert, « La recherche de nouveaux matériaux thermoélectriques, » Ref. Phys., (41), p. 18-22, 2014. [13]
Guilcor. (2020). Sondes et capteurs industriels, adresse : https://sondesthermiques.fr/ (visité le 15/04/2020).
V.3
Expérience de Rüchardt
L’expérience de Rüchardt permet de déterminer le facteur adiabatique γ de l’air. Elle consiste à suivre les oscillations d’un mobile soumis à son poids et à la force de pression exercée par l’air enfermé dans un récipient. Le phénomène fait intervenir à la fois de la thermodynamique (loi d’évolution du gaz et effet des échanges thermiques) et de la mécanique (bilan des forces sur le mobile).
Sommaire 1 2 3 4
Introduction . . . . . . . Aspects théoriques . . . . Réalisation de l’expérience Exploitation des résultats
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
356 357 362 364
1 Introduction La capacité calorifique d’un corps quantifie l’énergie cédée ou reçue lors d’une variation de température. De nombreuses applications requièrent de connaître la capacité calorifique, comme les moteurs thermiques (de types Diesel ou Otto-Beau de Rochas par exemple), où un volume de gaz se dilate au contact d’une source chaude et fournit ainsi du travail mécanique [1]. Plusieurs définitions existent, chacune étant adaptée aux conditions particulières dans lesquelles évolue le système. On distingue en particulier les capacités à volume constant et à pression constante : ∂U ∂H ncV = , ncp = , (1) ∂T n,V ∂T n,p où n désigne la quantité de matière (nombre de moles), V est le volume, p la pression, U l’énergie interne, H l’enthalpie et T la température. Ainsi définies, cV et cp sont des grandeurs intensives, que l’on appelle capacités calorifiques molaires. Les capacités à volume et pression constants sont deux variables distinctes, sans toutefois être indépendantes : elles sont liées l’une à l’autre par la relation de Mayer n(cp − cV ) = T pV αβ,
(2)
dans laquelle α et β, tous deux positifs, sont respectivement les coefficients de dilatation isobare et d’augmentation de pression isochore [2]. L’Éq. (2) relie cV , généralement déduite d’un modèle microscopique, à cp , généralement mesurée ; de ce fait, elle permet de comparer théorie et expérience. Pour l’eau, les deux capacités calorifiques sont quasiment confondues, mais ce n’est pas le cas de la plupart des phases condensées (liquide et solide), qui sont certes peu dilatables (α faible), mais également peu compressibles (β élevé) [2]. Les capacités calorifiques à volume 356
V.3 Expérience de Rüchardt
357
et pression constants des gaz diffèrent sensiblement et apportent de précieuses informations sur la structure interne des molécules. Une autre façon de quantifier la différence entre ces deux grandeurs est donnée par le facteur adiabatique, γ=
cp . cV
(3)
Ce facteur dépend en général de la température et de la pression. Pour le gaz parfait, il ne dépend que de la température ; il vaut environ 5/3 ' 1,67 pour un gaz monoatomique, et 7/5 = 1,4 pour un gaz diatomique à température ambiante, lorsque les degrés de liberté de vibration des molécules sont gelés, et ceux de rotation activés [3, 4]. Les méthodes de détermination de γ sont multiples. Citons l’expérience historique de Clément et Desormes (1819), dont le principe est de mesurer l’augmentation de pression d’un volume d’air enfermé dans un récipient, soumis à une détente adiabatique, après retour à l’équilibre thermique avec l’environnement [5]. Une méthode totalement différente consiste à mesurer la célérité d’ondes acoustiques, soit dans un tube de Kundt, soit dans l’air libre [6]. Les valeurs ainsi mesurées de γ peuvent être très précises. Une autre enfin est celle d’É. Rüchardt (1888-1962) [7], qu’on propose de discuter ici. Quoiqu’étant similaire à l’expérience de Clément et Desormes sous plusieurs aspects, la méthode de Rüchardt fait intervenir à la fois les lois de la mécanique et de la thermodynamique, et offre ainsi une discussion physique riche.
2 Aspects théoriques 2.1 Évolution adiabatique L’expérience de Rüchardt consiste à étudier les oscillations d’un mobile soumis à son propre poids et à la force de pression du gaz enfermé dans un récipient (Fig. 1(a)). Le gaz, qui est assimilé à de l’air, constitue un système fermé. La réalisation de l’expérience nécessite que le mobile coulisse presque sans frottements dans un tube cylindrique vertical de même diamètre interne d, fixé au récipient de façon hermétique. Considérons en premier lieu la situation d’équilibre mécanique du mobile. Son centre d’inertie se situe alors à une altitude ze , qui fixe l’origine de l’axe z vertical ascendant ; le volume total de gaz dans le récipient est Ve (cela inclut le volume du récipient et de la portion du tube au-dessous du mobile), sa pression pe et sa température Te , qui diffère de la température atmosphérique T0 en l’absence d’équilibre thermique. L’équilibre mécanique impose pe = p0 +
mg , s
(4)
où p0 ' 1 bar est la pression atmosphérique, g l’intensité de la pesanteur et s = πd2 /4 la section du tube. Le mobile est à présent écarté de sa position d’équilibre puis lâché sans vitesse initiale. Il oscille autour de sa position d’équilibre. Pour déterminer l’évolution temporelle de son altitude z, un certain nombre d’hypothèses sont formulées, dont la validité est discutée plus amplement en Sec. 4.2.
358
Thermodynamique
(a)
(b)
d
m
•
z 1006
ze = 0
1004 p (hPa)
1002 1000 998 996
S, T0
Ve , pe , Te
994 992
0
2
4
6
8
10
t (s)
Fig. 1 (a) Principe de l’expérience de Rüchardt dans une situation hypothétique où le mobile de masse m est à l’équilibre mécanique, immobile à l’altitude ze = 0 dans un tube de même diamètre interne d. Le volume, la pression et la température du gaz enfermé dans le récipient valent respectivement Ve , pe et Te . Les parois du récipient, de surface S, sont à la température de l’atmosphère T0 . (b) Oscillations de la pression pour un mobile d’environ 20 g, dans un tube de 50 cm et un récipient d’environ 10 L.
La transformation du gaz est tout d’abord supposée quasi statique, si bien que la température T et la pression p sont définies à tout instant, tout comme le volume V occupé par le gaz. Le principe fondamental de la dynamique appliqué au mobile dans le référentiel galiléen du laboratoire donne alors, après projection selon la verticale, d2 z m 2 = s(p − p0 ) − mg = s(p − pe ). (5) dt Pour le moment, aucune relation supplémentaire ne lie la grandeur mécanique (position z) aux grandeurs thermodynamiques (pression p) ; il faut spécifier la transformation subie par le gaz. Deux cas limites peuvent se présenter. •
•
Soit le déplacement du mobile est bien plus lent que les échanges thermiques avec la paroi du récipient, de sorte que le gaz interne est en équilibre thermique avec l’atmosphère à tout instant. La transformation est alors isotherme à la température Te = T0 des parois du récipient. Soit les échanges thermiques sont lents devant les oscillations du mobile. L’évolution du gaz interne est alors adiabatique.
Ces deux situations conduisent à des oscillations, comme celles observées sur les données expérimentales de la Fig. 1(b). Nous verrons cependant en fin de section que l’analyse quantitative de la période des oscillations favorise la seconde hypothèse. Nous supposons par conséquent que la transformation est adiabatique. De plus, nous négligeons les éventuels frottements solides secs et fluides : la transformation est donc également réversible. L’équation d’état du gaz doit être connue. Dans les
359
V.3 Expérience de Rüchardt
conditions normales de température et de pression (T0 = 25 °C, p0 = 1 bar), l’air se comporte en bonne approximation comme un gaz parfait. Sous ces hypothèses, la loi de Laplace s’applique [5] : la quantité pV γ est constante, ce qui donne sous forme différentielle dp dV +γ = 0. (6) p V Nous assimilons ici γ à sa valeur en Te . Les variations de pression (p − pe ) et de volume (V −Ve = sz) sont faibles devant les grandeurs moyennes, il est donc légitime de les assimiler aux variations infinitésimales dp et dV , d’où l’on tire p − pe = −
γpe sz . Ve
(7)
En exprimant z en fonction de p dans l’Éq. (5), nous obtenons l’équation d’évolution d2 p γpe s2 + (p − pe ) = 0. dt2 mVe
(8)
Puisque z est proportionnel à p − pe , l’altitude du mobile satisfait également à l’Éq. (8). En conclusion, la pression oscille autour de sa valeur d’équilibre à la pulsation s γpe s2 (9) . ω0 = mVe La mesure de la pulsation permet donc de déterminer le facteur γ de l’air à la température d’équilibre Te , qui est très proche de la température ambiante T0 . Pour une transformation isotherme réversible, nous aurions obtenu une pulsation ω0,iso =
p
pe s2 /mVe ,
(10)
qui est similaire à l’Éq. (9), si ce n’est que le facteur γ est absent. Une estimation de la pulsation à partir des données de la Fig. 1(b) donne ω0,exp ' 5,2 s−1 . L’Éq. (9) prédit ω0 ' 5,3 s−1 avec les paramètres utilisés dans cette acquisition, tandis que ω0,iso ' 4,5 s−1 . La transformation est donc plus proche du cas adiabatique que du cas isotherme.
2.2 Prise en compte des échanges thermiques Établissement de l’équation d’évolution L’évolution idéale que décrit l’Éq. (8) n’est pas réaliste dans la mesure où aucun processus dissipatif n’est pris en compte. La dissipation conduit à un amortissement des oscillations, qui est bien visible sur les données de la Fig. 1(b). Comme nous le montrerons en Sec. 4.2 par une estimation des pertes énergétiques, seuls les échanges thermiques permettent d’expliquer cet amortissement. L’hypothèse d’adiabaticité n’est donc pas exacte. Comme les parois du verre sont à la température atmosphérique T0 , différente de celle du gaz interne T , nous modélisons les échanges thermiques par un flux conducto-convectif [8] Φ = −hS(T − T0 ),
(11)
360
Thermodynamique
compté positivement dans le sens de la paroi vers le gaz. S dénote la surface totale du récipient (celle du tube peut être négligée) et h est le coefficient de Newton, supposé constant. Le transfert thermique élémentaire δQ reçu au cours d’une transformation quasi statique s’exprime en fonction des différentielles de p et de V comme [5] δQ = λdp + µdV,
(12)
où les coefficients calorimétriques valent λ = V cV /R et µ = pcp /R pour un gaz parfait, avec R la constante des gaz parfaits. Par définition, δQ = Φ dt et donc V cV pcp dp + dV = −hS(T − T0 )dt. R R
(13)
On en tire, en assimilant p et V aux valeurs moyennes, T − T0 1 dp sγ dz + = −ν , pe dt Ve dt Te
(14)
après avoir introduit la constante ν = hS/ncV homogène à l’inverse d’un temps, où n = pe Ve /RTe désigne la quantité de matière. Notons que le rapport cp /cV , et donc le facteur adiabatique, apparaît explicitement dans l’Éq. (14) quelle que soit la nature de la transformation. Bien que la température T oscille autour de Te aux temps courts, elle converge nécessairement vers T0 aux temps longs, suite aux échanges thermiques. Afin d’éliminer l’inconnue z, il est judicieux d’utiliser la loi du gaz parfait sous forme différentielle, p − pe sz T − Te + = , pe Ve Te
(15)
puis d’effectuer la combinaison linéaire γ d(15)/dt − (14) pour aboutir à γ dT T − T0 γ − 1 dp = +ν . pe dt Te dt Te
(16)
Il reste à exprimer la dérivée première de T grâce à l’Éq. (14) puis au bilan de quantité de mouvement de l’Éq. (5), soit 1 d2 p 1 dT 2 =− + ω0 (p − pe ) . (17) Te dt νpe dt2 L’équation régissant l’évolution de la pression est donc d2 p dp 4γξ 2 T − T0 2 + 2ξ + ω (p − p ) = pe , e 0 dt2 dt (γ − 1)2 Te
(18)
où l’on a introduit le coefficient ξ=
ν(γ − 1) hSTe (γ − 1)2 = , 2γ 2γpe Ve
(19)
homogène à l’inverse d’un temps. La dernière égalité de l’Éq. (19) s’obtient grâce à la relation cV = R/(γ − 1), valable pour un gaz parfait [5].
V.3 Expérience de Rüchardt
361
Analyse de l’équation L’Éq. (18) peut être analysée ordre par ordre, en supposant que le coefficient ξ, qui traduit l’écart à l’adiabaticité, est petit devant ω0 . Nous estimons en effet à partir du coefficient d’amortissement expérimental que ξ ' 0,2 s−1 ω0 (Fig. 1(b)). À l’ordre zéro en ξ/ω0 , l’Éq. (18) se réduit à l’Éq. (8) de l’oscillateur harmonique valable en l’absence d’échanges thermiques. Les effets dissipatifs interviennent à l’ordre un en ξ/ω0 , où une dérivée première en p apparaît. L’équation est alors celle d’un oscillateur amorti, dont la solution est de la forme p(t) = Ae−Λt sin(ωt + φ) + pe ,
(20)
p ω02 − ξ 2 la pseudooù A est l’amplitude initiale, φ la phase à l’origine, ω = pulsation, et Λ = ξ le coefficient d’amortissement. L’amplitude initiale est fixée par la pression à l’équilibre pe , et donc par la masse du mobile et la section du tube, en vertu de l’Éq. (4). L’allure de la Fig. 1(b) et les mesures précises de la Sec. 4 montrent que l’Éq. (20) reproduit correctement les données. Enfin, le membre de droite de l’Éq. (18) contribue à l’ordre deux en ξ/ω0 , et est à l’origine de deux effets importants. Le premier est de déplacer aux temps courts la valeur moyenne de la pression par rapport à la valeur d’équilibre pe , puisque T oscille autour de Te , qui diffère de la température ambiante T0 . Cet effet est difficile à mettre en évidence [7]. Le second est de modifier les expressions de ω et Λ par rapport à celles attendues pour un oscillateur amorti. En effet, en dérivant l’Éq. (18) par rapport au temps puis en tirant profit de l’Éq. (17), nous obtenons une équation du troisième degré qui porte sur la seule variable p, 2 d d2 p d p ω02 2 + ω0 (p − pe ) + ν + (p − pe ) = 0. (21) dt dt2 dt2 γ Dans la limite ν → 0 (transformation adiabatique), cette équation se réduit à celle d’un oscillateur harmonique de pulsation propre ω0 ; dans la limite ν → +∞ (transformation isotherme), elle se réduit à l’équation d’un oscillateur harmonique de pulsation √ propre ω0,iso = ω0 / γ.
Les expressions de la pseudo-pulsation et du coefficient d’amortissement s’obtiennent soit en cherchant les racines r = −Λ ± iω du polynôme caractéristique associé à l’Éq. (21), soit en injectant une solution de la forme de l’Éq. (20), puis en résolvant l’équation. On peut ensuite développer l’expression analytique de ω et de Λ à l’ordre deux en ξ/ω0 . Il vient ω ' ω0 − (γ + 3)ξ 2 /2(γ − 1)ω0 et Λ ' ξ : cette dernière relation est inchangée à cet ordre du développement par rapport au cas de l’oscillateur harmonique amorti. On en déduit 2
ω 'γ
pe s2 mVe
2
−Λ
γ+3 γ−1
.
(22)
Or, le coefficient d’amortissement Λ ne dépend que très faiblement de la masse m au travers de la pression d’équilibre pe , et peut donc être considéré constant sur
362
Thermodynamique
toutes les expériences, quelle que soit la masse du mobile choisie. La représentation de ω 2 en fonction de la variable pe s2 /mVe pour plusieurs masses du mobile donne ainsi une droite, dont la pente est le facteur adiabatique γ.
3 Réalisation de l’expérience 3.1 Choix du matériel Le matériel se compose des éléments de la Fig. 2. Le récipient est un vase de Mariotte d’environ 10 L, pourvu d’une embouchure latérale sur laquelle peuvent être fixés des tuyaux en plastique de faible diamètre. Plus le volume est élevé, plus la période est grande, et donc meilleure est la précision de la mesure à résolution temporelle donnée. Le fond du vase contient un tapis dont le but est de protéger le verre lorsque le mobile tombe à la fin de l’expérience, suite aux inévitables fuites d’air. La longueur L du tube cylindrique en plexiglas doit être aussi grande que possible (typiquement, plus de 40 cm), parce qu’elle limite l’amplitude initiale des oscillations de pression à une valeur inférieure à Amax ' γpe sL/2Ve d’après l’Éq. (7). Le tube est fixé hermétiquement au vase par un bouchon creux en caoutchouc. Une masselotte cylindrique de même diamètre que l’intérieur du tube fait office de mobile. Une pompe impose une surpression initiale dans le vase (en obstruant le haut du tube avec le mobile avant de le lâcher), de sorte que la pression d’équilibre pe soit atteinte lorsque le mobile se situe à peu près à mi-hauteur du tube. La pression est mesurée par un manomètre avec sortie analogique, relié à une carte d’acquisition. Le manomètre que nous utilisons a une résolution de 1 hPa pour une précision de 1 % sur la sortie analogique. Le temps de réponse des manomètres courants est faible devant la période des oscillations (quelques secondes). Aucune
tube mobile
vase de Mariotte pompe tapis
manomètre
Fig. 2 Dispositif expérimental. Un tube est fixé hermétiquement sur le vase de Mariotte. Un tapis protège le fond du vase des chocs du mobile au cas où celui-ci chuterait. La pompe impose une surpression initiale avant le lâcher du mobile, et l’évolution temporelle de la pression est suivie par un manomètre.
V.3 Expérience de Rüchardt
363
contrainte n’impose une masse précise à la masselotte, car nous pouvons jouer sur la pression dans le récipient pour contenir les oscillations du mobile dans le tube ; elle vaut typiquement une vingtaine de grammes. Enfin, un système de raccordement (bouchon en caoutchouc, tube rigide et T en plastique) relie le vase à la pompe et au manomètre.
3.2 Calibration et mesures préliminaires La calibration de la sortie analogique du manomètre ne sert pas pour mesurer la pseudo-pulsation, puisque la linéarité du capteur, que nous vérifions ci-après, assure que la périodicité de la tension est la même que celle de la pression, mais elle est nécessaire pour déterminer la pression d’équilibre pe à partir d’une acquisition. En bouchant hermétiquement l’extrémité du tube, on impose une pression p, lue sur l’affichage numérique du manomètre, grâce à la pompe, et on mesure la tension U correspondante en sortie du manomètre. Explorer des pressions de ±20 hPa autour de la pression atmosphérique suffit pour exploiter ensuite les données. Le manomètre utilisé fonctionne linéairement sur la gamme de pression explorée, comme montré en Fig. 3. L’ajustement affine p = aU + b donne a = (3,89 ± 0,08) × 102 hPa·V−1 et b = (955,3 ± 0,8) hPa. Ensuite, le volume V0 du vase de Mariotte doit être mesuré, soit en remplissant le vase avec une éprouvette graduée tout en notant le volume d’eau versé, soit en pesant le vase rempli d’eau sur une balance préalablement tarée si l’on dispose d’une balance pouvant supporter une dizaine de kilogrammes. Le volume à l’équilibre vaut Ve = V0 + sLe , où Le est la hauteur du tube sous le mobile à l’équilibre. Comme la contribution du tube est faible, on peut estimer Le ' L/2. La masse m du mobile se mesure avec une balance, et le diamètre interne d du tube au pied à coulisse. La détermination précise de ce paramètre est cruciale, car le carré de la pulsation propre, qui est proportionnel à γ, varie comme d4 : toute erreur de mesure sur d se reporte sur la mesure du facteur adiabatique de façon
1025 1015
p (hPa)
1005 995 985 975 965 955 0,02
0,04
0,06
0,08 0,10 U (V)
0,12
0,14
0,16
Fig. 3 Pression p affichée par le manomètre en fonction de la tension U en sortie. L’ajustement affine (droite bleue) donne p = aU + b avec a = (3,89 ± 0,08) × 102 hPa·V−1 et b = (955,3 ± 0,8) hPa.
364
Thermodynamique
Grandeur
L (mm)
d (mm)
s (mm2 )
V0 (L)
Ve (L)
Valeur
491 ± 1
15,99 ± 0,01
200,8 ± 0,3
11,19 ± 0,02
11,24 ± 0,02
Tab. 1 Longueur L, diamètre interne d et section s = πd2 /4 du tube ; volume V0 du vase de Mariotte et volume Ve ' V0 + sL/2 du gaz à l’équilibre dans l’enceinte.
dramatique. Le Tab. 1 liste les valeurs de ces paramètres dans notre expérience.
3.3 Protocole Nettoyer le mobile et la paroi interne du tube avec de l’éthanol. Sécher avec un tissu propre, puis disposer les éléments du montage comme en Fig. 2. La sortie analogique du manomètre est reliée à une carte d’acquisition. La verticalité du tube doit être soigneusement vérifiée au niveau à bulle. Si le mobile est amorti au bout de deux ou trois périodes seulement, le problème vient probablement des frottements solides secs contre la paroi légèrement inclinée du tube.
Régler les paramètres d’acquisition : la gamme de tension (500 mV pour appareil utilisé), la durée d’acquisition (environ 30 s) et le pas de temps (nous avons choisi 15,6 ms). Le pas de temps doit être faible devant la pseudo-période, qui est de l’ordre de 1,5 s. Imposer une surpression d’environ 5 à 10 hPa en maintenant le mobile dans l’extrémité haute du tube, puis le lâcher sans vitesse initiale. Si le mobile oscille avec une amplitude trop faible ou tombe dans le vase, refaire l’expérience en adaptant la pression initiale en conséquence. Effectuer plusieurs acquisitions sur le même mobile, puis répéter l’expérience pour plusieurs masses, en fixant d’autres poids plus légers sur le mobile avec par exemple de la pâte adhésive.
4 Exploitation des résultats 4.1 Mesure de la pseudo-pulsation et de la pression d’équilibre La Fig. 4 montre les résultats d’une acquisition après conversion de la tension en pression, selon la calibration présentée en Fig. 3. La pression d’équilibre pe est déterminée en moyennant la pression sur les cinq dernières secondes, lorsque l’équilibre est atteint. L’écart-type de l’ensemble des points est négligeable devant l’incertitude relative associée à la précision du manomètre, qui est de 1 %. La sensibilité de la sortie analogique permet toutefois de détecter des variations de pression bien plus faibles que l’incertitude associée à une mesure absolue. La pseudo-pulsation s’obtient en repérant les passages successifs de la courbe de pression par la valeur moyenne pe . L’incertitude associée provient de l’échantillonnage et vaut ∆ω = ω 2 ∆t/2π, où ∆t = 15,6 ms est l’intervalle de temps entre deux points. Enfin, le coefficient d’amortissement s’obtient par la méthode du décrément logarithmique (Fig. 4). Les derniers extrema sont rejetés parce que les frottements solides secs dominent la décroissance aux faibles amplitudes. En effet, le mobile tend à frotter contre les parois
V.3 Expérience de Rüchardt
ln(δp/1 Pa)
1012 1009
p (hPa)
1006 1003
7 6 5 4 3 2
1001
365
0 2 4 6 8 10 12
998 995 992
0
2
4
6 t (s)
8
10
12
Fig. 4 Oscillations de la pression p en fonction du temps t pour un mobile de masse m = (17,576 ± 0,001) g. Les points expérimentaux (disques bleus) sont compatibles avec une sinusoïde amortie p(t) = Ae−Λt sin(ωt + 3π/2) + pe (ligne continue rouge), sauf aux faibles amplitudes où les frottements solides secs dominent, avec pe = (999 ± 10) hPa et ω = (5,283 ± 0,007) s−1 . Encart : logarithme des maxima δp = |p − pe |max (carrés verts) en fonction de t et régression affine (droite verte) sur les treize premiers points, de pente absolue Λ = (0,194 ± 0,005) s−1 et d’ordonnée à l’origine ln(A/1 Pa) avec A = (5,9 ± 0,1) hPa.
du tube lorsque sa vitesse est faible. L’incertitude sur les extrema de p − pe est estimée à 0,1 hPa, qui est l’ordre de grandeur de la variation de p sur quelques points autour d’un extremum. Notons que la précision du manomètre sur une variation de pression est bien meilleure que celle sur une mesure absolue. La Fig. 4 est obtenue pour un mobile de masse m = (17,576 ± 0,001) g. Les points expérimentaux sont compatibles avec la sinusoïde amortie de l’Éq. (20), de pression à l’équilibre pe = (999 ± 10) hPa, pour une pseudo-pulsation ω = (5,283 ± 0,007) s−1 , un coefficient d’amortissement Λ = (0,194 ± 0,005) s−1 et une amplitude initiale A = (5,9 ± 0,1) hPa. La phase à l’origine φ dépend du choix de l’origine des temps. L’expérience est répétée une dizaine de fois pour chaque masse, et quatre masses du mobile sont utilisées. La pression à l’équilibre pe et le carré de la pseudo-pulsation ω sont moyennés sur toutes les répétitions pour une masse m donnée. Le coefficient d’amortissement Λ est, quant à lui, moyenné sur toutes les expériences, quelle que soit la masse du mobile, soit Λ = (0,193 ± 0,003) s−2 . Les variations de Λ d’une masse à l’autre sont du même ordre de grandeur que les variations d’une répétition de l’expérience à l’autre pour une même masse, ce qui justifie de considérer ce paramètre constant.
4.2 Résultats D’après l’Éq. (22), le tracé de ω 2 en fonction de la quantité pe s2 /mVe est une droite de pente γ. D’après l’ajustement affine de la Fig. 5, nous trouvons un facteur adiabatique γexp = 1,37 ± 0,03,
(23)
366
Thermodynamique 30
ω 2 (s−2 )
27 24 21 18 15 12
8
10
12
14 16 18 pe s2 /mVe (s−2 )
20
22
Fig. 5 Carré de la pseudo-pulsation ω des oscillations en fonction de la variable pe s2 /mVe , où pe est la pression d’équilibre, s la section du tube, m la masse du mobile et Ve le volume d’équilibre. Un ajustement affine (ligne continue) donne une pente γexp = 1,37 ± 0,03 et une ordonnée à l’origine de (0,0 ± 0,4) s−2 .
qui est compatible avec la valeur attendue γ = 1,4 pour un gaz parfait classique diatomique. La valeur mesurée concorde également avec les valeurs tabulées du Tab. 2, où l’on note une faible dépendance du facteur adiabatique en la température, suite à la structure interne des molécules et à leur interaction mutuelle. La présence de vapeur d’eau, de facteur adiabatique égal à 1,33, tend à diminuer le facteur adiabatique de l’air, mais l’effet est très faible. Pour une humidité relative typique ϕ = 70 %, la fraction molaire de vapeur d’eau xvap = ϕp0 /psat , où psat désigne la pression de vapeur saturante, vaut environ 2 % dans les conditions normales de température et de pression [9] 1 . La nature diatomique du gaz est sans équivoque, puisqu’on aurait γ ' 1,67 pour un gaz monoatomique, en désaccord avec l’expérience. Nous trouvons une ordonnée à l’origine de (0,0 ± 0,4) s−2 . À partir du coefficient d’amortissement mesuré, nous déduisons la valeur attendue de l’ordonnée à l’origine −Λ2 (γ + 3)/(γ − 1) = (−0,41 ± 0,01) s−2 . La précision des mesures ne permet donc pas d’estimer de façon satisfaisante la correction à la pulsation induite par les échanges thermiques. T (°C)
0
20
100
200
400
γ
1,403
1,400
1,401
1,398
1,393
Tab. 2 Facteur γ de l’air sec à différentes températures sous p0 = 1 bar [10].
1. Voir également l’Exp. V.1, « Thermométrie à gaz ».
V.3 Expérience de Rüchardt
367
4.3 Discussion des hypothèses Nature de l’amortissement Nous vérifions maintenant que la manifestation de la dissipation est cohérente avec une origine thermique, en estimant le coefficient de Newton des échanges convectifs h à partir de l’Éq. (19) et de la loi des gaz parfaits. Le coefficient de Newton vaut h=
2γpe Ve ξ . Te S(γ − 1)2
(24)
πdlη dz , δ dt
(25)
On mesure pe ' 1 bar. La surface des échanges est S ' 0,3 m2 , et la température à l’équilibre est celle du laboratoire Te ' 25 °C, d’où l’on tire h ' 40 W·m−2 ·K−1 avec ξ ' Λ. La valeur de h dépend grandement des conditions de l’expérience (convection libre ou forcée, ventilation de la pièce) mais l’ordre de grandeur est raisonnable pour ce type de situation [8]. Une autre approche pour valider l’origine thermique des pertes consiste à vérifier que le coefficient d’amortissement Λ est inversement proportionnel au volume du gaz dans le récipient (par exemple en ajoutant différents volumes d’eau au fond du vase de Mariotte), ce qui n’est pas le cas pour des pertes induites par frottements [7]. Réversibilité de la transformation La transformation est supposée réversible. Cela revient à négliger de nombreux phénomènes tels que la relaxation moléculaire, la dissipation visqueuse et la conduction thermique au sein du gaz. Ces effets sont extrêmement faibles, et nous renvoyons le lecteur à la Réf. [11] pour plus de détails. À titre d’exemple, les effets visqueux se traduisent par un amortissement des ondes de pression générées par le mouvement du mobile, de coefficient d’atténuation λvis = ηω 2 /2ρc3 (homogène à l’inverse d’une longueur), où η désigne la viscosité dynamique, ρ la masse volumique de l’air et c la célérité du son. Pour l’air sec à 20 °C, ρ = 1,2 kg·m−3 , c = 3,4 × 102 m·s−1 et η = 1,8 × 10−5 Pa·s, soit λvis ' 10−11 m−1 . Cet effet est plus important en réalité, parce que l’onde de pression se propage dans un milieu confiné, de taille petite devant la longueur d’onde, mais il reste négligeable. Influence des fuites Le gaz est supposé constituer un système fermé, ce qui exclut toute fuite d’air entre le mobile et la paroi du tube. Ces pertes sont observables : en mesurant la durée que met le mobile à descendre le long du tube à partir de sa position d’équilibre, nous estimons un débit volumique de fuite QV ' 1 mL·s−1 . Ces fuites perturbent très peu l’expérience, dont la durée τ ' 15 s est telle que la variation relative de volume τ QV /Ve ' 10−3 est très petite devant 1. De plus, l’écoulement de l’air entre le mobile et le tube engendre des frottements fluides. La vitesse maximale du mobile vaut v ' Lω = 2,6 m·s−1 , d’où l’on tire un nombre de Reynolds Re = ρvδ/η ' 8, avec δ ' 50 µm une estimation haute au pied à coulisse de l’intervalle paroi-mobile. Comme l’angle θ que fait l’axe du mobile avec celui du tube est presque nul, on a Re 1/θ, et on peut traiter l’écoulement dans l’approximation de lubrification [12]. La force de frottement visqueux que subit le mobile vaut, dans la limite θ 1, F '
où l = 2,0 cm est la hauteur du mobile. Le temps d’amortissement vaut τη ' mδ/πdlη = 55 s. Les effets visqueux peuvent amortir les oscillations sur une expé-
368
Thermodynamique
rience suffisamment longue mais il ne peut s’agir de la source principale de dissipation, puisque le temps d’amortissement mesuré Λ−1 ' 5 s est plus petit d’un ordre de grandeur. Évolution adiabatique d’un gaz réel Dans les conditions normales de température et de pression, l’air se comporte comme un gaz parfait en bonne approximation. L’écart au caractère parfait du gaz conduit à une expression légèrement différente de la pulsation propre. Pour un gaz de van der Waals de paramètre d’interaction a et de covolume b [5], l’équation de Laplace (6) doit être remplacée par une équation polytropique pV k = cste, (26) où d’après l’Éq. (12), k = µV /λp ' γ(1 − a/RT0 vm − b/vm ), où vm est le volume molaire à T0 . Le facteur adiabatique γ de l’Éq. (9) doit alors être remplacé dans l’expression de ω0 par ce coefficient polytropique k, qui est plus faible d’environ 0,4 % [9], ce qui ne peut pas se vérifier à la précision de nos mesures. L’expérience de Rüchardt permet de déterminer précisément le facteur adiabatique de l’air tout en offrant une discussion riche sur les lois de la mécanique et de la thermodynamique. Le facteur adiabatique intervient plus généralement dans tout phénomène où entre en jeu une transformation adiabatique, comme la propagation d’ondes acoustiques, les cycles idéaux de machines thermiques, etc.
Références [1]
Y. Çengel, M. Boles et M. Lacroix, Thermodynamique : une approche pragmatique, 2e éd. De Boeck, 2015.
[2]
G. Bruhat et A. Kastler, Thermodynamique. Masson et Cie, 1968.
[3]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Thermodynamique. Hermann, 2007.
[4]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Physique statistique. Hermann, 1996.
[5]
M. Bertin, J.-P. Faroux et J. Renault, Thermodynamique. Dunod, 1976.
[6]
M. Fruchart, P. Lidon, E. Thibierge, M. Champion et A. Le Diffon, Physique expérimentale. De Boeck Supérieur, 2016.
[7]
A. Deiber et J. Simond, « Aux confins de la mécanique et de la thermodynamique à travers l’expérience de Rüchardt, » Bup, 92 (808), p. 1615-1631, 1998.
[8]
L. Quaranta et J. Donnini, Dictionnaire de physique expérimentale (tome 2), thermodynamique et applications. Pierron, 1997.
[9]
W. Haynes, CRC handbook of chemistry and physics, 95e éd. CRC Press, 2014.
[10]
J. Dean et N. Lange, Lange’s handbook of chemistry. McGraw-Hill, 1992.
[11]
C. Garing, Ondes mécaniques et diffusion. Ellipses, 1998.
[12]
E. Guyon, J.-P. Hulin et L. Petit, Hydrodynamique physique, 3e éd. EDP Sciences, 2012.
V.4
Mesure d’une chaleur latente de vaporisation
Nous proposons un protocole pour mesurer la chaleur latente de vaporisation de l’azote liquide, c’est-à-dire l’énergie à fournir à l’unité de masse de la substance pour la vaporiser. Après avoir discuté l’intérêt de connaître la chaleur latente de substances frigorifiques, nous présentons une méthode de mesure, dite électrique. Une résistance fournit une puissance électrique connue à l’azote liquide, dont on mesure la masse qui se vaporise au cours du temps. Les pertes thermiques qui s’ajoutent à la puissance fournie sont évaluées, puis d’autres méthodes calorimétriques sont évoquées.
Sommaire 1 2 3 4 5
Introduction . . . . . . . . . . . La méthode électrique . . . . . . Protocole . . . . . . . . . . . . . Exploitation des résultats . . . . Autres méthodes calorimétriques
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
369 370 373 375 377
Cette expérience utilise de l’azote liquide à une température de −196 °C. Des précautions de sécurité sont nécessaires au vu de la gravité des brûlures potentielles. Des gants cryogéniques et des lunettes de sécurité sont indispensables.
1 Introduction Le développement de la théorie des transitions de phase s’est beaucoup appuyé sur deux exemples canoniques que sont la transition ferromagnétique-paramagnétique et le changement d’état liquide-gaz [1]. Nous nous focalisons dans cette expérience sur le deuxième exemple, non pas du point de vue du théoricien, mais de celui de l’expérimentateur. Les applications de ce type de changement d’état sont nombreuses. Les machines frigorifiques, par exemple, tirent profit de la vaporisation d’une substance (dite substance frigorifique, comme le R134-a) pour prélever de l’énergie thermique à une chambre froide [2]. La vaporisation est en effet une méthode de refroidissement plus efficace que la conduction thermique au contact d’un corps froid, parce que l’énergie absorbée lors de la vaporisation, appelée chaleur latente, est bien plus grande que celle absorbée lors d’une variation de température d’une phase pure d’un kelvin, quantifiée par la capacité calorifique [3, 4]. Par exemple, à pression constante de 3,2 bars (pression imposée lors de la phase d’évaporation du cycle de réfrigération), la chaleur latente massique de vaporisation du R134-a est de 197 kJ·kg−1 , et sa capacité calorifique massique en phase liquide de 0,169 kJ·kg−1 ·K−1 [2]. Pour obtenir un transfert thermique équivalent à celui 369
370
Thermodynamique
de la vaporisation, il faudrait donc augmenter la température de plus de 1000 K, ce qui s’étend bien au-delà du domaine d’existence de la phase liquide. Nous proposons de mesurer la chaleur latente d’une substance courante en laboratoire : le diazote N2 en phase liquide, plus souvent appelé « azote liquide ». Le diazote est une substance gazeuse dans les conditions normales de température et de pression, utilisée couramment dans l’industrie et la recherche scientifique comme liquide cryogénique. Son atout principal est son coût de fabrication, bien moins élevé que celui de l’hélium liquide par exemple. Sous pression atmosphérique patm = 1013 hPa, sa température de vaporisation est Tv = 77,36 K, soit −195,79 °C [5]. Nous mesurons dans cette expérience la chaleur latente massique de vaporisation Lv de l’azote liquide à pression atmosphérique, dont la valeur tabulée est de 198,6 kJ·kg−1 [5].
2 La méthode électrique 2.1 Principe de la méthode La calorimétrie désigne la science expérimentale qui étudie les échanges thermiques au cours d’une transformation thermodynamique [3, 4, 6]. Elle consiste plus particulièrement en la mesure de capacités calorifiques et de chaleurs latentes de changement d’état. Plusieurs méthodes calorimétriques sont envisageables pour cette expérience, mais nous utiliserons uniquement la méthode électrique, qui est particulièrement adaptée aux liquides. D’autres méthodes sont présentées en Sec. 5. La Fig. 1(a) illustre le principe de cette méthode. Le liquide est contenu dans un calorimètre (récipient aux parois calorifugées) pouvant supporter de basses températures, comme un vase Dewar, tandis qu’une résistance électrique immergeable (thermoplongeur) plonge entièrement dans la substance, et lui apporte une puissance P > 0 constante. Supposons que le système Σ, constitué du liquide au point de vaporisation et de la partie interne du vase Dewar en équilibre avec le liquide, est homogène à la température Tv , évolue à pression constante patm , ne reçoit aucun travail, et est macroscopiquement au repos. Alors le premier principe de la thermodynamique affirme que la variation d’enthalpie de Σ est égale au transfert thermique : ∆H = Q = (P + Pf )t, (1) où t est le temps écoulé depuis le début de l’expérience et Pf désigne la puissance de l’ensemble des fuites thermiques (convection de l’air au-dessus de l’azote liquide majoritairement), également supposée constante sur la durée de l’expérience. Pour de l’azote liquide, Pf est négative, parce que la température d’ébullition est inférieure à la température atmosphérique. L’hypothèse sur la constance de Pf est justifiée dans la mesure où ni l’aire de l’interface entre l’azote liquide et l’atmosphère, ni sa température n’évoluent : les échanges conducto-convectifs sont donc constants.
La chaleur latente massique étant définie comme la variation d’enthalpie par unité de masse, il vient ∆H = mvap Lv , (2)
V.4 Mesure d’une chaleur latente de vaporisation (a)
(b)
371
2r
potence pinces manche
(s)
tige métallique partie chauffante azote liquide calorimètre
(σ) h 2R z
balance
Fig. 1 (a) Dispositif expérimental sans la partie électrique. Le thermoplongeur est relié à un transformateur et à un wattmètre, non représentés ici. Le vase Dewar contient l’azote liquide dans lequel plonge la partie chauffante du thermoplongeur. Une potence assure la stabilité du montage. (b) Surfaces immergée (σ) et libre (s) du thermoplongeur à un instant donné. La hauteur h de l’interface air/diazote diminue par vaporisation. Le rayon interne du vase Dewar est R, et le rayon de chaque tige métallique r. L’axe vertical descendant est noté z.
où mvap est la masse de liquide vaporisée. La dérivée temporelle de l’Éq. (1) donne donc, en fonction de la masse m de liquide restant dans le vase Dewar à l’instant t, d dm (mvap Lv ) = −Lv = P + Pf . dt dt
(3)
Les grandeurs (dm/dt) et P sont faciles à mesurer, ce qui n’est pas le cas de Pf . Toutefois, en supposant que les pertes thermiques ne dépendent pas de P , la puissance fournie suit une loi affine en fonction de la dérivée temporelle de la masse, P = −Pf − Lv
dm , dt
(4)
dont la pente est la chaleur latente de vaporisation Lv . Les fuites thermiques devraient, en fait, dépendre faiblement de P , parce qu’une puissance fournie différente implique une ébullition plus ou moins intense et donc une convection dans des conditions différentes, mais cet effet sera négligé.
La méthode électrique peut être adaptée à d’autres substances, comme l’eau par exemple, mais elle souffre alors d’inconvénients majeurs. La chaleur latente de l’eau (2264,76 kJ·kg−1 ) est en effet dix fois plus élevée que celle de l’azote liquide, ce qui requiert soit d’utiliser des puissances de plusieurs centaines de watts, soit de réaliser l’expérience sur plusieurs dizaines de minutes. Plus grave encore, une partie de la
372
Thermodynamique
vapeur d’eau se condense sur les parois du vase Dewar, ce qui fausse la mesure de la masse de liquide vaporisée, parce que la majeure partie de l’énergie libérée par condensation est cédée à l’air ambiant. Ce problème ne se rencontre pas avec l’azote liquide, dont la température d’ébullition est inférieure à la température ambiante.
2.2 Variations de masse réelle et mesurée La variation de masse d’azote liquide se mesure avec une balance, sur laquelle repose le vase Dewar, comme sur la Fig. 1(a). Cependant, l’Éq. (4) ne peut pas être appliquée directement, parce que la masse mmes mesurée par la balance, et la masse réelle m de l’azote liquide, ne sont pas identiques. La partie immergée du thermoplongeur subit en effet une poussée d’Archimède de la part de l’azote liquide, bien plus forte que celle qui serait exercée par l’air ; le thermoplongeur exerce donc par réaction une force opposée sur l’azote liquide, qui s’ajoute à son poids et augmente la valeur de la masse qu’affiche la balance. Cet effet n’apparaît pas si la potence qui soutient le thermoplongeur est aussi posée sur la balance (puisque cette poussée devient une force interne au dispositif), mais cette situation est difficilement réalisable en pratique. Or, cette force décroît avec l’évaporation de l’azote liquide, parce que la portion immergée du thermoplongeur est de moins en moins haute au fil du temps. Ainsi, la variation réelle de masse dm/dt diffère de celle mesurée dmmes /dt. Bilan des forces sur l’azote liquide Pour lier ces deux grandeurs, raisonnons sur le modèle particulier de thermoplongeur de cette expérience, qui possède deux tiges métalliques parallèles de rayon r terminées par un serpentin, comme illustré sur la Fig. 1(b). Nous notons R le rayon interne du vase Dewar, et h la hauteur de l’interface air/diazote par rapport au fond du vase. Le dispositif est soumis au champ de pesanteur g = gez , où ez est le vecteur unitaire vertical dirigé vers le bas. La grandeur mmes est définie à une constante additive près ; nous supposons que la balance est tarée avec le vase Dewar vide d’azote liquide (et donc rempli d’air), de sorte que la réaction du vase Dewar sur l’azote liquide s’écrive Fréa = −mmes g − πR2 p0 ez , où p0 désigne la pression de l’air au niveau du fond du vase. En plus de la réaction du récipient, l’azote liquide est soumis à trois autres forces : son poids P = mg ; la force de réaction F = F ez exercée par la partie immergée (σ) du thermoplongeur, avec F > 0 ; enfin, la force de pression Fair = π(R2 −2r2 )p(h)ez qu’exerce l’air situé au-dessus de l’interface, où règne la pression p(h). En vertu de la loi de l’hydrostatique, p(h) = p0 − ρair gh où ρair est la masse volumique de l’air. En supposant que l’ensemble est à tout instant en situation d’équilibre, le bilan des forces sur l’azote liquide donne Fréa + P + F + Fair = 0 ⇒ mmes g = mg + F + π(R2 − 2r2 )p(h) − πR2 p0 .
(5)
Les signes positifs des termes de droite de l’Éq. (5) sont cohérents avec l’intuition, dans la mesure où le thermoplongeur et l’air appuient indirectement sur la balance. Force exercée par le thermoplongeur Soit ρ la masse volumique de l’azote liquide et ρVσ = ρπR2 h − m la masse du liquide déplacé par le volume Vσ de la partie immergée (σ) du thermoplongeur (Fig. 1(b)). En raison des forces internes
V.4 Mesure d’une chaleur latente de vaporisation
373
aux tiges, F ne s’identifie pas à la poussée d’Archimède que l’azote liquide exerce sur la partie immergée du thermoplongeur, qui ne constitue pas une surface fermée. Par contre, la force F est identique à celle qu’exercerait un volume d’azote liquide délimité par cette même surface (σ) sur le liquide environnant. La section (s) de ce volume à hauteur de l’interface, qui s’identifie à la section des tiges, subirait la force de pression Fs = 2πr2 p(h)ez . Or, le volume délimité par la surface (s + σ), qui est fermée, subit une poussée d’Archimède d’expression ΠA = −ρVσ g. Celle-ci est la somme de Fs et de la force de réaction −F que le liquide environnant exerce sur (σ), soit ΠA = Fs − F ⇒ F = (ρπR2 h − m)g + 2πr2 p(h). (6) Variations de masse En combinant les Éq. (5) et (6), nous trouvons la relation mmes g = πR2 (ρ − ρair )hg, puis en dérivant par rapport au temps,
dh dmmes = πR2 (ρ − ρair ) . (7) dt dt Il reste à relier dh/dt à la variation de la masse réelle d’azote liquide. Tant que l’interface air/diazote ne descend pas au niveau du serpentin, l’évaporation d’une masse dm d’azote liquide s’accompagne d’une diminution de volume π(R2 −2r2 ) dh, où dh représente la baisse de hauteur de liquide. Ainsi, dm dh = ρπ(R2 − 2r2 ) . dt dt
(8)
En combinant les Éq. (7) et (8), nous trouvons dmmes /dt = α(dm/dt), avec α=
1 − ρair /ρ . 1 − 2(r/R)2
(9)
Nous précisons que l’expression de α dépend de la géométrie du vase Dewar et du thermoplongeur, et doit être adaptée au montage utilisé. Le coefficient α est, dans notre cas, légèrement supérieur à l’unité, et induit une correction d’environ 1 %. À partir de l’Éq. (4), on obtient la loi affine suivante sur la puissance fournie : P = −Pf −
Lv dmmes . α dt
(10)
3 Protocole À des fins de lisibilité, les schémas des parties calorimétrique et électrique du montage ont été séparés. La Fig. 1(a) présente le dispositif thermodynamique tandis que la Fig. 2 schématise le montage électrique. Un transformateur à secondaire variable relié au secteur (230 V, 50 Hz) alimente le thermoplongeur. La puissance fournie au thermoplongeur est mesurée soit par un wattmètre, soit par deux multimètres, l’un en série du thermoplongeur pour l’intensité du courant, l’autre en parallèle pour la tension. Dans ce dernier cas, les montages courte et longue dérivation se valent pour un serpentin de résistance électrique ' 100 Ω. Pour plus de détails sur l’utilisation des transformateurs et la mesure simultanée du courant et de la tension, voir l’Exp. III.3, « Transformateur électrique monophasé ».
374
Thermodynamique wattmètre +
transformateur − 230 V +
i
-
W
+
-
thermoplongeur
u
Fig. 2 Circuit d’alimentation du thermoplongeur et de mesure de la puissance moyenne fournie P = huii. Un wattmètre dispose de quatre bornes, dont deux sont en série avec un générateur (transformateur à secondaire variable) et le thermoplongeur pour mesurer l’intensité du courant i, et deux en parallèle de ce dernier pour mesurer la tension u.
Ces deux méthodes de mesure sont préférables à la seule mesure de la tension, parce que la résistance électrique du serpentin chauffant dépend de la température (voir l’Exp. V.2, « Thermométrie électrique »).
La balance doit idéalement être précise au dixième de gramme, et supporter le poids du vase Dewar rempli. Même si nous avons supposé la balance tarée en Sec. 2.2, cette opération n’est pas indispensable. Brancher le thermoplongeur au secondaire du transformateur et à un wattmètre, ou bien à deux multimètres, l’un en série pour mesurer l’intensité du courant, l’autre en parallèle pour mesurer la tension. Verser de l’azote liquide dans le vase Dewar jusqu’à mi-hauteur (attention, se munir de gants, de lunettes, et manipuler au sol pour prévenir les projections), puis poser le vase Dewar sur une balance. À l’aide d’une potence et d’une pince, introduire le thermoplongeur verticalement dans le vase Dewar de façon que la partie chauffante soit totalement immergée, comme illustré sur la Fig. 1(a). Ne pas mettre le thermoplongeur en contact avec les bords du vase Dewar, au risque de fausser la masse affichée par la balance au moindre mouvement.
Patienter une ou deux minutes, le temps que le thermoplongeur atteigne l’équilibre thermique avec le bain d’azote liquide, et que l’ébullition s’arrête. Alimenter le thermoplongeur à la puissance voulue (quelques dizaines de watts), et attendre que la puissance affichée par le wattmètre se stabilise. Pour une variation de masse de 100 g sur une durée de 5 min, la puissance doit valoir P ' 70 W, sachant que Lv ' 200 kJ·kg−1 .
Relever la masse mmes affichée par la balance à intervalles de temps réguliers. Pour nos manipulations, nous avons choisi un intervalle de 20 s. Si l’on dispose d’une balance avec sortie numérique, enregistrer mmes sur un logiciel d’acquisition.
V.4 Mesure d’une chaleur latente de vaporisation
375
S’assurer que l’ensemble du serpentin chauffant reste constamment immergé au cours de l’expérience. Dans le cas contraire, une fraction de la puissance électrique fournie est directement perdue par convection de l’air au contact du serpentin.
Une fois l’expérience terminée, remplir à nouveau le vase Dewar d’azote liquide et reprendre les mêmes étapes pour des puissances d’alimentation différentes.
4 Exploitation des résultats 4.1 Détermination de la chaleur latente Le rayon interne R du vase Dewar ainsi que le rayon r des tiges métalliques du thermoplongeur sont mesurés au pied à coulisse, et l’incertitude est estimée par la dispersion des mesures répétées à différentes positions. Les valeurs expérimentales sont r = (3,50 ± 0,10) mm et R = (40,16 ± 0,10) mm, d’où l’on tire α = 1,0139 ± 0,0009, en utilisant les masses volumiques ρ = 806,6 kg·m−3 de l’azote liquide et ρair = 1,184 kg·m−3 de l’air à 25 ◦ C [5]. La masse mesurée a pour incertitude ∆mmes = 0,3 g suite aux fluctuations de la force ressentie par la balance, induites par l’ébullition de l’azote liquide. Le temps est mesuré à intervalles réguliers par un chronomètre. La source majeure d’incertitude sur le temps provient du temps nécessaire pour lire la masse affichée par la balance, qui est évalué à ∆t = 0,5 s. Les expériences sont réalisées pour quatre puissances différentes. L’incertitude sur la puissance provient de deux contributions du même ordre de grandeur, à savoir les fluctuations de la valeur affichée par le wattmètre, estimées à 0,3 W, et la précision du wattmètre, de 1 % + 2 digits. La Fig. 3(a) présente les courbes expérimentales de masse mesurée en fonction du temps. La régression affine n’est pas satisfaisante sur les premiers points, (a)
(b) 0
5 4 3 25,0 40,2 56,2 65,9
-100 -150 -200
0
90
ε (g)
mmes (g)
-50 W W W W 180 270 t (s)
2 1 0
360
450
-1
0
90
180 270 t (s)
360
Fig. 3 (a) Masse mesurée mmes translatée à l’origine pour t = 0 en fonction du temps t pour quatre puissances. Les régressions affines (courbes continues) excluent les sept premiers points. (b) Résidu ε pour chaque courbe. Les premiers points dévient de la droite, ce qui justifie de les exclure de la régression.
450
376
Thermodynamique 80 70
P (W)
60 50 40 30 20 10 0 0,0
0,5
1,0 1,5 2,0 2,5 3,0 −(dmmes /dt) (10−4 kg · s−1 )
3,5
4,0
Fig. 4 Puissance électrique P fournie à l’azote liquide en fonction de la dérivée temporelle de la masse mesurée dmmes /dt, en valeur absolue. La régression affine P = b − a(dmmes /dt) (courbe continue) donne une ordonnée à l’origine b = −(3,2 ± 0,8) W et une pente a = (195 ± 3) kJ·kg−1 .
ce qui s’explique probablement par le temps nécessaire à la partie immergée du thermoplongeur pour atteindre l’équilibre thermique. Nous excluons donc les sept premiers points, puis justifions ce choix a posteriori, en traçant les résidus εi (t) = mmes,i (t) − fi (t) pour chaque régression fi (t) = ai t + bi , i = 1, ..., 4, sur la Fig. 3(b). Pour chaque expérience, nous estimons dmmes /dt par la pente ai . Nous trouvons par exemple dmmes /dt = (−1,455 ± 0,005) × 10−4 kg·s−1 pour une puissance P = (25,0 ± 0,5) W. Nous représentons ensuite la puissance en fonction de la variation de masse mesurée (Fig. 4). Une régression affine P = b − a(dmmes /dt) donne une puissance des fuites thermiques Pf = −b = (3,2 ± 0,8) W, et une pente a = (195 ± 3) kJ·kg−1 . D’après l’Éq. (10), la chaleur latente vaut Lv = αa, d’où l’on tire Lv = (198 ± 3) kJ·kg−1 .
(11)
L’accord avec la valeur tabulée Ltab = 198,6 kJ·kg−1 est excellent [5]. L’écart apv préciable entre a et Lv justifie de corriger la masse mesurée par le facteur α.
4.2 Origine des fuites thermiques Les pertes thermiques ne sont pas négligeables devant la puissance fournie. La contribution la plus importante provient de la convection libre de l’air au-dessus de l’azote liquide, qui fait l’objet du premier paragraphe. Nous montrons ensuite que le rayonnement du système d’éclairage est négligeable. Convection libre Notons Φc le flux conducto-convectif transmis à l’azote liquide par l’air, β le coefficient de Newton, S ' πR2 l’aire de la surface d’échange, et ∆T > 0 la différence de température entre l’air et l’azote liquide. Il vient Φc = βS∆T.
(12)
V.4 Mesure d’une chaleur latente de vaporisation
377
La convection libre est un phénomène complexe, dont on pourra trouver une étude plus poussée dans les Réf. [6, 7]. Nous nous contentons ici d’utiliser l’ordre de grandeur β ' 10 W·m−2 ·K−1 . Comme l’air se refroidit au contact de l’azote liquide et que le diazote gazeux stagne dans le vase Dewar, la différence de température est inférieure à Tamb − Tv où Tamb ' 20 °C. L’estimation ∆T ' 100 K semble raisonnable. Nous trouvons ainsi un flux conducto-convectif Φc de quelques watts, ce qui est cohérent avec l’ordre de grandeur de Pf . Rayonnement Le rayonnement de l’éclairage ambiant contribue peu à la vaporisation de l’azote liquide. En effet, le flux lumineux émis par les tubes fluorescents les plus puissants est de 9,4 × 103 lm 1 , ce qui correspond à une puissance du rayonnement Pray d’environ 14 W. Seule une faible fraction de ce rayonnement est absorbée par l’azote liquide. En supposant que le tube se situe à la verticale du vase Dewar, le rayonnement absorbé couvre un angle solide Ω = S/d2 où d ' 1 m est la distance entre le tube et la surface de l’azote liquide. Comme le tube émet dans un demi-espace, d’angle solide 2π sr, le flux thermique correspondant s’écrit Φray = ΩPray /2π ' 0,01 W, qui est faible devant le flux conducto-convectif. Le flux émis par l’azote liquide, que l’on peut estimer à partir de la loi du corps noir, est du même ordre de grandeur que le flux lumineux absorbé.
5 Autres méthodes calorimétriques D’autres méthodes sont envisageables pour mesurer une chaleur latente de vaporisation. Nous en discutons deux : la détermination de la courbe de coexistence, et la méthode des mélanges.
5.1 Méthode de la courbe de coexistence La chaleur latente peut être déterminée en traçant la courbe de coexistence liquide-vapeur puis en utilisant la formule de Clapeyron : Lv dpsat = , dT T (vg − vl )
(13)
où T désigne la température, psat (T ) la pression de vapeur saturante, Lv (T ) la chaleur latente massique de vaporisation, et vg (T ) et vl (T ) les volumes massiques des phases gazeuse et liquide respectivement. Cette méthode a l’avantage de donner accès à la chaleur latente pour plusieurs températures à l’aide d’une seule courbe expérimentale [8]. Elle possède toutefois certains inconvénients ; dans le protocole, d’une part, puisqu’elle nécessite de disposer d’un récipient thermostaté et de pression contrôlable, et dans le traitement, d’autre part, la dérivation d’une courbe discrète introduisant beaucoup d’erreurs pour un nombre insuffisant de points.
5.2 Méthode des mélanges Avec la méthode des mélanges [6], le liquide est à la température initiale Ti dans le calorimètre, puis un corps de capacité thermique connue et de température 1. Le lumen vaut 1 lm = 1 cd·sr = (1/683)W.
378
Thermodynamique
Tc supérieure à la température de vaporisation est plongé dans le liquide. Une fois l’équilibre atteint, la mesure de la masse de liquide vaporisée mvap et de la température finale Tf permet de remonter à la chaleur latente. Les inconvénients de cette méthode sont qu’il est nécessaire d’attendre l’équilibre thermique, et que les pertes thermiques doivent être évaluées séparément puisqu’elles varient en fonction de la durée de l’expérience. En plus des méthodes discutées ci-dessus, une méthode alternative est celle de Berthelot, qui ne consiste pas à mesurer l’énergie fournie pour vaporiser le liquide, mais celle absorbée pour condenser la vapeur. Pour la chaleur latente de fusion, il faut recourir à la méthode des mélanges, qui sert également à mesurer la capacité calorifique d’une phase condensée [6].
Références [1]
N. Goldenfeld, Lectures on phase transitions and the renormalization group. Westview Press, 1992.
[2]
Y. Çengel, M. Boles et M. Lacroix, Thermodynamique : une approche pragmatique, 2e éd. De Boeck, 2015.
[3]
M. Bertin, J.-P. Faroux et J. Renault, Thermodynamique. Dunod, 1976.
[4]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Thermodynamique. Hermann, 2007.
[5]
W. Haynes, CRC handbook of chemistry and physics, 95e éd. CRC Press, 2014.
[6]
L. Quaranta et J. Donnini, Dictionnaire de physique expérimentale (tome 2), thermodynamique et applications. Pierron, 1997.
[7]
E. Guyon, J.-P. Hulin et L. Petit, Hydrodynamique physique, 3e éd. EDP Sciences, 2012.
[8]
M. Fruchart, P. Lidon, E. Thibierge, M. Champion et A. Le Diffon, Physique expérimentale. De Boeck Supérieur, 2016.
V.5
Supraconductivité : lévitation Meissner et chute de résistivité
Lors du refroidissement d’un matériau, des propriétés étonnantes peuvent apparaître : la répulsion des lignes de champ magnétique extérieur (effet Meissner) permet des effets de lévitation, et l’annulation de la résistance électrique permet au matériau de conduire le courant électrique sans dissipation d’énergie. Ces deux phénomènes, qui apparaissent pour certains matériaux appelés supraconducteurs, résultent d’une transition de phase que nous étudions expérimentalement. Après une brève introduction à la supraconductivité, nous caractérisons l’effet Meissner puis nous proposons une mesure quantitative de la température critique du matériau en analysant la chute de sa résistance en fonction de la température au voisinage de la transition.
Sommaire 1 2 3 4 5
Introduction . . . . . . . . . Aspects théoriques . . . . . . Expériences qualitatives . . . Chute de résistivité et mesure Discussion . . . . . . . . . .
. . . . . . . . . de Tc . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
379 380 385 386 392
Compléments A B C
Supraconducteur et conducteur parfait . . . . . . . . . 396 Force magnétique sur un supraconducteur . . . . . . . . 397 Conseils pour construire son expérience . . . . . . . . . 398
Cette expérience utilise de l’azote liquide à une température de −196 ◦C. Des précautions de sécurité sont nécessaires au vu de la gravité des brûlures potentielles. Des gants cryogéniques et des lunettes de sécurité sont indispensables.
1 Introduction En refroidissant le mercure sous 4 K, K. Onnes constata en 1911 son absence de résistance électrique lors du passage d’un courant. Il venait de découvrir le phénomène de supraconductivité. Par la suite, d’autres propriétés furent mises en évidence, comme l’effet Meissner en 1933 par W. Meissner et R. Ochsenfeld, qui est à l’origine de la lévitation du supraconducteur par expulsion du champ magnétique extérieur 1 . En pratique, de nombreux matériaux conducteurs qualifiés de 1. Cet effet distingue notamment un supraconducteur d’un conducteur parfait, pour lequel la résistivité électrique serait aussi nulle (voir la Sec. 2.1 et le Comp. A).
379
380
Thermodynamique
Supra (type)
Hg(I)
NbTi(I)
CeFeAsO(II)
YBa2 Cu3 O7 (II)
CSHx (II)
Tc (K)
4
10
41
93
287,7 ± 1,2
Tab. 1 Température critique de quelques métaux et alliages métalliques supraconducteurs, dont le type est indiqué entre parenthèses (voir la Sec. 2.3). Pour le sulfure d’hydrogène carboné CSHx la température critique a été mesurée sous une pression d’environ 267 GPa, pour les autres il s’agit de la pression atmosphérique. Les incertitudes non indiquées sur les températures critiques sont inférieures au kelvin.
« normaux » à température ambiante deviennent supraconducteurs en dessous d’une certaine température, appelée température critique, et notée Tc . Dans toute la suite et par abus de langage, nous appellerons supraconducteur tout matériau qui peut le devenir, que celui-ci soit en phase normale ou en phase supraconductrice. Des applications aux supraconducteurs existent déjà. La conduction sans perte permet de générer des champs magnétiques intenses et stables : on les retrouve donc en résonance magnétique nucléaire (RMN) et en imagerie par résonance magnétique (IRM), mais aussi dans les accélérateurs de particules comme au CERN. Par ailleurs, ces mêmes électroaimants supraconducteurs permettent aux trains à sustentation magnétique (par exemple le JR-Maglev japonais) d’éviter le frottement mécanique sur les rails, donc leur usure, et ainsi d’atteindre des vitesses supérieures à 600 km·h−1 . Bien que les valeurs de Tc varient significativement d’un matériau à l’autre, aucune phase supraconductrice n’a été observée dans les conditions normales de température et de pression, ce qui fait l’objet d’actives recherches. Le sulfure d’hydrogène carboné CSHx 2 possède la température de transition supraconductrice la plus élevée connue à ce jour : 288 K (15 ◦C) sous une pression de 267 GPa [1]. Des ordres de grandeur de Tc pour différents métaux ou alliages sont donnés dans le Tab. 1. Aucune théorie n’unifie tous les phénomènes de supraconductivité connus à ce jour. La partie suivante ne vise donc qu’à donner une idée simplifiée de ce phénomène. Pour plus de détails et une description quantitative, on consultera les Réf. [2, 3].
2 Aspects théoriques 2.1 Description macroscopique : théorie de London Une des propriétés les plus frappantes des matériaux supraconducteurs est l’effet Meissner. Lorsqu’un tel matériau est placé dans un champ magnétique au-dessous de sa température critique, le champ est expulsé de l’intérieur du matériau 3 . Ce comportement ne peut être interprété dans le seul cadre de l’électrodynamique classique et son explication complète requiert une théorie quantique. Une théorie complète de la supraconductivité de type I (Sec. 2.3) fut l’une des avancées majeures de la théorie de la matière condensée. 2. La composition exacte du supraconducteur n’est pas connue, mais une analyse des modes vibrationnels de la molécule indiquerait x = 8 [1]. 3. Ceci est vrai si l’intensité du champ magnétique est faible. Pour des valeurs plus élevées de champ magnétique, il peut exister une ou plusieurs phases d’énergie plus basse (Sec. 2.3).
V.5 Supraconductivité : lévitation Meissner et chute de résistivité
381
Afin d’expliquer l’effet Meissner en l’absence d’une théorie quantique, les frères London ont postulé en 1935, par une démarche phénoménologique, une équation reliant la densité de courant j et le champ magnétique B dans le supraconducteur : µ0 ∇ × j = −B/λ2L ,
(1)
∆B − B/λ2L = 0.
(2)
où λL est homogène à une longueur, appelée longueur de London [4]. Cette équation est appelée équation de London. En se plaçant en régime stationnaire, l’équation de Maxwell-Ampère s’écrit ∇ × B = µ0 j. Par ailleurs, aucun champ électrique ne peut subsister dans un supraconducteur en régime stationnaire, car sa résistivité est nulle. En injectant l’Éq. (1) dans l’équation de Maxwell-Ampère, à laquelle on applique l’opérateur rotationnel, et en utilisant la relation ∇ × (∇ × B) = ∇(∇ · B) − ∆B = −∆B, on aboutit à l’équation gouvernant l’évolution spatiale de B dans le supraconducteur :
Cette équation montre que le champ magnétique pénètre le matériau sur une distance caractéristique λL et s’annule au-delà. Son ordre de grandeur varie de quelques dizaines à quelques centaines de nanomètres [2]. Lorsque cette longueur de pénétration est négligeable devant l’épaisseur du supraconducteur, on peut considérer que le champ magnétique, nul en volume, est localisé en surface. Comme par définition l’excitation magnétique H et l’aimantation M sont reliées au champ magnétique par B = µ0 (H + M ) 4 , on en déduit que dans le supraconducteur, l’aimantation s’oppose parfaitement à l’excitation magnétique (M = −H). La susceptibilité magnétique χ, définie par M = χH, vaut χ = −1 : le supraconducteur est donc qualifié de diamagnétique parfait. Il développe en présence d’un champ magnétique des courants macroscopiques localisés à sa surface qui écrantent ce champ dans son intérieur. On note que le diamagnétisme parfait d’un supraconducteur ne provient pas de la nature magnétique de ses constituants, mais de ces courants macroscopiques, ce qui explique son effet plus important. L’équation de London (1) peut, en fait, être démontrée dans le cadre de la mécanique quantique. La théorie phénoménologique de Ginzburg-Landau [5] améliore le modèle de London et permet d’interpréter la coexistence des phases supraconductrice et normale (Sec. 2.3). La théorie BCS permet de comprendre la nature des porteurs de charge responsables du courant supraconducteur (Sec. 2.4). Bien qu’initialement issue d’arguments phénoménologiques, la théorie de London fournit une description convenable de la réponse magnétique d’un supraconducteur. Nous montrons dans le Comp. A certains de ces arguments, et nous y expliquons pourquoi une approche classique ne peut rendre compte de l’effet Meissner.
2.2 Effet Meissner et lévitation La manifestation la plus spectaculaire de l’effet Meissner est certainement la lévitation magnétique d’un aimant. En effet, la proximité d’un aimant au voisinage d’un supraconducteur génère une force répulsive entre eux. Cette force peut alors compenser le poids de l’aimant et produire une lévitation stable verticalement. 4. Voir l’Exp. II.1, « Ascension d’un liquide paramagnétique » pour la définition de l’excitation magnétique et de l’aimantation.
382
Thermodynamique
Nous démontrons dans le Comp. B que la force magnétique subie par un supraconducteur dans un champ magnétique extérieur s’écrit ‹ Bs2 F =− n dS, (3) S 2µ0
où l’intégrale est effectuée sur la surface S du matériau, n désigne le vecteur normal unitaire extérieur à un élément de surface dS de celui-ci, et Bs désigne la norme du champ magnétique total à la surface du matériau. La quantité Bs2 /2µ0 s’interprète comme une pression magnétique, car la force surfacique subie par le supraconducteur est dirigée vers l’intérieur de celui-ci. Ainsi, un supraconducteur est repoussé des zones de champ intense vers les zones de champ plus faible, comme tout diamagnétique 5 . On peut exprimer plus simplement cette force magnétique répulsive dans le cas d’un aimant produisant un champ magnétique dipolaire et placé suffisamment proche du supraconducteur pour considérer que ce dernier occupe un demi-espace infini. Dans ces conditions, on a (voir l’exercice 3.6 de la Réf. [6]) F =
3µ0 M2 1 + cos2 (θ) ez , 64π a4
(4)
où M est le moment magnétique de l’aimant, faisant un angle θ avec la normale au supraconducteur ez , et a la distance entre le moment magnétique et le supraconducteur. Cette force est effectivement toujours répulsive, et on peut également montrer qu’un équilibre stable de l’orientation de M existe pour θ = π/2, ce qui s’observe sur la Fig. 1. Pour l’aimant composé de Nd2 Fe14 B étudié dans l’Exp. II.4, « Mesure du moment magnétique d’un aimant permanent », m ' 3 g et M ' 0,4 A·m2 : en compensant le poids, on estime la hauteur de lévitation à a ' 2 cm.
aimant supraconducteur
Fig. 1 Photographie de la lévitation d’un aimant au-dessus d’un matériau supraconducteur refroidi à l’azote liquide (effet Meissner).
5. Inversement, un matériau paramagnétique, tel que la solution étudiée dans l’Exp. II.1, « Ascension d’un liquide paramagnétique », est attiré vers des zones de champ magnétique fort.
V.5 Supraconductivité : lévitation Meissner et chute de résistivité
383
2.3 Diagramme de phase des supraconducteurs Un supraconducteur perd ses propriétés supraconductrices s’il est parcouru par un courant dépassant une intensité critique, ou s’il est soumis à une excitation magnétique dépassant une excitation critique Hc . Il existe deux types de supraconducteurs. Les supraconducteurs de type I ont un diagramme de phase (H, T ) simple comprenant deux phases séparées par une ligne de transition qui s’étend d’une excitation critique Hc (à température nulle) jusqu’à la température critique Tc (à excitation nulle) (Fig. 2(a)). Ceux de type II ont un diagramme plus complexe, sur lequel nous reviendrons en Sec. 2.5, comprenant une phase supplémentaire mixte délimitée par deux excitations critiques à température nulle (Fig. 2(b)). Dans la plupart des cas, les supraconducteurs de type I possèdent une température critique basse, typiquement Tc < 30 K, alors que ceux de type II ont généralement une température critique plus élevée. En présence d’une excitation magnétique, la transition de phase est du premier ordre pour un supraconducteur de type I, et s’accompagne d’une chaleur latente volumique de changement d’état µ0 Hc2 /2, égale à la densité volumique d’énergie magnétique stockée dans le supraconducteur. La transition devient du deuxième ordre en l’absence d’excitation magnétique [7]. À notre connaissance, il n’existe pas de résultat général pour les supraconducteurs de type II.
2.4 Description microscopique : théorie BCS La théorie BCS (pour Bardeen, Cooper et Schrieffer [8]) explique dans la plupart des cas le comportement des supraconducteurs de type I [3]. Il s’agit d’une théorie microscopique de la supraconductivité, fondée sur l’existence d’une attraction effective entre électrons suite à leur interaction avec les vibrations du réseau cristallin (phonons). Cette interaction entraîne la création d’un état lié constitué de paires d’électrons de spins opposés, appelées paires de Cooper. Cette théorie (a)
(b)
H
H Hc2
normal
normal Hc mixte Hc1
supraconducteur
supraconducteur Tc
T
Tc
T
Fig. 2 Diagrammes de phase schématiques de supraconducteurs (a) de type I et (b) de type II. Tc est la température critique à H = 0 T et Hc l’excitation magnétique critique à 0 K. Pour les supraconducteurs de type II, il existe deux excitations critiques entre lesquelles se trouve la phase mixte, décrite en Sec. 2.5.
384
Thermodynamique
explique la fragilité de l’état supraconducteur : les paires de Cooper se dissocient à haute température, à forte excitation magnétique, ou encore lorsqu’un courant important traverse le matériau. Les phonons thermiques peuvent détruire l’état lié, c’est pourquoi les propriétés de supraconductivité n’apparaissent qu’à suffisamment basse température, où les paires de Cooper sont stables. Par leur comportement bosonique, elles échappent au principe d’exclusion de Pauli. Ces paires peuvent alors se condenser dans un même état quantique où l’impulsion de chaque paire est nulle. Cette condensation crée le comportement collectif à l’origine des propriétés de supraconductivité. La théorie BCS p donne l’expression de la longueur de London apparaissant dans l’Éq. (2), λL = mc /µ0 nc qc2 où nc est la densité de paires de Cooper, qc = −2e leur charge et mc leur masse. La densité de paires de Cooper étant fonction de la température T , cette expression montre que λL dépend de T .
Pour plus de détails sur la nature de l’interaction entre les électrons et le réseau, on pourra consulter la Réf. [9] pour une version simplifiée, ou encore la Réf. [3] pour un traitement quantique.
2.5 Piégeage dans les supraconducteurs de type II La lévitation d’un aimant au-dessus d’un supraconducteur de type I n’est pas stable dans le plan horizontal, car la force exercée par le supraconducteur n’a pas de composante horizontale. En revanche, la lévitation au-dessus du supraconducteur de type II est stabilisée par le phénomène de piégeage qui s’ajoute à l’effet Meissner. Lorsque le champ magnétique extérieur imposé à un supraconducteur de type II est trop important, celui-ci passe dans un état mixte (Fig. 2(b)). Contrairement aux supraconducteurs de type I qui éjectent tout champ magnétique (Fig. 3(a)), l’état (a)
(b)
supra
0, 0) = 0 et c(z < 0, 0) = 1. Cette condition initiale revient à imposer ( ( √ B = 1/2 f (+∞) = B + A π = 0 ⇒ (13) √ . √ A = −1/2 π f (−∞) = B − A π = 1 En reliant α(z, t) à f 0 (u) via l’Éq. (9), on obtient finalement α(z, t) =
e(nm − ne ) √ exp −z 2 /4Dt . 4πDt
(14)
La fonction de l’Éq. (14) vérifie des conditions aux limites libres : α(±∞, t) = 0. Ces conditions sont compatibles avec l’expérience, parce que les molécules qui diffusent n’atteignent le bord (haut ou bas) de la cuve, de hauteur H ' 5 cm, qu’au bout d’un temps typique H 2 /D supérieur à plusieurs dizaines de jours, ce qui est très grand devant la durée de l’expérience (quelques heures).
Nous suivons sur l’écran le point de la trace issu du rayon de déviation maximale α(0, t), qui est le point dont la position évolue selon la loi la plus simple. L’écran se situe à une distance L de la face de sortie de la cuve. La distance verticale maximale h(t) ' Lα(0, t) entre la trace réelle et la trace non déformée (droite tiretée de la Fig. 1), a donc pour expression h(t) =
eL(nm − ne ) √ . 4πDt
(15)
En pratique, on ne peut pas repérer facilement ce point de déviation maximale, contrairement au point le plus bas du profil. On trace donc, au tout début de
V.6 Diffusion du glycérol dans l’eau
409
l’expérience, l’axe vertical passant par le point le plus bas, en le supposant très proche du point de déviation maximale ; puis l’on estime h(t) par la distance le long de cet axe entre les profils réel et non déformé. L’erreur introduite par cette méthode est négligeable, comme discuté en Sec. 3.3. Attention, le point le plus bas du profil et celui de déviation maximale n’évoluent pas de la même façon. Soit γ = Lc /(Lc + L) le grandissement de la trace du faisceau sur la cuve par rapport à la trace du faisceau sur l’écran, où Lc désigne la distance entre le centre de la lentille cylindrique et la face d’entrée de la cuve (Fig. 1). La distance verticale δ(X, t) entre les traces réelle et non déformée dépend de l’abscisse X sur l’écran selon la loi δ(X, t) ' Lα(z = Xγ tan(ϕ), t) = h(t) exp − (Xγ tan(ϕ))2 /4Dt .
(16)
Le profil réel a pour équation Z(X, t) = −X tan(ϕ) − δ(X, t). Le point le plus bas est atteint pour ∂Z/∂X = 0, soit ∂δ/∂X = − tan(ϕ), alors que la distance maximale entre les profils réel et non déformé s’obtient pour ∂δ/∂X = 0, soit X = 0, et l’on retrouve h(t) = δ(0, t).
2.3 Choix du mélange L’expérience est d’autant mieux réussie que les liquides sont miscibles (sans quoi la diffusion ne peut avoir lieu), de densités et d’indices de réfraction raisonnablement éloignés (pour observer une déviation suffisamment grande tout en assurant la validité de l’Éq. (9)), et que l’indice du mélange varie linéairement avec la concentration (pour que la déviation satisfasse à l’équation de diffusion). Enfin, pour réduire les phénomènes de convection qui s’ajoutent au transport diffusif, on privilégiera un liquide visqueux. Pour satisfaire aux critères de miscibilité et de densité, il est avantageux de choisir deux substances polaires, par exemple, de l’eau pure d’un côté, et une espèce organique polaire de l’autre (glycérol, acétone, éthanol, etc.). Du reste, ces composés sont communs dans les laboratoires d’enseignement. Le glycérol est celui dont l’écart d’indice avec l’eau est le plus important, et sa forte viscosité, mille fois plus élevée que celle de l’eau, limite efficacement les phénomènes convectifs. Justifions maintenant l’approximation linéaire (7) pour la dépendance de l’indice de réfraction n(z, t) avec la concentration. Dans une phase condensée, la théorie de Lorentz permet de prendre en compte l’influence des molécules voisines via le champ local, et prédit que l’indice de réfraction suit la loi de Lorentz-Lorenz [6], M n2 − 1 Mg n2g − 1 Me n2e − 1 =x + (1 − x) . 2 2 ρ n +2 ρg ng + 2 ρe n2e + 2
(17)
Dans l’équation ci-dessus, x désigne la fraction molaire en glycérol d’une solution de glycérol-eau ; les indices « g » et « e » se rapportent au glycérol pur et à l’eau pure respectivement ; M = xMg + (1 − x)Me est la masse molaire du mélange, et ρ sa masse volumique, qui est tabulée. Les valeurs tabulées de l’indice de réfraction sont en excellent accord avec cette prédiction, comme le montre la Fig. 3. En utilisant une solution de faible fraction molaire en glycérol xm , il est possible de linéariser l’Éq. (17) entre x = 0 et x = xm pour obtenir l’Éq. (7). Nous avons préparé un mélange eau-glycérol à 50 % en masse avec une précision d’environ 1 %, soit de
410
Thermodynamique 1,48
1,42
Lorentz-Lorenz Tables Lin´eaire 1,39
1,40
1,37
1,46
n
1,44
1,38 1,36 1,34
1,35 1,33 0,00
0,04
0,08
0,12
0,16
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 x Fig. 3 Indice de réfraction n à la longueur d’onde de la raie D du sodium (589 nm), en fonction de la fraction molaire x en glycérol dans l’eau, à 20 ◦C [15]. Encart : comparaison entre les valeurs mesurées, issues de tables (disques bleus) ; attendues dans le cadre de la théorie du champ local de Lorentz (courbe rouge) ; et attendues pour une linéarisation entre x = 0 et x = xm ' 0,16, qui est la fraction molaire du mélange eau-glycérol (pointillés verts).
fraction molaire 1 xm = 0,164 ± 0,016. L’encart de la Fig. 3 montre que pour ce mélange, l’erreur induite par la linéarisation n’est pas négligeable devant l’écart nm − ne . C’est pourquoi il est nécessaire de trouver un compromis entre une faible valeur de la fraction molaire xm en glycérol, pour laquelle l’approximation affine (7) est bonne, et une valeur plus importante pour laquelle l’écart d’indice entre le mélange et l’eau est élevé. Par ailleurs, le coefficient d’interdiffusion du mélange eau-glycérol dans l’eau pure diminue quand la fraction molaire augmente [10] : l’expérience est donc d’autant plus rapide que le mélange est pauvre en glycérol. Les valeurs tabulées de l’indice de réfraction donnent nm = 1,398 à 20 °C [15], pour une incertitude de 3 × 10−3 provenant de l’imprécision sur la fraction massique. La variation de l’indice des substances organiques avec la température est d’environ 5 × 10−4 K−1 [15], de sorte que l’influence des variations de température au cours de l’expérience peut être négligée. Enfin, l’indice est tabulé pour la raie D du sodium (589 nm), qui ne correspond pas à la longueur d’onde des lasers usuels, et en particulier au laser vert à 532 nm que nous utilisons. Cet écart en longueur d’onde induit typiquement une variation d’indice de 2 × 10−3 pour les substances organiques [15]. En composant ces deux sources d’incertitudes, nous estimons la différence entre l’indice du mélange et celui de l’eau à nm − ne = 0,065 ± 0,004.
3 Mesure du coefficient de diffusion 3.1 Protocole Préparer un mélange eau-glycérol de fraction massique en glycérol d’environ 50 %, puis homogénéiser le mélange. Si l’on dispose d’un réfractomètre, mesurer son 1. xm = (w/Mg )/(w/Mg + (1 − w)/Me ) avec w la fraction massique en glycérol, et Mg = 92,09 g·mol−1 et Me = 18,02 g·mol−1 les masses molaires du glycérol et de l’eau [15].
V.6 Diffusion du glycérol dans l’eau
411
indice de réfraction nm . Dans le cas contraire, se reporter à la Fig. 3. Si l’on se sert de valeurs tabulées d’indice, il faut choisir un laser de longueur d’onde la plus proche possible de la raie D du sodium (589 nm).
Placer une mince cuve en verre sur un support élévateur, après avoir mesuré l’épaisseur interne e au pied à coulisse. La remplir à moitié avec de l’eau distillée. Éclairer la cuve avec un laser dont le faisceau, initialement horizontal, s’étale en une nappe oblique au passage d’une lentille cylindrique (simple cylindre allongé de plexiglas ou de verre), inclinée d’environ 45° par rapport à l’horizontale (Fig. 1). Disposer un écran après la cuve, et mesurer la distance L le séparant de la face de sortie de la cuve. La hauteur h(t) augmente avec L, en vertu de l’Éq. (15) : on choisira donc une distance de l’ordre du mètre, ce qui donne une déviation sur l’écran d’une dizaine de centimètres. Il est possible que la trace du faisceau sur l’écran ne soit pas nette. On peut éliminer en partie l’éclairement parasite en disposant une fente entre la lentille cylindrique et la cuve pour réduire légèrement l’épaisseur de la nappe laser, tout en évitant de la diffracter.
Fixer une feuille de papier millimétré sur l’écran et y tracer à la règle la droite matérialisant la trace de la nappe laser non déviée. À l’aide d’une seringue terminée par un tuyau souple, ajouter délicatement le mélange eau-glycérol au fond de la cuve. Pour assurer l’incidence normale des rayons de déviation maximale, on veillera à ce que l’interface soit à la même hauteur que la lentille cylindrique. La trace du faisceau se déforme fortement près de l’interface. Attendre quelques minutes que l’interface se stabilise et que la trace du faisceau redevienne nette. Déclencher le chronomètre, et tracer la droite verticale passant par le point le plus bas du profil. Relever régulièrement la position de l’intersection entre le profil sur l’écran et la droite verticale, typiquement toutes les 10 min la première heure, puis toutes les 20 min au-delà. Avec certains appareils numériques, il est possible de déclencher une photographie à intervalles réguliers. En posant l’appareil sur un trépied et en disposant une échelle de longueur sur l’écran (on prendra garde à la parallaxe), on évite le repérage manuel des points sur l’écran.
3.2 Résultats L’allure de la trace observée sur l’écran au cours du temps texp écoulé depuis le premier point de√mesure est représentée en Fig. 4. D’après l’Éq. (15), la hauteur h varie comme 1/ t, où t désigne le temps écoulé depuis le début de la diffusion. Cependant, dans l’analyse théorique nous avons choisi l’origine des temps de sorte qu’à l’instant initial, le profil de concentration est un échelon parfait, ce qui ne coïncide pas avec le début de l’expérience. Il est donc plus pertinent de représenter texp en fonction de 1/h2 , en admettant l’existence d’une ordonnée à l’origine. Les incertitudes de repérage en temps et position sont ∆texp = 3 s et ∆h = 1 mm, respectivement. En ajustant les points expérimentaux de la Fig. 5 par une loi affine
412
Thermodynamique
texp = 0 h
texp = 1 h
texp = 2 h
texp = 3 h
texp = 4 h
Fig. 4 Trace lumineuse sur l’écran à différents instants, depuis le début de l’expérience à texp = 0 h, jusqu’à texp = 4 h. La hauteur du rectangle blanc représente 10 cm et s’applique aux échelles verticale et horizontale. La distance h(t) entre le profil du faisceau non dévié (droite jaune tiretée) et le profil instantané (croix jaune) se mesure le long de la verticale passant par le point initialement le plus bas (droite continue blanche).
texp = a/h2 + b, nous obtenons les paramètres optimaux b = −(49,9 ± 0,4) min et a = (1,785 ± 0,009) × 102 s·m2 . Par ailleurs, on a χ2red ' 0,5, ce qui valide la loi (15). Le coefficient de diffusion du mélange eau-glycérol dans l’eau pure s’obtient à partir de la pente a de l’ajustement suivant l’Éq. (15), soit D = (eL(nm −ne ))2 /4πa. La distance écran-cuve est mesurée au mètre ruban, et vaut L = (1,49 ± 0,02) m, où l’incertitude prend en compte le non-parallélisme de l’écran par rapport à la face de sortie de la cuve. L’épaisseur interne de la cuve est mesurée au pied à coulisse et vaut e = (11,29 ± 0,05) mm. Il vient alors D = (5,3 ± 0,5) × 10−10 m2 ·s−1 .
(18)
250 texp (h)
h (mm)
225 200 175 150
4 3 2 1 0
0 20 40 60 80 100 h−2 (m−2 )
125 100
0
30
60
90 120 150 texp (min)
180
210
240
Fig. 5 Hauteur h en fonction du temps texp depuis le début de la série de mesures. Une régression affine du temps écoulé en fonction de 1/h2 donne texp = a/h2 + b avec b = −(49,9 ± 0,4) min et a = (1,785 ± 0,009) × 102 s·m2 .
V.6 Diffusion du glycérol dans l’eau
413
Cette valeur est cohérente avec les mesures réfractométriques [11] et les résultats des expériences de dispersion de Taylor [10]. En revanche les expériences plus précises d’interférométrie obtiennent un coefficient Dtab = 3,95 × 10−10 m2 ·s−1 pour un mélange à 50 % en masse de glycérol à 25 °C [10]. L’ordre de grandeur est correct, mais nous surestimons le coefficient de diffusion par rapport aux mesures interférométriques. Quelques arguments sont proposés en Sec. 3.3 pour discuter des causes possibles de cet écart.
3.3 Discussion Ordonnée à l’origine La durée t0 = −b = (49,9 ± 0,4) min est bien plus élevée que la durée d’attente entre le dépôt du mélange eau-glycérol au fond de la cuve (et donc a priori le début de la diffusion) et le premier point de mesure, qui n’est que de quelques minutes. La raison est que lorsque le liquide est déposé, il se mélange inévitablement avec l’eau pure qui surnage, si bien que la condition initiale ne correspond pas à une interface nette. On retrouve malgré tout le profil de gradient de concentration de l’Éq. (14) une fois que les remous ont cessé et que l’interface s’est aplanie, mais celui-ci est bien plus avancé dans le temps qu’attendu, puisque les mouvements macroscopiques de fluides ont accéléré l’homogénéisation. Rôle de la convection Nous avons négligé les mouvements d’ensemble du fluide. La convection est minimisée en réduisant les vibrations de la table au cours de l’expérience, en introduisant lentement le mélange eau-glycérol, ainsi qu’en utilisant une cuve étroite et un mélange visqueux, ce qui limite le transport de quantité de mouvement [2, 9]. Nous attendons que l’interface redevienne nette avant de prendre le premier point de mesure, si bien que la convection perturbe peu la mesure. De plus, la prise en compte d’un transport convectif conduirait à un terme supplémentaire en ∂c/∂z dans l’Éq. (10), ce que les données de la Fig. 5 ne semblent pas indiquer. Si la convection joue un rôle dans cette expérience, elle est indétectable aux incertitudes expérimentales près. Rôle de la température L’influence de la température sur le coefficient de diffusion peut s’estimer à l’aide de la relation d’Einstein (6), ce qui est utile dans la mesure où les valeurs de D sont souvent tabulées à la température de 25 ◦C, qui n’est pas forcément celle de l’expérience. À partir de valeurs tabulées de la viscosité, l’Éq. (6) indique que D augmente d’environ 10 % par rapport à sa valeur à 25 ◦C pour un échauffement de 2,5 ◦C. De telles variations de température n’ont pas été constatées, et n’expliquent donc pas l’écart entre les valeurs de D tabulée et mesurée dans cette expérience. Hypothèse de faible déviation L’hypothèse d’un faible angle de déviation est bien vérifiée aux temps longs, mais est moins satisfaisante à l’instant initial, où le faisceau est dévié d’une hauteur h0 ' 25 cm, soit un angle α0 = arctan(h0 /L) ' 9°. Néanmoins, cet écart ne semble pas affecter la loi (15) à la précision de nos mesures, et ne saurait expliquer l’écart entre le coefficient de diffusion que nous mesurons, et celui issu d’expériences interférométriques.
414
Thermodynamique
Inclinaison de la nappe lumineuse Dans le protocole décrit en Sec. 3.1, les rayons qui frappent la cuve à hauteur de l’interface ont une inclinaison θ0 faible par rapport à la normale, mais non nulle. En raison de cette inclinaison, les rayons de déviation maximale traversent la cuve sur une distance l ' e/ cos(θ0 /n) > e en négligeant la courbure de la trajectoire. En remplaçant e par l dans l’Éq. (15), nous en déduisons que le coefficient de diffusion réel Dréel ' D/ cos2 (θ0 /n) est légèrement supérieur au coefficient mesuré D. Pour un angle θ0 = 5°, l’erreur relative sur le coefficient de diffusion est de 0,4 %, ce qui est très inférieur à l’incertitude sur la valeur mesurée : l’inclinaison de la nappe laser ne porte pas à conséquence au vu de la précision de nos mesures. Cet effet géométrique est absent de la méthode employant un collimateur. Repérage de la déviation maximale Nous proposons dans le protocole de la Sec. 3.1 de mesurer la hauteur h(t), qui correspond à la déviation maximale du faisceau, le long de la droite verticale passant par le point le plus bas de la trace lumineuse au début de l’expérience. Cette technique a un avantage pratique certain. Cependant, puisque nous traçons cette droite verticale à un instant où le profil de diffusion est déjà âgé de t0 ' 50 min, nous commettons une erreur en estimant h(t) ainsi. Nous montrons ci-après que la distance δ(X0 , t) entre les traces lumineuses réelle et non déviée, mesurée le long de la droite passant par le point initialement le plus bas du profil, d’abscisse X0 , peut être assimilée à tout instant à la distance de déviation maximale h(t) en très bonne approximation. Nous rappelons que le point le plus bas du profil vérifie l’équation − tan(ϕ) =
∂δ eL(nm − ne )γ 2 tan2 (ϕ)X 2 √ =− exp − (Xγ tan(ϕ)) /4Dt . (19) ∂X 4 π(Dt)3/2
L’expérience suggère qu’à t = t0 , l’argument de l’exponentielle de l’Éq. (19) est petit devant 1, d’où l’on tire la solution approchée √ 4 π(Dt0 )3/2 ' 0,9 mm, (20) X0 ' eL(nm − ne )γ 2 tan(ϕ) avec γ ' 0,12 et tan(ϕ) ' 1. L’écart relatif de hauteur s’écrit donc 2 h(t) − δ(X0 , t) 4πt0 Dt0 ' ≤ 9 × 10−4 , δ(X0 , t) t eL(nm − ne )γ
(21)
et diminue avec le temps. Cet écart reste inférieur à l’incertitude de lecture de h(t), d’environ 1 mm, soit 0,4 % au minimum, et peut être négligé. En revanche le déplacement horizontal du point le plus bas de la trace, lui, est bien visible. Au bout d’un temps t ' 5 h, la résolution numérique de l’Éq. (19) donne X ' 11 mm, en accord avec ce que l’on peut voir sur la dernière image de la Fig. 4.
Références [1]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Physique statistique. Hermann, 1996.
V.6 Diffusion du glycérol dans l’eau
415
[2]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Thermodynamique. Hermann, 2007.
[3]
L. Dettwiller, « Démonstration de l’équation de la chaleur dans un milieu réactionnel avec diffusion des espèces chimiques et mouvement éventuel (IV), » Bup, 89 (775(2)), p. 117-124, 1995.
[4]
E. Guyon, J.-P. Hulin et L. Petit, Hydrodynamique physique, 3e éd. EDP Sciences, 2012.
[5]
D. Calecki, B. Diu, C. Guthmann, D. Lederer et B. Roulet, Exercices et problèmes de thermodynamique. Hermann, 2010.
[6]
C. Garing, Ondes électromagnétiques dans le vide et les milieux conducteurs. Ellipses, 1998.
[7]
N. Pottier, Physique statistique hors d’équilibre-processus irréversibles linéaires. EDP Sciences, 2012.
[8]
C. Kittel, Physique de l’état solide, 8e éd. Dunod, 2007.
[9]
H. Tyrrell et K. Harris, Diffusion in liquids : a theoretical and experimental study. Elsevier Science, 2013.
[10]
G. D’Errico, O. Ortona, F. Capuano et V. Vitagliano, « Diffusion coefficients for the binary system glycerol-water at 25 °C. A velocity correlation study, » J. Chem. Eng. Data, 49 (6), p. 1665-1670, 2004.
[11]
F. A. Bassi, G. Arcovito et G. D’Abramo, « An improved optical method of obtaining the mutual diffusion coefficient from the refractive index gradient profile, » J. Phys. E : Sci. Instr., 10 (3), p. 249-253, 1977.
[12]
C. Gaffney et C.-K. Chau, « Using refractive index gradients to measure diffusivity between liquids, » Am. J. Phys., 69 (7), p. 821-825, 2001.
[13]
B. Portelli et J. Barthes, La physique par la pratique. H & K, 2005.
[14]
C. Garing, Ondes mécaniques et diffusion. Ellipses, 1998.
[15]
W. Haynes, CRC handbook of chemistry and physics, 95e éd. CRC Press, 2014.
Pendule double puits
VI.1 électronique
Dans cette expérience, nous modélisons expérimentalement à l’aide de composants électroniques un système dynamique non linéaire simple : le pendule double puits. Après avoir introduit les aspects théoriques nécessaires à la bonne compréhension de l’expérience, nous décrivons le circuit modélisant le système et traçons expérimentalement son portrait de phase. Ce dispositif met également en évidence la présence d’une bifurcation dans le comportement de ce système dynamique. Celle-ci est caractérisée par le tracé du diagramme de bifurcation correspondant.
Sommaire 1 2 3 4
Introduction . . . . . . . Aspects théoriques . . . . Pendule double puits . . . Diagramme de bifurcation
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
419 420 426 430
Compléments A
Typologie des points fixes des systèmes dynamiques linéaires bidimensionnels . . . . . . . . . . . . . . . . . 432
1 Introduction La théorie des systèmes dynamiques à temps continu traite des systèmes dont l’évolution temporelle est régie par un ensemble d’équations différentielles déterministes. On les rencontre dans de nombreux domaines : le pendule pesant en mécanique [1, 2], le modèle de Lotka-Volterra pour la dynamique des populations en compétition [3, 4] ou encore la modélisation de réactions chimiques spontanément oscillantes [5]. Si la dynamique des systèmes linéaires est exactement connue, celle des systèmes non linéaires est rarement résoluble analytiquement. Cependant, il existe dans certains cas des outils permettant l’étude détaillée de leur dynamique, tels que le portrait de phase. L’expérience présentée dans ce chapitre expose l’application de ces outils à un exemple concret : le pendule double puits. Alors qu’un pendule simple possède une position d’équilibre stable, le pendule double puits en possède deux symétriques. Une réalisation simple de ce système peut être mise en œuvre à l’aide d’un pendule pesant portant un aimant, oscillant entre deux autres aimants qui définissent les deux positions d’équilibre du pendule [1]. Dans cette expérience, nous en présentons plutôt une modélisation électronique, qui permet un contrôle précis des paramètres le caractérisant. En particulier, cela rend possible la réalisation expérimentale d’une bifurcation, c’est-à-dire un changement important et qualitatif de la dynamique lorsqu’un paramètre de contrôle varie faiblement. La compréhension des bifurcations est fondamentale dans l’étude 419
420
Phénomènes non linéaires et instabilités
des systèmes dynamiques : elle fournit une information sur les conditions d’obtention d’un état final donné. Par exemple, le gain du milieu actif d’un laser permet de contrôler une bifurcation de l’intensité de la lumière laser, de zéro à une valeur finie [6, 7]. Nous obtenons dans la suite un tracé expérimental du diagramme de bifurcation du pendule double puits.
2 Aspects théoriques Cette partie suppose acquises les notions élémentaires nécessaires à l’étude des systèmes dynamiques. Une présentation de ses notions peut être trouvée dans la Réf. [6]. Dans toute la suite, X˙ désigne la dérivée temporelle dX/dt de la grandeur X.
2.1 Étude du système dynamique 2.1.1 Dynamique du système et points fixes Le mouvement unidimensionnel d’un point matériel de masse m dans un champ de force conservatif est décrit par le système dynamique mx ¨(t) = −
dV x(t) , dx
(1)
où x(t) désigne l’abscisse du point, x ¨(t) sa dérivée seconde temporelle et V x le potentiel dans lequel il évolue. Dans toute la suite, nous considérons des grandeurs adimensionnées et posons m = 1. On étudie ici le potentiel V (x) = δ x2 + λ x4 ,
(2)
comportant un terme d’ordre 4 en x pour λ 6= 0. Ce potentiel décrit un système non linéaire simple possédant des états liés. Il n’y a pas de solution analytique pour x(t) dès lors que λ est non nul, mais l’étude des points fixes va permettre la détermination de la dynamique [6]. On supposera dans toute la suite λ > 0, afin d’assurer l’existence de positions d’équilibre stables. Le signe de δ détermine leur nombre et leur nature. Les différentes situations sont représentées sur la Fig. 1. Afin de faciliter la résolution du système, il est commode de se ramener à un système d’équations ne contenant que des dérivées du premier ordre :
x˙ y˙
= f (x, y) = = g(x, y) =
y . −(2δ x + 4λ x3 )
(3)
On ramène alors l’étude d’un problème du second ordre à une dimension sur l’axe (Ox), à un problème du premier ordre à deux dimensions dans le plan (Oxy), où la variable y représente la vitesse du mobile. Les points d’équilibre (x∗ , y ∗ ) sont ∗ ∗ définis par (x, ˙ y) ˙ = (0, 0), ce pqui donne ici (x , y ) = (0, 0) = P0 quel que soit le ∗ ∗ signe de δ, et (x± , y± ) = (± −δ/2λ, 0) = P± si δ < 0. Pour déterminer la stabilité de ces points fixes dans l’approximation linéaire, on étudie la matrice jacobienne J
VI.1 Pendule double puits électronique
421
δ = −2 δ = −1,5 δ=0 δ=1 δ=6 V (x∗± )
1,0
V
0,5
0,0
-0,5 -1,0
-0,5
0,0 x
0,5
1,0
Fig. 1 Allure du potentiel pour différentes valeurs de δ, λ = 2 étant fixé. Pour δ < 0, il existe une position d’équilibre instable, d’abscisse x = 0, et deux positions d’équilibre stables, d’abscisses symétriques par rapport à l’origine. La courbe tiretée noire est le lieu des minima x∗± de V lorsque δ varie. Elle est tangente inférieurement à l’axe des abscisses en l’origine. Pour δ ≥ 0, il n’y a qu’une position d’équilibre stable x = 0.
du système, évaluée aux points fixes : ∂f ∂x ∗ ∗ J(x , y ) = ∂g ∂x
∂f 0 1 ∂y (x∗ , y ∗ ) = . 2 ∂g −(2δ + 12λ x∗ ) 0 ∂y
La typologie des points fixes des systèmes dynamiques linéaires 2D est rappelée dans le Comp. A. Considérons d’abord le point fixe à l’origine P0 . En ce point, la jacobienne vaut 0 1 J(0, 0) = J0 = . (4) −2δ 0 Pour δ < 0, le déterminant de J0 est strictement négatif, le point fixe est donc un point col instable. Pour δ > 0, J0 est de trace nulle et de déterminant strictement positif. Dans le cadre d’une analyse linéaire, l’origine est donc un centre : une trajectoire passant près de l’origine n’est ni attirée ni repoussée par ce point fixe. Les deux autres points fixes P± sont symétriques par rapport à l’axe (Oy) et ont pour jacobienne p 0 1 . (5) J(± −δ/2λ, 0) = 4δ 0
Ainsi, lorsque δ < 0 (ce qui conditionne leur existence), l’analyse linéaire prédit que les points fixes P± sont des centres. Toutefois, ce type de point fixe est très sensible aux non-linéarités (voir Comp. A) : un point fixe décrit comme un centre par une analyse linéaire peut devenir stable ou instable si les non-linéarités du système sont prises en compte. Cependant, le système étant conservatif, on a bien ici des centres
422
Phénomènes non linéaires et instabilités
non linéaires 1 . En intégrant l’équation du mouvement (1) sous la forme 1 2 y + V (x) = E(x, y) = cste, 2
(6)
la grandeur E s’interprète comme l’énergie totale du système, conservée en l’absence de dissipation. Les trajectoires du point matériel dans le plan de phase (x, y) sont alors des contours d’énergie constante, c’est-à-dire des trajectoires fermées suffisamment près des points fixes [6]. Cette robustesse des centres linéaires du système peut se comprendre à la lumière d’une autre propriété : un système conservatif est symétrique par renversement du temps t → −t. Les équations du système (3) sont invariantes sous le changement (t → −t, x → x, y → −y), et donc si (x(t), y(t)) décrit une trajectoire, (x(−t), −y(−t)) en décrit une aussi. Cela implique une invariance de l’ensemble des trajectoires par rapport à la symétrie d’axe (Ox) dans le plan de phase. Les centres linéaires de ce système sont situés sur la droite (Ox). Une trajectoire passant près d’un centre croise l’axe (Ox), elle est donc fermée puisque son symétrique par rapport à (Ox) est aussi une trajectoire. Le point fixe est donc un centre, même en tenant compte des non-linéarités [6]. À l’inverse, considérons un système non conservatif tel que
x˙ y˙
= =
−y + x(x2 + y 2 ) . x + y(x2 + y 2 )
(7)
L’étude fixe (0, 0) est un centre. Pourtant, en notant p linéaire prévoit que le point 3 2 2 r = x + y , on montre que r˙ = r . Ainsi, pour une condition initiale différente de (0, 0), la distance du mobile à son point fixe diverge. Celui-ci est en réalité instable, une fois les non-linéarités prises en compte.
L’étude précédente nous permet de tracer le portrait de phase du système, c’est-à-dire l’ensemble de ses trajectoires dans le plan (x, y) pour différentes conditions initiales. Il est représenté en Fig. 2(a) dans le cas δ < 0. Les trajectoires traversant l’axe (Ox) sont fermées, donc périodiques, comme prévu pour le potentiel considéré. Il existe tout de même deux trajectoires non périodiques, appelées ici homoclines 2 , qui démarrent et finissent à l’origine. Les homoclines à gauche et à droite de l’axe des ordonnées sont distinctes, deux trajectoires d’un portrait de phase ne pouvant se croiser. On peut montrer que le temps mis par un point matériel pour les parcourir entièrement est infini, ce qui justifie qu’elles ne sont parcourues qu’une fois [6]. Un système physique réel présente inévitablement de la dissipation, qui ne modifie souvent pas les positions d’équilibre. Quelle que soit la condition initiale, si un système ne comporte pas d’élément actif lui apportant de l’énergie, son énergie va décroître. Les trajectoires vont donc converger vers les points fixes stables, qui correspondent aux minima du potentiel (voir la Fig. 6(b) pour un portrait de phase expérimental
1. Un centre est dit non linéaire s’il reste un centre lorsque les déviations au point fixe sont significatives et que les non-linéarités entrent en jeu. 2. On désigne par homocline une trajectoire joignant un point d’équilibre à lui-même. Une trajectoire joignant deux points d’équilibre distincts est appélée hétérocline.
VI.1 Pendule double puits électronique
0
x∗ (unit´e arb.)
(b)
y = x˙ (unit´e arb.)
(a)
423
0
0 0 δ (unit´e arb.) x (unit´e arb.) Fig. 2 (a) Portrait de phase dans le cas δ < 0. Les disques noirs représentent les points fixes stables, et le cercle le point fixe instable. Les trajectoires homoclines sont tracées en tireté. (b) Diagramme de bifurcation du système. Les points fixes stables P± sont représentés par des lignes rouges continues, tandis que P0 est représenté par la courbe bleue, continue quand le point fixe est stable et tiretée dans le cas contraire. présentant de la dissipation). En présence de dissipation, les centres deviennent donc des points fixes stables, et les trajectoires du portrait de phase ne sont plus fermées.
2.1.2 Bifurcations des systèmes dynamiques Dans le langage des systèmes dynamiques, on parle de bifurcation lorsque la nature ou le nombre de points fixes d’un système changent si un paramètre de contrôle varie. Ici, c’est le paramètre δ qui joue ce rôle. On peut tracer un diagramme de bifurcation qui représente la position des points fixes en fonction de δ (Fig. 2(b)). Lorsque le paramètre de contrôle δ passe d’une valeur positive à négative, le point fixe P0 perd sa stabilité tandis que p deux nouveaux points fixes stables P± symétriques apparaissent. Comme x± = −δ/2λ, le diagramme de bifurcation pour δ < 0 est une parabole. Cette forme est à l’origine de la dénomination « fourche » de la bifurcation [6]. Si l’on part d’une situation d’équilibre à δ > 0 et que l’on diminue progressivement ce paramètre, le point fixe que choisit le système lorsque δ devient négatif varie en présence d’une perturbation initiale. On parle alors de brisure de symétrie : il n’y a plus invariance par réflexion par rapport à la droite d’équation x = 0 pour δ < 0. Cette situation, a priori contre-intuitive, où un système physique choisit une configuration possédant moins de symétries que son énergie potentielle, est en fait courante. Le même phénomène a par exemple lieu lors du flambage d’une poutre compressée [8]. La notion de brisure de symétrie trouve des applications en physique des transitions de phase. Prenons l’exemple d’un matériau ferromagnétique (voir l’Exp. II.2, « Cycle d’hystérésis d’un milieu ferromagnétique »). À l’équilibre thermodynamique, on peut écrire l’énergie libre du système comme une fonction de la température T et de l’aimantation moyenne seulement [9, 10]. L’aimantation spontanée est celle qui minimise cette énergie libre. La transition ferromagnétique-paramagnétique correspond à une
424
Phénomènes non linéaires et instabilités
bifurcation entre états d’équilibre à aimantation nulle et à aimantation finie lorsque T varie. Dans ce dernier cas, le système perd en degré de symétrie. Ce lien entre symétries et transitions irrigue toute la physique, depuis les modèles de Landau phénoménologiques [9, 11] jusqu’au mécanisme de Higgs du modèle standard [12, 13].
2.2 Modélisation expérimentale Décrivons à présent une réalisation expérimentale d’un tel système dynamique à partir de composants électroniques, en nous inspirant de la Réf. [14]. 2.2.1 Réalisation de l’élément non linéaire La première étape est de concevoir un circuit électronique modélisant le comportement non linéaire voulu, et donc un potentiel décrit par l’Éq. (2). Pour obtenir une loi polynomiale, on utilise des multiplieurs analogiques, supposés idéaux 3 et de coefficient commun k. Le schéma de l’élément non linéaire est représenté en Fig. 3(a). Les notations employées dans la suite y sont indiquées. Une tension x est appliquée à l’entrée de l’élément, qui délivre une tension de sortie s. La tension V0 est continue, paramètre de contrôle qui va jouer un rôle important dans la suite. On suppose que l’amplificateur opérationnel (AO), dont la rétroaction agit sur l’entrée inverseuse, est idéal et fonctionne en régime linéaire. Ses courants d’entrée sont en particulier supposés nuls 4 . Le premier multiplieur délivre une tension y1 = k x2 . En appliquant un pont diviseur de tension entre les deux multiplieurs, on obtient V1 − y2 =
R2n (y1 − y2 ) . R1n + R2n
(8)
De manière équivalente, en appliquant un pont diviseur de tension à la borne non inverseuse de l’AO, là encore en utilisant que les courants d’entrée sont nuls, il vient V1 =
R4n V0 . R3n + R4n
(9)
En injectant ce résultat dans l’Éq. (8), on aboutit à y2 =
R4n R1n + R2n R2n 2 V0 − k x . R3n + R4n R1n R1n
(10)
Finalement, en câblant le deuxième multiplieur de sorte à délivrer une tension s = −k y2 x, on obtient la caractéristique de l’élément non linéaire s = −k y2 x = αx + βx3 ,
(11)
3. Un multiplieur idéal fonctionne à toute fréquence, a des impédances d’entrée infinies et une impédance de sortie nulle. 4. En pratique, ils sont de l’ordre du pA [15] alors que les courants dans les branches en amont sont de l’ordre du mA.
425
VI.1 Pendule double puits électronique
}
(a) A B
2
x R1n
R2n
s
1
y2 y1
A
{z
−
N.L.
x
R3n
B s
+
V0
R4n |
V1
Rv
(b)
C1 R
R1 −
s
1
− +
C2
R u
2
R2 − +
B
3
+
N.L.
x
A
Fig. 3 Schémas des circuits électriques. Les notations utilisées dans la suite de la section y sont introduites. (a) Réalisation de l’élément non linéaire. Le cercle en sortie du multiplieur 2 indique qu’il est branché de sorte que son coefficient est de signe opposé à celui du multiplieur 1, soit s = −k y2 x. (b) Circuit modélisant le pendule double puits. Le sens de branchement de l’élément non linéaire est indiqué par une flèche. Les valeurs des composants utilisés sont listées dans le Tab. 1.
où les coefficients α et β sont donnés par R1n + R2n R4n kV0 α = − R3n + R4n R1n R2n β = k 2 >0 R1n
.
(12)
Nous avons ainsi réalisé un élément non linéaire modélisant le pendule double puits, qui reproduit le second membre de l’Éq. (1). Il reste à insérer cet élément dans un circuit reproduisant tout le système dynamique. 2.2.2 Réalisation du double puits Le schéma électrique global est représenté en Fig. 3(b), dont nous utiliserons les notations dans le calcul qui suit. La tension x dont on souhaite étudier l’équa-
426
Phénomènes non linéaires et instabilités
tion d’évolution est la tension en entrée de l’élément non linéaire. Les premier et troisième blocs de la branche supérieure jouent le rôle d’intégrateurs dans la bande de fréquences utilisée. Le potentiel à la borne inverseuse de l’AO 1 est nul. En appliquant la loi des nœuds, on obtient u s = −C1 u˙ − . R1 Rv
(13)
Le bloc suivant est un amplificateur inverseur de gain 1 délivrant la tension −u. Le dernier bloc est un intégrateur, de sorte qu’en sortie, x˙ = u/R2 C2 . Finalement, en utilisant la caractéristique de l’élément non linéaire (11), on trouve l’équation différentielle vérifiée par x : x ¨+
1 α β x˙ + x+ x3 = 0. Rv C1 R1 R2 C1 C2 R1 R2 C1 C2
(14)
On obtient ainsi l’équation souhaitée, c’est-à-dire un système dynamique décrit par l’Éq. (1) avec un potentiel de la forme (2), à un terme d’amortissement près proportionnel à x. ˙ Les paramètres δ et λ sont donnés par δ = α/(2R1 R2 C1 C2 ) et λ = β/(4R1 R2 C1 C2 ). La résistance Rv est variable, mais reste toujours beaucoup plus faible que les résistances de fuite des deux condensateurs 5 . De cette manière, l’amortissement est contrôlé par l’expérimentateur, le temps caractéristique de relaxation du système étant τrelax = Rv C1 . La valeur de √ la résistance Rv n’influe pas sur les positions d’équilibre. On définit également T = R1 R2 C1 C2 , qui donne une estimation de la période des oscillations du système. On constate que β est toujours positif d’après l’Éq. (12), ce qui assure que le système possède toujours au moins un point fixe stable, indépendamment de la valeur de α. En revanche, la valeur et le signe de α sont directement fixés par la tension de contrôle V0 . On va donc pouvoir faire varier celle-ci pour tracer un diagramme de bifurcation, en étudiant l’évolution des positions d’équilibre.
3 Pendule double puits 3.1 Étude de l’élément non linéaire Réaliser le schéma électrique représenté sur la Fig. 3(a). Prendre garde à brancher le multiplieur 2 de façon à obtenir en sortie l’opposé du produit des deux tensions d’entrée. Les multiplieurs que nous avons utilisés ont pour même coefficient k = (0,1001 ± 0,0001) V−1 . Les valeurs des résistances que nous avons utilisées pour cette expérience sont données dans le Tab. 1. Ces valeurs ont été mesurées au RLC-mètre, utilisé à une fréquence de 120 Hz. À ce calibre, l’incertitude relative sur les mesures effectuées est de 0,5 %. Les impédances de sortie des AO (utilisés en contre-réaction) et des multiplieurs étant de l’ordre de quelques ohms, il faut veiller à utiliser des résistances bien plus élevées pour 5. La résistance de fuite des condensateurs à film plastique que nous avons utilisés est de l’ordre de 100 GW [15]. Elle est plus faible pour les condensateurs électrochimiques et dépend dans ce cas de la tension appliquée.
427
VI.1 Pendule double puits électronique Élément non linéaire
Double puits
R1n = (6,214 ± 0,003) kΩ R2n = (82,14 ± 0,04) kΩ R3n = (6,178 ± 0,003) kΩ R4n = (1,998 ± 0,001) kΩ
R1 = (1,000 ± 0,005) kΩ R2 = (9,954 ± 0,005) kΩ C1 = (989 ± 7) nF C2 = (882 ± 6) nF
Tab. 1 Valeurs des composants utilisés pour la modélisation expérimentale, mesurées à l’aide d’un RLC-mètre utilisé à une fréquence de 120 Hz. La valeur de R n’est pas contraignante et Rv est laissée variable. pouvoir les considérer comme idéaux.
Appliquer en entrée une tension x sinusoïdale, basse fréquence et d’amplitude de l’ordre de 5 V. Il faut prendre garde au fait que les multiplieurs ne fonctionnent correctement que si les tensions en entrée sont inférieures à leur tension de saturation en valeur absolue (celle-ci est de 10 V pour les multiplieurs utilisés). Le gain des AO et des multiplieurs chutant à haute fréquence, il est important de travailler à une fréquence comprise dans leur gamme d’utilisation. Les composants utilisés ont une fréquence de coupure de l’ordre de 1 MHz. Une fréquence de balayage de 10 Hz pour x convient alors.
À l’aide d’une carte d’acquisition, mesurer les tensions de sortie s et d’entrée x, et représenter s en fonction x. Pour V0 = (498 ± 1) mV, la caractéristique est représentée sur la Fig. 4(a). Pour une visualisation rapide de la loi de comportement de l’élément non linéaire, on peut utiliser le mode XY d’un oscilloscope et activer la persistence lumineuse.
Répéter l’étape précédente pour différentes valeurs de V0 afin de mesurer les paramètres α et β et de vérifier les prédictions de l’Éq. (12). A priori, il n’est pas utile de faire varier V0 pour obtenir la valeur de β, mais procéder ainsi permet de vérifier que β est effectivement indépendant de V0 et de réduire l’incertitude sur son estimation. (a)
(b) 1,0
0,5 s/x
s (V)
2
0
0,0
−2 −2
-0,5
0 x (V)
2
0
2
4 x2 (V2 )
6
8
Fig. 4 (a) Caractéristique de l’élément non linéaire pour V0 = (498 ± 1) mV. (b) Vérification de la relation s = s(x) de l’élément non linéaire pour V0 = (498 ± 1) mV. Un ajustement affine est représenté par une courbe continue rouge.
428
Phénomènes non linéaires et instabilités 0,5
α
0,0 -0,5 -1,0 -1,5 -1
0
1
2
3
4
V0 (V)
Fig. 5 Évolution de α en fonction de V0 . Un ajustement affine α = a0 V0 + b0 , en courbe pleine, donne a0 = (−3,55 ± 0,03) × 10−1 V−1 et b0 = (−7,22 ± 0,02) × 10−3 .
On vérifie la prédiction théorique de l’Éq. (11) en traçant s/x en fonction de x2 . La Fig. 4(b) montre un tel ajustement pour V0 = (498 ± 1) mV, qui confirme la dépendance prévue. En répétant les mesures pour une dizaine de valeurs de V0 différentes, on obtient βmes = (1,332 ± 0,002) × 10−1 V−2 . L’accord avec la valeur attendue βatt = (1,324 ± 0,003) × 10−1 V−2 est satisfaisant. Les résultats expérimentaux concernant la variation de α en fonction de V0 sont représentés en Fig. 5. Un ajustement affine α = a0 V0 + b0 suivant l’Éq. (12) donne a0 =(−3,55 ± 0,03) × 10−1 V−1 et b0 = (−7,22 ± 0,02) × 10−3 . La théorie prévoit une évolution linéaire avec une pente a0att = (−3,478 ± 0,005) × 10−1 V−1 . L’accord sur la valeur de a0 mesurée est satisfaisant. La valeur de l’ordonnée à l’origine que nous obtenons peut être due à une tension de décalage (offset) résiduelle de l’AO présent dans l’élément non linéaire, qui ajoute à la sortie s un terme proportionnel à l’entrée x. Elle n’influence pas la suite de l’expérience, puisque seule la connaissance de la loi α = f (V0 ) est requise. Il est possible de minimiser la tension de décalage des AO utilisés pour s’affranchir de ces effets. Cette tension de décalage Vd , de l’ordre de 1 mV, provient d’une dissymétrie entre les transistors d’entrée de l’AO [16]. Les modèles d’AO les plus courants (TL081 par exemple) possèdent huit broches, dont deux sont dédiées à la compensation de ce décalage. Il faut y connecter un potentiomètre, dont le curseur est relié à l’alimentation de l’AO. Pour visualiser la tension de décalage, il faut relier les deux bornes d’entrée de l’AO entre elles. La tension en sortie est alors A0 Vd , où A0 est le gain statique de l’AO. Cette tension est en général de l’ordre de 100 V, l’AO sature donc à ±Vsat . Le réglage peut dans ces conditions se faire de façon particulièrement fine, car lorsque la tension de décalage est compensée par le potentiomètre, la tension de sortie varie fortement de ±Vsat à ∓Vsat . Toutefois, la tension de décalage est sensible à la température ainsi qu’à l’environnement de l’AO, et ce réglage délicat doit parfois être effectué plusieurs fois au cours de l’expérience.
429
VI.1 Pendule double puits électronique
3.2 Étude de la dynamique Reproduire le schéma électrique représenté sur la Fig. 3(b). On veillera au sens de branchement de l’élément non linéaire dans la boucle de rétroaction et à choisir un V0 positif. Les valeurs des composants que nous avons utilisés sont données dans le Tab. 1. La valeur de R n’est pas très contraignante, le bloc de l’AO 2 servant juste d’amplificateur inverseur. Elle doit toutefois être plus grande que l’impédance de sortie de l’AO. Les valeurs de R1 , R2 , C1 et C2 contrôlent T , en accord avec l’Éq. (14). Elles sont choisies de sorte à avoir une fréquence proche de 120 Hz. Cette fréquence se situe dans la bande passante des AO. La capacité C1 a alors été choisie constante tandis que Rv est une résistance variable. La tension de décalage de l’AO 1 sur la Fig. 3(b) a pour effet de translater les portraits de phase verticalement en modifiant la valeur de u. Il est donc important de la réduire le plus possible avant d’effectuer les mesures, afin de recentrer les trajectoires sur l’axe des abscisses.
Observer sur un oscilloscope la tension x. Relier la sortie de l’AO 1 à une masse via un interrupteur fermé. Les tensions u et x sont donc nulles et le système est en état d’équilibre instable. Ouvrir l’interrupteur. Le bruit électrique initie alors les oscillations. On obtient les courbes présentées en Fig. 6(a) pour Rv = 100 kΩ, représentant des oscillations amorties jusqu’aux positions d’équilibre x± . Pour cette valeur de Rv on a τrelax /T ' 10. Ce choix permet d’avoir une décroissance visible des oscillations sur un temps caractéristique de quelques périodes. En théorie, seules les conditions initiales déterminent la position d’équilibre. Le double puits n’étant pas parfaitement symétrique, et la trajectoire pouvant fluctuer à cause du bruit électrique, le puits d’arrivée varie en pratique d’un essai à l’autre. Il faut donc lancer plusieurs oscillations pour atteindre chacun des deux points fixes.
Se placer en mode XY, activer la persistance lumineuse et représenter u en fonction de x pour observer le portrait de phase des oscillations. On obtient la (b)
x (V)
7,5 4,5 1,5 -1,5 -4,5 7,5 -7,5 4,5 0 1,5 -1,5 -4,5 -7,5 0
2 1 1
2
3
u (V)
x (V)
(a)
0 -1 -2
1
2 t (s)
3
-3,0
-1,5
0,0 x (V)
1,5
3,0
Fig. 6 (a) Évolution temporelle pour deux conditions initiales différentes, menant aux positions d’équilibre x∗+ en haut et x∗− en bas. (b) Portrait de phase associé. Les trajectoires sont tracées pour τrelax /T ' 10.
430
Phénomènes non linéaires et instabilités 3 2 u (V)
1 0 -1 -2 -3 -4
-3
-2
-1
0 x (V)
1
2
3
4
Fig. 7 Portrait de phase exprérimental, obtenu pour τrelax /T ' 500. Les différentes courbes correspondent à différentes amplitudes initiales. Deux trajectoires proches des homoclines sont représentées par des lignes noires tiretées. Les courbes ne sont pas tout à fait fermées à cause de la dissipation. Les disques noirs représentent les positions d’équilibre stables, correspondant aux points fixes stables.
Fig. 6(b). Les trajectoires ne sont pas fermées, à la différence de celles présentées en Fig. 2(a), du fait de la dissipation. Pour tracer un portrait de phase analogue à celui de la Fig. 2(a), il faut que les trajectoires soient quasiment fermées après une période d’oscillation. En traçant des portions du graphe parcourant une seule période T , à différents stades de la décroissance, on obtient un ensemble de trajectoires à énergie quasiment constante. Cela correspond au portrait de phase du système. Le temps de relaxation doit être grand devant la période des oscillations. C’est ce qui a été choisi pour tracer la Fig. 7, pour laquelle nous avons pris Rv = 5 MΩ. Cette valeur correspond à τrelax /T ' 500. L’accord entre les portraits de phase expérimental et théorique est excellent. On remarque la présence de trajectoires proches des homoclines, qui démarrent et finissent à l’origine.
4 Diagramme de bifurcation 4.1 Principe et protocole L’analyse théorique a montré que le paramètre de contrôle permettant de modifier les positions d’équilibre du système est la tension V0 , intervenant dans l’élément non linéaire. En effet, α est proportionnel à V0 d’après l’Éq. (12). En imposant une rampe suffisamment lente en V0 , on peut alors parcourir l’ensemble des positions d’équilibre du système. La rampe doit varier lentement devant le temps de relaxation du système pour que l’évolution soit quasi statique. De cette manière, le système est à tout instant à l’équilibre, et la tension mesurée correspond bien à x∗ . La rampe doit également posséder une portion négative afin d’explorer les situations où il n’existe qu’une seule position d’équilibre. p Dans le cas δ < 0, les points fixes stables du système sont P± = (± −δ/2λ, 0), où les paramètres δ et λ apparaissent dans l’Éq. (2). Pour le système étudié, en
431
VI.1 Pendule double puits électronique réinjectant les expressions de δ et λ, on trouve finalement x∗±
=±
r
α − . β
(15)
Le protocole que nous mettons en œuvre permet de vérifier quantitativement cette relation. Choisir Rv = 10 kΩ, de sorte à avoir τrelax ' 10 ms. Imposer une rampe triangulaire symétrique en V0 dans l’élément non linéaire, de fréquence de l’ordre de 100 mHz (voir l’encart de la Fig. 8(b)). Sa période est ainsi de l’ordre de 10 s, et est donc grande devant τrelax . Supposons que le coefficient α initial soit positif. Dans ce cas, le point fixe dans lequel est le système est P0 . Lorsque α diminue et devient négatif, ce point fixe va devenir instable et le système va bifurquer. Pour déterminer vers quelle branche du diagramme de bifurcation le système va se diriger, il faut connaître les conditions en α = 0. À l’instant où α devient négatif, la tension x n’est pas rigoureusement nulle à cause du bruit électrique. En contrôlant la tension de décalage de l’AO 3 (voir la Fig. 3(b)), on peut « forcer » la branche que va emprunter le point fixe. Réduire autant que possible la tension de décalage de l’AO 3, comme expliqué à la fin de la Sec. 3.1. Observer sur un oscilloscope la rampe d’entrée et la tension x en mode XY, avec la persistance lumineuse activée. On observe alors une branche ayant l’allure de celles présentées en Fig. 8(a). Si le système n’explore spontanément qu’un seul puits, on peut le forcer à explorer l’autre à l’aide de la tension de décalage de l’AO 3. Imposer une légère tension de décalage positive. Le système va alors parcourir la branche supérieure du (a)
(b) V0 (V)
16
5,0
13 x∗+ 2 (V 2 )
x∗± (V )
2,5 0,0
10
8 4 0 -4
7
-2
4
1 4 t (s)
7
-2,5
1 -5,0 -2,0 -1,5 -1,0 -0,5 α
0,0
0,5
1,0
-2 -2,0
-1,5
-1,0
-0,5
0,0
0,5
α
Fig. 8 (a) Diagramme de bifurcation représentant les positions d’équilibre stables du système en fonction du paramètre adimensionné α. Les deux branches sont symétriques par rapport à l’axe des abscisses, aux incertitudes expérimentales près. (b) Graphe représentant le carré de x∗+ en fonction du paramètre α. La rampe de tension V0 présentée dans l’encart permet de faire varier α en accord avec l’Éq. (12). Un ajustement affine x∗+ 2 = a α + b sur la portion correspondant à α < 0 donne a = (−7,4 ± 0,1) V2 et b = (0,02 ± 0,02) V2 .
432
Phénomènes non linéaires et instabilités
diagramme au cours d’une période de V0 . Puis imposer un léger décalage négatif cette fois, afin de parcourir la branche inférieure du diagramme.
4.2 Résultats Le diagramme de bifurcation obtenu est présenté en Fig. 8(a). L’accord avec le diagramme de bifurcation théorique présenté en Fig. 2(b) semble bon. Pour le confirmer quantitativement, on effectue une régression linéaire en traçant x∗+ 2 en fonction de α (Fig. 8(b)). Les points trop proches de l’origine ne sont pas pris en compte dans l’ajustement. La modélisation affine x∗+ 2 = a α + b fournit les paramètres d’ajustement a = (−7,4 ± 0,1) V2 et b = (0,02 ± 0,02) V2 . L’incertitude sur l’ordonnée à l’origine étant de l’ordre du paramètre d’ajustement, nos données sont compatibles avec la loi linéaire prévue théoriquement. Il faut comparer ce résultat à la valeur attendue aatt = −1/βmes = (−7,508 ± 0,011) V2 , calculée pour la valeur mesurée de β (voir Sec. 3.1). Le modèle théorique est donc très bien vérifié. Revenons sur notre décision de ne pas tenir compte, dans l’ajustement, des points près de l’origine. Il n’y a pas de singularité de la dérivée à l’origine sur le graphe expérimental. En effet, pour de trop faibles valeurs de α le potentiel n’est plus exactement symétrique, car la tension de décalage résiduelle de l’AO n’est plus négligeable. Ainsi, puisqu’une des positions d’équilibre devient favorable, il n’y a plus de brisure de symétrie : la singularité à l’origine disparaît. Ce système simple peut être mis à profit pour étudier une physique plus riche. En forçant le système avec une excitation sinusoïdale (à la borne inverseuse de l’AO 1 par exemple), le système acquiert un troisième degré de liberté : le temps. C’est alors un système non linéaire avec un espace des phases de dimension trois, qui peut devenir chaotique [14]. Un autre exemple typique de circuit électronique exhibant un comportement chaotique est le circuit de Chua, qui n’est pas forcé, mais possède trois composants pouvant stocker de l’énergie, donc trois degrés de liberté [17]. Sa simplicité en a fait un des systèmes chaotiques expérimentaux les plus étudiés.
Complément A - Typologie des points fixes des systèmes dynamiques linéaires bidimensionnels Un système dynamique linéaire 2D est décrit par une équation différentielle dX = AX, dt où X(t) = (x(t), y(t)) est une fonction de R dans R2 et où a b A= c d
(16)
(17)
est une matrice réelle 2 × 2 à coefficients constants. On suppose que A n’est pas proportionnelle à l’identité. Le comportement d’un tel système est déterminé par les valeurs propres de A. On définit la trace de A, τ = Tr(A) = a + d, et son
VI.1 Pendule double puits électronique
433
τ ble insta e ´ r e ´ n ´eg´e dd u spirale nœ
nœud instable point col
instable
centre
∆ nœ u nœud stable
spirale stable
dd ´eg´e n´er´e sta
ble
Fig. 9 Représentation dans le plan (τ, ∆) du type du point fixe P0 du système dynamique donné par l’Éq. (16). Le type des points fixes caractérisés par ∆ = 0 n’est pas indiqué.
déterminant ∆ = det(A) = ad − bc. Le polynôme caractéristique de A est alors QA (X) = X 2 − τ X + ∆. Les valeurs propres γ± de A sont les racines de QA . Notons que si A n’admet pas de valeur propre nulle, le seul point fixe du système dynamique est P0 = (0, 0). Il faut distinguer plusieurs cas [6], comme représenté sur la Fig. 9. Premier cas : τ 2 − 4∆ > 0 A est diagonalisable et ses valeurs propres sont réelles. La solution générale du système dynamique est X(t) = u+ eγ+ t U + + u− eγ− t U − ,
(18)
où U ± est un vecteur propre associé à la valeur propre γ± , et u± est un réel dépendant des conditions initiales. On peut alors caractériser le point fixe P0 du système, à partir de τ et ∆. On rappelle que τ = γ+ + γ− et ∆ = γ+ γ− . •
•
•
•
Si γ+ et γ− sont négatives, P0 est appelé nœud stable. Cela correspond à ∆ > 0 et τ < 0. Toutes les trajectoires convergent exponentiellement vers P0 . Si γ+ et γ− sont positives, P0 est appelé nœud instable. Cela correspond à ∆ > 0 et τ > 0. Toutes les trajectoires divergent exponentiellement de P0 . Si γ+ est positive et γ− négative, P0 est appelé point col. Cela correspond à ∆ < 0. Les trajectoires convergent selon la direction U − mais divergent selon la direction U + .
Si l’une des deux valeurs propres est nulle (∆ = 0), il existe une ligne continue de points fixes, générée par le vecteur propre associé à la valeur propre 0. Le système converge vers cette ligne si l’autre valeur propre est négative, ou s’en éloigne si elle est positive.
Deuxième cas : τ 2 − 4∆ < 0 Dans ce cas, A est diagonalisable mais ses valeurs propres γ± = ν ± iω sont complexes conjuguées. La solution générale du système
434
Phénomènes non linéaires et instabilités
dynamique s’écrit alors
X(t) = Re(veγ+ t V ),
(19)
2
où V ∈ C est un vecteur propre associé à γ+ et v ∈ C dépend des conditions initiales. Puisque τ = γ+ + γ− = 2ν, le type du point fixe P0 est entièrement déterminé par le signe de τ . • • •
Si τ est strictement négatif, la trajectoire est une spirale, ou foyer, stable, convergeant vers P0 . Elle s’enroule autour de P0 à la vitesse angulaire ω. Si τ est strictement positif, la trajectoire est une spirale, ou foyer, instable, divergeant de P0 . Elle se déroule autour de P0 à la vitesse angulaire ω. Si τ est nul, P0 est appelé centre. Le point fixe est alors marginalement stable : dans le plan (τ, ∆) la zone correspondant à ces points fixes est une ligne (Fig. 9). Une faible déviation à partir d’un point de cette ligne modifie radicalement le comportement du système, qui n’est plus un centre. Cela explique pourquoi les centres linéaires sont en général sensibles aux non-linéarités. La trajectoire oscille autour de P0 à la vitesse angulaire ω. L’oscillateur harmonique en est un exemple typique.
Troisième cas : τ 2 − 4∆ = 0 Il n’existe alors qu’une seule valeur propre double γ ∈ R∗ . S’il existait deux vecteurs propres de A distincts associés à γ, A serait proportionnelle à l’identité, ce qui est exclu dans notre analyse. Ainsi, A n’est pas diagonalisable dans ce cas. Le point fixe est un nœud dégénéré, dont la stabilité est donnée par le signe de τ . C’est le cas limite entre une spirale et un nœud. Les trajectoires convergent ou divergent selon l’unique direction propre de A. •
Si τ est négatif, P0 est appelé nœud dégénéré stable.
•
Si τ est positif, P0 est appelé nœud dégénéré instable.
Références [1]
M. Fruchart, P. Lidon, E. Thibierge, M. Champion et A. Le Diffon, Physique expérimentale. De Boeck Supérieur, 2016.
[2]
J.-P. Faroux et J. Renault, Mécanique 1, cours et exercices corrigés, 1ère année MPSI-PCSI. Dunod, 1996.
[3]
V. Volterra, « Fluctuations in the abundance of a species considered mathematically, » Nature, 118, p. 558-560, 1926.
[4]
N. F. Britton, Essential mathematical biology. Springer, 2003.
[5]
I. R. Epstien et J. A. Pojman, An introduction to nonlinear chemical dynamics. Oxford University Press, 1998.
[6]
S. Strogatz, Nonlinear dynamics and chaos. Westview Press, 2014.
[7]
B. Cagnac et J.-P. Faroux, Lasers. EDP Sciences, 2002.
[8]
L. Landau et E. Lifchitz, Théorie de l’élasticité, 2e éd. Mir, 1990.
[9]
N. Goldenfeld, Lectures on phase transitions and the renormalization group. Westview Press, 1992.
VI.1 Pendule double puits électronique
435
[10]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Physique statistique. Hermann, 1996.
[11]
B. Diu, C. Guthmann, D. Lederer et B. Roulet, Thermodynamique. Hermann, 2007.
[12]
P. W. Higgs, « Broken symmetries and the masses of gauge bosons, » Phys. Rev. Lett., 13 (16), p. 508-509, 1964.
[13]
F. Englert et R. Brout, « Broken symmetry and the mass of gauge vector mesons, » Phys. Rev. Lett., 13 (9), p. 321-323, 1964.
[14]
M. Krob, Électronique expérimentale. Ellipses, 2002.
[15]
R. Duffait et J.-P. Lièvre, Expériences d’électronique : agrégation de sciences physiques. Bréal, 1999.
[16]
J.-M. Donnini et L. Quaranta, Introduction à l’électronique. Masson, 1998.
[17]
T. Matsumoto, L. Chua et M. Komuro, « The double scroll, » IEEE Transactions on Circuits and Systems, 32 (8), p. 797-818, 1985.
Résonance paramétrique
VI.2 d’un circuit RLC
Nous choisissons le cadre de l’électronique pour aborder le phénomène de résonance paramétrique, qui se produit lorsque la fréquence propre d’un oscillateur (ici un circuit RLC) est modifiée au cours du temps de manière périodique par un opérateur extérieur (ici un générateur basses fréquences (GBF)). Nous analysons théoriquement le comportement du système puis nous vérifions expérimentalement que l’oscillateur entre en résonance lorsque la fréquence du signal de tension délivré par le GBF appartient à un intervalle centré sur le double de la fréquence propre du résonateur, et dont la largeur dépend de l’amplitude de la tension délivrée par le GBF. Enfin, puisque la résonance paramétrique correspond à une instabilité du système au repos, nous mesurons également son taux de croissance.
Sommaire 1 2 3 4 5
Introduction . . . . . . . . . . . . . . . . . . . . . Caractéristiques de la résonance paramétrique . . . . Modélisation expérimentale . . . . . . . . . . . . . Mesure de la première bande de résonance . . . . . Mesure du taux de croissance dans la première bande de résonance paramétrique . . . . . . . . . . . . . .
. . . .
. . . .
436 437 440 443
. . 447
1 Introduction Les systèmes résonnants sont des oscillateurs dont la réponse est maximale lorsqu’un opérateur extérieur les excite à une ou plusieurs fréquences particulières, qui constituent leurs fréquences de résonance [1]. Les phénomènes de résonance les plus connus (oscillateurs mécaniques [2], filtres passe-bande en électronique [3], cavités optiques [4], horloges atomiques [5], transitions énergétiques à l’origine de méthodes de spectroscopies moléculaires [6]) se produisent lorsque l’excitateur exerce un forçage direct sur le résonateur qui se comporte comme un oscillateur linéaire. Du point de vue mathématique, l’équation différentielle qui régit l’évolution de l’oscillateur est linéaire à coefficients constants et fait intervenir dans le second membre un terme de forçage direct proportionnel à l’amplitude de l’excitation. La résonance paramétrique, elle, se produit quand le forçage de l’excitateur sur le résonateur est indirect, le premier faisant varier périodiquement au cours du temps un des paramètres du second [7]. Mathématiquement, le système est décrit par une équation différentielle pouvant être linéaire ou non linéaire et certains coefficients intervenant dans cette équation sont alors dépendants du temps. Les phénomènes de résonance paramétrique se rencontrent assez fréquemment en physique, que ce soit en mécanique du solide (Botafumeiro à Saint-Jacques de Compostelle [8]), en mécanique des fluides (instabilité de Faraday, décrivant les oscillations 436
437
VI.2 Résonance paramétrique d’un circuit RLC
de la surface libre d’un fluide dont le récipient est en mouvement sinusoïdal forcé [9]), ou encore en optique non linéaire (afin d’amplifier une onde électromagnétique à partir d’une onde pompe intense et d’une onde auxiliaire [10]). Dans cette expérience, nous allons mettre en évidence théoriquement et expérimentalement les caractéristiques particulières de la résonance paramétrique. L’analyse sera faite sur un exemple issu de l’électronique, mais toutes les propriétés que nous allons décrire ici sont générales et concernent toutes les autres situations citées précédemment.
2 Caractéristiques de la résonance paramétrique 2.1 Analyse qualitative Pour mettre en évidence les propriétés particulières de la résonance paramétrique qui la distinguent de la résonance par forçage direct, nous étudions le circuit RLC présenté Fig. 1(a), constitué d’une bobine d’inductance L de résistance nulle, d’une résistance R et d’un condensateur de capacité C. Cet oscillateur est alimenté par un générateur basses fréquences (GBF) délivrant une tension ve (t), et nous notons vr (t) la tension aux bornes du condensateur. En utilisant la loi des mailles et les relations constitutives des dipôles passifs, on aboutit à l’équation différentielle R dvr vr ve d2 vr + + = . 2 dt L dt LC LC
(1)
Dans le cas de la résonance par forçage direct, tous les paramètres du circuit RLC sont constants et on prend ve (t) = Ve cos(2πfe t) sinusoïdale de fréquence fe . Dans ce cas, à toute fréquence fe , la tension aux bornes du condensateur est de la forme vr (t) = Vr cos(2πfe t + ϕ), où Vr et ϕ désignent respectivement l’amplitude p et la phase à l’origine et sont fonctions de f . Si le facteur de qualité Q = (1/R) L/C e √ vérifie la condition Q > 1/ 2, alors on observe une unique résonance caractérisée (a)
(b)
L
R
ve
C
vr
C
CM
Cm 0 αTe
Te t
2Te
Fig. 1 (a) Circuit RLC pour l’analyse qualitative. (b) Évolution schématique de la capacité du condensateur C au cours du temps pour l’étude qualitative de la résonance paramétrique.
438
Phénomènes non linéaires et instabilités
p √ par un maximum de Vr lorsque fe = f0 1 − 1/2Q2 , où f0 = (2π LC)−1 désigne la fréquence propre du circuit [3]. Dans le cas de la résonance paramétrique, on prend ve = 0 et on suppose dorénavant que la capacité du condensateur C est une fonction du temps. Par exemple, on imagine qu’un opérateur extérieur fait varier la capacité C(t) en éloignant ou en rapprochant les deux armatures, de telle sorte que C(t) soit un créneau de fréquence fe et de rapport cyclique α, compris entre Cm et CM (voir Fig. 1(b)). Pour commencer, on suppose que le facteur de qualité Q du circuit est infini (R = 0) et que la tension vr oscille de façon sinusoïdale à la fréquence f0 . On s’intéresse à une variation brutale de C en t = 0 induite par l’opérateur. Cette dernière variation se faisant à charges ±q des armatures du condensateur constantes, le courant traversant le circuit reste constant, tout comme l’énergie emmagasinée dans la bobine EL . Par contre, l’énergie EC = q 2 /2C emmagasinée dans le condensateur varie au cours du saut de capacité d’un incrément CM − Cm (+) (−) (−) , (2) ∆EC = EC − EC = EC Cm (±)
où on a noté EC l’énergie stockée dans le condensateur en t = 0± . L’équation précédente indique que lorsque l’opérateur fournit un travail pour éloigner les armatures du condensateur, ce travail est reçu par le circuit RLC qui voit son énergie augmenter. On en déduit donc que si le saut de capacité a lieu à l’instant où vr = q/C (et donc EC ) est extrémal, alors l’incrément d’énergie est maximal. Or, lorsque vr est extrémal, l’énergie emmagasinée dans la bobine est nulle car le courant est en quadrature de phase par rapport à la tension. On peut alors remplacer EC dans l’Éq. (2) par l’énergie totale E = EC + EL stockée dans le résonateur. Pour éviter que cette énergie supplémentaire soit perdue au cours de la variation de capacité en t = αTe , il faut choisir le rapport cyclique de telle sorte que l’augmentation de capacité ait lieu au moment où EC s’annule (et vr également). Ainsi, le transfert d’énergie entre l’opérateur et le circuit est optimal quand les décroissances (respectivement croissances) de la capacité se produisent simultanément aux extrema (resp. annulations) de la tension aux bornes du condensateur (qui sont séparés de T0 /2, où T0 = 1/f0 est la période de vr ). La condition sur les fronts descendants de la capacité impose donc que la période Te soit de la forme Te,n =
2f0 nT0 ⇐⇒ fe,n = (n ∈ N∗ ) , 2 n
(3)
tandis que la condition sur les fronts montants de C contraint la valeur de α. En particulier, pour n = 1, on trouve que l’excitateur doit être périodique de fréquence double de celle du résonateur. De plus, si l’Éq. (3) est satisfaite, alors l’Éq. (2) indique que l’énergie totale du circuit croît de façon exponentielle au cours du temps. Ainsi, nous définissons le taux d’amplification paramétrique comme étant la variation relative d’énergie totale du résonateur du fait du travail fourni par l’excitateur pendant une période Te . Nous pouvons dès à présent mettre en évidence plusieurs différences entre la résonance paramétrique et la résonance par forçage direct.
VI.2 Résonance paramétrique d’un circuit RLC
439
Démarrage des oscillations Dans le cas de la résonance par forçage direct, l’oscillateur répond à toute fréquence d’excitation fe , mais l’amplitude de sa réponse varie avec fe . À l’inverse, dans le cas de la résonance paramétrique (ve = 0), l’excitateur ne fait qu’amplifier le signal vr aux bornes du résonateur, donc si vr = 0, l’excitation est inefficace et vr reste nul. Du point de vue mathématique, cela vient du fait que dans le cas où ve = 0, l’Éq. (1) est une équation différentielle linéaire homogène. En pratique, il y a toujours une tension résiduelle dans le circuit (bruit électrique) et c’est la composante à la fréquence f0 de cette dernière qui est amplifiée par le processus. Fréquences de résonance Dans le cas du forçage direct du circuit RLC par le GBF, l’oscillateur ne présente qu’une seule fréquence de résonance, car il ne possède qu’un seul degré de liberté, à savoir la charge q de l’une des armatures du condensateur. Ce résultat se généralise et un système paramétré par N degrés de liberté présente N fréquences de résonance [2]. En revanche, dans le cas de la résonance paramétrique, un système à un degré de liberté a un nombre infini de fréquences de résonance, comme l’indique l’Éq. (3). Ce dernier résultat, que nous avons démontré pour une excitation créneau, se généralise à toute excitation périodique [11, 12]. Bandes de résonance L’Éq. (3) donne un nombre discret de fréquences fe,n de résonance paramétrique. En réalité (voir Sec. 3), on peut montrer qu’il existe des intervalles de fréquences de résonance centrés sur chaque fe,n appelés bandes de résonance [13]. Pour la résonance d’ordre n, l’excitateur oscille à une fréquence fe dans la bande de résonance, tandis que le résonateur oscille à une fréquence nfe /2, proche de sa fréquence propre f0 . Cette propriété n’a pas d’égal dans la résonance par forçage direct. En particulier, elle est à distinguer de la notion de bande passante définie dans la résonance par forçage direct. Cette dernière décrit l’intervalle de fréquences autour d’une fréquence de résonance dans lequel le rapport des amplitudes des signaux aux bornes du système résonnant et de l’excitateur est supérieur à une √ fraction de sa valeur à la fréquence de résonance, conventionnellement fixée à 1/ 2.
2.2 Influence de la dissipation On réintroduit un facteur de qualité Q 1 fini dans le circuit. Si la capacité C reste constante, alors au premier ordre en 1/Q, l’énergie totale décroît exponentiellement au cours du temps, du fait de l’effet Joule : E(t) = E(0)e−2πf0 t/Q .
(4)
En première approximation, on peut considérer que les taux de dissipation par effet Joule et d’amplification paramétrique s’ajoutent. Ainsi, au cours d’une période Te , la variation relative totale d’énergie emmagasinée dans le circuit s’écrit ∆E ∆E ∆E CM − Cm 2πf0 Te = + = − . (5) E E param. E Joule Cm Q
440
Phénomènes non linéaires et instabilités
On peut alors distinguer deux cas. Si l’amplification paramétrique est inférieure à la dissipation par effet Joule, les oscillations ne peuvent pas s’établir et le résonateur reste au repos car toute excitation est amortie exponentiellement. À l’inverse, si l’amplification paramétrique est supérieure à la dissipation alors l’énergie croît exponentiellement. Nous mettons ainsi en évidence deux autres différences entre la résonance par forçage direct et la résonance paramétrique. Rôle de la dissipation Dans le cas de la résonance par forçage direct, l’amplitude de la réponse est infinie à la résonance en l’absence de dissipation, mais devient finie quand on en tient compte. En revanche, pour la résonance paramétrique, la dissipation impose une excitation minimale à dépasser pour que la résonance se mette en place. Mais une fois ce seuil franchi, le résonateur oscille avec une amplitude divergeant exponentiellement. En réalité, ce sont les non-linéarités du résonateur, non prises en compte jusqu’ici, qui permettent de saturer l’amplitude de résonance [13]. Le taux d’amplification paramétrique (défini dans l’Éq. (2)) est donc le paramètre de contrôle du système dynamique que constitue le résonateur, pouvant induire une bifurcation 1 de Hopf supercritique [14] qui rend instable l’état de repos vr = 0 du résonateur au profit d’un cycle limite stable. Influence de l’amplitude du signal excitateur Dans la résonance par forçage direct, l’amplitude du signal émis par l’oscillateur est simplement proportionnelle à l’amplitude du forçage. À l’inverse, dans la résonance paramétrique, l’amplitude de résonance est indépendante de l’amplitude de forçage, mais cette dernière détermine si la résonance peut avoir lieu. L’amplitude de l’excitation intervient dans la valeur du taux d’amplification paramétrique, ainsi que dans la largeur des bandes de résonance (voir Sec. 3).
3 Modélisation expérimentale 3.1 Présentation et mise en équation du problème Le circuit que nous utilisons pour étudier expérimentalement la résonance paramétrique est représenté Fig. 2, à laquelle on se référera pour les notations. Il contient un multiplieur supposé idéal : ses impédances d’entrée sont infinies (les courants parcourant les deux entrées du multiplieur sont donc nuls), son impédance de sortie est nulle. Par conséquent, le multiplieur est entièrement caractérisé par le coefficient de proportionnalité k exprimé en V−1 , défini par la relation liant la tension de sortie aux tensions d’entrée vm = k v e vr .
(6)
Dans le modèle du multiplieur idéal, le coefficient k est indépendant de la fréquence des signaux d’entrée, ce qui reste valable tant que les fréquences de ces derniers sont 1. Pour des rappels sur la notion de bifurcation, nous renvoyons à l’Exp. VI.1, « Pendule double puits électronique ».
VI.2 Résonance paramétrique d’un circuit RLC R
441
(L,r)
k vr
C
ve
vm
Fig. 2 Circuit utilisé pour la modélisation expérimentale de la résonance paramétrique. Il est constitué d’un multiplieur de coefficient k dont l’une des entrées est reliée à un GBF tandis que l’autre est reliée au condensateur. La sortie est branchée sur une bobine et une résistance.
inférieures à 1 MHz. L’une des entrées du multiplieur est reliée à un GBF, jouant le rôle d’excitateur. L’autre entrée et la sortie du multiplieur sont connectées à un filtre RLC comportant une résistance R, une bobine d’inductance L et de résistance r et un condensateur de capacité C dont on néglige la résistance de fuite. L’équation différentielle régissant le comportement du circuit, obtenue en utilisant la loi des mailles et les relations constitutives des résistance, bobine et condensateur ainsi que la loi de comportement (6) du multiplieur, s’écrit d2 vr 2πf0 dvr + + (2πf0 )2 (1 − k ve )vr = 0, dt2 Q dt
(7)
p √ où nous rappelons que f0 = (2π LC)−1 et Q = L/C/(R + r). Notons tout d’abord que si ve est identiquement nulle, alors on retrouve l’équation régissant le comportement du circuit RLC passif. De plus, si ve est une fonction périodique du temps alors cette équation décrit le comportement d’un circuit RLC dont la capacité C/(1 − kve ) est modifiée périodiquement au cours du temps par l’excitateur, comme la situation schématique de la Sec. 2. En outre, le circuit de la Fig. 2 comporte un multiplieur constitué d’amplificateurs opérationnels dont la tension de sortie ne peut excéder la tension de saturation d’environ 10 V en valeur absolue. C’est cette saturation qui permet de limiter l’amplitude des oscillations de tension aux bornes du condensateur quand la résonance paramétrique se produit (voir Sec. 2). Contrairement à l’analyse de la Sec. 2, nous prenons par la suite ve sinusoïdale de fréquence fe et d’amplitude Ve . La fonction vr vérifie dorénavant une équation de Mathieu [15] avec dissipation : 2πf0 dvr d2 vr (t) + (t) + (2πf0 )2 (1 + h cos (2πfe t)) vr (t) = 0, 2 dt Q dt
(8)
où h = −kVe (le signe moins pourrait être absorbé par une redéfinition de l’origine des temps).
442
Phénomènes non linéaires et instabilités
3.2 Calcul de la première bande de résonance En Sec. 2, nous avons montré que la première résonance paramétrique se produit pour fe = 2f0 . En réalité, nous avons déjà mentionné qu’il existe un intervalle (−) (+) [fe , fe ] de fréquences de résonance centré sur 2f0 , pour lesquelles la tension aux bornes du résonateur croît exponentiellement tout en oscillant à une fréquence moitié de celle à laquelle vibre l’excitateur. Ainsi, nous proposons l’ansatz suivant pour vr [16, 17] : vr (t) = eπSt (A cos(πfe t) + B sin(πfe t)) ,
(9)
où S est le taux de croissance (à un facteur π près) et A et B deux constantes. Nous voulons déterminer la largeur de la première bande de résonance 2 . Par définition, le taux de croissance s’annule aux bords de la première bande de résonance, nous allons donc supposer que S f0 . En réinjectant l’Éq. (9) dans l’Éq. (8), en se contentant d’un développement limité à l’ordre 1 en S et en utilisant les formules d’addition de trigonométrie, on obtient : !# " 2 fe h S 1 S fe B+A 1− + cos(πfe t) + + 2f0 f0 Q 2f0 2f0 Q 2 " !# 2 fe h S 1 fe S (10) + − − sin(πfe t) + A+B 1− + 2f0 f0 Q 2f0 2f0 Q 2 +
h h A cos(3πfe t) + B sin(3πfe t) = 0. 2 2
Premièrement, nous constatons que du fait de la non-linéarité du multiplieur, la réponse du résonateur subit une distorsion qui se traduit par l’existence d’harmoniques aux multiples entiers impairs de fe /2. Si l’on suppose dans la suite |h| 1, alors les termes harmoniques de fréquence 3fe /2 peuvent être négligés si on se contente d’un développement limité à l’ordre 1 en h. En outre, comme l’amplification paramétrique doit vaincre la dissipation pour que le système entre en résonance, cela impose également de supposer que la dissipation est faible, au plus du même ordre de grandeur que le terme d’amplification, soit 1/Q = O(h) 1. Pour mener les calculs, nous considérons que toutes les quantités infinitésimales sont du même ordre de grandeur, en particulier S/f0 = O(h). Sous ces hypothèses, pour que l’Éq. (10) soit vérifiée, il faut que les coefficients en facteur des fonctions sinusoïdales s’annulent, ce qui donne un système homogène d’équations à deux inconnues A et B. Pour qu’il y ait d’autres solutions que (A, B) = (0, 0), il faut annuler le déterminant de la matrice associée à ce système, ce qui nous permet d’obtenir la relation entre le taux de croissance S et la fréquence d’excitation fe au plus petit ordre non nul en h :
fe 2f0
2
S 1 + f0 Q
2
S + f0 Q
1−
fe 2f0
2 !
2 h = − 2
1−
fe 2f0
2 !2
. (11)
2. Il existe une autre méthode, plus générale, reposant sur la théorie des systèmes dynamiques et un développement en échelles multiples [14, 18].
VI.2 Résonance paramétrique d’un circuit RLC
443
Comme expliqué précédemment, les fréquences extrémales de la première bande de résonance sont obtenues en posant S = 0 dans l’Éq. (11). Si on note ces dernières (±) (±) (±) fe = 2f0 +∆fe , l’Éq. (11) indique que ∆fe /f0 = O(h) 1. Ceci nous permet (+) (−) donc de déterminer au plus petit ordre non nul en h la largeur ∆fe = ∆fe −∆fe de la première bande de résonance s ∆fe =
(kVe f0 )2 −
2f0 Q
2
(12)
,
où nous avons réinjecté l’expression de h. Nous retrouvons dans l’Éq. (12) que l’amplification paramétrique doit au moins vaincre la dissipation (respectivement les premier et second termes sous la racine carrée), et que si cette condition est vérifiée, alors il existe un intervalle de valeurs de fe centré sur 2f0 pour lesquelles le résonateur oscille à une fréquence fe /2. Dans cet intervalle, de plus, le taux de croissance S des oscillations obtenu à partir de l’Éq. (11) au plus petit ordre en h f0 S=− + Q
s
1 kVe f0 2
2
2
− (fe − 2f0 )
(13)
est positif, ce qui conduit à une augmentation exponentielle de l’amplitude du signal aux bornes du résonateur jusqu’à saturation de la tension en sortie du multiplieur. On notera que pour obtenir cette dernière équation, nous avons utilisé le fait que fe − 2f0 < ∆fe , sachant que ∆fe /f0 = O(h) 1. De plus, au centre de la bande de résonance (fe = 2f0 ), nous retrouvons bien une formule analogue à l’Éq. (5). Rappelons que les Éq. (12) et (13) ont été obtenues au premier ordre en h. Pour obtenir un développement aux ordres supérieurs en h, il faudrait compléter l’ansatz de l’Éq. (9) en ajoutant des harmoniques aux multiples entiers impairs de fe /2. La poursuite du calcul montre, par exemple, que l’amplitude relative du premier harmonique à la fréquence 3fe /2 par rapport à celle du fondamental à la fréquence fe /2 est égale à |h| /16 en valeur absolue, au premier ordre en h. De plus, l’analyse réalisée ici pour la première bande de résonance peut être menée pour toutes les bandes. On montre alors que la largeur de la n-ième bande de résonance n est proportionnelle à |h| , ainsi la première bande est la plus aisée à mesurer [16]. Dans les deux sections suivantes, nous allons vérifier expérimentalement les Éq. (12) et (13).
4 Mesure de la première bande de résonance 4.1 Protocole Pour vérifier l’Éq. (12), nous proposons de réaliser le protocole suivant inspiré de la Réf. [19]. Alimenter le circuit représenté Fig. 2 avec un GBF et visualiser à l’oscilloscope les tensions aux bornes du générateur ve et du condensateur vr .
444
Phénomènes non linéaires et instabilités La théorie développée précédemment suppose que l’oscillateur présente un grand facteur de qualité. En pratique, on pourra choisir Q & 10, tout en prenant une résistance R suffisamment grande par rapport à la valeur de l’impédance de sortie du multiplieur, d’une part, et à celle de la résistance de la bobine, d’autre part, car ces dernières, de l’ordre de quelques Ω [20], dépendent a priori de la fréquence [21]. De plus, la fréquence propre du circuit RLC doit être choisie dans la bande passante du multiplieur utilisé (le plus souvent en deçà du MHz), f0 de l’ordre du kHz convient alors.
Pour différentes valeurs d’amplitude Ve du signal d’entrée mesurées au voltmètre, (−) déterminer la plus petite fréquence fe à laquelle les oscillations apparaissent aux bornes du condensateur en augmentant progressivement la fréquence du signal délivré par le générateur. Synchroniser la base de temps de l’oscilloscope sur le signal aux bornes du condensateur, avec un niveau de déclenchement suffisamment bas permet alors d’observer la croissance des oscillations en bord de zone (voir Sec. 5). L’augmentation de la fréquence du signal délivré par le GBF doit se faire le plus (−) lentement possible pour ne pas avoir d’erreur systématique sur la mesure de fe . En effet, en bord de zone, le taux de croissance des oscillations est nul : le temps de réponse du système est infini. Du fait de la bifurcation de Hopf supercritique, le comportement du système en bord de zone souffre d’hystérésis [14], ce qui explique que les mesures doivent toujours être effectuées en augmentant la fréquence.
Augmenter la valeur de la fréquence du signal délivré par le générateur jusqu’à constater la disparition des oscillations aux bornes du condensateur. Noter la (−) (+) valeur de la fréquence fe . Les mêmes précautions que pour la mesure de fe s’appliquent. Les valeurs des composants utilisés dans cette section sont données dans le Tab. 1. Les valeurs de R, r, L et C ont été mesurées au RLC-mètre fonctionnant à 1 kHz, qui est l’ordre de grandeur de la fréquence des signaux dans notre expérience. Comme le RLC-mètre que nous avons utilisé ne peut mesurer les impédances qu’à deux fréquences discrètes (120 Hz et 1 kHz), l’incertitude provient ici uniquement de la précision de l’appareil en fonctionnement à 1 kHz et ne tient pas compte d’éventuelles variations de la valeur des composants avec la fréquence. Ces mesures nous permettent de déduire la fréquence propre f0 du circuit et son facteur de qualité Q, également indiqués dans le Tab. 1. Le coefficient k du multiplieur a aussi été mesuré et est reporté dans ce même tableau. Nous montrons Fig. 3(a) des signaux typiques obtenus pour Ve ' 3,5 V et fe = (1,43 ± 0,02) kHz dans la première bande de résonance. La tension vr aux Composants R + r = (32,9 ± 0,2) Ω L = (46,1 ± 0,4) mH C = (982 ± 7) nF
Paramètres de l’Éq. (12) f0 = (748 ± 4) Hz Q = 6,59 ± 0,05 k = (0,1001 ± 0,0001) V−1
Tab. 1 Composants utilisés pour câbler le circuit représenté Fig. 2, ainsi que le calcul de f0 et Q lors de la mesure de la largeur de la première bande de résonance paramétrique.
VI.2 Résonance paramétrique d’un circuit RLC (a)
445
(b) 6
1,0
vr
|TF[vr ]|/|TF[vr ]|max
Tension (V)
ve
0,8
3
0,050
0,6
0
0,025
0,4
-3 -6
0,000 1,5
0,2
0
1
2 t (ms)
3
4
0,0
0
1
2
2,0
3 4 f (kHz)
2,5 5
6
Fig. 3 (a) Tensions ve (disques bleus) et vr (triangles rouges) pour Ve ' 3,5 V et fe = (1,43 ± 0,02) kHz enregistrées à l’oscilloscope : le résonateur oscille à une fréquence (0,710 ± 0,007) kHz, moitié de celle de l’excitateur. (b) Spectre de la tension vr , calculé par l’algorithme de transformée de Fourier rapide de l’oscilloscope. Deux pics sont observés aux fréquences (0,71 ± 0,08) kHz et (2,10 ± 0,08) kHz. L’encart correspond à un agrandissement du pic secondaire.
bornes du condensateur oscille à la fréquence (0,710 ± 0,007) kHz, compatible avec fe /2. Le déphasage entre les deux signaux dépend de fe et Ve . Pour s’assurer que la distorsion est négligeable et que la tension aux bornes du condensateur est bien quasi sinusoïdale, nous traçons aussi le module de la transformée de Fourier 3 (spectre) du signal vr représenté Fig. 3(b). Celui-ci présente un pic fondamental à (0,67 ± 0,08) kHz mais aussi un second à (2,10 ± 0,08) kHz. Le premier harmonique a une fréquence qui correspond bien environ au triple de la fréquence fondamentale. De plus, son amplitude relative par rapport au pic fondamental vaut environ 0,026 1, ce qui est compatible avec la valeur attendue kVe /16 ' 0,022. Tout ceci est en accord avec le cadre théorique présenté en Sec. 3.
4.2 Analyse des résultats Les résultats de la mesure de la largeur de la première bande de résonance sont représentés Fig. 4 où nous avons tracé (∆fe )2 en fonction du carré de l’amplitude Ve du signal d’entrée (voir l’Éq. (12)). Nous avons fait varier la fréquence du GBF suffisamment lentement de sorte que l’incertitude sur la mesure des fréquences est de 1 Hz. Quant à l’incertitude sur Ve , elle est donnée par la précision du voltmètre utilisé. Un ajustement affine des données de la forme (∆fe )2 = aVe 2 +b a été réalisé, dont les paramètres a et b sont donnés dans le Tab. 2, et se superpose bien aux données expérimentales. On constate cependant que les deux derniers points dévient de la prédiction théorique ; pour le moment nous les écartons de l’analyse. Avec cet échantillon restreint, la valeur du χ2 réduit obtenu est d’environ 0,92, très proche de 1. Nous pouvons en outre comparer les paramètres d’ajustement aux valeurs attendues également référencées dans le Tab. 2 : aatt = (kf0 )2 et batt = −(2f0 /Q)2 . 3. Pour plus de détails sur le calcul du spectre d’un signal, nous renvoyons à l’Exp. I.5, « Spectroscopie par transformée de Fourier ».
446
Phénomènes non linéaires et instabilités 0,36 aVe 2 + b c 0 Ve 4 + a0 Ve 2 + b0
(∆fe )2 (kHz2 )
0,30 0,24 0,18 0,12 0,06 0,00
10
20
30
40 50 Ve 2 (V2 )
60
70
80
Fig. 4 Tracé du carré de la largeur de la première bande de résonance paramétrique ∆fe en fonction du carré de l’amplitude Ve du signal d’entrée. Les points expérimentaux ont été modélisés par une fonction affine à l’exception des deux derniers points (∆fe )2 = aVe 2 + b, et par une fonction parabolique (∆fe )2 = c0 Ve 4 + a0 Ve 2 + b0 également tracées sur le graphique. Les paramètres d’ajustement sont donnés dans le Tab. 2.
Les valeurs sont cohérentes, sans que l’accord soit excellent. Les différences peuvent être expliquées par le fait que les valeurs de |h| = kVe deviennent de l’ordre de 1. Or, l’Éq. (12) a été obtenue dans l’hypothèse |h| 1, et cesse d’être légitime pour de grandes valeurs de tension Ve . Nous avons donc repris l’analyse théorique de la Sec. 3 en développant l’expression de ∆fe à l’ordre
Ajustement affine
Ajustement parabolique
a = (5,46 ± 0,03) × 10−3 kHz2 ·V−2
a0 = (5,66 ± 0,13) × 10−3 kHz2 ·V−2
aatt = (5,61 ± 0,06) × 10−3 kHz2 ·V−2
a0att = (5,63 ± 0,06) × 10−3 kHz2 ·V−2
batt = (−5,15 ± 0,08) × 10−2 kHz2
b0att = (−5,15 ± 0,08) × 10−2 kHz2
b = (−5,77 ± 0,08) × 10−2 kHz2 χ2red = 0,92
b0 = (−6,01 ± 0,18) × 10−2 kHz2
c0 = (−3,4 ± 1,6) × 10−6 kHz2 ·V−4
c0att = (−2,19 ± 0,03) × 10−6 kHz2 ·V−4 Tab. 2 Paramètres intervenant dans les ajustements de la Fig. 4. Pour l’ajustement affine, nous donnons également la valeur du χ2 réduit.
VI.2 Résonance paramétrique d’un circuit RLC suivant 4 en h, et nous obtenons 2 2 (∆fe ) = (kf0 ) 1 +
3 16Q2
2
Ve −
2f0 Q
2 −
5k 4 f02 4 Ve . 128
447
(14)
Nous réalisons un ajustement parabolique des données de la forme (∆fe )2 = c0 Ve 4 + a0 Ve 2 + b0 , également représenté Fig. 4, dont les paramètres d’ajustement figurent aussi dans le Tab. 2. L’accord est excellent pour les coefficients linéaire et quadratique bien que les incertitudes soient supérieures. Par contre, les valeurs de b0 mesurée et attendue diffèrent encore. Cela provient probablement d’une surestimation du facteur de qualité : nous avons notamment négligé l’impédance de sortie du multiplieur qui s’ajoute aux résistances R et r. La résistance interne du GBF peut en revanche être négligée car le courant appelé aux bornes d’entrée du multiplieur est d’intensité très faible devant celle du courant de sortie du multiplieur.
5 Mesure du taux de croissance dans la première bande de résonance paramétrique Nous voulons maintenant étudier plus en détail l’instabilité qui amène le système de son point de repos vr = 0 à son cycle limite stable, en particulier afin de vérifier l’Éq. (13) qui relie le taux de croissance S des oscillations à l’amplitude Ve du signal d’entrée à fréquence fe fixée. Dans cette section, nous avons changé les valeurs des composants du circuit, pour celles données dans le Tab. 3.
5.1 Protocole expérimental Nous proposons le protocole suivant, générique dans l’étude des instabilités [21]. Reprendre le circuit représenté Fig. 2 en plaçant un interrupteur en série du GBF et visualiser à l’oscilloscope la tension aux bornes du condensateur vr . Synchroniser l’affichage de l’oscilloscope sur le signal vr et le placer en mode Déclenchement (ou Single), avec un niveau de déclenchement juste supérieur au bruit électrique. Fixer la fréquence d’excitation fe du GBF pour toute l’expérience dans la première bande de résonance paramétrique. Composants R + r = (26,1 ± 0,2) Ω L = (11,6 ± 0,2) mH C = (47,2 ± 0,4) nF
Paramètres de l’Éq. (13) k = (0,1001 ± 0,0001) V−1 f0 = (6,80 ± 0,07) kHz Q = 19,0 ± 0,2
Tab. 3 Composants utilisés pour câbler le circuit représenté Fig. 2 ainsi que le calcul de f0 et Q lors de la mesure du taux de croissance des oscillations dans la première bande de résonance paramétrique. (±)
4. Le calcul à l’ordre 2 en h donne une correction identique pour les fréquences extrêmes fe , (±) qui n’intervient donc pas dans l’expression de ∆fe . Il faut alors mener le calcul de fe à l’ordre 3 en h.
448
Phénomènes non linéaires et instabilités Choisir fe = 2f0 permet de maximiser l’intervalle de valeurs d’amplitude Ve pour lesquelles la résonance paramétrique a lieu. En outre, l’expression du taux de croissance S se simplifie dans ce cas : S devient une fonction affine de Ve (voir l’Éq. (13)). Dans la suite, nous avons fixé fe = 2f0 = 13,6 kHz, à la résolution du GBF près.
Pour différentes amplitudes Ve , fermer l’interrupteur et observer à l’oscilloscope la croissance des oscillations. Mesurer le taux de croissance S des oscillations par la méthode de l’incrément logarithmique (celle-ci est expliquée dans le Chap. « Incertitudes et ajustements »). Ouvrir l’interrupteur et attendre le retour de vr à son point de repos avant de changer Ve et de recommencer. Nous rappelons que le taux de croissance S est défini par l’Éq. (9), et qu’il diffère d’un facteur π de sa définition usuelle.
Nous représentons Fig. 5(a) un exemple de courbe obtenue expérimentalement pour une amplitude Ve ' 2,25 V. La méthode de l’incrément logarithmique, dont les résultats sont présentés Fig. 5(b) pour la même valeur d’amplitude Ve , permet de mesurer le taux de croissance des oscillations. Par mesure directe de l’amplitude des oscillations à saturation et de leur pseudo-période pendant la phase de croissance, on peut alors représenter par une ligne continue l’ansatz ajustant les mesures (voir Fig. 5(a)). (a)
(b) 0
12
ln |vr |max /Vsat
vr (V)
8
-1
4 0 -4 -8 -12
2
-2
0 -2
-5 -4 -8 -7 -6 -5 -4 -3 -2 -1 0 t (ms)
1
-3
-5
-4
-3 -2 t (ms)
-1
Fig. 5 (a) Enregistrement de la croissance des oscillations aux bornes du condensateur pour Ve ' 2,25 V. L’origine des temps a été choisie au début de la saturation de l’amplitude des oscillations. Nous constatons une première phase de croissance, suivie d’oscillations d’amplitude constante. L’encart représente un agrandissement de la portion du signal entre t = −5 ms et t = −4 ms. La ligne continue correspond à l’ansatz (9) dont le taux de croissance a été mesuré par la méthode de l’incrément logarithmique. (b) Illustration de la mesure du taux de croissance par la méthode de l’incrément logarithmique pour la même valeur d’amplitude Ve . La tension aux extrema locaux a été normalisée par l’amplitude des oscillations quand le système atteint son cycle limite.
0
VI.2 Résonance paramétrique d’un circuit RLC
449
0,8
S (kHz)
0,6
0,4
0,2
0,0 2,0
2,5
3,0 Ve (V)
3,5
4,0
Fig. 6 Tracé du taux de croissance S des oscillations en fonction de l’amplitude Ve du signal d’entrée. Un ajustement affine S = aVe + b des données a été réalisé, en accord avec l’Éq. (13) car fe = 2f0 . Il est représenté par un trait plein et nous avons obtenu a = (0,331 ± 0,007) kHz·V−1 et b = (−0,572 ± 0,019) kHz, ainsi qu’un χ2 réduit de 0,94.
5.2 Analyse des résultats Nous pouvons finalement tracer S en fonction de Ve afin de vérifier l’Éq. (13). Les résultats sont présentés Fig. 6. Comme nous avons choisi fe = 2f0 , nous pouvons effectuer un ajustement affine des données de la forme S = aVe + b. Ce dernier reproduit correctement les mesures (χ2red ' 0,94 est proche de 1). Il fournit une pente a = (0,331 ± 0,007) kHz·V−1 et une ordonnée à l’origine b = (−0,572 ± 0,019) kHz, alors que les valeurs attendues sont aatt = kf0 /2 = (0,340 ± 0,004) kHz·V−1 et batt = −f0 /Q = (−0,358 ± 0,005) kHz. L’accord sur les valeurs de pente est très bon, par contre les deux valeurs d’ordonnée à l’origine sont seulement du même ordre de grandeur. Les mêmes raisons que pour la mesure de la largeur de la première bande de résonance peuvent être évoquées pour rationaliser cette différence. En particulier, nous avons probablement de nouveau surestimé le facteur de qualité en omettant des résistances supplémentaires, comme l’impédance de sortie du multiplieur. D’autres propriétés de la résonance paramétrique pourraient également être étudiées, en particulier d’autres bandes de résonance (plus minces et donc plus difficiles à observer). L’étude du portrait de phase, par l’enregistrement des tensions aux bornes du condensateur et de la résistance est également possible, pour visualiser le cycle limite.
Références [1]
J. Valentin, « Le coefficient de qualité et ses interprétations, » Bup, 75 (628), p. 163-177, 1980.
450
Phénomènes non linéaires et instabilités
[2]
J. Faroux et J. Renault, Mécanique des fluides et des ondes mécaniques : cours et 105 exercices corrigés. Dunod, 1999.
[3]
É. Bellanger, J. Perez, X. Ducros, V. Renvoizé et al., Physique MPSIPCSI-PTSI. Pearson, 2013.
[4]
S. Houard, Optique. De Boeck, 2011.
[5]
J.-L. Basdevant, J. Dalibard et M. Joffre, Mécanique quantique. Éditions École Polytechnique, 2002.
[6]
É. Biémont, Spectroscopie moléculaire : structures moléculaires et analyse spectrale. De Boeck Supérieur, 2008.
[7]
R. Moreau, « Résonance paramétrique, » Bup, 78 (661 (1)), p. 565-586, 1984.
[8]
J. R. Sanmartin, « O Botafumeiro: parametric pumping in the middle ages, » Am. J. Phys., 52 (10), p. 937-945, 1984.
[9]
R. E. Goldstein, « Coffee stains, cell receptors, and time crystals: lessons from the old literature, » Phys. Today, 71 (9), p. 32-38, 2018.
[10]
R. W. Boyd, Nonlinear optics. Academic Press, 2003.
[11]
D. Mauras, « Résonance paramétrique : théorie, étude par ordinateur, » Bup, 86 (747 (1)), p. 1277-1302, 1992.
[12]
V. I. Arnold, V. V. Kozlov et A. I. Neishtadt, Mathematical aspects of classical and celestial mechanics, 3e éd. Springer, 2007.
[13]
E. I. Butikov, « Parametric resonance, » Comp. Sci. Eng., 1 (3), p. 76-83, 1999.
[14]
S. Strogatz, Nonlinear dynamics and chaos. Westview Press, 2014.
[15]
É. Mathieu, « Mémoire sur le mouvement vibratoire d’une membrane de forme elliptique, » J. Math. Pures Appl., 13, p. 137-203, 1868.
[16]
L. Landau et E. Lifchitz, Mécanique, 4e éd. Mir, 1982.
[17]
V. Leroy, J.-C. Bacri, T. Hocquet et M. Devaud, « A hamiltonian approach to the parametric excitation, » Eur. J. Phys., 27 (3), p. 469-483, 2006.
[18]
R. Berthet, A. Petrosyan et B. Roman, « An analog experiment of the parametric instability, » Am. J. Phys., 70 (7), p. 744-749, 2002.
[19]
F.-X. Bally et P. Boissé, « Un modèle électronique simple et exact de l’oscillateur paramétrique, » Bup, 86 (747 (1)), p. 1267-1276, 1992.
[20]
R. Duffait et J.-P. Lièvre, Expériences d’électronique : agrégation de sciences physiques. Bréal, 1999.
[21]
M. Krob, Électronique expérimentale. Ellipses, 2002.
Instabilité de
VI.3 Rayleigh-Plateau Toute colonne cylindrique liquide est soumise à une instabilité capillaire, conduisant à sa fragmentation en de multiples gouttes. Nous présentons dans cette expérience un protocole simple visant à mesurer la longueur d’onde privilégiée par cette instabilité. Le grand nombre de mesures réalisées nous permet de mener une étude statistique de leur dispersion par la méthode quantile-quantile, et ainsi de discuter les biais de l’expérience.
Sommaire 1 2 3 4 5
Introduction . . . . . . . . . . . . . . . Analyse théorique de l’instabilité . . . . Aspects expérimentaux . . . . . . . . . Résultats . . . . . . . . . . . . . . . . . Influence de la pesanteur sur l’instabilité
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
451 452 459 462 469
Compléments A
Traitement numérique d’une image
. . . . . . . . . . . 470
1 Introduction L’existence d’une interface entre deux fluides a un coût énergétique. À l’échelle microscopique, il existe dans un fluide des interactions attractives de courte portée (de van der Waals, par exemple) entre molécules, qui assurent sa cohésion. La présence de voisines autour d’une molécule abaisse son énergie : cette dernière est donc plus élevée pour les molécules à l’interface que pour celles présentes dans le volume du fluide. Cela se traduit à l’échelle macroscopique par une force linéique tendant à réduire l’aire de l’interface, appelée tension superficielle. L’instabilité de Rayleigh-Plateau est une illustration de ce phénomène : elle a lieu quand une colonne de fluide se fragmente en gouttes afin de minimiser l’interface liquide-air. Cette instabilité fut étudiée expérimentalement par F. Savart et J. Plateau au xixe siècle, puis théoriquement par Lord Rayleigh, qui fut le premier à appliquer les outils de l’analyse linéaire à ce problème [1]. Elle se manifeste dans la vie quotidienne, pour des colonnes statiques ou des jets : la rosée qui se dépose sur les toiles d’araignées tend à former des gouttes [2], et un mince filet d’eau uniforme en sortie d’un robinet se fragmente en un chapelet de gouttes. La compréhension de la stabilité de jets liquides présente par ailleurs un intérêt dans certaines industries, comme les jets d’encre en imprimerie, ou l’irrigation en agriculture. Une analyse linéaire permet de prévoir la longueur d’onde privilégiée par l’instabilité, que l’on assimile à l’écartement moyen entre deux gouttes successives. Nous nous proposons dans cette expérience de vérifier cette prédiction à l’aide d’un 451
452
Phénomènes non linéaires et instabilités
montage réalisable avec du matériel d’enseignement. Dans un premier temps, nous étudions la stabilité d’un jet liquide en chute libre en sortie d’une burette graduée. La longueur d’onde est d’abord mesurée sur une photographie. Nous menons ensuite une étude statistique d’un grand nombre de mesures obtenues en filmant la fragmentation.
2 Analyse théorique de l’instabilité 2.1 Origine physique Considérons une colonne cylindrique d’eau de rayon r0 et de hauteur h. Cette colonne est susceptible de se fragmenter en une assemblée de N gouttes sphériques sous l’effet de la tension superficielle. L’énergie potentielle interfaciale est donnée par E = γS, où γ est la tension superficielle entre l’eau et l’air, et S est l’aire totale de l’interface. Déterminer quelle configuration est la plus stable revient donc à comparer l’aire initiale Sc = 2πr0 h à celle de l’ensemble de N gouttes, supposées sphériques de rayon r, Sg = 4πN r2 . La conservation du volume impose πr02 h = (4π/3)N r3 . La colonne se déstabilise à condition que Sg /Sc = 3r0 /2r < 1, c’est-àdire si r > 3r0 /2 [3]. Ainsi, à volume de liquide donné, Sg et l’énergie potentielle interfaciale sont d’autant plus faibles que le rayon r des gouttes est élevé. Cependant, la formation de grosses gouttes exige d’importants déplacements de liquide, qui sont limités par l’inertie. La dissipation visqueuse, bien que négligeable dans notre cas (cela est discuté en Sec. 2.3), peut également limiter la taille des gouttes formées. Si l’instabilité se déclare dans un liquide recouvrant une fibre, comme dans le cas de la rosée sur une toile d’araignée, la dissipation visqueuse contre la paroi solide est la principale limitation à son développement [2].
2.2 Analyse linéaire Une grande partie de cette analyse est fondée sur la Réf. [4], revue détaillée de la stabilité des jets liquides. 2.2.1 Principe La dynamique d’une colonne liquide est régie par l’équation non linéaire de Navier-Stokes. La résolution de cette équation n’est possible que dans certains cas simples, et en particulier dans l’approximation linéaire, dans le cadre de laquelle nous nous plaçons désormais. On note (r, ϕ, z) les coordonnées cylindriques centrées sur la colonne. Nous supposons que la surface libre de la colonne, repérée par son rayon rs , subit une déformation de faible amplitude : rs (t, ϕ, z) = r¯(1 + ε(t, ϕ, z)),
(1)
où r¯ est le rayon moyen de la colonne, et |ε| 1. En injectant cette solution dans les équations de la dynamique, et en ne gardant que les termes du premier ordre en ε, on obtient un ensemble linéaire d’équations, qui peuvent ensuite s’analyser dans l’espace de Fourier, chaque mode étant indépendant des autres. Dans le cas
VI.3 Instabilité de Rayleigh-Plateau d’un unique mode de Fourier, l’expression de ε est ε(t, ϕ, z) = εm Re eiωt cos (kz) cos (mϕ),
453
(2)
où k ∈ R est le nombre d’onde longitudinal, m est un entier naturel. Les perturbations azimutales sont décrites par un entier naturel m plutôt qu’un réel quelconque. Cette quantification tient au fait que la perturbation doit vérifier la condition aux limites périodiques ε(t, ϕ + 2π, z) = ε(t, ϕ, z). ω, homogène à une pulsation, décrit l’évolution temporelle du mode. Elle est reliée à k par la relation de dispersion que nous établirons en Sec. 2.2.4. Nous nous restreignons à deux cas : si ω ∈ R, la perturbation est une oscillation de la surface : on dit que le mode est stable. À l’inverse, si ω ∈ iR, le mode est exponentiellement atténué ou amplifié : ce dernier cas correspond aux modes instables, qui croissent jusqu’à fragmenter la colonne. On suppose alors que si une pertubation de longueur d’onde λ = 2π/k est instable, elle aboutira à des gouttes espacées de λ. Par conservation du volume, elles auront un rayon rg = (3r02 λ/4)1/3 . L’analyse linéaire repose sur l’hypothèse de faibles perturbations. Elle ne gouverne donc que la première phase de croissance de l’instabilité. Lorsque la déformation de la colonne devient comparable à r¯, une théorie non linéaire devient nécessaire. Celleci permet d’expliquer certaines propriétés, comme la formation de gouttes satellites entre les gouttes principales [5], visibles sur la Fig. 4(b) par exemple.
2.2.2 Longueurs d’onde instables Le calcul simple effectué dans la Sec. 2.1 indique que seules des perturbations de longueur d’onde suffisamment grande devant le rayon de la colonne sont instables. On peut établir rigoureusement ce résultat, en effectuant une version infinitésimale de ce calcul [6, 7]. Nous cherchons donc une condition sur k 6= 0 pour laquelle la perturbation réduit l’aire S de la surface déformée de la colonne : dans ce cas, il est énergétiquement favorable d’augmenter l’amplitude de la perturbation, qui est donc instable. On considère une faible perturbation de rayon rs (ϕ, z), donnée par les Éq. (1) et (2), d’une colonne liquide initialement de rayon r0 et de hauteur h. On ne prend pas en compte les dépendances temporelles. Tous les calculs sont ici menés à l’ordre le plus bas non nul en εm , et on suppose pour simplifier que la hauteur de la colonne est un multiple de λ = 2π/k. On commence par relier r¯, le rayon moyen de la colonne perturbée, à r0 , en utilisant la conservation du volume V = V0 = πr02 h. L’expression du volume de la colonne perturbée, que l’on peut retrouver en s’aidant de la Fig. 1(a), est 1 V = 2
ˆ 0
h
ˆ
2π
0
rs2
ε2m dϕ dz ' hπ¯ r 1+ (1 + δ0,m ) , 4 2
(3)
où δ0,m vaut 1 si m = 0, et 0 sinon. Avec V = V0 , on obtient ε2 r¯ ' r0 1 − m (1 + δ0,m ) . 8
(4)
On peut à présent évaluer la surface de la colonne déformée. Pour de faibles per-
454
Phénomènes non linéaires et instabilités
(a)
(b)
z
z
rs(ϕ, z) dz
dϕ rs
rdϕ
dϕ
dϕ
∂rs ∂ϕ
dz
dz
∂rs ∂z
Fig. 1 (a) Élément de volume infinitésimal en coordonnées cylindriques (r, ϕ, z). (b) Élément de surface infinitésimal en coordonnées cylindriques, pour une surface définie par la donnée de rs (ϕ, z).
turbations |ε| 1, elle est donnée par (voir la Fig. 1(b)) s 2 2 ˆ h ˆ 2π ∂rs 1 ∂rs 1+ S' + 2 rs dϕ dz ∂z rs ∂ϕ 0 0 2 2 ! ˆ h ˆ 2π 1 ∂rs 1 ∂rs + 2 rs dϕ dz ' 1+ 2 ∂z 2rs ∂ϕ 0 0 ' 2πh¯ r+
πh¯ r 2 ε (1 + δ0,m ) (k¯ r)2 + m2 . 4 m
En réinjectant l’Éq. (4) dans cette équation, on obtient finalement ε2 S ' S0 1 + m (1 + δ0,m ) (kr0 )2 + m2 − 1 , 8
(5)
(6)
où S0 = 2πr0 h est l’aire de la colonne non perturbée. L’Éq. (6) a deux conséquences importantes. Pour tout mode non axisymétrique (c’est-à-dire non invariant par rotation autour de l’axe de révolution du cylindre), caractérisé par m ≥ 1, on a toujours S ≥ S0 . La perturbation de la surface n’est pas favorable énergétiquement : tous les modes non axisymétriques sont stables. Ils seront étudiés en Sec. 4.3. • Pour m = 0, la perturbation ne permet de diminuer l’aire que si (kr0 )2 −1 < 0, ce qui revient à λ = 2π/k > 2πr0 . Les modes instables sont donc les modes axisymétriques dont la longueur d’onde est supérieure au périmètre du jet. Dans la suite de l’analyse linéaire, nous considérerons donc m = 0. •
2.2.3 Sélection dynamique des modes instables A priori, tous les modes de longueur d’onde supérieure à 2πr0 sont instables. Il existe pourtant une longueur d’onde sélectionnée par le système, car on constate
VI.3 Instabilité de Rayleigh-Plateau
455
expérimentalement que la séparation entre gouttes est très régulière. On peut la plupart du temps considérer que la perturbation initiale du jet (mouvements de l’air, interactions avec l’orifice de sortie, etc.) est un bruit aléatoire excitant un large spectre de modes. Chacun de ces modes possède une dynamique propre, que l’on obtient en injectant les Éq. (1) et (2) dans les équations du mouvement, ce qui fournit une relation de dispersion reliant ω à m et k. Si ω 2 (m, k) est positif, la perturbation ne grossit pas dans le temps et la colonne liquide est stable. Si en revanche ω 2 (m, k) est négatif, la perturbation croît exponentiellement avec le temps et le mode est instable. Le nombre d’onde observé est celui du mode le plus instable, dont le taux de croissance est le plus élevé. Le but de la Sec. 2.2.4 est de calculer la relation de dispersion des perturbations axisymétriques de la colonne, afin de connaître la longueur d’onde du mode le plus instable. Il est possible de passer à la Sec. 3 en admettant l’expression (18) de cette longueur d’onde. Un montage expérimental adapté permet d’exciter sélectivement une colonne liquide à une fréquence donnée, et donc de n’observer la dynamique que d’un seul mode de Fourier [5, 8]. Il est alors possible d’étudier l’ensemble de la relation de dispersion ω(m = 0, k). Cela demande toutefois un matériel complexe, rarement disponible dans un laboratoire d’enseignement.
2.2.4 Relation de dispersion On étudie dans cette section la dynamique d’un mode axisymétrique (m = 0), instable pour kr0 < 1. On considère une colonne liquide de masse volumique ρ uniforme et de rayon r0 , possédant une tension de surface γ avec l’air. Dans cette section, on suppose l’écoulement incompressible et l’on néglige les effets de viscosité et l’inertie du milieu extérieur (ils seront discutés en Sec. 2.3). On suppose également que dans le référentiel R du laboratoire, la vitesse de la colonne non perturbée est uniforme dans tout le jet. Cette hypothèse est valide si l’on ne tient pas compte de la pesanteur, dont l’influence sera étudiée en Sec. 5. On se place dans le référentiel galiléen R0 , où la colonne est au repos. On note v(t, r, z) le champ de vitesse et p(t, r, z) le champ de pression dans le fluide. La pression dans la colonne non perturbée p0 est uniforme, elle est due à la tension superficielle à l’interface de la colonne droite et à la pression atmosphérique patm . L’équation de Navier-Stokes dans le référentiel R0 , en l’absence de viscosité et de pesanteur, se réduit à l’équation d’Euler, qui s’écrit ∂v 1 + (v · ∇)v = − ∇p. ∂t ρ
(7)
Le champ de vitesse, incompressible, doit vérifier ∇ · v = 0. Dans le cadre d’une analyse linéaire, on néglige le terme non linéaire (v · ∇)v devant ∂v/∂t. En prenant la divergence de l’Éq. (7), on aboutit à l’équation de Laplace : ∆p = 0.
(8)
On cherche une solution de cette équation sous la forme p(t, r, z) = p0 + δp(t, r, z) = p0 1 + Re(eiωt )f (r) cos (kz) , où δp p0 . En injectant cette solution dans l’Éq. (8) et en utilisant l’expression du laplacien en coordonnées cylindriques, on obtient d2 f 1 df + − k 2 f = 0. dr2 r dr
(9)
456
Phénomènes non linéaires et instabilités
La solution de cette équation différentielle est la fonction de Bessel modifiée de première espèce d’ordre 0 [9], notée I0 : f (r) = f0 I0 (kr).
(10)
On obtient la constante f0 grâce aux conditions aux limites. La pression à la surface du jet est déterminée par la loi de Laplace [2], qui donne la différence entre la pression dans le liquide et dans l’air à l’interface : p(t, rs , z) − patm = 2γK(t, z),
(11)
où K est la courbure moyenne de la surface libre 1 . La courbure moyenne est une grandeur algébrique : la surpression se situe du côté concave de l’interface, vers l’intérieur de la courbure. Pour une surface libre axisymétrique, K s’exprime comme 2K =
1 ∂ 2 rs /∂z 2 1 1 + =− + p , R1 R2 (1 + (∂z rs )2 )3/2 rs 1 + (∂z rs )2
(12)
où R1 et R2 sont les rayons de courbure principaux de la surface (voir la Fig. 2). En un point considéré, R1 et R2 sont les deux rayons de courbure des sections de la surface par deux plans perpendiculaires contenant la normale à la surface en ce point [10]. Ce sont des grandeurs algébriques, leur signe dépend comme K de la convexité de l’interface. R1 et R2 dépendent du choix des plans, mais K en est indépendante. Le premier terme dans l’Éq. (12) est associé à la courbure le long du jet, et tend à stabiliser le jet. Le second terme est associé à la courbure dans un plan proche de la perpendiculaire au jet, et tend à déstabiliser le jet.
Pour de faibles déformations, on approxime l’Éq. (12) par 2K ' −∂ 2 rs /∂z 2 + 1/rs . En injectant l’Éq. (2) dans l’expression de K, et en ne gardant que les termes R1 rs (t, z)
n R2 z
O
λ Fig. 2 Profil rs (t, z) du développement d’un mode axisymétrique instable, de longueur d’onde λ. On a représenté en bleu les cercles osculateurs de rayons de courbure principaux R1 et R2 en un point de normale n. En rouge, on représente le cercle osculateur dans l’approximation des faibles déformations, de rayon R2 ' rs . 1. Si n est le champ de vecteurs unitaires normaux à l’interface, orientés du liquide vers l’air, la courbure moyenne K de cette surface est définie comme 2K = ∇ · n.
VI.3 Instabilité de Rayleigh-Plateau
457
γ γ + (kr0 )2 − 1 ε(t, z). r0 r0
(13)
du premier ordre en ε, on trouve p(t, rs , z) − patm '
La pression non perturbée dans la colonne vaut donc p0 = patm + γ/r0 , tandis que la constante f0 vaut f0 = (γ/r0 p0 ) (kr0 )2 − 1 ε0 /I0 (kr0 ). On aboutit à δp(t, r, z) = −
I0 (kr) γ 1 − (kr0 )2 ε(t, z). r0 I0 (kr0 )
(14)
On peut maintenant relier δp à v en utilisant l’équation d’Euler linéarisée : ∂v 1 = − ∇p ∂t ρ
⇒
I1 (kr) ∂vr 1 ∂δp γ =− = 2 (kr0 ) 1 − (kr0 )2 ε, ∂t ρ ∂r ρr0 I0 (kr0 )
(15)
où I1 = I00 désigne la dérivée première de I0 . De plus, pour de faibles perturbations, on peut relier simplement le déplacement de la surface libre rs (t, z) à la vitesse radiale locale [10] : ∂ε ∂rs (t, z) = r0 (t, z) ' vr (t, r = r0 , z). ∂t ∂t
(16)
En dérivant l’Éq. (16) par rapport au temps, et en injectant l’Éq. (15), on aboutit finalement à la relation de dispersion de l’instabilité (avec ∂ 2 ε/∂t2 = −ω 2 ε) : ω2 = −
I1 (kr0 ) γ (kr0 ) 1 − (kr0 )2 . 3 ρr0 I0 (kr0 )
(17)
Puisque I0 et I1 sont positives sur [0, +∞[, ω 2 est négatif pour kr0 < 1 : la colonne est instable. On retrouve ainsi le critère établi √ dans la Sec. 2.2.2. Le taux de croissance d’un mode instable est défini par σ = −ω 2 . On trouve le mode le plus instable en cherchant le nombre d’onde kmax tel que σ(k), tracé en fonction de kr0 sur la Fig. 3, est maximal. En recherchant numériquement la position du maximum de cette courbe, on trouve kmax r0 ' 0,697. La longueur d’onde du mode le plus instable vaut donc λmax =
2π ' 9,02 r0 . kmax
(18)
Le temps caractéristique de croissance du mode le plus instable vaut s 1 ρr03 τ= ' 2,91 . (19) σ(kmax ) γ p Notons que ρr03 /γ est la seule grandeur homogène à un temps que l’on peut construire à partir des données du problème ; il n’est donc pas étonnant de constater que cette quantité détermine l’ordre de grandeur de τ . On remarque également que λmax ne dépend pas de γ, bien que la tension superficielle soit à l’origine de l’instabilité.
458
Phénomènes non linéaires et instabilités 0,4
0,2
σ
p
ρr03 /γ
0,3
0,1 0,697 0,0 0,0
0,2
0,4
0,6
0,8
1,0
kr0
Fig. 3 Taux de croissance normalisé de l’instabilité de Rayleigh-Plateau, donné par l’Éq. (17). Le taux de croissance maximal est atteint pour kmax r0 ' 0,697.
Il est possible de faire un calcul plus simple qui ne recourt pas aux fonctions de Bessel modifiées, dans l’approximation des grandes longueurs d’onde où |kr0 | 1. Cela permet par exemple de négliger le terme d2 f / dr2 devant (1/r) df / dr dans l’Éq. (9). Le nombre d’onde√du mode le plus instable trouvé par cette analyse est alors donné par kmax r0 = 1/ 2 ' 0,707, au lieu de 0,697 [10].
2.3 Retour sur les hypothèses Viscosité Les Éq. (17) et (18) ont été démontrées en considérant l’équation d’Euler, donc dans la limite d’un écoulement non visqueux. Pourtant, la viscosité affecte la dynamique du jet. L’équation de Navier-Stokes linéarisée doit en principe être utilisée : ∂v 1 = − ∇p + ν∆v, (20) ∂t ρ où ν est la viscosité cinématique du liquide. p Pour quantifier l’effet de la viscosité, on définit le nombre d’Ohnesorge Oh = ν ρ/γr0 comme le rapport des ordres de grandeur du terme visqueux ν∆v et du terme de déplacement capillaire ∂v/∂t : r τν kν∆vk ρ ' 2 =ν . (21) k∂v/∂tk r0 γr0 La prise en compte rigoureuse d’un nombre d’Ohnesorge non nul conduit à des calculs très lourds. En revanche, dans l’approximation des grandes longueurs d’onde kr0 1, on peut prouver que le nombre d’onde du mode le plus instable est donné par [7] 1 kmax r0 = p . (22) √ 2 + 3 2 Oh √ Dans la limite non visqueuse Oh = 0, on retrouve bien kmax r0 = 1/ 2. L’effet de la viscosité est de sélectionner de plus grandes longueurs d’onde et de ralentir le
VI.3 Instabilité de Rayleigh-Plateau
459
développement de l’instabilité. Le nombre d’Ohnesorge pour une colonne d’eau pure de diamètre 1 mm vaut environ 5 × 10−3 . La correction attendue, d’environ 0,8 %, est inférieure aux incertitudes expérimentales. Inertie de l’air environnant On a également négligé l’inertie de l’air environnant, qui a pour effet de ralentir le développement de l’instabilité et de diminuer la valeur du nombre d’onde le plus instable [4]. La correction à la relation de dispersion serait d’ordre ρair /ρ, où ρair est la masse volumique de l’air. Si le liquide est l’eau, ce ratio vaut ρair /ρ ' 1,2 × 10−3 à pression et température ambiantes : l’erreur commise en ne prenant pas cette correction en compte est là aussi inférieure à nos incertitudes expérimentales. Cisaillement L’influence du milieu extérieur ne tient pas seulement à son inertie : il y a cisaillement entre le liquide dans le jet, s’écoulant à vitesse v0 dans R, et l’air extérieur immobile dans R. Un tel écoulement est intrinsèquement instable en l’absence de viscosité : c’est l’instabilité de Kelvin-Helmholtz [10]. Si la vitesse du liquide est suffisamment élevée, l’instabilité du jet peut être dominée par l’instabilité de Kelvin-Helmholtz plutôt que par des phénomènes capillaires. Il faut noter que la tension superficielle entre le liquide et air est ici un élément stabilisateur ; le nombre d’onde du mode le plus amplifié par l’instabilité de Kelvin-Helmholtz résulte d’un équilibre entre inertie des fluides et tension superficielle. On peut montrer que l’instabilité de Rayleigh-Plateau est dominée par l’instabilité de Kelvin-Helmholtz si [4] ρair v02 r0 1. (23) γ Avec notre choix de paramètres, l’instabilité de Kelvin-Helmholtz devient prépondérante pour v0 14 m·s−1 . La vitesse du jet dans notre expérience est nettement plus faible, valant au maximum v0 ' 2 m·s−1 . La déstabilisation du jet est donc majoritairement due aux effets capillaires.
3 Aspects expérimentaux 3.1 Description du dispositif Une façon simple d’obtenir, en laboratoire d’enseignement, une colonne de liquide de rayon initial bien maîtrisé est d’utiliser une burette graduée. La Fig. 4(a) présente le dispositif expérimental complet. La zone de fragmentation de la colonne est filmée à l’aide d’un appareil photographique, tandis que les gouttes sont éclairées de côté par un stroboscope. Une photographie du développement complet de l’instabilité est présentée sur la Fig. 4(b). Elle permet de mesurer le rayon de la colonne liquide en sortie de la burette. Nous obtenons r0 = (0,33 ± 0,01) mm. Nous exploiterons d’abord une seule photographie afin de mesurer la longueur d’onde de l’instabilité en Sec. 4.1. Il est possible d’améliorer la précision de la mesure de λmax en analysant un grand nombre d’images de la fragmentation de la colonne à partir d’un film (voir la Sec. 4.2). Enfin, nous pourrons également étudier un mode non axisymétrique stable (voir la Sec. 4.3).
460
Phénomènes non linéaires et instabilités (a)
Stroboscope
(b)
Appareil photographique
Fig. 4 (a) Schéma du montage expérimental. Une burette en position verticale est initialement remplie de solution. Le jet liquide en sortie est éclairé latéralement par un stroboscope et filmé par une caméra montée sur un trépied. Un réglet métallique est tenu par une potence. (b) Photographie de la colonne liquide en sortie de la burette.
Débit Le débit de la burette doit être connu pour évaluer la vitesse de sortie v0 du jet. Nous avons préalablement pesé la masse de liquide écoulée pendant une durée mesurée au chronomètre, ainsi que le rayon de la colonne en sortie de la burette, et avons obtenu v0 = (1,50 ± 0,03) m·s−1 . Le débit doit être maintenu constant au cours de l’acquisition : pour cela, on peut connecter le haut de la burette, par un tuyau souple, à un cristallisoir plein. Si la section du cristallisoir est grande devant celle de la burette, la pression dans le liquide, et donc la vitesse de sortie, varie peu sur la durée d’un film. Éclairage Pour photographier les gouttes, il faut éviter le flou de mouvement. Les gouttes ayant un rayon d’environ 0,5 mm et se déplaçant à v0 = 1,5 m·s−1 , le temps d’exposition doit être bien inférieur à 3 × 10−4 s, ce qui n’est pas réalisable avec la plupart des appareils photographiques. Il est nécessaire d’utiliser un stroboscope, qui éclaire par flashs suffisamment courts pour éviter le flou de mouvement. Diffuseur Il peut être difficile de repérer la position des gouttes sur les photographies. Il est possible de les éclairer de manière plus homogène en rajoutant à l’eau un diffuseur. Nous avons choisi une poudre fine d’hydroxyde de calcium. Cette poudre a pour effet de diminuer la tension de surface du liquide, mais ne modifie
VI.3 Instabilité de Rayleigh-Plateau
461
pas λmax . On peut également utiliser un colorant, comme la rhodamine 2 . Photographie Dans le cas de l’acquisition d’un film, afin de permettre une étude statistique ultérieure, chaque image doit pouvoir être considérée comme indépendante des autres. Il faut donc choisir une fréquence d’acquisition suffisamment faible pour que la même goutte n’apparaisse pas sur deux images consécutives. Si le champ est d’environ 5 cm pour une vitesse de v0 = 1,5 m·s−1 , il ne faut pas dépasser 30 Hz. Le temps d’exposition doit être plus court que la période du stroboscope. S’il est trop faible, il y aura en revanche de nombreuses images noires, où aucun flash n’a eu lieu pendant l’exposition. On peut donc régler le temps d’exposition à environ la moitié de la période du stroboscope.
3.2 Protocole À l’aide d’un tuyau en caoutchouc souple, relier le haut d’une burette à un réservoir d’eau additionnée de diffuseur. L’ajout de poudre doit se faire progressivement, afin de bien voir les gouttes, sans surcharger la solution. Elle a pour effet de réduire la tension de surface, et donc d’augmenter le temps τ d’établissement de l’instabilité (Éq. (19)), ce qui diminue la validité des approximations faites (voir la Sec. 5). Une trop forte concentration de poudre pourrait par ailleurs augmenter la viscosité de la solution.
Mesurer le débit de la burette avec une balance de précision et un chronomètre. La hauteur du réservoir d’eau modifie le débit : il ne faut plus le déplacer. Installer l’appareil photographique sur un trépied, de façon à viser la zone d’apparition de l’instabilité sur le jet. On peut la repérer facilement à l’œil avec l’éclairage stroboscopique. Installer le stroboscope de manière à éclairer les gouttes de côté (voir la Fig. 4(a)). Si possible, disposer un fond noir derrière la colonne liquide. Un étalon de longueur doit être présent dans le champ, au plus près de la colonne (voir la Fig. 5(a)), et perpendiculaire à l’axe optique de l’appareil photographique pour éviter les effets de parallaxe. Lancer l’acquisition. On cherche à obtenir environ 1000 images pour le traitement statistique, soit une acquisition d’environ 1 min.
3.3 Traitement des images Après avoir photographié la zone de développement de l’instabilité, nous traitons numériquement l’image obtenue pour déterminer les centres des gouttes, à l’aide d’un algorithme Python donné dans le Comp. A. Une image en noir et blanc codée sur 8 bits est équivalente à un tableau, chaque pixel correspondant à une entrée du tableau dont la valeur entière code l’intensité en niveau de gris de 0 à 255. Traiter une image revient à effectuer des opérations algébriques sur les composantes de son tableau. La zone correspondant aux gouttes à étudier sur l’image est représentée sur la Fig. 5(b). Nous commençons par « seuiller » l’image : on attribue la valeur maximale aux pixels d’intensité supérieure à un certain seuil, et la valeur nulle à ceux 2. La rhodamine est toxique, à employer avec précaution.
462
Phénomènes non linéaires et instabilités
(a)
(b)
(c)
Fig. 5 (a) Photographie de la zone de développement de l’instabilité capillaire. La règle sert à étalonner les distances. (b) Agrandissement de la zone dans le rectangle blanc en (a). (c) Image seuillée. Les croix noires correspondent aux isobarycentres de chaque goutte.
situés sous ce seuil 3 . Le seuil est choisi de manière à séparer les gouttes du fond (voir la Fig. 5(c)). Nous rejetons les gouttes trop petites, correspondant souvent à des gouttes satellites résultant de la dynamique non linéaire de l’instabilité. Finalement, nous déterminons les coordonnées des isobarycentres des différentes gouttes (indiqués par des croix noires sur la Fig. 5(c)), et en extrayons l’écartement moyen, assimilé à la longueur d’onde du mode le plus instable. On peut automatiser cet algorithme pour traiter l’ensemble des images d’un film, et ainsi étudier la statistique de la variable aléatoire λmax . Un autre procédé, plus simple, consiste à obtenir un profil d’intensité en moyennant l’image selon la direction perpendiculaire au jet, puis à détecter les maxima d’intensité de ce profil. Cependant, cette méthode est moins précise, car le maximum d’intensité associé à une goutte ne se trouve pas forcément au centre de celle-ci.
4 Résultats 4.1 Étude d’une image On peut mesurer λmax à partir d’une seule image. On veillera dans ce cas à choisir une image où les gouttes sont régulièrement espacées. La longueur d’onde attendue vaut λmax, att = 9,02 r0 = (2,97 ± 0,09) mm. À partir de l’espacement moyen entre les gouttes sur la Fig. 5(c), on mesure la longueur d’onde du mode le 3. Dans cette expérience, nous nous contentons d’un seuil global. Voir l’ Exp. II.3, « Domaines de Weiss : origine de l’hystérésis ferromagnétique », pour une méthode plus élaborée, employant un seuil local.
VI.3 Instabilité de Rayleigh-Plateau
463
plus instable λmax ' 2,88 mm. L’incertitude associée à une mesure unique de λmax n’est toutefois pas représentative de l’incertitude réelle, majoritairement due aux fluctuations statistiques et non à la résolution finie de notre image. Cela est immédiatement visible sur la dispersion des espacements entre gouttes sur la Fig. 5(c). Si l’étude d’une image permet une confirmation rapide de l’Éq. (18), elle n’est pas suffisante dans le cadre d’une évaluation rigoureuse des incertitudes.
4.2 Étude statistique 4.2.1 Mesure de la longueur d’onde la plus instable On néglige dans cette section les incertitudes liées au traitement de l’image. Une image ne permet d’obtenir qu’une unique mesure de longueur d’onde moyennée, car les différents espacements entre gouttes d’une même image ne peuvent être considérés comme indépendants. En appliquant le traitement décrit dans la Sec. 3.3 à l’ensemble des images d’un film, nous avons pu de cette manière effectuer N = 386 mesures de λmax . Nous assimilons l’écartement entre deux gouttes successives à λmax , ce qui introduit un biais : la pesanteur écarte les gouttes les unes des autres après leur formation (son influence sur le développement de l’instabilité est, elle, discutée en Sec. 5). Les longueurs d’onde sont moyennées sur un rectangle de hauteur H (cadre blanc sur la Fig. 5(a)). Considérons deux gouttes entrant dans le cadre à la vitesse v0 : lorsque la deuxième entre dans le cadre, la première a déjà parcouru une distance λmax vers le bas. Lorsque la première atteint le bord inférieur du rectangle, leur écart vaut alors λmax 1 + g(H − λmax )/v02 , au premier ordre en gH/v02 . Dans la suite, nous avons analysé nos résultats avec H1 = 9,7 mm (environ trois longueurs d’onde). Il est difficile de choisir H plus petit, puisqu’il faut avoir au moins deux gouttes dans le rectangle à chaque image. Une estimation haute de l’erreur relative commise est alors g(H − λmax )/v02 ' 0,02, qui reste raisonnable. La valeur moyenne de la distribution est hλmax i = 2,95 mm, tandis que son écart-type vaut σ√λ = 0,8 mm. On en déduit que l’incertitude-type sur la mesure de hλmax i vaut σλ / N = 0,04 mm. Le résultat de la mesure s’écrit λmax = (2,95 ± 0,07) mm,
(24)
où l’incertitude provient de la composition de l’incertitude statistique et provenant de l’écartement croissant des gouttes. L’accord avec la valeur attendue est excellent. On peut vérifier la validité du calcul ci-dessus et l’ordre de grandeur de l’effet de chute libre en augmentant H. Pour H2 = 2H1 , nous avons obtenu hλmax i2 ' 3,10 mm, soit (hλmax i2 − hλmax i1 )/ hλmax i2 ' 0,05, du même ordre que g(H2 − H1 )/v02 ' 0,04.
4.2.2 Hypothèse gaussienne Pour mettre en œuvre les techniques présentées dans le Chap. « Incertitudes et ajustements », il faut faire une hypothèse a priori sur la distribution de probabilité suivie par la variable aléatoire étudiée, à cause d’un manque d’information ou d’un échantillon statistique trop réduit. Nous disposons ici de suffisamment de mesures indépendantes de λmax pour estimer cette distribution. Pour ce faire, il est tout
464
Phénomènes non linéaires et instabilités
Nombre d’´ev`enements
100
75
50
25
0
0
1
2
3 4 λmax (mm)
5
6
7
Fig. 6 Histogramme des 386 mesures de λmax . La valeur attendue est indiquée par la ligne tiretée rouge. La zone bleutée indique les valeurs interdites, car inférieures au diamètre moyen des gouttes.
d’abord possible d’inspecter visuellement l’allure des données : l’histogramme de la variable aléatoire λmax obtenu est présenté sur la Fig. 6. Celui-ci présente une allure en cloche approximativement compatible avec une loi de probabilité gaussienne (ou normale), bien qu’il semble présenter une légère asymétrie vis-à-vis de la moyenne. De manière générale, une mesure dont le résultat est sujet à un grand nombre de faibles erreurs suit une loi de probabilité gaussienne [11]. Cela est justifié par le théorème central limite [9], le résultat de la mesure étant alors la somme d’un grand nombre de variables aléatoires indépendantes. Dans cette situation, il est opportun de tester si λmax est distribuée selon une loi gaussienne. Un écart à celleci suggère souvent qu’un processus physique est oublié dans l’analyse du problème, ou l’existence de corrélations entre les différentes erreurs. Les histogrammes permettent une représentation visuelle rapide des données. Cependant, leur allure dépend fortement du nombre de classes choisi. Il est possible de motiver théoriquement le nombre de classes à utiliser : on cherche en fait à estimer la densité de probabilité mesurée [12]. Dans le cas d’une distribution gaussienne, la règle de Sturges [13] donne un critère simple : pour un échantillon de N mesures, le nombre de classes optimal vaut log2 (N ) + 1. Ce nombre peut servir d’estimation initiale, mais il faut s’en remettre à une inspection visuelle pour déterminer le nombre de classes optimal.
Avec l’histogramme seul, il est souvent difficile de déterminer si les écarts à l’histogramme attendu sont dus au hasard, le nombre de mesures étant fini, ou s’ils trahissent une distribution de probabilité différente de la loi gaussienne. Il nous faut donc une méthode plus objective pour identifier des structures éventuelles dans la distribution de la grandeur mesurée. 4.2.3 Test de normalité Le diagramme quantile-quantile [14, 15] est une méthode graphique permettant d’estimer rapidement l’écart à la normalité d’un ensemble de N résultats de me-
VI.3 Instabilité de Rayleigh-Plateau
465
sure, en comparant une certaine représentation des données expérimentales à une droite. Les q-quantiles, pour q ∈ J2, +∞J, sont les q − 1 valeurs du jeu de données séparant l’ensemble des données en q intervalles contenant tous le même nombre de mesures 4 . On appelle diagramme quantile-quantile le graphe reportant les données ordonnées d’une série de N mesures xi en fonction des (N + 1)-quantiles issus d’une loi de probabilité théorique, que nous choisissons ici être la loi gaussienne centrée et normalisée 5 . On note x(i) les N résultats de mesure ordonnées par ordre croissant. Les N nombres x(i) divisent le jeu de données en N + 1 intervalles. Une fraction i/(N + 1) des données étant inférieure à x(i) , ces nombres sont par définition les (N + 1)-quantiles empiriques (obtenus par l’expérience). Pour vérifier la normalité de la distribution, on compare ces quantiles empiriques aux quantiles théoriques. On note Φ la fonction de distribution cumulative 6 de la loi gaussienne centrée et normalisée, de fonction réciproque Φ−1 . On divise l’intervalle [0, 1] en N + 1 intervalles de taille égale 1/(N + 1), et on note pi = i/(N + 1) pour i ∈ J1, N K la fraction contenue dans les i premiers intervalles. Les (N + 1)-quantiles théoriques de la loi gaussienne centrée et normalisée sont donnés par qi = Φ−1 (pi ).
(25)
Ainsi, la probabilité de tirer selon cette loi une valeur inférieure à qi vaut Φ(qi ) = pi =
i . N +1
(26)
On peut calculer Φ−1 sur Python en appelant scipy.stats.norm.ppf, ce qui permet d’obtenir numériquement les qi à N donné. Finalement, on reporte sur un graphe les points de coordonnées (qi , x(i) ) afin de comparer quantiles théoriques et empiriques. Si les données sont tirées selon une loi de distribution gaussienne, ces points doivent se disposer selon une droite. Toute déviation systématique (et non aléatoire) à une droite indique que les données ne sont pas distribuées selon une loi gaussienne. Notons qu’un tel graphe est nécessairement strictement croissant. Dans le cas d’une distribution de probabilité théorique gaussienne centrée et normalisée, si le diagramme quantile-quantile est raisonnablement ajustable par un modèle affine, l’ordonnée à l’origine du modèle donne directement la moyenne de la distribution, et sa pente donne son écart-type. En effet, la loi gaussienne N de moyenne µ et d’écart-type σ s’exprime en fonction de la loi gaussienne centrée et normalisée G selon N (x) =
1 x−µ G σ σ
=
2 2 1 √ e−(x−µ) /2σ . σ 2π
(27)
Par conséquent, qi est l’écart entre la mesure triée x(i) et la moyenne, en unité de σ.
4. Un cas particulier de quantile est la médiane (2-quantile), séparant la moitié des mesures ordonnées les plus basses de la moitié des mesures les plus hautes. 5. Cette méthode peut être appliquée à d’autres lois de probabilité théoriques. 6. La fonction de distribution cumulative Φ d’une densité de probabilité f est la primitive de f vérifiant ∀x, 0 < Φ(x) < 1. En conséquence, pour x0 donné, la probabilité de tirer selon la loi f une valeur x < x0 vaut P (x < x0 ) = Φ(x0 ).
466
Phénomènes non linéaires et instabilités
Donn´ees ordonn´ees (mm)
6,5 Donn´ees simul´ees Points exp´erimentaux
5,5 4,5 3,5 2,5 1,5 0,5
-3
-2
-1 0 1 Quantiles th´eoriques qi
2
3
Fig. 7 Diagramme quantile-quantile, tracé pour les N = 386 mesures de λmax (disques bleus) et pour un jeu de N données simulées, tirées selon une loi gaussienne de moyenne hλmax i et d’écart-type σλ .
Le diagramme quantile-quantile obtenu pour les N mesures de λmax est représenté sur la Fig. 7. Une structure convexe est clairement visible, reflétant le fait que les quantiles inférieurs à la moyenne sont plus resserrés que les quantiles supérieurs à celle-ci. La distribution de données est donc effectivement asymétrique, avec une queue plus large à droite qu’à gauche. À titre de comparaison, nous avons également tracé le même diagramme pour un ensemble de N valeurs tirées selon une loi de probabilité gaussienne, de mêmes moyenne et écart-type que la distribution de mesures : ces données s’alignent bien selon une droite, sans structure apparente. Un intérêt majeur de la méthode se trouve dans la possibilité de relier une structure visible sur le diagramme quantile-quantile à un type d’écart à la normalité 7 . On peut proposer une justification physique de cette asymétrie. Comme chaque mesure est issue d’une moyenne sur une boîte, l’écartement supplémentaire entre gouttes dû à la pesanteur ne peut pas introduire d’asymétrie. En revanche, puisque la distance entre deux gouttes est minorée par leur diamètre, le domaine des valeurs accessibles à λmax n’est lui-même pas symétrique autour de la moyenne. La zone bleutée de l’histogramme de la Fig. 6 représente l’ensemble des valeurs de λmax interdites, dont la borne supérieure est estimée par le diamètre moyen des gouttes. Les plus faibles valeurs de λmax sont proches de cette limite, ce qui peut expliquer l’asymétrie observée. D’autres tests de normalité existent, fondés sur l’évaluation des moments d’ordre supérieur de la série statistique des λmax par exemple. Le moment d’ordre trois est associé à l’asymétrie de la distribution, et celui d’ordre quatre à son aplatissement. Il faut alors savoir si les valeurs obtenues sont compatibles, dans un intervalle de confiance donné, avec celles attendues pour une distribution gaussienne. 7. Par exemple, on peut repérer de cette façon un aplatissement de la distribution plus faible que celui de la loi gaussienne, qui se caractérise par un diagramme quantile-quantile en forme de S. On trouve d’autres exemples dans la Réf. [14].
VI.3 Instabilité de Rayleigh-Plateau
467
4.3 Mode non axisymétrique stable Comme mentionné en Sec. 2.2.2, il existe, en plus des modes instables, des modes de vibration stables de la colonne liquide, pour lesquels ω 2 (m, k) est positif. En particulier, tout mode non axisymétrique est stable. Un mode stable, donné par l’Éq. (2) avec ω réel, correspond à une onde stationnaire dans le référentiel R0 en mouvement avec la colonne. Comme pour l’étude de l’instabilité, on suppose qu’une large gamme de modes est continuellement excitée. Cherchons l’effet observé dans le référentiel du laboratoire R. Dans R0 , une onde plane progressive monochromatique (OPPM) donnée par ε(t, z) = εm cos (ωt − kz) cos (mϕ) peut s’écrire comme la superposition de deux ondes stationnaires (donc deux modes stables) de mêmes nombre d’onde k et pulsation ω, mais déphasées : ε(t, z) = εm cos (mϕ) (cos (ωt) cos (kz) + sin (ωt) sin (kz)). Par ailleurs, si la pulsation d’une OPPM de nombre d’onde k vaut ω dans R0 , sa pulsation ω0 dans R subit un décalage Doppler ω0 = ω + k · v0 .
(28)
Puisque par hypothèse, un large spectre de modes sont excités à la sortie de la colonne, un large spectre d’OPPM sont excitées. Dans tout ce spectre, les perturbations vérifiant ω0 = 0, c’est-à-dire ω = −k · v0 , apparaissent immobiles à un observateur dans R. Ces perturbations correspondent dans R0 à des OPPM se propageant contre le sens de l’écoulement, à la vitesse de phase ω/k = v0 . On observe donc dans R une ondulation immobile de la surface, de longueur d’onde statique λs = 2π/k = 2πv0 /ω. On note Z = z + v0 t la cote mesurée dans le repère associé à R. Une ondulation statique dans R, due à des modes stables d’indice m = 2 de rayon rs (ϕ, Z) = r¯ (1 + ε2 cos(kZ) cos(2ϕ)), est la plus facile à observer : elle est représentée sur la Fig. 8(a). Les modes non axisymétriques peuvent parfois s’observer sur le jet en sortie de burette, comme le montre la photographie de la Fig. 8(b). Il est possible d’exciter sélectivement un mode m 6= 0 en utilisant un orifice de sortie non axisymétrique, comme une ellipse pour m = 2. Pour prévoir la longueur d’onde statique λs observée, il faut établir la relation de dispersion des modes m 6= 0. Le raisonnement de la Sec. 2.2 est toujours valable. L’Éq. (9) devient 2 m 1 df d2 f 2 − + + k f = 0, (29) dr2 r dr r2 dont les solutions sont des fonctions de Bessel modifiées de première espèce d’ordre m, notées Im (kr). Pour calculer la nouvelle courbure, on peut à nouveau écrire 2K = 1/R1 + 1/R2 , où on approxime R1 et R2 par les rayons de courbure de sections respectivement longitudinale et transverse de la colonne. Pour de faibles perturbations, l’expression de R1 est inchangée ; R2 est cependant modifié au premier ordre en εm . D’après l’expression de la courbure d’un arc rs (ϕ) paramétré en coordonnées polaires, on a [16] 2r˙ 2 + rs2 − rs r¨s 1 = s , 3/2 R2 (r˙s2 + rs2 )
où r˙s =
drs . dϕ
(30)
468
Phénomènes non linéaires et instabilités (a)
(b)
λs
ez
Fig. 8 (a) Forme théorique du mode non axisymétrique m = 2, statique dans R. (b) Photographie du jet en sortie de burette, présentant une ondulation immobile et de longueur d’onde λs 2πr0 , que l’on identifie avec la perturbation due à des modes d’indice m = 2.
Au premier ordre en ε, on obtient 1/R2 ' 1 + ε(t, ϕ, z)(m2 − 1) /r0 . En tenant compte de ces modifications, l’Éq. (17) devient [6] ω2 = −
I 0 (kr0 ) γ . kr0 1 − (kr0 )2 − m2 m 3 ρr0 Im (kr0 )
(31)
Pour un mode stable caractérisé par m 6= 0, la pulsation ω est toujours réelle, comme attendu. Nous nous contentons d’une approximation à l’ordre le plus bas en kr0 . Sa 0 chant que Im (x) = (x/2)m 1/m! + O x2 en x = 0, on obtient xIm (x)/Im (x) −→ x→0
m, d’où une expression simplifiée :
ω2 =
γ m3 − m . ρr03
(32)
Pour le mode m = 2, la longueur d’onde statique mesurée dans le référentiel du laboratoire a pour expression 2πv0 λs = = 2πv0 ω
s
ρr03 . 6γ
(33)
À partir de la Fig. 8(b), on mesure λs = (7,5 ± 0,2) mm, pour r0 = (0,48 ± 0,02) mm, et v0 = (1,9 ± 0,1) m·s−1 . On en déduit γ = (47 ± 8) × 10−3 J·m−2 . Cette valeur est nettement inférieure à la tension de surface de l’eau pure γatt = 72 × 10−3 J·m−2 , mais cette diminution n’est pas surprenante car l’eau, additionnée d’un diffuseur, n’est pas pure.
VI.3 Instabilité de Rayleigh-Plateau
469
5 Influence de la pesanteur sur l’instabilité 5.1 Profil stationnaire Nous avons étudié en Sec. 2 une colonne liquide s’écoulant à vitesse constante et uniforme. Cependant, au cours de notre expérience, le jet est en chute libre en sortie de la burette. La vitesse dans R de l’écoulement non perturbé est notée v = v0 (Z)ez , où ez est le vecteur unitaire vertical et orienté vers le bas. Puisqu’elle augmente avec Z (cote dans R), il n’existe plus de référentiel galiléen où le liquide est, initialement, uniformément au repos. Dans le même temps, le jet s’affine par conservation du débit πr0 (Z)2 v0 (Z), où l’on note r0 (Z) le rayon du jet à la hauteur Z, mesuré à partir de la sortie de la burette (avec r0 (0) = r0 ). Le jet ne se décompose en gouttes qu’à partir d’une distance L depuis la sortie de la burette. Dans notre expérience, le jet sort avec une vitesse v0 = 1,5 m·s−1 et se déstabilise au bout de L ' 1,5 cm. En négligeant les effets de viscosité et de tension de surface sur l’écoulement non perturbé, on peut déterminer le profil v0 (Z) par le théorème de Bernoulli [10], la pression dans le jet étant partout quasiment égale à la pression atmosphérique. On trouve alors le champ de vitesse correspondant à une chute libre q gZ 2 v0 (Z) = v0 + 2gZ ' v0 1 + 2 , (34) v0 l’approximation linéaire étant valable car gL/v02 ' 0,07 1. L’instabilité se développe par-dessus ce profil stationnaire. En se plaçant dans le référentiel R0 en translation rectiligne à la vitesse v0 par rapport au référentiel du laboratoire, tout se passe comme si le jet était étiré longitudinalement, le profil de vitesse dans ce référentiel s’écrivant v 0 (z) = αz, avec α = g/v0 = 6,54 s−1 .
5.2 Influence d’un étirement constant On considère deux particules de fluide dans l’écoulement donné par l’Éq. (34), de cotes respectives Z(t) et Z(t) + δZ(t), et initialement séparées de δZ0 sur l’axe de révolution du cylindre. La distance δZ(t) entre ces deux particules évolue selon δZ(t + dt) = δZ(t) + v0 (Z(t) + δZ(t)) − v0 (Z(t)) dt, (35) ce qui conduit à la solution δZ(t) = δZ0 eαt . Le rayon du jet doit se contracter au cours du temps selon r0 (Z(t)) = r0 e−αt/2 . Ainsi, le profil de vitesse ayant pour effet d’étirer longitudinalement l’écoulement, un mode de longueur d’onde valant initialement λ0 va voir sa longueur d’onde croître avec le temps selon [17] λ(t) = λ0 eαt .
(36)
L’étirement a également pour effet de modifier la dynamique des modes et leur stabilité : en les aplanissant, il les stabilise. Il est possible d’étudier la dynamique d’un mode, dans le référentiel R0 , en lui superposant un écoulement incompressible V (r, z) = αzez −(αr/2)er , correspondant à l’étirement. Une étude détaillée permet de tirer les conclusions suivantes [4]. • Le taux de croissance initial d’un mode est abaissé par rapport au cas sans étirement, d’une quantité de l’ordre de α. L’intervalle de nombres d’onde k initialement instables est donc réduit, strictement inclus dans [0, 1/r0 ].
470
Phénomènes non linéaires et instabilités •
•
L’instabilité capillaire ne se développe que si le taux d’étirement α n’est pas trop grand par rapport à σmax = 1/τ . Dans ce cas, le nombre d’onde du mode le plus instable reste inchangé. Aux temps longs t 1/α, si elle ne s’est pas déjà déclarée, l’instabilité de Rayleigh-Plateau ne peut plus se développer, et toutes les perturbations décroissent exponentiellement.
Avec nos paramètres, nous trouvons ατ ' 10−2 : l’étirement n’est pas assez fort pour atténuer l’instabilité. La longueur d’onde λmax du mode initialement le plus instable est ensuite étirée, et vaut λmax eατ ' λmax (1 + ατ ) lorsque le jet se décompose en gouttes. Cet effet est cependant difficilement mesurable. Ainsi, les prédictions de la Sec. 2.2.4 sont toujours valables en présence de pesanteur dans notre régime de paramètres.
5.3 Longueur de développement de l’instabilité Nous avons jusqu’ici travaillé en supposant que L est de l’ordre de v0 τ , et dans l’hypothèse où tous les modes sont excités à la sortie de la burette, le mode le plus instable se développant en un temps caractéristique τ . Celui-ci est donné par l’Éq. (19) et vaut τ ' 2 × 10−3 s, ce qui donnerait une longueur v0 τ ' 3 mm. Nous mesurons cependant L ' 1,5 cm, en net désaccord avec cette prédiction. L’analyse du mode non axisymétrique stable, effectuée en Sec. 4.3, permet de confirmer l’ordre de grandeur de τ dans notre liquide. Ainsi, l’instabilité met beaucoup plus de temps à se développer qu’il n’est prévu dans le seul cadre de l’instabilité capillaire. On peut envisager que l’orifice de sortie d’une burette ne perturbe pas suffisamment le jet pour amorcer la croissance de l’instabilité, qui ne se déclenchera que plus tard. Il est alors impossible de savoir à quelle hauteur le mode le plus instable a commencé à grandir. De ce fait, l’influence de la pesanteur via l’étirement des longueurs d’onde est difficilement quantifiable, car on ne peut savoir sur quelle hauteur un mode a été étiré. En tout état de cause, il faut minimiser l’influence de la pesanteur en minimisant gL/v02 , afin d’avoir un profil de vitesse aussi uniforme que possible le long du jet. On essaiera donc d’avoir v0 suffisamment élevée et L la plus faible possible, bien que cette grandeur soit difficilement contrôlable.
Complément A - Traitement numérique d’une image Le code Python ci-dessous calcule la longueur d’onde moyenne λmax d’une image. Il faut rentrer les limites de la zone à étudier, désignées par les indices i1, i2, j1 et j2 (voir le rectangle blanc sur la Fig. 5(a)), ainsi que le rapport de conversion des pixels au mètre, dénommé pix_to_m (obtenu à partir du réglet métallique sur la Fig. 5(a)). Le paramètre size_min détermine la taille minimale des gouttes à étudier sur une image. Cela permet en particulier d’éliminer les gouttes satellites que l’on peut trouver entre deux gouttes principales, et qui pourraient fausser la détermination de λmax . La fonction ndimage.label permet finalement de faire une liste des différentes structures connexes sur l’image, afin de déterminer les coordonnées de leurs isobarycentres. Sur l’image frame.jpg que nous analysons, nous nous assurons que le jet est bien vertical. Ce code peut être ensuite utilisé pour traiter successivement toutes les images
VI.3 Instabilité de Rayleigh-Plateau
471
d’un film et obtenir un histogramme de λmax . Le paramètre threshold permet d’éliminer une image noire, correspondant à une photo prise entre deux flashs du stroboscope (voir la Sec. 3). 1
4
#coding: utf-8 import numpy as np import imageio from scipy import ndimage
10
image = imageio.imread("frame.jpg") pix_to_m = (980-132)/(2.5e-2) threshold, size_min = 0.01, 100 i1, i2, j1, j2 = 750, 1000, 420, 750 drops = image[j1:j2, i1:i2, 0]
13
binary = (drops > 4.0*drops.mean()).astype(np.float) img = ndimage.binary_opening(binary)
16
if (img.mean() > threshold): label_im, nb_labels = ndimage.label(img)
7
#Conversion pixel/m #Zone à étudier
#Seuillage #Nettoie l'image
#Élimine une image noire #Étiquette les gouttes
#Élimine les gouttes satellites d'après la taille d'une goutte sizes = ndimage.sum(img, label_im, range(nb_labels+1)) mask_size = sizes < size_min remove = mask_size[label_im] img[remove] = 0 label_im2, nb_labels2 = ndimage.label(img)
19
22
25
#Calcule les isobarycentres des gouttes restantes bar = ndimage.center_of_mass(img, label_im2, range(1, nb_labels2+1))
28
#Calcule la longueur d'onde moyenne de l'image list_bar = np.array(bar)[:,0] list_spaces = list_bar[1:]-list_bar[:-1] mean_wave = np.mean(list_spaces) print(f"Longueur d'onde moyenne : {mean_wave/pix_to_m:.3g}m")
31
Références [1]
L. Rayleigh, « On the instability of jets, » Proc. Lond. Math. Soc., s1-10 (1), p. 4-13, 1878.
[2]
P.-G. De Gennes, F. Brochard-Wyart et D. Quéré, Gouttes, bulles, perles et ondes, 2e éd. Belin, 2005.
[3]
F. Charru, Instabilités hydrodynamiques. EDP Sciences, 2007.
[4]
J. Eggers et E. Villermaux, « Physics of liquid jets, » Rep. Prog. Phys., 71 (3), p. 036 601, 2008.
[5]
P. Lafrance, « Nonlinear breakup of a laminar liquid jet, » Phys. Fluids, 18 (4), p. 428-432, 1975.
472
Phénomènes non linéaires et instabilités
[6]
L. Rayleigh, « On the capillary phenomena of jets, » Proc. Roy. Soc. Lond. Ser. I, 29, p. 71-97, 1879.
[7]
S. Chandrasekhar, Hydrodynamic and hydromagnetic stability. Dover Publications, 2013.
[8]
D. F. Rutland et G. J. Jameson, « A non-linear effect in the capillary instability of liquid jets, » J. Fluid Mech., 46 (2), p. 267-271, 1971.
[9]
W. Appel, Mathématiques pour la physique et les physiciens. H&K, 2008.
[10]
E. Guyon, J.-P. Hulin et L. Petit, Hydrodynamique physique, 3e éd. EDP Sciences, 2012.
[11]
J. Taylor, Incertitudes et analyse des erreurs dans les mesures physiques : avec exercices corrigés. Dunod, 2000.
[12]
L. Birge et Y. Rozenholc, « How many bins should be put in a regular histogram, » ESAIM: Prob. Stat., 10, p. 24-45, 2006.
[13]
H. A. Sturges, « The choice of a class interval, » J. Am. Stat. Assoc., 21 (153), p. 65-66, 1926.
[14]
J. M. Chambers, W. S. Cleveland, B. Kleiner et P. A. Tukey, Graphical methods for data analysis. Chapman et Hall/Cole Publishing Company, 1983.
[15]
H. C. Thode, Testing for normality. CRC Press, 2002.
[16]
J. Lelong-Ferrand et J.-M. Arnaudiès, Cours de Mathématiques 3, géométrie et cinématique. Dunod, 2001.
[17]
S. Tomotika, « Breaking up of a drop of viscous liquid immersed in another viscous fluid which is extending at a uniform rate, » Proc. R. Soc. Lond. A, (153), p. 302-318, 1936.
Index A Adiabatique (transformation) . . . . . . . 358 Aimantation. . . . . . . . . . . . . . . . . . . . . . . .105 rémanente . . . . . . . . . . . . . . . . . . . . . 126 à saturation . . . . . . . . . . . . . . . . . . . 126 Aimant permanent . . . . . . . . . . . . 168, 182 Ajustement . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Alimentation triphasée . . . . . . . . . . . . . 224 Alternostat . . . . . . . . . . . . . . . . . . . . . . . . . 256 Amortissement . . . . . . . . . . . . . . . . . . . . . 359 Anti-Helmholtz (configuration) . . . . . 173 Appareil photographique . . . . . . . . 82, 459 Asymétrique (solide) . . . . . . 308, 313, 319 Auto-échauffement . . . . . . . . . . . . . . . . . 344 Azote liquide . . . . . . . . . . . . . . . . . . . . . . . 370 B Balais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 Barkhausen (saut de) . . . . . . . . . . . . . . . 159 BCS (théorie) . . . . . . . . . . . . . . . . . . . . . . 383 Bifurcation . . . . . . . . . . . . . . . 423, 430, 440 Bilan thermique . . . . . . . . . . . . . . . 329, 370 Bloch (parois de) . . . . . . . . . . . . . . . . . . . 147 Branchement étoile/triangle . . . . . . . . 233 Brisure de symétrie . . . . . . . . . . . . . . . . . 423 C Calorimétrie . . . . . . . . . . . . . . . . . . . 370, 377 Capacité calorifique. . . . . . . . . . . .356, 369 Cavité optique. . . . . . . . . . . . . . . . . . . . . . .36 Champ démagnétisant . . . . . . . . . 127, 145 Champ magnétique dipolaire . . . . . . . . . . . . . . . . . . . . . . . 185 tournant . . . . . . . . . . . . . . . . . . . . . . . 224 Charge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 Circuit magnétique . . . . . . . . . . . . . . . . . 248 Cohérence spatiale . . . . . . . . . . . . . . . . . . . . . . . . . 22 temporelle . . . . . . . . . . . . . . . . . . . . . . 22 Coin d’air . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Collecteurs . . . . . . . . . . . . . . . . . . . . . . . . . 201 Composition des incertitudes . . . . . . . . . 8
Conduction électrique . . . . . . . . . 340, 341 Conversion électromécanique de puissance . . . . . . . . . . 200, 224 Couple . . . . . . . . . . . . . . . . . . . . . . . . 205, 229 résistant . . . . . . . . . . . . . . . . . . . . . . . 229 Courant d’aimantation . . . . . . . . . . . . . 106 Crédibilité d’une mesure . . . . . . . . . . . . . . 5 Curie loi de . . . . . . . . . . . . . . . . . . . . . . . . . . 108 température de . . . . . . . . . . . . . . . . 123 Cycle d’hystérésis . . . . 123, 136, 161, 170 à saturation . . . . . . . . . . . . . . . . . . . 126 Cycle limite . . . . . . . . . . . . . . . . . . . . . . . . 440 D Décalage isotopique. . . . . . . . . . . . . . . . . .50 Décrément logarithmique . . . . . . . . . . . . 16 Densité spectrale . . . . . . . . . . . . . . . . . . . . 74 Dérivations (courte et longue) . . . . . . 267 Désaimantation . . . . . . . . . . . . . . . . . . . . 134 Diagramme quantile-quantile . . . . . . . 464 Diamagnétisme . . . . . . . . . . . . . . . . . . . . . 108 parfait . . . . . . . . . . . . . . . . . . . . . . . . . 381 Diffusion coefficient de . . . . . . . . . . . . . . 402, 404 particulaire . . . . . . . . . . . . . . . . . . . . 403 équation de . . . . . . . . . . . . . . . . . . . . 402 Digit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Distorsion . . . . . . . . . . . . . . . . . . . . . . . . . . 279 Domaine de fermeture . . . . . . . . . . . . . . 147 Dopler (effet) . . . . . . . . . . . . . . . . . . . . . . . 467 Doublet du sodium . . . . . . . . . . . . . . . . . . 44 E Effet capillaire. . . . . . . . . . . . . . . . . . . . . .115 Effet Hall (sonde à) . . . . . . . . . . . . 112, 119 Élasticité linéaire . . . . . . . . . . . . . . . . . . . 272 Électroaimant . . . . . . . . . . . . . . . . . . . . . . 111 Électromagnétisme des milieux magnétiques . . . . . . . . . . . . . . . . . . . . . 105 Énergie d’anisotropie . . . . . . . . . . . . . . . 146 Entrefer . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
473
474 Erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Estimation des incertitudes . . . . . . . . . . . 4 de type A . . . . . . . . . . . . . . . . . . . . . . . . 6 de type B . . . . . . . . . . . . . . . . . . . . . . . . 7 Euler angle d’ . . . . . . . . . . . . . . . . . . . . . . . . 311 équations d’ . . . . . . . . . . . . . . . . . . . 309 Excitation coercitive en aimantation. . . . . . . . . . . . . . . . .126 en champ . . . . . . . . . . . . . . . . . . . . . . 127 Excitation magnétique. . . . . . . . . . . . . .106
Hooke (loi de) . . . . . . . . . . . . . . . . . . . . . . 272 Humidité relative . . . . . . . . . . . . . . 337, 366 Hystérésis ferromagnétique . . . . . . . . . 148 I Incertitude . . . . . . . . . . . . . . . . . . . . . . . . . 3, 4 Incertitude constructeur . . . . . . . . . . . . . . 8 Incertitude-type . . . . . . . . . . . . . . . . . . . . . . 5 Inducteur . . . . . . . . . . . . . . . . . . . . . . . . . . 200 Induction électromagnétique . . . 181, 247 Induit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 Inertie axe principal d’ . . . . . . . . . . . 294, 309 moment d’ . . . . . . 275, 298, 306, 309 tenseur d’ . . . . . . . . . . . . . . . . . 294, 305 Instabilité . . . . . . . . . . . . . . . . . . . . . . . . . . 453 Intégrateur . . . . . . . . . . . . . . . . . . . . 133, 426 Intégration numérique . . . . . . . . . . . . . . 194 Interaction d’échange . . . . . . . . . . . . . . . . . 125, 143 dipolaire . . . . . . . . . . . . . . . . . . . . . . . 144 Interférences à deux ondes . . . . . . . . . . . 22 Interférogramme . . . . . . . . . . . . . . . . . . . . . 74 Interféromètre de Fabry-Perot . . . 21, 25, 40, 47, 54 de Michelson . . . . . . . . . . . . . . . . 79, 83 à division d’amplitude . . . . . . . . . . 24 à division du front d’onde . . . . . . . 22 Intervalle de confiance . . . . . . . . . . . . . . . . 5
F Facteur adiabatique . . . . . . . . . . . 357, 365 Facteur de puissance . . . . . . . . . . . . . . . 235 Facteur de Landé . . . . . . . . . . . . . . . . . . . . 66 Faraday effet . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 loi de . . . . . . . . . . . . . . . . 130, 181, 228 Fenêtrage. . . . . . . . . . . . . . . . . . . . . . . . . . . .77 Ferrimagnétisme. . . . . . . . . . . . . . . . . . . .154 Ferromagnétisme . . . . . . . . . 108, 123, 142 matériau doux . . . . . . . . . . . . 127, 168 matériau dur . . . . . . . . . . . . . . 127, 168 Fidélité . . . . . . . . . . . . . . . . . . . . . . . . . . 3, 325 Finesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Flexion d’une poutre . . . . . . . . . . . . . . . 271 Flux magnétique . . . . . . . . . . . . . . . . . . . 200 Fonction d’Airy . . . . . . . . . . . . . . . . . . . . . 27 Force électromotrice . . . . . . 181, 228, 249 J Force volumique magnétique. . . . . . . .119 Foucault (courants de) . . . . 139, 186, 252 Justesse . . . . . . . . . . . . . . . . . . . . . . . . . 3, 325 Freinage magnétique . . . . . . . . . . . . . . . 183 L Fréquence de résonance . . . . . . . . . . . . . 436 Lame à faces parallèles . . . . . . . . . . . . . . 80 Fuites de flux magnétique . . . . . . . . . . 210 Lame quart d’onde . . . . . . . . . . . . . . . . . . 64 Laplace G force de . . . . . . . . . . . . . . . . . . . 184, 201 Génératrice . . . . . . . . . . . . . . . . . . . . . . . . 209 loi de . . . . . . . . . . . . . . . . . . . . . . . . . . 456 Grandeur nominale . . . . . . . 211, 232, 248 Lenz (loi de). . . . . . . . . . . . . . . . . . .139, 182 Gyroscope . . . . . . . . . . . . . . . . . . . . . 289, 308 Lévitation . . . . . . . . . . . . . . . . . . . . . 381, 385 Gyroscopique Ligne neutre . . . . . . . . . . . . . . . . . . . . . . . 274 approximation . . . . . . . . . . . . . . . . . 291 Localisation des interférences . . . . 22, 81 couple . . . . . . . . . . . . . . . . . . . . . . . . . 291 Loi des puissances effet . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 électromécaniques . . . . . . . . . 205 Loi gaussienne. . . . . . . . . . . . . . . . . . . . . .464 H Histogramme . . . . . . . . . . . . . . . . . . . . . . . 464 London (théorie de) . . . . . . . . . . . . . . . . 380 Homocline. . . . . . . . . . . . . . . . . . . . . . . . . .422 Lorentz-Lorenz (loi de) . . . . . . . . . . . . . 409
Index M Magnétostatique . . . . . . . . . . . . . . . . . . . 106 Manomètre . . . . . . . . . . . . . . . . . . . . . . . . . 363 Marche aléatoire . . . . . . . . . . . . . . . . . . . 403 Meissner (effet) . . . . . . . . . . . . . . . . 380, 385 Méthode des deux wattmètres . . . . . . 235 Méthode des moindres carrés . . . . . . . . 11 Mode de Fourier. . . . . . . . . . . . . . . . . . . .453 Modèle de l’électron élastiquement lié . . . . . . . . . . . . . . . . . . . . . . . . . 150 Mode propre . . . . . . . . . . . . . . . . . . . . . . . 276 Module de Young . . . . . . . . . . . . . . . . . . 272 Moment fléchissant . . . . . . . . . . . . . . . . . 276 Moment magnétique . . . . . . . . . . . . . . . . 168 Mouillage angle de . . . . . . . . . . . . . . . . . . . . . . . 115 hystérésis de . . . . . . . . . . . . . . . . . . . 115 N Nutation . . . . . . . . . . . . . . . . . . . . . . 295, 312 O Ohnesorge (nombre de) . . . . . . . . . . . . . 458 P Paire de pôles . . . . . . . . . . . . . . . . . . . . . . 226 Paramagnétisme . . . . . . . . . . . . . . . . . . . . 108 Peigne de Dirac . . . . . . . . . . . . . . . . . . . . . 95 Pendule double puits . . . . . . . . . . . . . . . . . . . 420 pesant . . . . . . . . . . . . . . . . . . . . . . . . . 299 Perméabilité magnétique . . . . . . . . . . . 251 relative . . . . . . . . . . . . . . . . . . . . . . . . 107 Pertes fer . . . . . . . . . . . . . . . . . . . . . . . . 209, 253 Joule . . . . . . . . . . . . . . . . . . . . . 209, 252 mécaniques . . . . . . . . . . . . . . . . . . . . 210 par hystérésis . . . . . . . . 131, 136, 253 thermiques . . . . . . 333, 360, 370, 376 Phénomènes de transport . . . . . . . . . . . 400 Piégeage . . . . . . . . . . . . . . . . . . . . . . . 384, 386 Point fixe . . . . . . . . . . . . . . . . . 324, 421, 432 Polarisation des ondes lumineuses. . . . . . . . . . . . .62, 152 Portrait de phase . . . . . . . . . . . . . . 422, 430 Précession . . . . . . . . . . . . . . . . 290, 310, 312 Précision . . . . . . . . . . . . . . . . . . . . . . . . 3, 325 Première aimantation . . . . . 126, 134, 158
475
Produit de convolution . . . . . . . . . . . . . . 95 Produit énergétique . . . . . . . . . . . . . . . . 170 Propagation des incertitudes . . . . . . . . . 10 Pulsation propre . . . . . . . . . . . . . . . . . . . 276 Q Quadripôle . . . . . . . . . . . . . . . . . . . . 201, 249 Quincke (méthode de) . . . . . . . . . . . . . . 109 R Rayon de courbure . . . . . . . . . . . . . . . . . 456 Réaction magnétique d’induit. . . . . . .203 Réfractométrie (méthode de Wiener)405 Règles de sélection. . . . . . . . . . . . . . . . . . .69 Relation constitutive . . . . . . . . . . . . . . . 106 Relation de dispersion . . . . . . . . . . . . . . 455 Rendement . . . . . . . . . . . . . . . . . . . . 208, 233 Repliement de spectre . . . . . . . . . . . . . . . 78 Résonance paramétrique . . . . . . . . . . . . 436 Rotation propre . . . . . . . . . . 290, 300, 312 Rotor . . . . . . . . . . . . . . . . . . . . . . . . . 200, 224 Rüchardt (expérience de) . . . . . . . . . . . 357 S Sauvola (méthode de) . . . . . . . . . 158, 164 Seebeck (effet) . . . . . . . . . . . . . . . . . . . . . 347 Semi-conducteur . . . . . . . . . . . . . . . . . . . 341 Sensibilité . . . . . . . . . . . . . . . . . . . . . . . . . . 324 Seuillage. . . . . . . . . . . . . . . . . . . . . . .158, 461 Shannon (critère de) . . . . . . . . . . . . . 79, 97 Sinus cardinal . . . . . . . . . . . . . . . . . . . . . . . 95 Sonde de fluxmètre . . . . . . . . . . . . . . . . . 188 Sonde de platine . . . . . . . . . . . . . . . . . . . 339 Spectre de l’atome d’hydrogène . . . . . . 49 Spectroscopie . . . . . . . . . . . . . . . . . . . . . . . . 40 Spectroscopie par transformée de Fourier . . . . . . . . . . . . . . . . . . 74 dynamique . . . . . . . . . . . . . . . . . . 81, 88 statique . . . . . . . . . . . . . . . . . . . . . . . . . 81 Stator . . . . . . . . . . . . . . . . . . . . . . . . . 200, 224 Stroboscope . . . . . . . . . . . . . . . . . . . . . . . . 460 Supraconducteur de type I. . . . . . . . . . . . . . . . . . . . . . .383 de type II . . . . . . . . . . . . . . . . . 383, 384 Supraconductivité . . . . . . . . . . . . . . . . . . 379 Susceptibilité magnétique. . . . . . . . . . .107 Système dynamique . . . . . . . 419, 432, 440
476 T Taux de croissance . . . . . . . . . . . . . . . . . 443 Température critique . . . . . . . . . . 380, 391 Temps de réponse . . . . . . . . . 325, 329, 352 Tension de décalage (offset) . . . . . . . . 428 Tension superficielle . . . . . . . . . . . . . . . . 451 Test du χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Théorème du moment cinétique . . . . . . . . . . . . . 205, 229 Thermistance . . . . . . . . . . . . . . . . . . . . . . 341 Thermocouple . . . . . . . . . . . . . . . . . . . . . . 347 Thermométrie . . . . . . . . . . . . . . . . . 323, 339 Thermomètre primaire . . . . . . . . . . . . . . . . . . . . . . . 324 secondaire . . . . . . . . . . . . . . . . . . . . . 324 à hydrogène . . . . . . . . . . . . . . . . . . . 326 Transformateur électrique monophasé . . . . . . . . . . . . . . . . 247 Transformée de Fourier . . . . . . . . . . . . . . 94 discrète . . . . . . . . . . . . . . . . . . . . . . . . . 96 Transition de phase . . . . . . . . . . . . 369, 390 ferro-paramagnétique . . . . . . . . . . 123 V Van der Waals (gaz de) . . . . . . . . . . . . . 368 Viriel (développement du) . . . . . . . . . . 335 Vitesse de synchronisme . . . . . . . . . . . . 224 W Weiss (domaine de) . . . . . . . . . . . . 125, 142 Wiedemann (loi de) . . . . . . . . . . . . . . . . 110 Z Zeeman (effet) anormal . . . . . . . . . . . . . . . . . . . . . 58, 66 normal . . . . . . . . . . . . . . . . . . . . . . 55, 58