136 39 17MB
French Pages 1584 [1290] Year 2021
Claude Deschamps | François Moulin | Yoann Gentric Maxime Bourrigan | Emmanuel Delsinne | François Lussier Chloé Mullaert | Serge Nicolas | Jean Nougayrède Claire Tête | Michel Volcker
MATHS
MPSI MP2I TOUT-EN-UN 6e édition
Couverture : création Hokus Pokus, adaptation Studio Dunod
© Dunod, 2021 11 rue Paul Bert, 92240 Malakoff www.dunod.com ISBN 978-2-10-083369-6
Table des matières Avant-propos
xiii
Mode d’emploi
xiv
Partie I : Notions de base Chapitre 0. Vocabulaire, notations I II III
1
Ensembles de nombres . . . . . . . . . . . . . . . . . . . . . . . . . . Comparaison des réels . . . . . . . . . . . . . . . . . . . . . . . . . . Le cas particulier des entiers . . . . . . . . . . . . . . . . . . . . . . .
Chapitre 1. Logique et raisonnement I Assertions et modes de II Quantificateurs . . . . III Récurrence . . . . . . Exercices . . . . . . . . . .
raisonnement . . . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
7 . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Chapitre 2. Ensembles, applications et relations I Ensembles . . . . II Applications . . . III Relations binaires Démonstrations . . . . Exercices . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
2 2 5
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
8 14 21 26 31
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
32 38 48 52 54
Table des matières
Partie II : Techniques de calcul Chapitre 3. Fonctions numériques de la variable réelle I Inégalités dans IR . . . . . . . . . . . . . . II Fonctions réelles de la variable réelle . . . III Dérivation – Rappels du secondaire . . . . IV Variations d’une fonction sur un intervalle Démonstrations . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
65 . . . . . .
. . . . . .
. . . . . .
Chapitre 4. Calculs algébriques et trigonométrie I Symboles et . . . . . . . . . . . . . . II Coefficients binomiaux, formule du binôme III Petits systèmes linéaires, méthode du pivot IV Trigonométrie . . . . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
101 . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Chapitre 5. Nombres complexes I L’ensemble des nombres complexes II Résolution d’équations dans C . . III Applications géométriques . . . . . Démonstrations . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
I Fonctions logarithmes et exponentielles . II Fonctions puissances . . . . . . . . . . . III Fonctions circulaires . . . . . . . . . . . IV Fonctions hyperboliques . . . . . . . . . V Fonctions à valeurs complexes . . . . . . Démonstrations . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
159 175 181 185 189 209
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
Chapitre 7. Primitives et calculs d’intégrales . . . . . . . . . . . calcul d’intégrales . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
210 213 217 225 228 232 237 249
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Chapitre 8. Équations différentielles linéaires I Équations différentielles linéaires du premier ordre . . . . . . . . . . II Équations différentielles linéaires du second ordre à coefficients constants Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
102 116 119 124 136 141 157
Chapitre 6. Fonctions usuelles
I Primitives . . . . . . . . . II Recherche de primitives et Démonstrations . . . . . . . . . Exercices . . . . . . . . . . . .
66 72 80 86 93 95
250 259 263 264 275 276 285 292 295
Table des matières
Partie III : Analyse Chapitre 9. Nombres réels, suites numériques I L’ensemble des nombres réels . . . . . . . . . . II Généralités sur les suites réelles . . . . . . . . . III Limite d’une suite réelle . . . . . . . . . . . . . IV Opérations sur les limites . . . . . . . . . . . . V Résultats d’existence de limites . . . . . . . . . VI Traduction séquentielle de certaines propriétés VII Suites complexes . . . . . . . . . . . . . . . . . VIII Étude de suites, suites récurrentes . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
309 . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
Chapitre 10. Limites et continuité
371
I L’aspect ponctuel : limites, continuité . . . . . . . . II L’aspect global : fonctions continues sur un intervalle III Extension aux fonctions à valeurs complexes . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Chapitre 11. Dérivation
372 389 397 400 408 421
I Dérivée . . . . . . . . . . . . . . . . . . . . . . II Théorèmes de Rolle et des accroissements finis III Fonctions de classe C k . . . . . . . . . . . . . . IV Extension aux fonctions à valeurs complexes . . Démonstrations . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Chapitre 12. Fonctions convexes I Fonctions convexes . . . II Convexité et dérivabilité Démonstrations . . . . . . . . Exercices . . . . . . . . . . .
310 314 317 323 328 330 331 335 345 357
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
422 428 437 444 448 454 467
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Chapitre 13. Intégration I Intégrale des fonctions en escalier . . . . . . . . II Intégrale des fonctions continues par morceaux III Intégration et dérivation . . . . . . . . . . . . . IV Formules de Taylor globales . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . .
468 473 475 480 491
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
492 497 504 505 507 516
vii
Table des matières
Chapitre 14. Relations de comparaison I Fonctions dominées, fonctions négligeables . II Fonctions équivalentes . . . . . . . . . . . . III Opérations sur les relations de comparaison IV Relations de comparaison sur les suites . . . Démonstrations . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . .
525 . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Chapitre 15. Développements limités
553
I Généralités . . . . . . . . . . . . . . . . . II Opérations sur les développements limités III Applications des développements limités . IV Développements asymptotiques . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Chapitre 16. Séries numériques I Séries numériques . . . . . . . . II Séries à termes réels positifs . . III Séries absolument convergentes IV Application à l’étude de suites Démonstrations . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . .
. . . . . .
527 531 536 541 544 546 554 564 578 582 588 592 609
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
610 618 622 626 628 630
Partie IV : Algèbre Chapitre 17. Arithmétique dans ZZ I Divisibilité dans ZZ II PGCD, PPCM . . III Nombres premiers IV Congruences . . . . Démonstrations . . . . . Exercices . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
641 . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Chapitre 18. Structures algébriques usuelles I Lois de composition interne II Groupes . . . . . . . . . . . III Anneaux . . . . . . . . . . . Démonstrations . . . . . . . . . . Exercices . . . . . . . . . . . . .
viii
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
642 644 652 657 659 665 673
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
674 682 686 692 695
Table des matières
Chapitre 19. Calcul matriciel I Matrices . . . . . . . . . . . II Systèmes linéaires . . . . . III Anneau des matrices carrées Démonstrations . . . . . . . . . . Exercices . . . . . . . . . . . . .
. . . . .
701 . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Chapitre 20. Polynômes
739
I Anneau des polynômes à une indéterminée II Divisibilité et division euclidienne . . . . . III Fonctions polynomiales et racines . . . . IV Dérivation . . . . . . . . . . . . . . . . . . V Factorisation dans C[X] et IR[X] . . . . . VI Arithmétique dans IK[X] . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
Chapitre 21. Fractions rationnelles I Corps des fractions rationnelles . . . II Décomposition en éléments simples . III Primitives d’une fonction rationnelle Démonstrations . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . .
. . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
740 747 749 755 759 760 770 782 795
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Chapitre 22. Espaces vectoriels I Espaces vectoriels . . . II Sous-espaces vectoriels III Familles de vecteurs . IV Sous-espaces affines . . Démonstrations . . . . . . . Exercices . . . . . . . . . .
702 711 714 726 732
796 800 810 814 816 831
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Chapitre 23. Applications linéaires I Définition et propriétés . . . . . . . . . . . . II Endomorphismes . . . . . . . . . . . . . . . III Applications linéaires et familles de vecteurs IV Caractérisation d’une application linéaire . V Formes linéaires et hyperplans . . . . . . . . VI Équations linéaires . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . .
832 836 844 853 856 860 871
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
872 878 883 884 886 888 890 895
ix
Table des matières
Chapitre 24. Dimension finie
907
I Dimension d’un espace vectoriel . . . . . . . II Relations entre les dimensions . . . . . . . . III Applications linéaires et dimension finie . . IV Formes linéaires et hyperplans en dimension Démonstrations . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . finie . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Chapitre 25. Représentation matricielle I Matrices et applications linéaires . II Changements de bases, équivalence Démonstrations . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . .
943
. . . . . . . . et similitude . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Chapitre 26. Déterminants . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
Chapitre 27. Espaces euclidiens . . . . sur . . . .
. . . . un . . . .
x
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
982 986 991 993 995 998 1002 1003 1012 1023
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . sous-espace de dimension finie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Chapitre 28. Dénombrement I Ensembles finis II Dénombrement Démonstrations . . . Exercices . . . . . .
944 955 965 970 981
I Groupe symétrique . . . . . . . . . . . II Formes p-linéaires alternées . . . . . . III Déterminant d’une famille de vecteurs IV Déterminant d’un endomorphisme . . V Déterminant d’une matrice carrée . . . VI Calcul des déterminants . . . . . . . . VII Comatrice . . . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . I Produit scalaire . . . . II Orthogonalité . . . . . III Projection orthogonale Démonstrations . . . . . . . Exercices . . . . . . . . . .
908 914 917 922 925 931
1024 1029 1034 1039 1043 1051
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
1052 1055 1063 1067
Table des matières
Partie V : Probabilités Chapitre 29. Probabilités — Variables aléatoires I Univers . . . . . . . . . . . . . II Espaces probabilisés . . . . . . III Loi d’une variable aléatoire . . IV Couples de variables aléatoires Démonstrations . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
1081 . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Chapitre 30. Conditionnement — Indépendance I Probabilités conditionnelles . . . . II Événements indépendants . . . . . III Variables aléatoires indépendantes Démonstrations . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
1115 . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Chapitre 31. Espérance — Variance I Espérance d’une variable aléatoire . II Variance . . . . . . . . . . . . . . . . III Covariance — Variance d’une somme IV Inégalités probabilistes . . . . . . . . Démonstrations . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . .
. . . . . .
1082 1087 1090 1094 1098 1101 1116 1120 1123 1130 1135 1151
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
1152 1156 1158 1163 1164 1169
Partie VI : Vers la deuxième année Chapitre 32. Familles sommables
1187
I Familles sommables de réels positifs . . . . II Familles sommables de nombres complexes . III Application aux sommes doubles . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Chapitre 33. Fonctions de deux variables I Fonctions continues sur un ouvert de II Fonctions de classe C 1 . . . . . . . . III Dérivation des fonctions composées . IV Extrema . . . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . .
IR2 . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
1188 1194 1199 1206 1210 1223
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
1224 1227 1233 1237 1240 1245
Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1259
xi
Avant-propos Ce nouveau Tout-en-un de mathématiques vient répondre aux attentes des nouveaux programmes entrés en vigueur en première année de classes préparatoires en septembre 2021. Il reprend l’ambition des précédentes éditions : faire tenir, en un seul volume, cours complet et exercices corrigés. Lors de l’élaboration de cet ouvrage, l’équipe d’auteurs ne s’est pas contentée d’adapter l’ancien livre au nouveau programme, mais a repensé chaque chapitre en profondeur, dans un souci permanent de clarté et de concision. Il nous tient à cœur de préciser quelques éléments clés de la structure du livre : • Plutôt que de faire figurer systématiquement, à la suite de l’énoncé d’une proposition ou d’un théorème, sa démonstration entièrement rédigée, nous préférons parfois donner un principe de démonstration (la démonstration complète étant alors reléguée en fin de chapitre). L’objectif est double : ∗ rendre l’exposé du cours plus concis et plus facile à lire lorsque l’étudiant ne souhaite pas s’attarder sur les démonstrations ; ∗ l’étudiant, ayant à sa disposition un principe de démonstration, peut soit (en cas de première lecture) tenter de réfléchir par lui-même à la manière d’élaborer la preuve complète, soit (en cas de lecture ultérieure) se souvenir rapidement de cette preuve. • Chaque chapitre se conclut par une série d’exercices permettant à l’étudiant de s’entraîner. Chacun de ces exercices est entièrement corrigé. ∗ Certains de ces exercices ont pour mission de faire appliquer de manière ciblée un théorème ou une méthode ; sous le numéro de l’exercice est alors indiqué le numéro de la page du cours associée. Inversement, ces exercices sont signalés dans la marge, à l’endroit concerné du cours. S’il n’est pas totalement indispensable de traiter ces exercices lors d’une première lecture du cours, leur lien étroit avec celui-ci les rend particulièrement intéressants pour assimiler les nouvelles notions et méthodes. ∗ L’étudiant trouvera également des exercices d’entraînement un peu plus ambitieux, demandant plus de réflexion. Certains, plus difficiles, sont étoilés. Bien entendu nous sommes à l’écoute de toute remarque dont les étudiants, nos collègues, tout lecteur. . . pourraient nous faire part (à l’adresse électronique ci-dessous). Cela nous permettra, le cas échéant, de corriger certaines erreurs nous ayant échappé et surtout ce contact nous guidera pour une meilleure exploitation des choix pédagogiques que nous avons faits aujourd’hui dans cet ouvrage.
François Moulin et Yoann Gentric [email protected]
ͨMode d’emploiͩĚ’un chapitre hŶĞŝŶƚƌŽĚƵĐƚŝŽŶƉƌĠƐĞŶƚĞůĞƐƵũĞƚƚƌĂŝƚĠ͘
>ĞƐĞŶĐĂĚƌĠƐĐŽƌƌĞƐƉŽŶĚĞŶƚƐŽŝƚăĚĞƐƚŚĠŽƌğŵĞƐ͕ƉƌŽƉŽƐŝƚŝŽŶƐŽƵĐŽƌŽůůĂŝƌĞƐ͕ ƋƵŝƉĂƌƚĂŐĞŶƚůĞŵġŵĞƐLJƐƚğŵĞĚĞŶƵŵĠƌŽƚĂƚŝŽŶ͕ƐŽŝƚăĚĞƐĚĠĨŝŶŝƚŝŽŶƐ͕ƋƵŝŽŶƚůĞƵƌƉƌŽƉƌĞ ŶƵŵĠƌŽƚĂƚŝŽŶ͘
>ĂĚĠŵŽŶƐƚƌĂƚŝŽŶde chaque résultat encadré, lorsqu’elle ne suit pas directement celuiͲĐŝ͕ĞƐƚ ŝŶĚŝƋƵĠĞƉĂƌƵŶƌĞŶǀŽŝ͘
>ĞƐƉŽŝŶƚƐĚĞŵĠƚŚŽĚĞĂƉƉĂƌĂŝƐƐĞŶƚƐƵƌĨŽŶĚŐƌŝƐĠ͘
>ĞƐƉŽŝŶƚƐĂƵdžƋƵĞůƐŝůĨĂƵƚĨĂŝƌĞƉĂƌƚŝĐƵůŝğƌĞŵĞŶƚĂƚƚĞŶƚŝŽŶ ƐŽŶƚƐŝŐŶĂůĠƐƉĂƌƵŶĨŝůĞƚǀĞƌƚŝĐĂůƐƵƌůĂŐĂƵĐŚĞ͘
ĞƐƌĞŶǀŽŝƐǀĞƌƐĚĞƐĞdžĞƌĐŝĐĞƐƉĞƵǀĞŶƚĂƉƉĂƌĂŠƚƌĞĞŶŵĂƌŐĞĂƵƐĞŝŶĚƵĐŽƵƌƐ͘
>ĞƐĞdžĞŵƉůĞƐƐŽŶƚƌĞƉĠƌĠƐƉĂƌĚĞƵdžĐŽŝŶƐ͘
ĞƐĞdžĞƌĐŝĐĞƐƐŽŶƚƉƌŽƉŽƐĠƐĞŶĨŝŶĚĞĐŚĂƉŝƚƌĞ͕ĂǀĞĐĠǀĞŶƚƵĞůůĞŵĞŶƚƵŶƌĂƉƉĞůĚƵŶƵŵĠƌŽ ĚĞůĂƉĂŐĞĚĞĐŽƵƌƐŽƶƐĞƚƌŽƵǀĞůĂŶŽƚŝŽŶĚŽŶƚl’exercice ĞƐƚƵŶĞĂƉƉůŝĐĂƚŝŽŶ͘
ĞƌƚĂŝŶƐĞdžĞƌĐŝĐĞƐďĠŶĠĨŝĐŝĞŶƚĚΖŝŶĚŝĐĂƚŝŽŶƐ͕ ĞƚůĞƐƉůƵƐĚŝĨĨŝĐŝůĞƐƐŽŶƚĠƚŽŝůĠƐ͘
dŽƵƐůĞƐĞdžĞƌĐŝĐĞƐƐŽŶƚĞŶƚŝğƌĞŵĞŶƚĐŽƌƌŝŐĠƐ͘
Chapitre 0 : Vocabulaire, notations I II III
Ensembles de nombres . . . . . . . . . . . . . . . . . . . Comparaison des réels . . . . . . . . . . . . . . . . . . . Le cas particulier des entiers . . . . . . . . . . . . . . .
2 2 5
Vocabulaire, notations I
0
Ensembles de nombres
Parmi les nombres que nous utilisons, nous pouvons distinguer les catégories suivantes. Les entiers naturels : 0 , 1 , 2 , . . . . L’ensemble des entiers naturels est noté IN. Les entiers relatifs : il s’agit des entiers naturels et de leurs opposés. L’ensemble des entiers relatifs est noté ZZ. Les décimaux : il s’agit des nombres de la forme L’ensemble des nombres décimaux est noté D. I Les rationnels : ce sont les quotients d’entiers
p q
L’ensemble des nombres rationnels est noté Q.
k 10n
avec k ∈ ZZ et n ∈ IN.
avec p ∈ ZZ et q ∈ IN∗ .
Les réels : nous supposons connu l’ensemble IR des nombres réels, ainsi que ses opérations usuelles + , − , × et / . 158
Nous étudierons les principales propriétés de IR aux chapitres 3 et 9.
Les complexes : nous étudierons au chapitre 5 l’ensemble C des nombres complexes, c’est-à-dire l’ensemble des nombres qui s’écrivent a + ib , avec (a, b) ∈ IR2 , où i est un nombre (non réel !) dont le carré vaut −1 . I ∗ , Q∗ , IR∗ et C∗ . Ces ensembles privés de 0 sont respectivement notés IN∗ , ZZ∗ , D
II
Comparaison des réels
Inégalités L’ensemble IR est muni des relations de comparaison et < . Si x ∈ IR et y ∈ IR, on dispose de : • la relation x y , qui se lit « x est inférieur (ou égal) à y » ou « x est plus petit que y » ; on peut aussi écrire y x qui se lit « y est supérieur (ou égal) à x » ou encore « y est plus grand que x » ; • la relation x < y , qui se lit « x est strictement inférieur à y » ou « x est strictement plus petit que y » ; on peut aussi écrire y > x qui se lit « y est strictement supérieur à x » ou encore « y est strictement plus grand que x » On a naturellement x < y si, et seulement si, x y et x �= y .
II Comparaison des réels Il y a une terminologie propre à la comparaison avec 0 : • un réel x est positif (respectivement strictement positif ) si x 0 (respectivement x > 0 ) ; • un réel x est négatif (respectivement strictement négatif ) si x 0 (respectivement x < 0 ). Notations • IR+ et Q+ désignent respectivement les ensembles des réels positifs et des rationnels positifs. • IR∗+ et Q∗+ désignent respectivement les ensembles des réels strictement positifs et des rationnels strictement positifs. • IR− , Q− et ZZ− désignent respectivement les ensembles des réels négatifs, des rationnels négatifs et des entiers négatifs. • IR∗− , Q∗− et ZZ∗− désignent respectivement les ensembles des réels strictement négatifs, des rationnels strictement négatifs et des entiers strictement négatifs.
Intervalles de IR Soit a et b deux réels tels que a b . On note 1 : [a, b] = {x ∈ IR : a x b}
[a, +∞[ = {x ∈ IR : a x}
]a, b] = {x ∈ IR : a < x b}
]a, +∞[ = {x ∈ IR : a < x}
[a, b[ = {x ∈ IR : a x < b}
]a, b[ = {x ∈ IR : a < x < b}
]−∞, b] = {x ∈ IR : x b}
]−∞, b[ = {x ∈ IR : x < b}
Ces ensembles, ainsi que IR = ]−∞, +∞[, sont appelés intervalles de IR. Remarques • L’ensemble IR est aussi appelé la droite réelle ou droite numérique. • L’ensemble vide est un intervalle puisque, par exemple, ∅ = ]2, 2[. • Les quatre intervalles de la colonne de droite sont appelés demi-droites. • Dans chacun des cas précédents, le réel a (respectivement b ) est appelé extrémité inférieure (respectivement extrémité supérieure) de l’intervalle. Si I est la demi-droite [a, +∞[ ou la demi-droite ]a, +∞[ , alors +∞ est l’extrémité supérieure de I . De même, −∞ est l’extrémité inférieure des demi-droites ]−∞, b] et ]−∞, b[ . Si I = IR, alors ses extrémités sont −∞ et +∞. • Si a b , l’intervalle [a, b] est appelé segment [a, b]. 1. Une double inégalité du type a x b signifie a x et x b .
3
Chapitre 0. Vocabulaire, notations • Par définition, les intervalles ouverts de IR sont les intervalles de la forme : ]a, +∞[,
]−∞, a[ ou ]a, b[
avec
a < b,
ainsi que IR et l’ensemble vide. • Les intervalles fermés sont les intervalles de la forme [a, +∞[ et ]−∞, a] avec a ∈ IR, les segments, ainsi que IR et l’ensemble vide. On remarque que IR et ∅ sont à la fois ouverts et fermés et que ce sont les seuls intervalles qui vérifient cette propriété.
• Les intervalles de la forme [a, b[ ou ]a, b], avec a < b sont dits semi-ouverts ou semi-fermés. • L’intérieur d’un intervalle I est l’intervalle ouvert qui a les mêmes extrémités que I . Ainsi, pour a b , l’intérieur des intervalles [a, b], [a, b[ , ]a, b] et ]a, b[ est l’intervalle ouvert ]a, b[ . Un point intérieur d’un intervalle I est donc un point de l’intérieur de I . Dans la suite de ce livre, on utilisera souvent l’expression : « soit I un intervalle d’intérieur non vide ». Cela signifie que les extrémités de I sont distinctes, et permet de dire que I contient deux points distincts ou encore que I contient une infinité d’éléments. Dans ce cas, on dit aussi qu’il s’agit d’un intervalle « non trivial ».
Partie entière Définition 1 La partie entière d’un réel x est le plus grand entier relatif n tel que n x. On le note ⌊x⌋. L’existence et l’unicité d’un tel entier sera prouvée à la page 313. On a donc, pour tout x ∈ IR : ⌊x⌋ x < ⌊x⌋ + 1
ou encore
x − 1 < ⌊x⌋ x.
Remarque On peut parfois rencontrer la notation ⌈x⌉ qui désigne le plus petit entier relatif n tel que x n, appelé aussi partie entière supérieure. • Pour x ∈ ZZ, on a naturellement ⌈x⌉ = x = ⌊x⌋. • Sinon, on a ⌊x⌋ < x < ⌈x⌉ et ⌈x⌉ = ⌊x⌋ + 1 .
Droite numérique achevée Définition 2 On appelle droite numérique achevée l’ensemble IR = IR ∪ {−∞, +∞} . On étend la relation à IR en posant −∞ x +∞ pour tout x ∈ IR.
Remarque L’ensemble IR+ ∪ {+∞} se note aussi [0, +∞]. 4
III Le cas particulier des entiers
III
Le cas particulier des entiers
Propriétés Nous admettons les propriétés fondamentales suivantes des entiers. • Si a et b sont deux entiers (relatifs), on a a < b si, et seulement si, a b − 1 .
• Toute partie non vide A de IN possède un plus petit élément a, c’est-à-dire un élément a de A tel que a n pour tout n dans A. Une partie A de ZZ est dite minorée s’il existe a dans ZZ tel que a n pour tout n de A. On définit de même les parties majorées. La deuxième propriété ci-dessus se généralise : • toute partie non vide et minorée de ZZ admet un plus petit élément ; • toute partie non vide et majorée de ZZ admet un plus grand élément.
Intervalles d’entiers Soit a et b deux entiers relatifs vérifiant a b . On note : [[a, b]] = {n ∈ ZZ : a n b} , [[a, +∞[[= {n ∈ ZZ : a n} ,
]]−∞, a]] = {n ∈ ZZ : n a} .
Remarques • Pour a et b entiers relatifs, on a : [[a, b]] = [a, b] ∩ ZZ,
[[a, +∞[[= [a, +∞[ ∩ ZZ et
]]−∞, b]] = ]−∞, b] ∩ ZZ.
• On n’a pas donné de notation pour des intervalles ouverts d’entiers, car, par exemple, pour a et b entiers, on a : {n ∈ ZZ : a < n b} = [[a + 1, b]]. • Lorsque a > b , l’intervalle [[a, b]] est vide. Ainsi, par exemple, pour n ∈ IN, l’intervalle [[1, n]] est vide si, et seulement si, n = 0 .
5
Chapitre 1 : Logique et raisonnement I
Assertions et modes de raisonnement . . . . . Assertions . . . . . . . . . . . . . . . . . . . . . Connecteurs . . . . . . . . . . . . . . . . . . . Modes de raisonnement . . . . . . . . . . . . . II Quantificateurs . . . . . . . . . . . . . . . . . . . 1 Quantificateurs universel et existentiel . . . . . 2 Propriétés élémentaires sur les quantificateurs . III Récurrence . . . . . . . . . . . . . . . . . . . . . 1 Raisonnement par récurrence . . . . . . . . . . 2 Récurrence double . . . . . . . . . . . . . . . . 3 Récurrence forte . . . . . . . . . . . . . . . . . 4 Récurrences finies . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . .
8 8 9 12 14 14 18 21 21 23 24 25 26
Logique et raisonnement
I
Assertions et modes de raisonnement
1
Assertions
1
La notion d’assertion est une notion première. Intuitivement, une assertion est une phrase mathématique qui est soit vraie soit fausse. Ex. 1. « 2 est un entier impair » est une assertion (fausse). Ex. 2. « Tout entier naturel pair supérieur ou égal à 4 est la somme de deux nombres premiers » est une assertion dont on ne sait pas actuellement si elle est vraie ou fausse 1 .
Une assertion peut dépendre de paramètres. Ex. 3. L’assertion « n est premier » est une assertion dont la véracité dépend de n . Remarque
Pour souligner la dépendance en n de cette assertion, on peut la noter P (n) .
Ex. 4. L’assertion « f (x) = 3 » dépend de f et de x . Ex. 5. L’assertion « (x + 1)2 = x2 + 2x + 1 » est vraie pour tout réel x . √ Ex. 6. L’assertion « x2 = x » est vraie pour tout réel x positif et fausse pour tout réel x strictement négatif.
Convention
Soit P une assertion. On écrit la plupart du temps :
« supposons P »
au lieu de
« supposons que P soit vraie »
« montrons P »
au lieu de
« montrons que P est vraie ».
1. On pense néanmoins qu’elle est vraie (conjecture de Goldbach).
I Assertions et modes de raisonnement
2
Connecteurs
Définition 1 Soit P et Q deux assertions. On appelle : • négation de P, et l’on note non P, toute assertion qui est vraie lorsque P est fausse et fausse sinon ; • conjonction de P et Q, et l’on note P et Q, toute assertion qui est vraie lorsque les assertions P, Q sont toutes les deux vraies, et fausse sinon ; • disjonction de P et Q, et l’on note P ou Q, toute assertion qui est vraie lorsqu’au moins l’une des deux assertions P, Q est vraie, et fausse sinon ; • équivalence entre P et Q , et l’on note P ⇔ Q, toute assertion qui est vraie lorsque les assertions P , Q sont toutes les deux vraies ou toutes les deux fausses, et fausse sinon ; • implication de Q par P , et l’on note P ⇒ Q, toute assertion qui est fausse lorsque P est vraie et Q est fausse, et vraie dans tous les autres cas. Remarque On peut visualiser ces définitions à l’aide de tables de vérité : P fausse fausse vraie vraie
Q fausse vraie fausse vraie
non P vraie vraie fausse fausse
P et Q fausse fausse fausse vraie
P ou Q fausse vraie vraie vraie
P⇔Q vraie fausse fausse vraie
P⇒Q vraie vraie fausse vraie
Notation Dans le texte de ce chapitre nous noterons les trois premiers connecteurs « non », « et », « ou », pour les distinguer de ceux du langage courant, mais dans les chapitres suivants nous utiliserons les graphismes classiques « non », « et », « ou ». Attention Le connecteur ou n’est pas exclusif comme il l’est parfois dans le langage courant (dans la locution « fromage ou dessert » par exemple). Remarques • Lorsque l’on a P ⇔ Q, on dit que les assertions P et Q sont équivalentes. • Lorsque l’on a P ⇒ Q, on dit que P implique Q .
• Par abus on dit « la » négation de P ; bien qu’une assertion puisse avoir plusieurs négations, toutes ces négations sont équivalentes. Par exemple, si x est un réel, alors la négation de « x = 0 » peut s’écrire « x �= 0 », mais aussi « x2 > 0 ». Ex. 7. Soit x un réel. • La négation de « x −1 » est « x < −1 ». • La négation de « x 1 » est « x > 1 ».
• L’assertion « x2 − 1 = 0 » est équivalente à « (x = 1) ou (x = −1) ».
• L’assertion « −1 x 1 » est équivalente à « (−1 x) et (x 1) ».
9
Chapitre 1. Logique et raisonnement Propriétés élémentaires sur les conjonctions et les disjonctions Soit P , Q et R trois assertions. On a les propriétés intuitives suivantes qui peuvent se vérifier facilement à l’aide d’une table de vérité : • l’assertion P et (non P) est fausse ;
• l’assertion P ou (non P) est vraie (principe du tiers exclu) ;
• si deux assertions sont équivalentes, alors leurs négations le sont aussi ; • les assertions non (non P) et P sont équivalentes ;
• les assertions non (P et Q) et (non P) ou (non Q) sont équivalentes ;
• les assertions non (P ou Q) et (non P) et (non Q) sont équivalentes ; • les assertions (P et Q) et R et P et (Q et R) sont équivalentes ;
• les assertions (P ou Q) ou R et P ou (Q ou R) sont équivalentes.
Les deux dernières propriétés nous permettent de noter P et Q et R sans parenthèses et de même pour P ou Q ou R . Ex. 8. Soit x , y et z trois réels. • Comme l’assertion x = y = z est équivalente à (x = y) et (y = z) , sa négation est (x �= y) ou (y �= z) .
• De même, comme l’assertion x < y z est équivalente à (x < y) et (y z) , sa négation est (y x) ou (z < y) .
Proposition 1 Soit P, Q et R trois assertions. • Les assertions P et (Q ou R) et (P et Q) ou (P et R) sont équivalentes.
Exo 1.1
• Les assertions P ou (Q et R) et (P ou Q) et (P ou R) sont équivalentes.
Démonstration.
Il suffit de faire une table de vérité à 8 lignes.
Propriétés élémentaires sur l’implication et l’équivalence Soit P et Q deux assertions : • l’assertion P ⇒ Q est équivalente à (non P) ou Q ; • la négation de P ⇒ Q est donc P et (non Q) ;
• les assertions P ⇒ Q et (non Q) ⇒ (non P) sont équivalentes ; • les assertions P ⇔ Q et Q ⇔ P sont équivalentes ;
• les assertions P ⇔ Q et (non P) ⇔ (non Q) sont équivalentes ;
• les assertions P ⇔ Q et (P ⇒ Q) et (Q ⇒ P) sont équivalentes. Remarque Par définition, l’assertion P ⇒ Q est fausse lorsque P est vraie et Q fausse, et uniquement dans ce cas. Donc : • si P est fausse alors P ⇒ Q est vraie ; • si P ⇒ Q est vraie et si P est vraie, alors Q est vraie, ce qui donne le sens intuitif habituel de l’implication : si P est vraie, alors Q est vraie.
10
I Assertions et modes de raisonnement Ainsi, pour démontrer P ⇒ Q : • si P est fausse, alors il n’y a rien à faire ;
• si P est vraie, alors on doit prouver que Q est vraie. Point méthode (pour démontrer P ⇒ Q)
Pour montrer que l’assertion P ⇒ Q est vraie, on peut commencer par supposer P et essayer de prouver Q , ce qui se rédige : « Supposons P et montrons Q ». Ex. 9. Soit P, Q et R trois assertions telles que P ⇒ Q et Q ⇒ R . Montrons que P ⇒ R .
Pour cela, supposons P et montrons R . Comme P ⇒ Q et que P est vraie, on en déduit que Q est vraie. Puis, comme Q ⇒ R , on en déduit que R est vraie.
Remarques • L’assertion P ⇒ Q peut donc être vraie même lorsque Q est fausse. Cela peut paraître bizarre à première vue, surtout si l’on a la mauvaise habitude d’utiliser ce symbole « ⇒ » comme une abréviation pour un « donc ». • Écrire « P donc Q » ou « P implique Q » ne signifie pas la même chose. Dans la première version l’assertion P est vraie alors que dans la seconde, elle ne l’est pas forcément. Ex. 10. L’assertion « (1 = 2) ⇒ (6 = 8) » est vraie puisque « 1 = 2 » est fausse.
Attention • Ne jamais utiliser le symbole ⇒ comme abréviation d’un « donc ».
• Écrire « On a P ⇒ Q » ne prétend pas que P est vraie, mais que si P est vraie, alors Q aussi.
Autre formulations Soit P et Q deux assertions. • Au lieu de dire « on a P ⇒ Q », on peut dire indifféremment : ∗ pour que Q soit vraie, il suffit que P le soit ; ∗ pour que P soit vraie, il faut que Q le soit ;
∗ P est une condition suffisante pour que Q soit vraie ;
∗ Q est une condition nécessaire pour que P soit vraie.
• Au lieu de dire « on a P ⇔ Q », on peut dire indifféremment : ∗ P est vraie si et seulement si Q l’est ;
∗ pour que Q soit vraie, il faut et il suffit que P le soit ;
∗ P est une condition nécessaire et suffisante pour que Q soit vraie. 11
Chapitre 1. Logique et raisonnement
3
Modes de raisonnement
Raisonnement par contraposée Définition 2 Soit P et Q deux assertions. L’assertion non Q ⇒ non P est appelée la contraposée de l’implication P ⇒ Q. On a vu dans les propriétés élémentaires de la page 10 qu’une implication et sa contraposée sont équivalentes. Pour montrer qu’une implication P ⇒ Q est vraie, il suffit donc de montrer sa contraposée. On dit alors que l’on raisonne par contraposée. Ex. 11. Soit n un entier. Montrons que si n2 est pair, alors n l’est aussi. Pour cela, raisonnons par contraposée : montrons que ( n impair) ⇒ ( n2 impair). Supposons n impair et montrons que n2 l’est aussi. Puisque n est impair, il existe un entier k tel que n = 2k + 1 . On a alors : n2 = 4k2 + 4k + 1 = 2 × (2k2 + 2k) + 1 donc n2 est impair. D’où le résultat.
Raisonnement par double implication Pour montrer que deux assertions P et Q sont équivalentes, on peut montrer P ⇒ Q et Q ⇒ P . On dit alors que l’on raisonne par double implication. Ex. 12. Soit n un entier. Montrons que n2 est pair si, et seulement si, n l’est.
• On a déjà prouvé l’implication ( n2 pair) ⇒ ( n pair). Montrons sa réciproque.
• Si n est pair, alors il existe un entier k tel que n = 2k . On a alors n2 = 4k2 = 2 × (2k2 ) qui est pair. Ainsi, n2 est pair si, et seulement si, n l’est aussi, autrement dit n et n2 ont la même parité.
Terminologie
Exo 1.2
Q ⇒ P est appelée l’implication réciproque de P ⇒ Q.
Raisonnement par disjonction de cas Pour démontrer un résultat, il peut être intéressant d’étudier séparément les différents cas de figure. Ex. 13. Redémontrons que n et n2 ont la même parité en raisonnant par disjonction de cas selon la parité de n . • Si n est pair, alors il existe un entier k tel que n = 2k . On a alors n2 = 4k2 = 2 × (2k2 ) qui est pair. • Si n est impair, alors il existe un entier k tel que n = 2k + 1 . On a alors n2 = 4k2 + 4k + 1 qui est impair. Cela conclut car, dans les deux cas, on a obtenu que n et n2 ont la même parité. Remarque Nous avons utilisé ici les mêmes arguments que dans l’exemple 12. Ce n’est que la façon de les présenter qui est différente.
12
I Assertions et modes de raisonnement Ex. 14. Soit P, Q et R trois assertions. Montrons que les assertions : A = (P et (Q ou R))
et
B = (P et Q) ou (P et R)
sont équivalentes, sans faire de table de vérité à 8 lignes. Procédons par disjonction de cas sur la véracité de P : • si P est vraie, alors A et B sont toutes les deux équivalentes à (Q ou R) ; • sinon, A et B sont toutes les deux fausses. Dans les deux cas, A et B sont équivalentes.
Raisonnement par l’absurde Pour prouver qu’une assertion P est vraie, on peut supposer qu’elle est fausse et en déduire une contradiction. Ex. 15. Montrons que
√
2 est un irrationnel. √ Raisonnons par l’absurde en supposant que 2 est rationnel. Il existe alors deux entiers p et q , √ p avec q non nul, tels que 2 = · q Quitte à simplifier la fraction, on peut supposer que p et q ne sont pas tous les deux pairs. En élevant au carré l’égalité précédente, on obtient : 2 q 2 = p2 . Par suite, l’entier p2 est pair et il en est donc de même de p . On peut ainsi trouver un entier k tel que p = 2 k . En remplaçant dans l’égalité 2 q 2 = p2 , on obtient 2 q 2 = 4 k2 et donc : q 2 = 2 k2 ce qui prouve que q 2 est pair. On en déduit que q est pair, ce qui contredit le fait que p et q ne sont pas tous les deux pairs. √ L’hypothèse de départ est donc fausse, ce qui montre que 2 est irrationnel.
Raisonnement par analyse-synthèse Lorsque l’on cherche l’ensemble des éléments x de E vérifiant une propriété P (x), on peut procéder par analyse-synthèse. • Dans la phase d’analyse, on considère un élément x de E vérifiant P (x) et on en déduit des propriétés sur x. Grâce à ces conditions nécessaires, on limite la liste des candidats. • Dans la synthèse, on détermine, parmi les candidats obtenus dans l’analyse, lesquels vérifient P (x). Ex. 16. Déterminons les réels x tels que 1 + x 0 et 1 − x2 =
√
1 + x.
Analyse. Supposons que x soit un réel vérifiant 1 + x 0 et 1 − x2 = 2 2
2
√
1 + x.
2
Alors (1 − x ) = 1 + x , ce qui s’écrit aussi (1 + x) (1 − x) = 1 + x , ou encore :
(1 + x) (1 + x)(1 − x)2 − 1 = 0 On en déduit que x ∈
− 1, 0,
et enfin
√ √ 1+ 5 1− 5 . , 2 2
(1 + x)x(x2 − x − 1) = 0.
13
Chapitre 1. Logique et raisonnement Synthèse. • On vérifie facilement que −1 et 0 sont solutions. √ 1− 5 • Si x = , alors en remontant les calculs ci-dessus, on obtient (1 − x2 )2 = 1 + x . 2 √ Donc, comme 1 + x 0 et 1 − x2 0 , on a 1 − x2 = 1 + x , i.e. x est solution. √ 1+ 5 , alors 1 − x2 < 0 donc x n’est pas solution. • Si x = 2 √ 1− 5 Conclusion. Il y a 3 solutions : −1 et 0 et · 2
II
Quantificateurs
Les notions d’ensemble et d’élément sont ici considérées comme des notions premières ; un ensemble correspond intuitivement à une « collection d’objets » qui sont les « éléments » de cet ensemble. Cette notion sera détaillée au chapitre suivant. Si a est un élément et E un ensemble : • l’assertion a ∈ E , qui se lit « a appartient à E » ou « E contient a », est vraie si a est un élément de E , et fausse dans le cas contraire ; • lorsque a n’est pas élément de E , on écrit a �∈ E . On admet qu’il existe un ensemble, appelé ensemble vide et noté ∅ , qui ne contient aucun élément.
1
Quantificateurs universel et existentiel
Définition 3 Soit P (x) une assertion dépendant d’une variable x appartenant à un ensemble E . • On note « ∀x ∈ E P (x) » l’assertion qui est vraie si, pour tout élément x de E , l’assertion P (x) est vraie. • On note « ∃x ∈ E P (x) » l’assertion qui est vraie s’il existe un élément x appartenant à E tel que l’assertion P (x) soit vraie. • On note « ∃ ! x ∈ E P (x) » l’assertion qui est vraie s’il existe un unique élément x appartenant à E tel que l’assertion P (x) soit vraie. Terminologie Le symbole « ∀ » est appelé quantificateur universel et le symbole « ∃ » est appelé quantificateur existentiel. Remarques • L’assertion « ∀x ∈ E • L’assertion « ∃x ∈ E
P (x) » se lit « pour tout x dans E , on a P (x) ». P (x) » se lit « il existe x dans E tel que P (x) soit vraie ».
• L’assertion « ∃ ! x ∈ E P (x) » se lit « il existe un unique x dans E tel que P (x) soit vraie » et est équivalente à : ∃x ∈ E P (x) et ∀y ∈ E P (y) ⇒ y = x .
Convention 14
Si E est l’ensemble vide, alors l’assertion « ∀x ∈ E
P (x) » est vraie.
II Quantificateurs
Ex. 17. ∃x ∈ IR
Ex. 18. ∃n ∈ ZZ
2x + 1 = 0 est une assertion vraie. 2n + 1 = 0 est une assertion fausse.
Ex. 19. L’assertion ∀n ∈ Z
Ex. 20. L’assertion ∀x ∈ R
(n > 3 ⇔ n 4) est vraie.
(x > 3 ⇔ x 4) est fausse.
Attention • Malgré les apparences, l’assertion « ∀x ∈ E
P (x) » ne dépend pas de x.
La lettre x figurant dans cette assertion a le statut de variable muette. En effet cette assertion peut aussi être écrite : « ∀y ∈ E P (y) », ou encore « ∀z ∈ E P (z) », sans en modifier le sens et peut d’ailleurs être énoncée sans la moindre lettre x, y ou z : « tous les éléments de E vérifient P ».
• Il en est de même des assertions « ∃x ∈ E
P (x) » et « ∃ ! x ∈ E
P (x) ».
Ex. 21. Soit f une fonction de IR dans IR . • L’assertion « ∀x ∈ IR f (x) 0 » signifie que la fonction f est positive. • L’assertion « ∃x ∈ IR f (x) = 0 » signifie que la fonction f s’annule. Dans les deux cas, la traduction en français ne fait pas intervenir la variable muette x . Ex. 22. À partir de l’assertion « x + y 2 = 0 » on peut en former d’autres : • « ∀x ∈ IR x + y 2 = 0 » est une assertion qui ne dépend que de la variable y . On peut la noter P (y) . Cette assertion n’est vérifiée pour aucune valeur de y car s’il existait un réel y tel que P (y) soit vraie, on aurait 1 + y 2 = 0 , ce qui est absurde. • « ∃x ∈ IR x + y 2 = 0 » est une assertion qui dépend de la variable y , et qui est vraie pour toute valeur de y (il suffit de prendre x = −y 2 ).
• « ∃y ∈ IR x + y 2 = 0 » est une assertion qui dépend de la variable x , et qui est vraie si, et seulement si, la variable réelle x est négative.
Notation Par abus, et lorsqu’il n’y a pas d’ambiguïté, on note « ∀x 0 P (x) » au lieu de « ∀x ∈ IR+ P (x) ». De même, on note « ∀n 1 P (n) » au lieu de « ∀n ∈ IN∗ P (n) ». Méthodes et rédaction Pour démontrer une assertion du type : ∀x ∈ E P (x) La façon la plus élémentaire de procéder est de fixer un élément x quelconque dans E puis de démontrer que P (x) est vraie. La rédaction est alors : « Soit x ∈ E . Montrons P (x) ». Ex. 23. Soit f la fonction de IR dans IR définie par : f (x) = x2 + x + 1 .
Démontrons que : ∀x ∈ IR f (x) > 0 . Soit x ∈ IR . Montrons que f (x) > 0 . On a :
f (x) = x + et donc f (x)
3 4
> 0 . D’où le résultat.
1 2
2
+
3 , 4
15
Chapitre 1. Logique et raisonnement Remarque Dans le cas particulier où E = IN, pour prouver une assertion du type : ∀n ∈ IN P (n),
on peut évidemment penser à utiliser une démonstration par récurrence. Ce type de raisonnement est détaillé à la fin de ce chapitre. Pour démontrer une assertion du type : ∃x ∈ E P (x) • Si l’on dispose d’un candidat évident, alors il suffit de l’exhiber.
• Si un tel élément n’est pas évident à trouver, on peut commencer par une phase d’analyse. L’idée est de supposer qu’un tel élément x existe, d’en déduire certaines de ses propriétés pour déterminer un élément qui convienne. À ce stade, on trouve donc des conditions nécessaires pour qu’un élément vérifie P . Cette phase d’analyse peut rester au brouillon. On vérifie ensuite si le(s) élément(s) obtenu(s) vérifie(nt) bien P . Dès que l’un d’entre eux convient, l’assertion est démontrée.
Ex. 24. Soit f la fonction de IR dans IR définie par f (x) = x2 + x + 1 . Pour démontrer l’assertion ∃x ∈ IR f (x) > 2 , il suffit de constater qu’en prenant x = 1 , on a f (x) = 3 > 2 . Ex. 25. Montrons qu’il existe un rationnel x tel que 3x3 + 4x2 + 4x + 1 = 0 . Analyse (formellement non nécessaire, mais permettant de cerner les solutions éventuelles). Soit x un tel rationnel que l’on écrit sous forme de fraction irréductible x = pq ·
En multipliant par q 3 la relation 3x3 + 4x2 + 4x + 1 = 0 , on obtient 3p3 + 4p2 q + 4pq 2 + q 3 , ce qui peut s’écrire : p(3p2 + 4pq + 4q 2 ) = −q 3
Le caractère irréductible de la fraction
p q
et
3p3 = −q(4p2 + 4pq + q 2 ).
et le fait que p divise q 3 et q divise 3p3 nous laissent
penser que p = ±1 et q = ±1 ou q = ±3 (ce que l’on pourrait montrer rigoureusement à l’aide des résultats du chapitre 17 d’arithmétique). D’autre part, il est clair qu’un tel x est nécessairement négatif. Il ne reste donc plus que deux candidats −1 et − 13 ·
Synthèse. Il est facile de voir que −1 n’est pas solution (malheureusement, c’était le premier qu’on avait envie d’essayer !) et un calcul rapide montre que − 31 convient.
Bien entendu, cette toute dernière vérification suffirait pour obtenir le résultat souhaité, la partie d’analyse pouvant rester au brouillon.
Pour démontrer une assertion du type : ∃ ! x ∈ E P (x) • Pour démontrer la partie « unicité », on peut considérer deux éléments a et b tels que P (a) et P (b) soient vraies, et montrer que a = b . Exo 1.3
• Pour la partie existence, si l’on n’a pas de candidat évident, on peut toujours faire une analyse-synthèse dans laquelle, la plupart du temps, la partie « analyse » permettra d’identifier un unique candidat et donc de montrer l’unicité. Ex. 26. Soit a , b , c et d quatre réels tels que a �= b .
Montrons qu’il existe une unique fonction affine f de IR dans IR telle que f (a) = c et f (b) = d . Analyse. Supposons que f soit une fonction affine telle que f (a) = c et f (b) = d . Il existe alors deux réels α et β tels que : ∀x ∈ IR f (x) = α(x − a) + β .
16
II Quantificateurs En évaluant f en a et en b , on obtient β = c et α(b − a) + β = d . Comme a �= b , on en d−c et donc : déduit que α = b−a d−c ∀x ∈ IR f (x) = (x − a) + c. b−a Cela montre l’unicité : il y a au plus une fonction affine valant c et a et d en b . Synthèse. Soit f la fonction de IR dans IR définie par : d−c (x − a) + c. ∀x ∈ IR f (x) = b−a La fonction f est clairement affine et vérifie évidemment f (a) = c et f (b) = d . Conclusion. Il existe une unique fonction affine f : IR → IR telle que f (a) = c et f (b) = d .
Pour utiliser une hypothèse du type : ∀x ∈ E P (x) Si l’on sait que « ∀x ∈ E P (x) » est vraie, alors on peut évidemment utiliser P (x) avec n’importe quel élément x ∈ E . La plupart du temps, il suffit de choisir un bon élément, dépendant du but que l’on veut atteindre. Ex. 27. Soit a et b deux réels et f la fonction de IR dans IR définie par f (x) = a x2 + b . Montrons que si l’on a ∀x ∈ IR f (x) = 0 , alors on a a = b = 0 . Supposons donc ∀x ∈ IR f (x) = 0 . • En utilisant cette hypothèse avec x = 0 , on obtient b = 0 . • Puis, en utilisant alors l’hypothèse avec x = 1 , on obtient a = 0 . On en déduit a = b = 0 , ce qui termine la démonstration. Remarque Parmi l’infinité des valeurs possibles pour x , on n’en a utilisé que deux ; mais cela a suffi pour établir ce que l’on voulait !
Pour utiliser une hypothèse du type : ∃x ∈ E P (x) Si l’on sait que « ∃x ∈ E P (x) » est vraie, alors on peut prendre un élément x ∈ E tel que P (x) soit vraie, mais il est indispensable d’introduire un tel élément par une phrase du type « Prenons x ∈ E tel que P (x) » ; il faut alors faire avec cet élément qui nous est donné, et l’on ne peut pas, sans justification supplémentaire, lui attribuer d’autres propriétés. Ex. 28. Soit a et b deux réels non nuls et f :
IR x
−→ �−→
IR ax2 + b.
Montrons que si la fonction f s’annule, alors les réels a et b vérifient a b < 0 . Supposons que f s’annule. Autrement dit : ∃x ∈ IR f (x) = 0 .
On peut alors fixer un réel x tel que f (x) = 0 , i.e. ax2 + b = 0 . • Comme b �= 0 , on a x �= 0 .
• En multipliant par a l’égalité ax2 + b = 0 , on obtient (ax)2 + ab = 0 , i.e. ab = −(ax)2 .
Or a �= 0 et x �= 0 , donc ax �= 0 . Par suite, on a (ax)2 > 0 , d’où ab < 0 . Cela termine la démonstration. Remarque Le nombre réel x fourni par l’hypothèse « ∃x ∈ IR f (x) = 0 » étant, a priori, quelconque, nous avons dû justifier x �= 0 pour pouvoir affirmer que x2 > 0 .
17
Chapitre 1. Logique et raisonnement Ex. 29. Soit a et b deux entiers naturels. On suppose : (∃n ∈ IN
a = b n)
et
(∃n ∈ IN
b = a n).
(∗)
Montrons que a = b . • L’assertion ∃n ∈ IN a = b n est vraie. Prenons donc n1 ∈ IN tel que a = b n1 . • On peut, de même, prendre n2 ∈ IN tel que b = a n2 .
On en déduit immédiatement a = a n2 n1 . Raisonnons maintenant par disjonction de cas. • Si a = 0 , alors la relation b = a n2 donne b = 0 , et donc a = b . • Sinon, on peut alors simplifier a = a n2 n1 par a , ce qui donne 1 = n2 n1 . Comme n1 et n2 sont entiers naturels, on en déduit n1 = n2 = 1 , et donc a = b . Dans les deux cas, on a a = b . Remarque L’hypothèse (∗) ci-dessus nous dit qu’il existe un entier n tel que a = b n et qu’il existe un entier n tel que b = a n , mais rien ne dit qu’il s’agit du même entier. La variable n figurant dans (∗) est muette, et (∗) aurait pu aussi s’écrire : (∃n1 ∈ IN
a = b n1 )
et
(∃n2 ∈ IN
b = a n2 ).
On ne peut donc pas commencer la résolution de l’exercice précédent en disant : « Fixons un entier n tel que a = b n et b = a n ».
2
Propriétés élémentaires sur les quantificateurs
Négation de quantificateurs Ex. 30. L’assertion « ∀x ∈ IR x2 − 1 = 0 » peut se traduire en français par la phrase : « pour tout réel x , on a x2 − 1 = 0 ». Elle est évidemment fausse. Sa négation, « on peut trouver un réel x tel que x2 − 1 �= 0 », qui est donc vraie (par exemple x = 0 ), s’écrit mathématiquement « ∃x ∈ IR x2 − 1 �= 0 » . Ex. 31. Soit f une fonction de IR dans IR . • Pour écrire que f est la fonction nulle, on écrit « ∀x ∈ IR f (x) = 0 ». • La négation de cette affirmation est « la fonction f prend au moins une valeur non nulle », ce qui s’écrit « ∃x ∈ IR f (x) �= 0 ». • Attention à ne pas confondre cette assertion avec « ∀x ∈ IR f (x) �= 0 » ∗ qui exprime que f ne s’annule pas, ∗ dont la négation, « f s’annule », s’écrit « ∃x ∈ IR f (x) = 0 ».
Plus généralement, si P (x) est une assertion dépendant d’une variable x ∈ E , alors : • la négation de « ∀x ∈ E P (x) » est « ∃x ∈ E non P (x) » ; • la négation de « ∃x ∈ E
P (x) » est « ∀x ∈ E
Ex. 32. La négation de « ∀x ∈ E
A(x) ⇒ B(x) » est :
∃x ∈ E
non P (x) ».
A(x) et non B(x) .
puisque l’assertion A(x) ⇒ B(x) s’écrit non A(x) ou B(x) .
18
II Quantificateurs Ex. 33. La négation de ∀x ∈ E ∃x ∈ E
A(x) ⇔ B(x) est :
A(x) et non B(x)
Ex. 34. Soit x un réel positif tel que ∀ε > 0
ou B(x) et non A(x)
.
x ε . Montrons que x = 0 . x (qui est un réel strictement Raisonnons par l’absurde : supposons x > 0 . En prenant ε = 2 x positif), on obtient, en utilisant l’hypothèse, x , ce qui donne x 0 et contredit le fait 2 que x soit strictement positif. D’où le résultat.
Exo 1.4
Action des quantificateurs sur une conjonction ou une disjonction Soit P (x) et Q(x) deux assertions dépendant d’une variable x ∈ E . On a les équivalences suivantes : • ∀x ∈ E P (x) et Q(x) ⇐⇒ (∀x ∈ E P (x)) et ∀x ∈ E Q(x) , • ∃x ∈ E P (x) ou Q(x) ⇐⇒ ∃x ∈ E P (x)) ou (∃x ∈ E Q(x) . On a aussi les implications suivantes : • ∀x ∈ E P (x) ou ∀x ∈ E Q(x) =⇒ ∀x ∈ E P (x) ou Q(x) , • ∃x ∈ E P (x) et Q(x) =⇒ ∃x ∈ E P (x) et ∃x ∈ E Q(x) .
mais leurs réciproques ne sont pas forcément vraies ; elles sont par exemple fausses si l’on prend E = IR, avec P (x) : « x 0 » et Q(x) : « x > 0 ».
Succession de quantificateurs Lorsqu’une assertion dépend de plusieurs variables, on peut quantifier successivement chacune de ces variables. Ex. 35. Soit f une fonction de IR dans IR . L’assertion f (x) f (a) dépend des deux variables réelles a et x . • Soit a un réel donné. ∗ Pour exprimer « f présente un minimum en a », on écrit : ∀x ∈ IR
f (x) f (a).
∗ L’assertion « f ne présente pas de minimum en a » est la négation de l’assertion précédente, et s’écrit « ∃x ∈ IR f (x) < f (a) ».
• Si l’on veut exprimer « f possède un minimum », c’est-à-dire « il existe (au moins) une valeur de a telle que f (a) soit minimum », on écrit : ∃a ∈ IR
∀x ∈ IR
f (x) f (a).
• Pour exprimer « f ne possède pas de minimum », on peut dire en français « il n’existe aucun point où f présente un minimum » ou encore « en a , réel quelconque, f ne présente pas de minimum », ce qui s’écrit : ∀a ∈ IR
∃x ∈ IR
f (x) < f (a).
19
Chapitre 1. Logique et raisonnement
Exo 1.5 Exo 1.6
Remarques • L’assertion « ∀x ∈ IR f (x) f (a) », où l’on a quantifié x (i.e. on a fait précéder x d’un quantificateur), nous donne une assertion de la seule variable a, exprimant que « f présente un minimum en a ». • L’assertion « ∃a ∈ IR ∀x ∈ IR f (x) f (a) » utilise une succession de deux quantificateurs (ce qui a rendu muettes les deux variables x et a) et exprime le fait que « f possède un minimum ». Ex. 36. L’assertion « tout entier naturel est le carré d’un entier naturel » s’écrit : ∀n ∈ IN • Sa négation est donc : ∃n ∈ IN
∃p ∈ IN
∀p ∈ IN
n = p2 .
n �= p2 .
• Pour démontrer que l’affirmation initiale est fausse, autrement dit que sa négation est vraie, on peut par exemple remarquer que n = 2 n’est le carré d’aucun entier (on a même prouvé à l’exemple 15 de la page 13 que ce n’était le carré d’aucun rationnel).
Inversion de quantificateurs Soit P (x, y) une assertion dépendant de deux variables x ∈ E et y ∈ F . On a les équivalences suivantes : • ∀x ∈ E ∀y ∈ F P (x, y) ⇐⇒ ∀y ∈ F ∀x ∈ E P (x, y) ; • ∃x ∈ E ∃y ∈ F P (x, y) ⇐⇒ ∃y ∈ F ∃x ∈ E P (x, y) . On dit que deux quantificateurs ∀ successifs commutent et que deux quantificateurs ∃ successifs commutent. Attention En général, on ne peut pas intervertir deux quantificateurs différents. Plus précisément, l’implication suivante est vraie mais sa réciproque ne l’est pas forcément : ∃x ∈ E ∀y ∈ F P (x, y) =⇒ ∀y ∈ F ∃x ∈ E P (x, y) .
Dans le membre de gauche, on cherche un x qui convient pour tous les y , alors qu’à droite on demande simplement que pour chaque y on puisse trouver un x (qui dépende éventuellement de y ).
Ex. 37. • L’assertion « ∃x ∈ IR ∀y ∈ IR y = x + 1 » est fausse. En effet, s’il existait un réel x0 tel que ∀y ∈ IR y = x0 + 1 , on aurait en particulier 0 = x0 + 1 et 1 = x0 + 1 , ce qui est absurde. • En revanche, l’assertion « ∀y ∈ IR réel x = y − 1 vérifie y = x + 1 .
20
∃x ∈ IR
y = x + 1 » est vraie car pour tout réel y , le
III Récurrence
III
Récurrence
• Les nombres entiers naturels, et leur ensemble IN, sont à la base de toutes les mathématiques, la première activité mathématique des humains ayant certainement été de compter. C’est pourquoi la plupart des propriétés de IN paraissent naturelles et n’ont, jusqu’à une période relativement récente, soulevé aucune question, même parmi les plus grands mathématiciens. • Il a fallu attendre le XIX e siècle pour que le problème de la construction de IN soit abordé. Une construction rigoureuse de l’ensemble des entiers sort du cadre de ce cours et nous ferons comme le mathématicien Kronecker qui disait : « Dieu nous a donné les entiers et l’homme a fait le reste ». Nous admettons en particulier la propriété suivante : Proposition 2 Toute partie non vide de IN possède un plus petit élément.
1
Raisonnement par récurrence
Dans ce qui suit, nous dirons que P est une propriété définie sur IN pour signifier que P (n) est une assertion pour tout n ∈ IN.
Théorème 3 Soit P une propriété définie sur IN. Si P (0) est vraie et si : ∀n ∈ IN
P (n) ⇒ P (n + 1),
(∗)
alors la propriété P (n) est vraie pour tout entier naturel n. Démonstration. Raisonnons par l’absurde en supposant que P ne soit pas vérifiée sur tout IN . L’ensemble A des entiers n pour lesquels P (n) est fausse est alors une partie non vide de IN , qui admet donc un plus petit élément n0 . • Comme P (0) est vraie, on a 0 ∈ / A et donc n0 > 0 , i.e. n0 − 1 ∈ IN . • L’entier n0 − 1 n’appartient donc pas à A , ce qui prouve que P (n0 − 1) est vraie. La relation (∗) entraîne alors que P (n0 ) est vraie et contredit donc l’appartenance de n0 à A . L’hypothèse que P n’est pas vérifiée sur tout IN est donc absurde.
Point méthode Un raisonnement par récurrence se déroule en trois temps : 1. on explicite la propriété P (n) faisant l’objet de la récurrence ; 2. on prouve que P (0) est vraie ; cette phase s’appelle initialisation ; 3. on prouve que ∀n ∈ IN P (n) ⇒ P (n + 1) ; cette phase s’appelle hérédité. Attention Ne pas oublier, dans une démonstration par récurrence, de vérifier l’initialisation. À titre d’exemple, en oubliant de vérifier P (0), on peut « montrer » que tous les entiers naturels sont égaux, puisque la propriété P (n) : « n = n + 1 » vérifie : ∀n ∈ IN
P (n) ⇒ P (n + 1). 21
Chapitre 1. Logique et raisonnement Ex. 38. Soit f une application strictement croissante de IN dans IN . Montrons par récurrence que : ∀n ∈ IN f (n) n. Pour n ∈ IN , notons P (n) la propriété « f (n) n ». Initialisation. P (0) est vraie puisque, par hypothèse, on a f (0) ∈ IN et donc f (0) 0 . Hérédité. Soit n ∈ IN tel que P (n) soit vraie. On a donc f (n) n . Comme f est strictement croissante, on a f (n + 1) > f (n) n .
Étant donné que f (n + 1) ∈ IN , on en déduit f (n + 1) n + 1 , ce qui prouve P (n + 1) et termine la récurrence.
Remarque Dans l’hérédité, on préfère parfois, pour simplifier certains calculs ou certaines expressions, montrer que : ∀n ∈ IN∗
P (n − 1) ⇒ P (n).
Ex. 39. Soit (un )n∈IN la suite définie par : u0 = 0
et
∀n ∈ IN
Montrons que, pour tout n ∈ IN , on a un =
un+1 = un + n + 1.
n(n + 1) ; notons P (n) cette propriété au rang n . 2
0(0 + 1) = 0 = u0 , la propriété P (0) est vraie. 2 Hérédité. Soit n ∈ IN∗ tel que P (n − 1) soit vraie. Montrons P (n) . On a, en utilisant le fait que P (n − 1) est vraie : Initialisation. Comme
un = un−1 + n =
n(n + 1) (n − 1)n +n= , 2 2
ce qui montre P (n) et termine la récurrence.
L’objet de ce qui suit est de présenter quelques variantes du raisonnement par récurrence. Récurrence à partir d’un certain rang Corollaire 4 Soit n0 un entier et P une propriété définie sur [[n0 , +∞[[. Si P (n0 ) est vraie et si : ∀n n0
P (n) ⇒ P (n + 1),
alors la propriété P (n) est vraie pour tout entier n n0 . Démonstration. Appliquer le théorème 3 de la page précédente à la propriété P (n0 +n) . Ex. 40. Montrons qu’à partir d’un certain rang, on a n! 2n+1 . • En calculant les premiers termes, il semble que, pour les entiers supérieurs ou égaux à 5 , on ait bien 2n+1 n! . Montrons-le par récurrence. • Notons P (n) la propriété « n! 2n+1 » et montrons par récurrence que P (n) est vraie pour tout n 5 . Initialisation. On a 5! = 120 et 26 = 64 donc P (5) est vraie.
22
III Récurrence Hérédité. Soit n 5 tel que P (n) soit vraie. D’après P (n) , on a 2n+1 n! et comme on a aussi 2 n + 1 (puisque n 5 ), on obtient P (n + 1) par produit d’inégalités entre nombres positifs. On a donc prouvé que P (n) est vraie à partir du rang n = 5 .
2
Récurrence double
Il arrive parfois que la justification de P (n) nécessite l’utilisation de P (n − 1) et de P (n − 2). On fait alors ce que l’on appelle une récurrence double, ou encore récurrence d’ordre 2, fondée sur le résultat suivant.
Exo 1.7
Corollaire 5 (Récurrence double) Soit P une propriété définie sur IN. Si P (0) et P (1) sont vraies et si : ∀n ∈ IN P (n) et P (n + 1) ⇒ P (n + 2), alors la propriété P (n) est vraie pour tout n ∈ IN.
Démonstration.
Appliquer le théorème 3 à la propriété H(n) : « P (n) et P (n + 1) ».
Ex. 41. Soit (un )n∈IN la suite définie par u0 = 2 , u1 = 3 et : un+2 = 3un+1 − 2un .
∀n ∈ IN
On peut calculer les premières valeurs prises par cette suite : n un
0 2
1 3
2 5
3 9
4 17
5 33
6 65
Ce tableau nous suggère que : ∀n ∈ IN un = 2n + 1 . Pour le prouver, posons P (n) : « un = 2n + 1 » et montrons par récurrence double que P (n) est vraie pour tout n ∈ IN . Initiatlisation. P (0) et P (1) sont vraies puisque u0 = 2 et u1 = 3 .
Hérédité. Soit n ∈ IN ; supposons P (n) et P (n + 1) . Alors d’après la définition de la suite : un+2 = 3 × (2n+1 + 1) − 2 × (2n + 1) = 2n+2 + 1. Cela prouve P (n + 2) et achève la récurrence.
Attention Dans le cas d’utilisation d’une récurrence double, ne surtout pas oublier de procéder à la double initialisation P (0) et P (1).
23
Chapitre 1. Logique et raisonnement
3
Récurrence forte
Il arrive parfois que la justification de P (n) nécessite l’utilisation de toutes les propriétés P (k) pour k ∈ [[0, n − 1]]. On fait alors une récurrence forte. Corollaire 6 (Récurrence forte) Soit P une propriété définie sur IN. Si P (0) est vraie et si : ∀n ∈ IN∗ P (0) et · · · et P (n − 1) ⇒ P (n), alors la propriété P (n) est vraie pour tout n ∈ IN.
Démonstration.
On montre, par une récurrence simple à partir du rang 1 que la propriété : H(n) : « ∀k ∈ [[0, n]]
P (k) »
est vraie pour tout n ∈ IN∗ .
Remarque Comme l’illustre l’exemple suivant, on peut bien sûr faire une récurrence forte à partir d’un certain rang.
Ex. 42. Démontrons que tout entier naturel supérieur ou égal à 2 possède (au moins) un diviseur premier. Pour tout n 2 , posons P (n) : « n possède un diviseur premier ». Montrons par récurrence forte que P (n) est vraie pour tout entier n 2 . Initialisation. La propriété P (2) est vraie, puisque 2 est premier. Hérédité. Soit n 3 . Supposons P (2), . . . , P (n − 1) vraies, et montrons P (n) . Procédons par disjonction de cas selon le caractère premier ou non de n . • Si n est premier, alors n est un diviseur premier de lui-même. • Si n n’est pas premier, alors il possède un diviseur d compris entre 2 et n − 1 . Or, d’après l’hypothèse de récurrence, P (d) est vraie. Ainsi, d possède un diviseur premier, qui est aussi un diviseur premier de n .
Exo 1.8
Cela montre P (n) et achève par récurrence. Ex. 43. Soit u une suite réelle telle que : ∀n ∈ IN que u est constante. Posons P (n) tout n ∈ IN .
:
(n+1)un+1 = u0 +u1 +· · ·+un . Montrons
« un = u0 » , et montrons par récurrence forte que P (n) est vraie pour
Initialisation. L’assertion P (0) est trivialement vraie. Hérédité. Soit n ∈ IN . Supposons P (0), . . . , P (n) vraies, et montrons P (n + 1) . On a, en utilisant P (1), . . . , P (n) : (n + 1)un+1 = u0 + u1 + · · · + un = u0 + u0 + · · · + u0 = (n + 1)u0
(n+1) termes
et donc un+1 = u0 . Cela prouve P (n + 1) et achève la récurrence.
24
III Récurrence
4
Récurrences finies
Corollaire 7 (Récurrence finie) Soit r ∈ IN et P une propriété définie sur [[0, r]] . Si P (0) est vraie et si : Exo 1.9
∀n ∈ [[0, r − 1]] P (n) ⇒ P (n + 1),
alors P (n) est vraie pour tout n ∈ [[0, r]] . Démonstration.
Appliquer le théorème 3 à la propriété H(n) : « (n > r) ou P (n) » .
Corollaire 8 (Récurrence finie descendante) Soit r ∈ IN et P une propriété définie sur [[0, r]] . Si P (r) est vraie et si : ∀n ∈ [[1, r]]
P (n) ⇒ P (n − 1),
alors P (n) est vraie pour tout n ∈ [[0, r]] . Démonstration.
Appliquer le résultat précédent à la propriété H(n) = P (r − n) .
Remarque Comme l’illustrent les deux exemples suivants, on peut combiner le principe de récurrence finie avec celui de récurrence double/forte/à partir d’un certain rang. Ex. 44. (Récurrence finie forte) Soit n ∈ IN∗ et i1 , . . . , in des entiers distincts entre 1 et n vérifiant : ∀k ∈ [[1, n]]
ik k .
Montrons que ∀k ∈ [[1, n]] ik = k . Posons P (k) : « ik = k » et montrons par récurrence finie forte que P (k) est vraie pour tout k ∈ [[1, n]] . Initialisation. On a i1 1 et i1 ∈ [[1, n]] donc i1 = 1 , ce qui prouve P (1) .
Hérédité. Soit k ∈ [[1, n − 1]] . Supposons P (1), . . . , P (k) et montrons P (k + 1) .
• D’après P (1), . . . , P (k) , on a {i1 , . . . , ik } = [[1, k]] . / [[1, k]] . • D’autre part, i1 , . . . , in étant distincts, on a ik+1 �∈ {i1 , . . . , ik } , i.e. ik+1 ∈ • On a donc ik+1 ∈ [[1, k + 1]] \ [[1, k]] , c’est-à-dire ik+1 = k + 1 .
Cela prouve P (k + 1) et achève la récurrence. Ex. 45. (Récurrence finie descendante forte)
Soit n ∈ IN∗ et i1 , . . . , in des entiers distincts entre 1 et n vérifiant : ∀k ∈ [[1, n]]
ik k .
Montrons que ∀k ∈ [[1, n]] ik = k . Posons P (k) : « ik = k » et montrons par récurrence finie forte descendante que P (k) est vraie pour tout k ∈ [[1, n]] . Initialisation. On a in n et in ∈ [[1, n]] donc in = n , ce qui prouve P (n) . Hérédité. Soit k ∈ [[2, n]] . Supposons P (k), . . . , P (n) et montrons P (k − 1) .
• D’après P (k), . . . , P (n) , on a {ik , . . . , in } = [[k, n]] . • D’autre part, i1 , . . . , in étant distincts, on a ik−1 �∈ {ik , . . . , in } , i.e. ik−1 ∈ / [[k, n]] . • On a donc ik−1 ∈ [[k − 1, n]] \ [[k, n]] , c’est-à-dire ik−1 = k − 1 .
Cela prouve P (k − 1) et achève la récurrence.
25
Chapitre 1. Logique et raisonnement
S’entraîner et approfondir Assertions, logique 1.1 Soit A , B et C trois points du plan formant un triangle T .
→10
1. Écrire une assertion, portant sur les longueurs AB , BC et AC , exprimant que T est un triangle équilatéral. 2. En déduire une assertion exprimant que T n’est pas équilatéral. 3. Comment exprimer que T n’est pas isocèle ?
1.2 Soit n un entier relatif. Prouver que →12
n(n + 1) est un entier. 2
1.3 Soit f une application de IR dans IR . Montrer qu’il existe un unique couple (f1 , f2 ) tel que l’on ait f = f1 + f2 avec f1 une fonction impaire et f2 une fonction paire de IR dans IR . La fonction f1 est appelée la partie impaire de f et f2 sa partie paire.
→16
1.4 1. Déterminer les fonctions g de IR dans IR telles que : →19
∀x ∈ IR
g(x) 0 ou g(x) 0 .
2. Déterminer les fonctions g de IR dans IR telles que : (∀x ∈ IR
g(x) 0) ou (∀x ∈ IR
g(x) 0).
1.5 1. Soit E = {1, 2, 3, 4, 5} . Pour chacune des assertions suivantes, dire si elle est vraie ou fausse, et le justifier.
→20
(i) (ii)
∀x ∈ E
∃y ∈ E
xy
(iii)
∃y ∈ E
∀x ∈ E
xy
(iv)
2. Reprendre les questions avec E = IR .
∀x ∈ E
∃y ∈ E
x y » est vraie en prenant par exemple x = 2 et y = 1 . 2. Avec E = IR . • L’assertion (i) reste vraie (même justification qu’à la question précédente). • L’assertion (ii) est fausse car IR n’admet pas de plus grand élément. • L’assertion (iii) est vraie car, si x est un nombre réel quelconque, alors le réel y = x+1 vérifie x < y . • L’assertion (iv) est fausse (même justification qu’à la question précédente). 1.6 1. L’affirmation « f est majorée par M » s’écrit : ∀x ∈ IR
f (x) M.
2. La fonction f est majorée si l’on peut trouver un réel M qui la majore, ce qui s’écrit : ∃M ∈ IR
∀x ∈ IR
f (x) M.
3. On en déduit automatiquement la négation : ∀M ∈ IR
∃x ∈ IR
f (x) > M,
qui exprime le fait que f n’est pas majorée. 1.7 Procédons par analyse-synthèse. Analyse. Supposons que (a, b) soit un couple de réels tel que ∀n ∈ IN un = (an + b) 2n . u1 − 2u0 · On a alors b = u0 et u1 = 2 (a + b) donc a = 2 Cela prouve qu’en cas d’existence, il y a unicité. u1 − 2u0 Synthèse. Posons a = et b = u0 et montrons par récurrence que la pro2 n priété P (n) : « un = (an + b) 2 » est vraie pour tout n ∈ IN .
Initialisation. On a (a × 0 + b) 20 = b = u0 et (a × 1 + b) 21 = 2a+2b = u1 donc P (0) et P (1) sont vraies.
28
Solutions des exercices Hérédité. Soit n ∈ IN . Supposons P (n) et P (n + 1) vraies, et montrons P (n + 2) . On a, en utilisant P (n) et P (n + 1) :
un+2 = 4un+1 − 4un = 4 a(n + 1) + b 2n+1 + 4(an + b) 2n
= 2n+2 2 a(n + 1) + b − (an + b)
= 2n+2 a(n + 2) + b , ce qui prouve P (n + 2) et achève la récurrence.
1.8 Pour tout n 2 , on pose P (n) : « n est un produit de nombres premiers ». Procédons par récurrence forte pour montrer que P (n) est vraie pour tout n 2 . Initialisation. La propriété P (2) est vraie, puisque 2 est premier. Hérédité. Soit n 3 . Supposons P (2), . . . , P (n − 1) vraies et montrons P (n) . Raisonnons par disjonction de cas. • Si n est premier, alors n est le produit d’un seul nombre premier : lui-même. • Si n n’est pas premier, il possède donc un diviseur d compris entre 2 et n − 1 . On a n n sont des entiers compris entre 2 et n−1 , l’hypothèse alors n = d× . Comme d et d d de récurrence assure que ce sont des produits de nombres premiers ; par conséquent, n aussi. Cela montre P (n) et achève la récurrence.
k
1 n vraie pour tout k ∈ [[1, n]] .
1.9 Posons P (k) : « 1 +
1+
k k2 + 2 » . Montrons par récurrence finie que P (k) est n n
1 1 1 1 + + 2· n n n Hérédité. Soit k ∈ [[2, n]] . Supposons P (k − 1) et montrons P (k) . Écrivons : Initialisation. L’assertion P (1) est vraie car 1 +
1+
1 n
k
En utilisant P (k − 1) , et puisque 1 +
1+
1 n
k
1+ =1+
= 1+
1 n
1+
1 0 , on a : n
1 n
1+
1 n
k−1
.
(k − 1)2 k−1 + n n2
k − 1 + (k − 1)2 (k − 1)2 k + + · 2 n n n3
Pour prouver P (k) , il s’agit alors de prouver que : (k − 1)2 k − 1 + (k − 1)2 k2 + 2, 2 3 n n n ce qui, en multipliant par n3 , revient à : n(k − 1) + n(k − 1)2 + (k − 1)2 nk2 ce qui, en simplifiant, équivaut à (k − 1)2 kn . Cette dernière inégalité étant vraie car 0 k − 1 k et 0 k − 1 n , cela prouve P (k) et achève la récurrence.
29
Chapitre 2 : Ensembles Applications Relations
I
Ensembles . . . . . . . . . . . . . . . . . . . . . . . . 1 Généralités sur les ensembles . . . . . . . . . . . . 2 Inclusion, égalité d’ensembles . . . . . . . . . . . . 3 Intersection, réunion, différence, complémentaire . 4 Produit cartésien . . . . . . . . . . . . . . . . . . . 5 Ensemble des parties d’un ensemble . . . . . . . . 6 Recouvrements, recouvrements disjoints, partitions II Applications . . . . . . . . . . . . . . . . . . . . . . 1 Définitions . . . . . . . . . . . . . . . . . . . . . . 2 Familles d’éléments d’un ensemble . . . . . . . . . 3 Fonction indicatrice . . . . . . . . . . . . . . . . . 4 Restriction et prolongement . . . . . . . . . . . . . 5 Images directes et images réciproques . . . . . . . 6 Composition d’applications . . . . . . . . . . . . . 7 Injectivité, surjectivité, bijectivité . . . . . . . . . III Relations binaires . . . . . . . . . . . . . . . . . . . 1 Relations d’équivalence . . . . . . . . . . . . . . . 2 Relations d’ordre . . . . . . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
32 32 33 34 36 37 37 38 38 40 40 41 41 43 44 48 49 50 52 54
Ensembles Applications Relations I
2
Ensembles
La théorie des ensembles a vu le jour dans le dernier quart du XIX e siècle. Il n’est pas question dans cette section d’en faire une étude axiomatique abstraite, mais plutôt d’en donner le vocabulaire et les règles d’utilisation.
1
Généralités sur les ensembles
Les notions d’ensemble et d’élément sont ici considérées comme des notions premières ; un ensemble correspond intuitivement à une « collection d’objets », dont les objets sont ce que l’on appelle ses « éléments ». Notations Lorsque a est un élément et E un ensemble : • pour signifier que a est un élément de E , on écrit a ∈ E ; • pour signifier que a n’est pas élément de E , on écrit a �∈ E . Remarque On peut définir un ensemble de deux grandes façons : • en extension, c’est-à-dire en donnant la liste de ses éléments ; • par compréhension, c’est-à-dire en donnant une condition d’appartenance à cet ensemble ; on écrit {x ∈ E : P (x)} l’ensemble des éléments de E tels que la propriété P (x) soit vraie. Ex. 1. Ci-dessous, l’ensemble est défini, à gauche, en extension, et à droite, par compréhension : {0, 1, 2, 3} = {n ∈ IN : n 3}. Ex. 2. L’ensemble A des entiers relatifs compris entre −2 et 2 s’écrit : • en extension : A = {−2, −1, 0, 1, 2} ; • par compréhension : A = {n ∈ ZZ : −2 n 2} .
Ex. 3. L’ensemble B des entiers naturels pairs s’écrit : • en extension : B = {2n | n ∈ IN} ; • par compréhension : B = {n ∈ IN : ∃k ∈ IN
n = 2k} .
I Ensembles Ex. 4. Si f : IR → IR est une fonction, alors l’ensemble de ses points d’annulation s’exprime naturellement par compréhension : {x ∈ IR : f (x) = 0} .
Remarques • Dans l’écriture d’un ensemble en extension, on ne tient pas compte de l’ordre à l’intérieur des accolades ; ainsi on a {a, b} = {b, a} .
• La notation E = {a1 , . . . , ap } ne nécessite pas que les éléments a1 , . . . , ap soient distincts. On appelle cardinal de E , et l’on note card E , le nombre d’éléments distincts de E .
Ex. 5. Soit x un réel. L’ensemble {1, x, x2 } est de cardinal 1 si x = 1 , de cardinal 2 si x = 0 ou x = −1 et de cardinal 3 sinon.
On admet qu’il existe un ensemble, appelé ensemble vide et noté ∅ , qui ne contient aucun élément. Ex. 6. On obtient naturellement l’ensemble vide quand on définit un ensemble par compréhension avec une condition d’appartenance jamais vérifiée. Par exemple {x ∈ IR : x2 + 1 = 0} = ∅ .
2
Inclusion, égalité d’ensembles
Définition 1 Soit E et F deux ensembles. On dit que F est un sous-ensemble ou une partie de E si tout élément de F est aussi élément de E . Notations • On dit aussi que l’ensemble F est inclus dans E et l’on note F ⊂ E .
• Lorsque F ⊂ E et F �= E , on dit que l’inclusion est stricte et l’on note F � E . • Au lieu de F ⊂ E , on écrit parfois E ⊃ F .
Traduction
On a F ⊂ E ⇐⇒ ∀x ∈ F
x ∈ E.
Ex. 7. Pour tout ensemble E , on a donc E ⊂ E et ∅ ⊂ E .
Ex. 8. On a la chaîne d’inclusions strictes suivante : IN � ZZ � Q � IR. Ex. 9. Soit E , F et G des ensembles tels que E ⊂ F et F ⊂ G . On a évidemment E ⊂ G . En effet, pour x ∈ E , l’inclusion E ⊂ F donne x ∈ F , puis l’inclusion F ⊂ G offre x ∈ G . Remarque
Cet exemple traduit la transitivité de l’inclusion (cf. page 48).
Remarque Soit E et F deux ensembles. • La négation de F ⊂ E s’écrit F �⊂ E , et se lit « F n’est pas inclus dans E ». On a donc : F �⊂ E ⇐⇒ ∃x ∈ F x ∈ / E. • Les ensembles E et F sont égaux si tout élément de l’un est élément de l’autre : E = F ⇐⇒ E ⊂ F et F ⊂ E .
33
Chapitre 2. Ensembles, applications et relations Point méthode (double inclusion) La principale méthode pour montrer que deux ensembles E et F sont égaux est d’établir la double inclusion E ⊂ F et F ⊂ E . Ex. 10. Dire que les solutions d’une équation (E ) sont les réels x1 et x2 signifie que son ensemble solution est S = {x1 , x2 } . Le plus souvent, on le prouve par double inclusion, ce qui revient à montrer : • d’une part que x1 et x2 sont effectivement solutions de (E ) , ce qui offre {x1 , x2 } ⊂ S ; • d’autre part, qu’il n’y a pas d’autre solution à (E ) que x1 et x2 , ce qui offre S ⊂ {x1 , x2 } .
3
Intersection, réunion, différence, complémentaire
Définition 2 Soit E et F deux ensembles. • La réunion de E et F est l’ensemble, noté E ∪F , des éléments qui sont dans E ou dans F . • L’intersection de E et F est l’ensemble, noté E ∩ F , des éléments qui sont à la fois dans E et dans F . Traduction
On a donc :
x ∈ E ∪ F ⇐⇒ (x ∈ E
ou x ∈ F )
et
x ∈ E ∩ F ⇐⇒ (x ∈ E
et
x ∈ F ).
Ex. 11. On a {x ∈ IR : x2 4} = ]−∞, −2] ∪ [2, +∞[ . Illustration E
E
F
E∪F Propriétés élémentaires
Exo 2.1
A A∪A A∪∅ A∪B A ∪ (B ∪ C) A ∩ (B ∪ C)
⊂ = = = = =
F
E ∩F
Étant donné trois ensembles A, B et C , on a :
A∪B A A B ∪A (A ∪ B) ∪ C (A ∩ B) ∪ (A ∩ C)
A∩B A∩A A∩∅ A∩B A ∩ (B ∩ C) A ∪ (B ∩ C)
⊂ = = = = =
A A ∅ B∩A (A ∩ B) ∩ C (A ∪ B) ∩ (A ∪ C)
Les démonstrations de ces résultats sont assez simples. Les premières découlent des définitions, les dernières peuvent se prouver (cf. exemple 12), ou bien par double inclusion, ou bien en utilisant les propriétés sur les connecteurs « et » et « ou ». 34
I Ensembles Ex. 12. Démontrons la relation A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) de deux façons différentes.
Par double inclusion. • Montrons l’inclusion A ∩ (B ∪ C) ⊂ (A ∩ B) ∪ (A ∩ C) . Soit x ∈ A ∩ (B ∪ C) . Alors x ∈ A et x ∈ B ∪ C . Distinguons deux cas (non exclusifs) : ∗ si x ∈ B , alors x ∈ A ∩ B donc x ∈ (A ∩ B) ∪ (A ∩ C) ; ∗ si x ∈ C , alors x ∈ A ∩ C donc x ∈ (A ∩ B) ∪ (A ∩ C) . Dans les deux cas, on a x ∈ (A ∩ B) ∪ (A ∩ C) . D’où l’inclusion A ∩ (B ∪ C) ⊂ (A ∩ B) ∪ (A ∩ C) . • Montrons l’autre inclusion. ∗ On a A ∩ B ⊂ A et A ∩ B ⊂ B ∪ C , donc A ∩ B ⊂ A ∩ (B ∪ C) . ∗ De même, on a A ∩ C ⊂ A ∩ (B ∪ C) . D’où l’inclusion (A ∩ B) ∪ (A ∩ C) ⊂ A ∩ (B ∪ C) . En utilisant les propriétés des connecteurs logiques. On a : x ∈ A ∩ (B ∪ C) ⇐⇒ x ∈ A ⇐⇒ (x ∈ A
et et
(x ∈ B x ∈ B)
ou ou
x ∈ C) (x ∈ A
et
x ∈ C)
⇐⇒ x ∈ (A ∩ B) ∪ (A ∩ C). D’où l’égalité A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) .
Remarque Les propriétés A ∪ (B ∪ C) = (A ∪ B) ∪ C et A ∩ (B ∩ C) = (A ∩ B) ∩ C rendent superflue l’utilisation des parenthèses. La réunion et l’intersection des trois parties A, B et C se notent donc simplement : A∪B∪C
et
A ∩ B ∩ C.
Définition 3 (Différence ensembliste) Soit E et F deux ensembles. On appelle différence de E et F , et l’on note E \F , l’ensemble des éléments qui sont dans E mais pas dans F . Traduction
On a donc : E \ F = {x ∈ E : x �∈ F } .
Définition 4 Soit E un ensemble et A une partie de E . L’ensemble E \ A est appelé le complémentaire de A dans E . Notation Lorsque l’ensemble E est fixé et qu’il n’y a pas de confusion possible, alors le complémentaire de A dans E est aussi noté A ou Ac . Remarque Soit A et B deux parties d’un ensemble E . On dispose des égalités évidentes suivantes : A =A A\B = A∩B
Exo 2.2
A∪A=E
A∩A=∅
A∩B = A∪B
A∪B = A∩B
ainsi que des équivalences suivantes : A ⊂ B ⇐⇒ B ⊂ A
et
A = B ⇐⇒ A = B. 35
Chapitre 2. Ensembles, applications et relations Extension de la réunion et l’intersection à une famille de parties Si (Ai )i∈I est une famille de parties de E (notion qui sera explicitée page 40), alors la réunion et l’intersection des éléments de cette famille sont notées respectivement : Ai = {x ∈ E : ∃i ∈ I x ∈ Ai } et Ai = {x ∈ E : ∀i ∈ I x ∈ Ai } . i∈I
Exo 2.3
i∈I
Les résultats vus pour la réunion et l’intersection de deux ensembles se généralisent : Ai et Ai . Ai = Ai = i∈I
4
i∈I
i∈I
i∈I
Produit cartésien
Cas de deux ensembles À partir de deux éléments a et b , on peut construire le couple (a, b), avec la propriété fondamentale suivante : (a, b) = (a′ , b′ ) ⇐⇒ (a = a′ et b = b′ ).
Définition 5
Étant donné deux ensembles A et B , on appelle produit cartésien de A par B l’ensemble, noté A × B , des couples de la forme (a, b), avec a ∈ A et b ∈ B .
Traduction On a donc : A × B = (a, b) a ∈ A Notation
et b ∈ B .
Le produit cartésien A × A se note plus simplement A2 .
Attention L’assertion (x, y) �= (0, 0) n’équivaut pas à (x �= 0) et (y �= 0) . En effet, si (x, y) = (1, 0), alors la première est vraie mais pas la seconde. On dispose simplement de l’implication suivante : (x �= 0) et (y �= 0) =⇒ (x, y) �= (0, 0).
Ex. 13. Si E = {0, 1} et F = {0, 1, 2} , alors on a :
E × F = (0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2) .
Attention Le couple (x, y) s’écrit avec des parenthèses, pas des accolades ! En effet, {x, y} désigne l’ensemble formé par les éléments x et y , et en particulier : • si x = y , alors {x, y} = {x} ; • si x �= y , alors {x, y} = {y, x} mais (x, y) �= (y, x).
Généralisation à plus de deux ensembles De même, à partir de trois éléments x, y et z , on peut construire le triplet (x, y, z), caractérisé par la propriété fondamentale : (x, y, z) = (x′ , y ′ , z ′ ) ⇐⇒ (x = x′
et
y = y′
et z = z ′ ).
Étant donné trois ensembles E , F et G, on peut construire leur produit cartésien, noté E × F × G, défini par : E × F × G = {(x, y, z) | x ∈ E
36
et y ∈ F
et
z ∈ G} .
I Ensembles Plus généralement, si n est un entier naturel non nul, • à partir de n éléments x1 , . . . , xn , on peut construire (x1 , , . . . , xn ) appelé n-uplet ou aussi n-liste, avec la règle d’utilisation : (x1 , . . . , xn ) = (x′1 , . . . , x′n ) ⇐⇒ ∀k ∈ [[1, n]] xk = x′k , • à partir de n ensembles E1 , . . . , En , on peut construire leur produit cartésien, noté E1 × · · · × En , défini par : E1 × · · · × En = {(x1 , . . . , xn ) | x1 ∈ E1 , . . . , xn ∈ En } .
Notation
Si E est un ensemble, le produit cartésien E × · · · × E est noté E p . p termes
5
Ensemble des parties d’un ensemble
Notation Traduction
Soit E un ensemble. L’ensemble des parties de E se note P(E). Soit E et F deux ensembles. On a donc : F ∈ P(E) ⇐⇒ F ⊂ E.
Ex. 14. Pour tout ensemble E , on a E ∈ P(E) et ∅ ∈ P(E) .
Ex. 15. Si E = {1, 2} alors on a P(E) = ∅, {1} , {2} , {1, 2} . Exo 2.4 Exo 2.5 Exo 2.6
Attention Prendre garde au double niveau d’accolades dans la description précédente : on a décrit P(E) en donnant l’ensemble de ses éléments. Or tout élément de P(E) est une partie de E , ce qui fait que l’on a : {1} ⊂ E
ou encore
{1} ∈ P(E) ,
alors que la relation 1 ∈ P(E) est fausse car 1 n’est pas une partie de E !
6
Recouvrements, recouvrements disjoints, partitions
Définition 6 Soit (Ai )i∈I une famille de parties de E . On dit que (Ai )i∈I est un recouvrement de E si
Ai = E .
i∈I
On dit que (Ai )i∈I est un recouvrement disjoint de E si (Ai )i∈I est un recouvrement de E constitué d’ensembles deux à deux disjoints, c’est-à-dire vérifiant : ∀(i, j) ∈ I 2
i �= j =⇒ Ai ∩ Aj = ∅.
On dit que (Ai )i∈I est une partition de E si c’est un recouvrement disjoint de E constitué d’ensembles non vides. 37
Chapitre 2. Ensembles, applications et relations
Ex. 16. L’ensemble des nombres pairs et l’ensemble des nombres impairs forment une partition de l’ensemble des entiers. Ex. 17. Plus généralement, pour toute partie A ⊂ E telle que A �= ∅ et A �= E , la fa¯ est une partition de E . mille (A, A)
Il existe une autre définition de la notion de partition : Définition 7 Une partition d’un ensemble E est un ensemble de parties de E , toutes non vides, disjointes deux à deux, et dont la réunion est égale à E ; autrement dit, c’est une partie U de P(E) telle que : • ∀A ∈ U
A �= ∅ ;
• ∀A ∈ U ∀B ∈ U • A = E.
A �= B =⇒ A ∩ B = ∅ ;
A∈U
Remarque La première définition de partition sera utilisée en probabilités alors que c’est la seconde que l’on utilisera pour les classes d’équivalence à la page 50. On passe de l’une à l’autre très facilement. Par exemple, si E = [[1, 7]], alors : • la famille (A, B, C), avec A = {1, 3} , B = {2, 6, 7} et C = {4, 5} , est une partition de E avec la première définition, • l’ensemble {1, 3}, {2, 6, 7}, {4, 5} est une partition de E avec la seconde.
II
Applications
Dans toute cette section, E , F , G et H désignent des ensembles.
1
Définitions
De façon intuitive, une application f de E dans F associe à tout élément de E un unique élément de F . • E est appelé l’ensemble de départ de f , et F son ensemble d’arrivée ;
• pour x ∈ E , l’unique élément y ∈ F associé à x par f est appelé image de x par f et se note f (x) ; on dit alors que x est un antécédent de y par f ; • l’ensemble Γ = (x, f (x)) x ∈ E est appelé le graphe de f ; • l’ensemble y ∈ F : ∃x ∈ E y = f (x) = f (x) x ∈ E est un sous-ensemble de F , appelé l’image de f ;
• une application f de E dans F est notée f : E −→ F x �−→ f (x). Notation
L’ensemble des applications de E dans F se note F E ou encore F (E, F ).
Terminologie 38
On utilise aussi le mot fonction au lieu d’application.
II Applications Remarque Étant donné une partie Γ du produit cartésien E × F , il existe une application f ∈ F E dont le graphe est Γ si, et seulement si : ∀x ∈ E
∃!y ∈ F
(x, y) ∈ Γ.
Ex. 18. Soit E un ensemble. • L’application
E x
−→ �−→
E x
est appelée identité de E , et notée IdE .
• Pour A ∈ P(E) , on peut définir l’application
P(E) X
−→ �−→
P(E) X ∩ A.
Ex. 19. Si E = F = IR , alors E ×F = IR2 est usuellement représenté par le plan usuel rapporté à un repère (O,�ı, �) . • Soit (a, b) ∈ IR2 , l’application affine
IR x
−→ �−→
IR ax + b
a pour graphe une droite.
Réciproquement, toute droite D non parallèle à l’axe (O, �) est le graphe d’une application affine. • L’application
IR+ x
−→ �−→
IR √+ x IR+ x
est correctement définie, et peut se réécrire :
−→ �−→
IR+ t ∈ IR+ tel que x = t2 .
En revanche : ne définit pas une application car, par exemple, ∗ écrire IR −→ IR+ x �−→ t ∈ IR+ tel que x = t2 l’image de −1 n’est pas définie ; ∗ écrire IR+ −→ IR ne définit pas non plus une application ; en x �−→ t ∈ IR tel que x = t2 effet, l’image, par exemple, de 4, n’est pas correctement définie car il existe deux valeurs de t telles que t2 = 4 . y 2 Γ • L’ensemble Γ = (t , t) t ∈ IR ne peut pas être le graphe d’une application car l’image de 1, par exemple, ne serait pas correctement définie. x
Point méthode (égalité d’applications) Pour montrer l’égalité de deux applications f : E → F et g : E ′ → F ′ , il faut : (i) prouver l’égalité des ensembles de départ, c’est-à-dire E = E ′ ,
(ii) prouver l’égalité des ensembles d’arrivée, c’est-à-dire F = F ′ , (iii) prouver que ∀x ∈ E
f (x) = g(x).
39
Chapitre 2. Ensembles, applications et relations
2
Familles d’éléments d’un ensemble
Définition 8 Si I est un ensemble quelconque, une application de I dans E est appelée famille d’éléments de E indexée par I . Remarques • Une famille d’éléments de E indexée par I est donc un élément de E I , mais l’utilisation du terme famille sous-entend que l’on utilise la notation indexée (xi )i∈I au lieu de la notation fonctionnelle I −→ E i �−→ x(i). • Une famille d’éléments de E indexée par IN est appelée suite d’éléments de E .
• En particulier, une famille de parties de E est une famille d’éléments de P(E). • Une famille est dite finie lorsque l’ensemble I est fini.
∗ Lorsque I est de cardinal p ∈ IN∗ , on prend le plus souvent I = [[1, p]] et une telle famille est aussi appelée p-liste ou p-uplet. ∗ La famille (xi )i∈[[1,p]] se note alors couramment (x1 , . . . , xp ) ; on a une identification naturelle entre E I , l’ensemble des p-listes d’éléments de E , et le produit cartésien E p .
• Soit (xi )i∈I une famille indexée par un ensemble I , et soit J une partie de I : ∗ la famille (xi )i∈J est appelée sous-famille de (xi )i∈I ;
∗ la famille (xi )i∈I est appelée sur-famille de (xi )i∈J . Ex. 20. Pour tout a ∈ IR , on peut définir fa : IR
x
−→ �−→
IR |x − a|.
La famille (fa )a∈IR est une famille de fonctions (d’éléments de IRIR ) indexée par IR . La famille (fa )a∈ZZ en est une sous-famille.
3
Fonction indicatrice
Définition 9 Soit A ⊂ E . La fonction indicatrice de A est la fonction de E dans {0, 1}, notée 1A et définie par : 1A (x) = 1
si x ∈ A
et
1A (x) = 0 si x ∈ / A.
Résultats élémentaires Si A et B sont deux parties de E , alors on a : • pour l’intersection : 1A∩B = 1A × 1B , • pour la réunion : 1A∪B = 1A + 1B − 1A × 1B , • pour le complémentaire : 1A = 1 − 1A .
40
II Applications Remarque Pour toutes parties A et B de E , on a A = B ⇐⇒ 1A = 1B . Point méthode Pour montrer l’égalité de deux ensembles, on peut montrer l’égalité de leurs fonctions indicatrices.
Exo 2.8
4
Restriction et prolongement
Définition 10 Soit f une application de E vers F . • Si A est une partie de E , la restriction de f à A, notée f|A , est l’application de A dans F définie par : ∀x ∈ A
f|A (x) = f (x).
• On appelle prolongement de f toute application g définie sur un ensemble E ′ contenant E et vérifiant : g(x) = f (x).
∀x ∈ E
Remarques • Le graphe de f|A est x, f (x) x ∈ A .
• Par définition, f est une restriction de g si, et seulement si, g est un prolongement de f .
5
Images directes et images réciproques
Définition 11 Soit f ∈ F E et A une partie de E . On appelle image directe de A par f , et l’on note f (A), la partie de F définie par : f (A) = {f (x) | x ∈ A} . Remarques Soit f ∈ F E . • On peut ainsi parler de f (x), l’image d’un élément x de E par l’application f , qui est un élément de F mais aussi de f (A), l’image d’une partie A de E , qui est une partie de F . • Si A est une partie de E , alors f (A) = ∅ si, et seulement si, A = ∅ .
• Pour tout x ∈ E , on a f ({x}) = {f (x)} .
• Si A et B sont deux parties de E telles que A ⊂ B , alors f (A) ⊂ f (B). • Une partie A de E est dite stable par f si f (A) ⊂ A. Ex. 21. Si f : IR x
−→ �−→
IR x2
alors on a :
f [−2, 2] = {x2 | x ∈ [−2, 2]} = [0, 4]
et
f [−1, 2] = {x2 | x ∈ [−1, 2]} = [0, 4].
41
Chapitre 2. Ensembles, applications et relations Remarque L’exemple précédent prouve que l’on peut avoir : • deux parties A et B telles que f (A) = f (B) mais A �= B ; • deux parties A et B telles que f (A) ⊂ f (B) mais A �⊂ B .
Ex. 22. Soit A et B deux parties de E et f ∈ F E . Justifions que : f (A ∪ B) = f (A) ∪ f (B)
et
f (A ∩ B) ⊂ f (A) ∩ f (B).
• Montrons que f (A ∪ B) = f (A) ∪ f (B) . Procédons par double inclusion. ∗ Soit y ∈ f (A ∪ B) . Il existe x ∈ A ∪ B tel que y = f (x) . Comme x ∈ A ou x ∈ B , on a f(x) ∈ f(A) ou f(x) ∈ f(B) , c’est-à-dire f(x) ∈ f(A) ∪ f(B) , i.e. y ∈ f(A) ∪ f(B) . ∗ Réciproquement, comme A ⊂ A ∪ B , on a f (A) ⊂ f (A ∪ B) . De même, f (B) ⊂ f (A ∪ B) . Ainsi, on obtient f (A) ∪ f (B) ⊂ f (A ∪ B) . • Montrons que f (A ∩ B) ⊂ f (A) ∩ f (B) . Comme A ∩ B ⊂ A , on a f (A ∩ B) ⊂ f (A) . Par symétrie, on a aussi f (A ∩ B) ⊂ f (B) , donc f (A ∩ B) ⊂ f (A) ∩ f (B) .
Exo 2.9
Attention L’inclusion f (A ∩ B) ⊂ f (A) ∩ f (B) peut être stricte. Par exemple, si f : IR → IR est définie par f (x) = x2 , et si l’on prend A = IR∗+ et B = IR∗− , alors f (A ∩ B) = ∅ tandis que f (A) ∩ f (B) = IR∗+ .
Définition 12 Soit f ∈ F E et B une partie de F . On appelle image réciproque de B par f , et l’on note f −1 (B), la partie de E définie par : f −1 (B) = {x ∈ E : f (x) ∈ B}. Remarques Soit f ∈ F E . • Pour toute partie B de F et x ∈ E , on a x ∈ f −1 (B) ⇐⇒ f (x) ∈ B . • On a f −1 (∅) = ∅ et f −1 (F ) = E .
• Soit y ∈ F . L’ensemble f −1 ({y}), l’image réciproque du singleton {y} par f , est l’ensemble des antécédents de y . Il peut être vide (si y n’a pas d’antécédent par f ), ou bien contenir un ou plusieurs éléments. • Si A et B sont deux parties de F telles que A ⊂ B , alors f −1 (A) ⊂ f −1 (B). Ex. 23. Si f : IR x
IR x2
−→ �−→
alors on a, par simple résolution d’équations ou d’inéquations :
f −1 {4} = {−2, 2}
f −1 [0, 4] = x ∈ IR : x2 ∈ [0, 4] = [−2, 2]
f −1 [−2, 4] = x ∈ IR : x2 ∈ [−2, 4] = [−2, 2]
f −1 [−2, −1] = x ∈ IR : x2 ∈ [−2, −1] = ∅.
Remarque Cet exemple prouve que l’on peut avoir : • deux parties A et B telles que f −1 (A) = f −1 (B) mais A �= B ; • deux parties A et B telles que f −1 (A) ⊂ f −1 (B) mais A �⊂ B .
42
II Applications Ex. 24. Soit f ∈ F E ainsi que A et B deux parties de F . Justifions que : f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B) ;
f −1 (A ∩ B) = f −1 (A) ∩ f −1 (B)
et
f −1 (A) = f −1 (A).
Pour x ∈ E , on a les chaînes d’équivalences suivantes, qui justifient les trois égalités ci-dessus : x ∈ f −1 (A ∪ B) ⇐⇒ f (x) ∈ A ∪ B ⇐⇒ f (x) ∈ A
f (x) ∈ B
ou
⇐⇒ x ∈ f −1 (A)
x ∈ f −1 (B)
ou
⇐⇒ x ∈ f −1 (A) ∪ f −1 (B) x ∈ f −1 (A ∩ B) ⇐⇒ f (x) ∈ A ∩ B ⇐⇒ f (x) ∈ A
⇐⇒ x ∈ f −1 (A) Exo 2.10
f (x) ∈ B
et
x ∈ f −1 (B)
et
⇐⇒ x ∈ f −1 (A) ∩ f −1 (B) et enfin :
Exo 2.11
x ∈ f −1 (A) ⇐⇒ f (x) �∈ A ⇐⇒ x �∈ f −1 (A) ⇐⇒ x ∈ f −1 (A).
6
Composition d’applications
Définition 13 Exo 2.12
Soit f ∈ F E et g ∈ GF . L’application E −→ G est appelée composée x �−→ g f (x) des applications g et f ; on la note g ◦ f . Ex. 25. Pour tout f ∈ F E , on a f ◦ IdE = f et IdF ◦f = f . Ex. 26. Si f : IR x
−→ �−→
g ◦ f : IR x
IR x2
−→ �−→
et g : IR x
IR. x+1
−→ �−→
IR x2 + 1
et
alors on a :
f ◦ g : IR x
−→ �−→
IR (x + 1)2 .
Ainsi, g ◦ f �= f ◦ g , car par exemple (g ◦ f )(1) = 2 �= 4 = (f ◦ g)(1) .
Attention En général (cf. exemple précédent), même lorsque les composées g ◦ f et f ◦ g existent, il n’y a aucune raison que g ◦ f = f ◦ g .
Proposition 1
Soit f ∈ F E , g ∈ GF et h ∈ H G . Alors h ◦ (g ◦ f ) = (h ◦ g) ◦ f . Démonstration. Les deux applications h ◦ (g ◦ f ) et (h ◦ g) ◦ f vont de E dans H . L’égalité entre ces deux applications vient alors du fait que, pour x ∈ E , on a :
h ◦ (g ◦ f ) (x) = h (g ◦ f )(x) = h g f (x)
(h ◦ g) ◦ f (x) = (h ◦ g) f (x) = h g f (x)
.
43
Chapitre 2. Ensembles, applications et relations 675
Remarque Nous verrons dans le chapitre 18 que, sur l’ensemble E E , la composition des applications est une loi de composition interne et que la propriété précédente traduit son associativité. Par abus, le résultat de la propriété précédente sera parfois invoqué de la façon suivante : « par associativité de la composition. . . »
7
Injectivité, surjectivité, bijectivité
Définition 14 Exo 2.13
Soit f ∈ F E . On dit que f est injective, ou que f est une injection, si tout élément de F possède au plus un antécédent par f . Traductions Une application f ∈ F E est donc injective si, et seulement si, pour tout y ∈ F , l’équation f (x) = y possède au plus une solution, ce qui s’écrit : ∀(x1 , x2 ) ∈ E 2
f (x1 ) = f (x2 ) =⇒ x1 = x2 .
Ex. 27. L’application IdE est évidemment injective. Ex. 28. Si D est une partie quelconque de IR et si f ∈ IRD est strictement monotone, alors elle est injective. En effet, supposons par exemple f strictement croissante et considérons deux éléments x1 et x2 de D tels que x1 �= x2 . Quitte à les échanger, on peut supposer x1 < x2 ; la stricte croissance de f nous donne alors f (x1 ) < f (x2 ) , donc a fortiori f (x1 ) �= f (x2 ) . La démonstration est similaire dans le cas où f est strictement décroissante.
Remarque D’après les règles de négation, une application f ∈ F E n’est pas injective si, et seulement si : ∃(x1 , x2 ) ∈ E 2
f (x1 ) = f (x2 )
et x1 �= x2 .
Pour prouver que f n’est pas injective, il suffit donc d’exhiber deux éléments distincts de E ayant la même image par f . Ex. 29. La fonction sin : IR → IR n’est pas injective car sin 0 = sin 2π . Définition 15 Exo 2.14
Soit f ∈ F E . On dit que f est surjective, ou que f est une surjection, si tout élément de F possède au moins un antécédent par f . Traductions Une application f ∈ F E est donc surjective si, et seulement si, pour tout y ∈ F , l’équation f (x) = y possède au moins une solution, ce qui s’écrit : ∀y ∈ F
∃x ∈ E
y = f (x).
• L’application IdE est évidemment surjective. • La fonction sin : IR → [−1, 1] est surjective car, pour tout y ∈ [−1, 1] , il existe (au moins) un x ∈ IR tel que y = sin x .
44
II Applications Remarque D’après les règles de négation, une application f ∈ F E n’est pas surjective si, et seulement si : ∃y ∈ F ∀x ∈ E y �= f (x). Pour prouver que f n’est pas surjective, il suffit donc d’exhiber un élément ne possédant pas d’antécédent par f . Ex. 30. La fonction sin : IR → IR n’est pas surjective car 2 n’a pas d’antécédent. Exo 2.15
Ex. 31. L’application t �→ t2 de IR dans IR+ : • est surjective car tout élément de IR+ possède au moins un antécédent, • n’est pas injective car −1 et 1 ont même image.
Définition 16 Soit f ∈ F E . On dit que f est bijective, ou que f est une bijection, si f est injective et surjective. Traductions Une application f ∈ F E est donc bijective si, et seulement si, tout élément de F a un et un seul antécédent par f , c’est-à-dire si, et seulement si, pour tout y ∈ F , l’équation f (x) = y possède exactement une solution, ce qui s’écrit : ∃!x ∈ E
∀y ∈ F
Ex. 32. L’application
IR+ −→ IR+ t �−→ t2 unique antécédent (sa racine carrée).
y = f (x).
est bijective car tout élément de IR+ possède un
Ex. 33. Aucune des trois applications : IR x
−→ �−→
IR sin x
n’est bijective, mais l’application
[− π2 , π2 ] x [− π2 , π2 ] x
−→ �−→ −→ �−→
Ex. 34. Justifions que l’application f : P(E) A
IR sin x [−1, 1] sin x
−→ �−→
Injectivité. On sait que, pour (A, B) ∈ P(E)2 , on a : 1A = 1B =⇒ A = B
Donc f est injective.
autrement dit
IR x
−→ �−→
[−1, 1] sin x
l’est.
{0, 1}E 1A
est une bijection.
f (A) = f (B) =⇒ A = B.
Surjectivité. Soit ϕ ∈ {0, 1}E . En posant A = ϕ−1 {1} , alors 1A = ϕ , i.e. f (A) = ϕ . Donc f est surjective.
Notation Une application bijective de E sur E est appelée permutation de E ; l’ensemble des permutations de E est noté S(E). Ex. 35. L’application IdE est une permutation de E . Si a et b sont deux éléments de E distincts, l’application qui échange a et b et qui laisse les autres invariants est une permutation.
45
Chapitre 2. Ensembles, applications et relations Proposition 2 Soit f ∈ F E et g ∈ GF .
• Si f et g sont injectives, alors g ◦ f est injective.
• Si f et g sont surjectives, alors g ◦ f est surjective.
Exo 2.16
• Si f et g sont bijectives, alors g ◦ f est bijective.
Démonstration page 52
Abus de langage En pratique, on peut utiliser la composition des applications dans un cadre un peu plus large que celui de la définition 13 de la page 43. Si f et g sont deux applications définies respectivement sur E et F , alors il est possible de parler de g ◦ f dès que l’on a : ∀x ∈ E f (x) ∈ F . Ex. 36. Étant donné f : IR x très bien considérer g ◦ f : IR x
−→ �−→
[−1, 1] et g : [−2, +∞[ sin x x
−→ �−→
IR √
−→ �−→
IR alors on peut √+ 2+x
2 + sin x.
En revanche, dans un tel cas, il faut être très prudent car, comme on peut le voir sur l’exemple précédent, le résultat sur les composées d’applications surjectives ne peut alors plus s’appliquer. Définition 17 Soit f une application bijective de E dans F . L’application de F dans E qui, à tout y ∈ F , associe l’unique x ∈ E tel que y = f (x), s’appelle application réciproque de f et se note f −1 .
Ex. 37. L’application IR+ t √ . racine carrée, notée 222
→ �→
Ex. 38. L’application [− π2 , π2 ] t notée Arcsin .
IR+ est bijective et son application réciproque est la fonction t2 −→ �−→
[−1, 1] est bijective, et son application réciproque est sin t
Point méthode Soit f ∈ F E . Si l’on a prouvé la bijectivité de f en montrant que, pour tout y ∈ F , l’équation f (x) = y possède une unique solution en en trouvant une expression en fonction de y , alors on a déterminé l’application réciproque f −1 . Ex. 39. Soit l’application f : [−2, +∞[ −→ x
�−→
IR √+ x + 2.
√ Pour tout y ∈ IR+ , l’équation x + 2 = y possède une unique solution : x = y 2 − 2 . Par suite, l’application f est bijective, et f −1 : IR+ −→ [−2, +∞[ y �−→ y 2 − 2.
46
II Applications Proposition 3 Si f est une application bijective de E dans F , alors on a : f −1 ◦ f = IdE
et
f ◦ f −1 = IdF .
Démonstration page 52
Attention Si f est une application bijective de E sur F , et si E et F sont distincts, alors f −1 ◦ f �= f ◦ f −1 car f −1 ◦ f = IdE et f ◦ f −1 = IdF .
Proposition 4
Soit f ∈ F E et g ∈ E F vérifiant f ◦ g = IdF et g ◦ f = IdE .
Les applications f et g sont alors bijectives et réciproques l’une de l’autre.
Démonstration.
Par symétrie de l’énoncé en f et g , contentons-nous de montrer que f est bijective et que g = f −1 . Soit y ∈ F ; résolvons l’équation y = f (x) par analyse-synthèse.
• Soit x ∈ E tel que f (x) = y . En composant par g , on obtient (g ◦ f )(x) = g(y) , soit x = g(y) , puisque g ◦ f = IdE . • Posons donc x = g(y) . On a alors f (x) = (f ◦ g)(y) = y puisque f ◦ g = IdF .
Ainsi, y admet g(y) pour unique antécédent par f . Cela prouve que f est bijective et que son application réciproque est y �→ g(y) , c’est-à-dire g .
Attention On peut très bien avoir l’une des égalités f ◦ g = IdF ou g ◦ f = IdE sans que les applications f et g soient bijectives, comme le montre l’exemple suivant. Ex. 40. Si l’on considère f la fonction exponentielle de IR dans IR , alors l’application : g : IR
−→
x
�−→
IR ln x 0
si si
x>0 x 0.
est telle que g ◦ f = IdIR car : ∀x ∈ IR g(f (x)) = g(exp x) = ln(exp x) = x. Néanmoins, la fonction f n’est pas bijective puisque son image, IR∗+ , n’est pas égale à IR . Cela n’a rien de contradictoire avec la proposition précédente qui réclame les deux hypothèses f ◦ g = IdF et g ◦ f = IdE .
Point méthode (pour montrer que f est bijective et donner f −1 ) Soit f ∈ F E .
• Si l’on exhibe une application g ∈ E F telle que f ◦ g = IdF et g ◦ f = IdE , alors on peut affirmer que f est bijective et que f −1 = g .
• Souvent, la démonstration de la surjectivité de f mène à expliciter une solution de l’équation f (x) = y , de la forme x = g(y). On a alors f ◦ g = IdF et il reste à montrer que g ◦ f = IdE . Corollaire 5
−1 1. Si f ∈ F E est bijective, alors f −1 est bijective et f −1 =f.
2. Si f ∈ F E et g ∈ GF sont bijectives, alors g ◦ f est bijective et : (g ◦ f )−1 = f −1 ◦ g −1 .
Démonstration page 52
47
Chapitre 2. Ensembles, applications et relations Terminologie Soit f une application de E dans E . On dit qu’elle est involutive, ou que c’est une involution, si elle vérifie f ◦ f = IdE .
Remarque D’après la proposition précédente, une application involutive est bijective, et elle est sa propre réciproque. Ex. 41. L’application
IR∗ x
Ex. 42. L’application P(E) A
−→ �−→
IR∗
est involutive, donc bijective.
1 x
−→ �−→
P(E) est involutive, donc bijective. A
Attention Soit f ∈ F E et B ∈ P(F ). L’utilisation de la notation f −1 (B) pour l’image réciproque de B par f ne suppose pas que f soit bijective. Remarque Soit f ∈ F E bijective et B ∈ P(F ). La notation f −1 (B) désigne deux ensembles : l’image directe de B par l’application f −1 , mais aussi l’image réciproque de B par f . La propriété suivante prouve qu’il n’y a pas de conflit de notations. Proposition 6 Soit f ∈ F E bijective et B ∈ P(F ). L’image directe de B par l’application f −1 et l’image réciproque de B par f sont égales. Démonstration page 52
III
Relations binaires
Dans toute cette partie, E désigne un ensemble quelconque. Définition 18 Une relation binaire R sur E est une partie de E×E . On dit que deux éléments x et y de E sont en relation, et l’on note x R y , si (x, y) ∈ R. Ex. 43. La relation définie sur IR par x R y ⇐⇒ x y correspond au demi-plan situé au dessus de la première bissectrice. Ex. 44. La relation définie sur IR par x R y ⇐⇒ x2 = y 2 correspond à la réunion des droites d’équations y = x et y = −x . Ex. 45. La notion de relation binaire est utilisée naturellement dans plusieurs contextes. • Dans IR , on a les relations usuelles , < et = . • Dans ZZ , on dispose de la relation | de divisibilité : a | b ⇐⇒ ∃n ∈ ZZ b = na . • Dans P(E) , on a la relation d’inclusion ⊂ .
Définition 19 Une relation binaire R sur E est dite : • réflexive si : ∀x ∈ E
x R x,
• symétrique si : ∀(x, y) ∈ E 2
x R y =⇒ y R x,
• transitive si : ∀(x, y, z) ∈ E
(x R y
• antisymétrique si : ∀(x, y) ∈ E 2
48
3
(x R y
et
et y R x) =⇒ x = y , y R z) =⇒ x R z .
III Relations binaires
1
Relations d’équivalence
Définition 20 On dit qu’une relation binaire R sur E est une relation d’équivalence sur E si elle est réflexive, symétrique et transitive.
Ex. 46. Soit α ∈ IR . La relation de congruence modulo α est la relation définie sur IR par : x − y = k α.
x R y ⇐⇒ ∃k ∈ ZZ
Si x et y sont deux réels en relation pour la congruence modulo α , on dit que x est congru à y modulo α , et l’on écrit x ≡ y [α] . Vérifions qu’il s’agit d’une relation d’équivalence sur IR . Réflexivité. Soit x ∈ IR . On a x − x = 0 × α donc x ≡ x
[α] .
2
Symétrie. Soit (x, y) ∈ IR tel que x ≡ y [α] . Il existe donc k ∈ ZZ tel que x − y = k α . Par suite, y − x = (−k) α et, comme −k ∈ ZZ , on a y ≡ x [α] . Transitivité. Soit (x, y, z) ∈ IR3 tel que x ≡ y [α] et y ≡ z [α] . Il existe donc (k, k′ ) ∈ ZZ2 tel que x − y = k α et y − z = k′ α . Par suite, x − z = (x − y) + (y − z) = (k + k′ ) α et, comme k + k′ ∈ ZZ , on a x ≡ z [α] .
Ex. 47. Soit n ∈ IN . La relation définie sur ZZ par : x R y ⇐⇒ ∃k ∈ ZZ
x − y = k n,
est une relation d’équivalence sur ZZ , appelée congruence modulo n . Si a et b sont deux éléments de ZZ en relation pour la congruence modulo n , on dit que a est congru à b modulo n et l’on écrit a ≡ b [n] .
Définition 21 Soit R une relation d’équivalence sur E . • Pour tout x ∈ E , l’ensemble y ∈ E : x R y est appelé classe d’équivalence de x pour R ; cet ensemble est noté cl(x), voire x ¯ ou x˙ . Exo 2.23
• Une partie X de E est une classe d’équivalence s’il existe un x ∈ E tel que X = cl(x) ; un tel x est alors appelé un représentant de X .
Remarques Avec les notations ci-dessus : • pour tout élément x de E , on a x ∈ cl(x) ;
• pour (x, y) ∈ E 2 , on a x R y ⇐⇒ y ∈ cl(x).
Ex. 48. Pour la congruence modulo 2 sur ZZ , il y a deux classes d’équivalence : • la classe de 0 qui est l’ensemble des entiers pairs, • la classe de 1 qui est l’ensemble des entiers impairs.
Ex. 49. Pour la relation de congruence modulo 5 sur ZZ , il y a 5 classes d’équivalence qui sont : ¯ 0,
¯ 1,
¯ 2,
¯ 3
et
¯ 4.
Pour tout x ∈ ZZ , on a x ¯ = x + 5 k | k ∈ ZZ .
49
Chapitre 2. Ensembles, applications et relations Proposition 7 Soit R une relation d’équivalence sur E . Pour (x, y) ∈ E 2 , on a : x R y ⇐⇒ cl(x) = cl(y).
Exo 2.24
Démonstration page 53
Proposition 8 Si R est une relation d’équivalence sur E , alors ses classes d’équivalence forment une partition de E . Principe de démonstration.
Il s’agit de montrer que :
Démonstration page 53
• chaque classe d’équivalence est non vide, • deux classes d’équivalence distinctes sont disjointes, • la réunion des classes d’équivalence est égale à E .
2
Relations d’ordre
Définition 22 On dit qu’une relation binaire R sur E est une relation d’ordre sur E si elle est réflexive, antisymétrique et transitive. Le couple (E, R) est alors appelé ensemble ordonné. Ex. 50. Sur IN , ZZ , Q ou IR , on a les relations d’ordre usuelles ou . Ex. 51. Sur P(E) , la relation d’inclusion est une relation d’ordre. Ex. 52. Sur IRIR , on a les relations d’ordre usuelles ou : • on dit que f g pour signifier que ∀x ∈ IR f (x) g(x) ; • on dit que f g pour signifier que ∀x ∈ IR f (x) g(x) .
Ex. 53. Montrons que la relation de divisibilité définie sur IN par : x | y ⇐⇒ ∃k ∈ IN
y = kx
est une relation d’ordre. Cette relation est : • réflexive car, pour tout x , l’entier k = 1 vérifie la relation x = k x ; • antisymétrique car, si y | x et x | y , alors on peut trouver k et k′ tels que : x = ky
et
y = k′ x ;
par substitution, on en déduit x = k k′ x ; ∗ si x = 0 , alors la relation y = k′ x entraîne y = 0 = x , ∗ sinon, en simplifiant par x , on en déduit k k′ = 1 ; mais comme k et k′ sont dans IN , on en déduit k = k′ = 1 et par suite x = y ; • transitive car, si x | y et y | z , alors on peut trouver k et k′ tels que : y = kx Exo 2.25
et
z = k′ y ;
on en déduit immédiatement z = k′ k x et donc x | z .
Attention La relation < utilisée habituellement sur IN, ZZ, Q ou IR n’est pas une relation d’ordre : elle est antisymétrique et transitive, mais elle n’est pas réflexive. 50
III Relations binaires Définition 23 Soit (E, ) un ensemble ordonné. On dit que deux éléments x et y de E sont comparables si l’on a x y ou y x. Ex. 54. Dans IR muni de son ordre usuel, deux éléments quelconques sont comparables. Ex. 55. Dans IN muni de la divisibilité, les éléments 2 et 3 ne sont pas comparables.
Exo 2.26 Exo 2.27
Définition 24 La relation d’ordre définit un ordre total sur E si deux éléments quelconques de E sont comparables, c’est-à-dire si : ∀(x, y) ∈ E 2
(x y
ou y x).
Dans le cas contraire, on dit que c’est un ordre partiel. Exemples d’ordres totaux Ex. 56. La relation d’ordre usuelle sur IR , et donc sur IN , ZZ et Q . Ex. 57. L’ordre alphabétique sur les mots de la langue française.
Exemples d’ordres partiels Ex. 58. La relation de divisibilité dans IN (par exemple, 3 et 2 ne sont pas comparables). Ex. 59. La relation d’inclusion sur P(E) , lorsque card E 2 , puisque si a �= b alors {a} et {b} ne sont pas comparables : en effet, on n’a ni {a} ⊂ {b} ni {b} ⊂ {a} . Ex. 60. La relation sur l’ensemble des fonctions de IR dans IR car, par exemple, cos et sin cos(0) = 1 > 0 = sin(0) ne sont pas comparables ; par exemple, on a cos(π) = −1 < 0 = sin(π).
Plus grand élément, plus petit élément Soit A une partie d’un ensemble ordonnée (E, ) et a ∈ A. On dit que a est le plus grand élément de A si ∀x ∈ A x a. Comme le laisse entendre l’utilisation de l’article « le », s’il existe, un tel élément est unique. En effet, si a et b dans A vérifient : ∀x ∈ A x a
et
∀x ∈ A x b,
alors b a (puisque b est dans A) et de même a b . Donc, par antisymétrie, b = a. On définit de la même façon la notion de plus petit élément (s’il existe). Ex. 61. Dans IN muni de son ordre naturel, tout partie non vide admet un plus petit élément. C’est la propriété fondamentale de IN qui nous a permis de démontrer le théorème de récurrence. Ex. 62. Toujours dans IN muni de son ordre naturel, la partie {6, 8} admet 8 pour plus grand élément. Mais pour la relation de divisibilité, elle n’en admet pas puisque 6 et 8 ne sont pas comparables. Ex. 63. Soit A et B deux parties d’un ensemble E . Pour l’ordre d’inclusion sur P(E) , l’ensemble des parties de E qui contiennent A et B admet un plus petit élément qui est A ∪ B . De même, A ∩ B est la plus grande des parties de E incluses à la fois dans A et dans B .
51
Chapitre 2. Ensembles, applications et relations
Démonstrations Proposition 2 •
•
•
Supposons f et g injectives. Soit x ∈ E et x′ ∈ E tels que g f (x) = g f (x′ ) .
Comme g est injective, on en déduit que f (x) = f (x′ ) . L’injectivité de f donne alors x = x′ , ce qui prouve l’injectivité de g ◦ f . Supposons f et g surjectives. Soit z un élément de G . Comme g est surjective, il existe y ∈ F tel que z = g(y) . Comme f est surjective, il existe x ∈ E tel que y = f (x) . On a alors z = g(f (x)) = (g ◦ f )(x) , ce qui prouve la surjectivité de g ◦ f . Le troisième point est une conséquence immédiate des deux premiers.
Proposition 3 •
•
Par définition, f −1 ◦ f est une application de E dans E . De plus, pour tout x ∈ E , on a f −1 f (x) = x car f (x) possède, par f , un unique antécédent qui est évidemment x . On en déduit f −1 ◦ f = IdE .
De même f ◦ f −1 est une application de F dans F .
De plus, pour tout y ∈ F , on a f f −1 (y) = y car f −1 (y) est par définition l’antécédent de y par f . D’où f ◦ f −1 = IdF .
Corollaire 5 1. Conséquence de la proposition précédente puisque f et f −1 vérifient : f −1 ◦ f = IdE 2.
et
f ◦ f −1 = IdF .
L’associativité de la composition nous donne :
f −1 ◦ g −1 ◦ (g ◦ f ) = f −1 ◦ (g −1 ◦ g) ◦ f = f −1 ◦ IdF ◦ f = f −1 ◦ f = IdE ,
(g ◦ f ) ◦ f −1 ◦ g −1 = g ◦ (f ◦ f −1 ) ◦ g −1 = g ◦ IdF ◦ g −1 = g ◦ g −1 = IdG .
La proposition 4 de la page 47 nous permet alors de conclure. Proposition 6
Posons : R = {x ∈ E : f (x) ∈ B}, image réciproque de B par f , D = {f −1 (y) | y ∈ B}, image directe de B par l’application f −1 .
Montrons que R = D par double inclusion. • Soit x ∈ R , i.e. tel que f (x) ∈ B . •
On a x = IdE (x) = (f −1 ◦ f )(x) = f −1 (f (x)) ∈ D . D’où R ⊂ D .
Soit x ∈ D . Il existe y ∈ B tel que x = f −1 (y) donc :
f (x) = f f −1 (y) = (f ◦ f −1 )(y) = IdF (y) = y ∈ B, donc x ∈ R . D’où D ⊂ R .
52
Démonstrations Proposition 7 • Supposons x R y , et montrons que cl(x) = cl(y) par double inclusion. ∗
•
∗
Soit z ∈ cl(x) ; alors on a x R z et, comme x R y , par symétrie et transitivité, on en déduit z R y , i.e. z ∈ cl(y) ; d’où l’inclusion cl(x) ⊂ cl(y) . Comme x et y jouent des rôles symétriques, on a aussi cl(y) ⊂ cl(x) .
Réciproquement, supposons cl(y) = cl(x) . Comme x ∈ cl(x) par définition, on a x ∈ cl(y) , c’est-à-dire x R y .
Proposition 8
Soit R une relation d’équivalence sur E .
Étant donné que, pour tout x ∈ E , on a x ∈ cl(x) , on en déduit qu’aucune classe d’équivalence n’est vide et que la réunion de toutes ces classes est égale à E . • Si A et B sont deux classes d’équivalence non disjointes, alors on peut trouver x ∈ E tel que x ∈ A et x ∈ B ; la proposition 7 de la page 50 nous donne alors A = cl(x) = B . Par contraposition, on a obtenu : A �= B =⇒ A ∩ B = ∅ . Par suite, les classes d’équivalence forment une partition de E .
•
53
Chapitre 2. Ensembles, applications et relations
S’entraîner et approfondir Ensembles 2.1 Soit E et F deux ensembles. 1. Montrer que F ⊂ E ⇐⇒ E ∩ F = F . 2. Montrer que F ⊂ E ⇐⇒ E ∪ F = E .
→34
2.2 Soit A et B deux parties d’un ensemble E . On pose A ∆ B = (A \ B) ∪ (B \ A) .
→35
Montrer que A ∆ B = (A ∪ B) \ (A ∩ B) .
2.3 Pour tout h ∈ IR∗+ , on pose Jh = ]−h, h[ . Prouver que :
→36
h∈IR∗ +
Jh = {0}
et
Jh = IR.
h∈IR∗ +
2.4 Décrire P(E) lorsque E = {1, 2, 3} .
→37
2.5 Décrire P P({1}) .
→37
2.6 Soit E et F deux ensembles. Montrer que : →37
E ⊂ F ⇐⇒ P(E) ⊂ P(F ).
2.7 Soit E et F deux ensembles. 1. Montrer que P(E ∩ F ) = P(E) ∩ P(F ) . 2. Montrer que P(E ∪ F ) ⊃ P(E) ∪ P(F ) .
3. Donner un exemple où P(E ∪ F ) �= P(E) ∪ P(F ) . 4. Prouver que : (F ⊂ E
ou
E ⊂ F ) ⇐⇒ P(E ∪ F ) = P(E) ∪ P(F ) .
Applications 2.8 Soit E un ensemble et (A, B) un couple de parties de E . On pose : →41
A∆B = (A ∪ B) \ (A ∩ B). 1. Déterminer la fonction indicatrice de A∆B en fonction de la somme et du produit de celles de A et B . 2. En déduire que A∆B = B ⇐⇒ A = ∅ .
2.9 Soit A une partie de E et f ∈ F E .
→42
1. Montrer l’inclusion f (E)\f (A) ⊂ f (A) . 2. Donner un exemple où l’inclusion précédente est stricte.
2.10 Soit f ∈ F E . →43
1. Soit A ∈ P(E) . Prouver que A ⊂ f −1 f (A) .
2. Soit B ∈ P(F ) . Prouver que f f −1 (B) ⊂ B puis que f f −1 (B) = f (E) ∩ B .
54
Exercices 2.11 Soit f ∈ F E et (Bi )i∈I une famille de parties de F , montrer que : →43
f −1
Bi
i∈I
=
i∈I
f −1 Bi
et
f −1
Bi
i∈I
=
f −1 Bi .
i∈I
2.12 Soit E un ensemble contenant au moins deux éléments. Construire deux applications f ∈ E E →43 et g ∈ E E telles que f ◦ g �= g ◦ f . Indication. Utiliser deux éléments distincts a et b de E . 2.13 Soit A ∈ P(E) et f : P(E) −→ P(E) →44 X �−→ X ∩ A. Montrer que l’application f est injective si, et seulement si, A = E . 2.14 Soit A ∈ P(E) et f : P(E) −→ P(E) →44 X �−→ X ∩ A. Montrer que l’application f est surjective si, et seulement si, A = E . 2.15 Soit f : →45
IR2 (x, y)
−→ �−→
IR2 (x + y, xy).
L’application f est-elle injective ? surjective ? 2.16 Étant donné f ∈ F(E, F ) et g ∈ F(F, G) , établir que : →46 1. si g ◦ f est injective alors f est injective, 2. si g ◦ f est surjective alors g est surjective. 2.17 Soit E , F et G trois ensembles, ainsi que f ∈ F(E, F ) et g ∈ F(F, G) .
1. Montrer que si g ◦ f est surjective et g injective, alors f est surjective. 2. Montrer que si g ◦ f est injective et f surjective, alors g est injective.
2.18 Peut-on trouver f : [−1, 1] −→ IR telle que ∀θ ∈ IR
cos θ = f (sin θ) ?
⋆ 2.19 Soit u ∈ F(E, F ) .
1. Montrer que u est injective si et seulement si : ∀X ⊂ E
2. Dans le même esprit, caractériser la surjectivité de u .
⋆ 2.20 Soit (A, B) ∈ P(E)2 . On considère l’application f : P(E) X
u−1 u(X) = X .
−→ �−→
P(A) × P(B) (X ∩ A , X ∩ B).
1. Montrer que f est injective si, et seulement si, A ∪ B = E . 2. Montrer que f est injective si, et seulement si, A ∩ B = ∅ . 3. Dans le cas où f est bijective, expliciter f −1 . 2.21 Soit u ∈ F(E, F ) et (A, B) ∈ P(F )2 . Montrer que :
u−1 (A △ B) = u−1 (A) △ u−1 (B).
Rappel : A △ B = (A ∩ B) ∪ (A ∩ B) où A = F \ A et B = F \ B .
55
Chapitre 2. Ensembles, applications et relations ⋆ 2.22 Soit u ∈ F(E, F ). Montrer que u est injective si, et seulement si : ∀(A, B) ∈ P(E)2
u(A ∩ B) = u(A) ∩ u(B).
Relations binaires 2.23 Soit f ∈ F E . Montrer que la relation R définie sur E par : →49
x R y ⇐⇒ f (x) = f (y),
est une relation d’équivalence et que, pour tout x ∈ E , on a cl(x) = f −1 {f (x)} . 2.24 Soit U une partition de E . Montrer que la relation R définie sur E par :
→50
x R y ⇐⇒ ∃A ∈ U
x∈A
et
y∈A
est une relation d’équivalence dont les classes sont les éléments de U . 2.25 Sur ZZ , la relation de divisibilité définie par : →50
est-elle une relation d’ordre ?
x | y ⇐⇒ ∃k ∈ ZZ
y = kx
2.26 1. Montrer que la relation définie sur IR2 par :
→51
(a, b) (a′ , b′ ) ⇐⇒ a < a′
ou
(a = a′
et
b b′ )
est une relation d’ordre (appelée ordre lexicographique). 2. Cet ordre est-il total ou partiel ?
2.27 Montrer que sur IR2 , la relation (a, c) (b, d) ⇐⇒ (a b et c d) définit un ordre partiel. →51
2.28 Sur IR , on considère la relation R définie par :
x R y ⇐⇒ x3 − y 3 = 3 (x − y).
1. Montrer que R est une relation d’équivalence. 2. Pour a ∈ IR , déterminer le nombre d’éléments de la classe de a .
56
Solutions des exercices
Solutions des exercices 2.1 1. Si F ⊂ E , alors on Réciproquement, si 2. Si F ⊂ E , alors on Réciproquement, si
a évidemment E ∩ F = F . E ∩ F = F , alors, comme E ∩ F ⊂ E , on a F ⊂ E . a évidemment E ∪ F = E . E ∪ F = E , alors, comme F ⊂ E ∪ F , on a F ⊂ E .
2.2 On peut commencer par se convaincre du résultat sur le dessin ci-dessous dans lequel on a grisé la partie A∆B . • Montrons que A ∆ B ⊂ (A ∪ B) \ (A ∩ B) . A Soit x ∈ A ∆ B = (A\B)∪(B \A) . Par symétrie des rôles joués par A et B , il suffit de traiter le cas où x ∈ (A \ B) . Alors, d’une part, x ∈ A donc x ∈ A ∪ B , et d’autre part, x ∈ / B donc x �∈ A ∩ B ; on en déduit x ∈ (A ∪ B) \ (A ∩ B) . B Cela prouve l’inclusion souhaitée. • Montrons que (A ∪ B) \ (A ∩ B) ⊂ A ∆ B . Soit x ∈ (A ∪ B) \ (A ∩ B) . Alors x �∈ A ∩ B , c’est-à-dire x ∈ / A ou x ∈ / B . Par symétrie, on peut se contenter de traiter le premier cas x �∈ A . Comme x ∈ A ∪ B , on a alors x ∈ B ; cela entraîne x ∈ (B \ A) puis x ∈ A ∆ B . Cela prouve l’inclusion annoncée. Remarque On aurait aussi pu prouver directement l’égalité souhaitée en utilisant les propriétés de la réunion et de l’inclusion. Détaillons-le. Par définition, on a : A ∆ B = (A ∩ B) ∪ (B ∩ A)
puis :
A ∆ B = A ∪ (B ∩ A) ∩ B ∪ (B ∩ A)
= (A ∪ B) ∩ (A ∪ A) ∩ (B ∪ B) ∩ (B ∪ A). Comme A ∪ A = B ∪ B = E , on en déduit :
A ∆ B = (A ∪ B) ∩ (B ∪ A).
L’égalité B ∪ A = B ∩ A donne enfin :
A ∆ B = (A ∪ B) ∩ B ∩ A = (A ∪ B) \ (A ∩ B).
2.3 • Montrons que ∗ 0∈
h∈IR∗ +
h∈IR∗ +
Jh = {0} . Raisonnons par disjonction de cas.
Jh puisqu’il est évident que ∀h ∈ IR∗+
∗ Si x ∈ IR∗ , alors x ∈ / / J |x| et donc x ∈ 2
On en déduit que • Montrons
h∈IR∗ +
Jh = {0} .
0 ∈ Jh .
Jh .
h∈IR∗ +
Jh = IR .
h∈IR∗ +
∗ Il est évident que
h∈IR∗ +
Jh ⊂ IR .
∗ De plus, si x ∈ IR , alors x ∈ J|x|+1 et donc x ∈
Jh .
h∈IR∗ +
57
Chapitre 2. Ensembles, applications et relations 2.4 En classant les parties selon leur nombre d’éléments, on obtient :
P(E) = ∅, {1} , {2} , {3} , {1, 2} , {1, 3} , {2, 3} , {1, 2, 3} .
2.5 On a P({1}) = ∅, {1}
puis P P({1}) =
∅, {∅}, {1} , ∅, {1}
.
2.6 • Supposons E ⊂ F et montrons que P(E) ⊂ P(F ) .
Soit A ∈ P(E) . On a alors A ⊂ E et E ⊂ F donc A ⊂ F , d’où l’on déduit A ∈ P(F ) .
Ainsi, P(E) ⊂ P(F ) .
• Supposons P(E) ⊂ P(F ) . Comme E ∈ P(E) , on a alors E ∈ P(F ) c’est-à-dire E ⊂ F . 2.7 1. On a, pour tout ensemble A : A ∈ P(E ∩ F ) ⇐⇒ A ⊂ E ∩ F ⇐⇒ A ⊂ E
et
A⊂F
⇐⇒ A ∈ P(E) ∩ P(F ). 2. Soit A ∈ P(E) ∪ P(F ) . Montrons que A ∈ P(E ∪ F ) par disjonction de cas : • si A ∈ P(E) , alors A ⊂ E , donc A ⊂ E ∪ F ; • si A ∈ P(F ) , alors A ⊂ F , donc A ⊂ E ∪ F .
3. Si l’on prend E = IR− et F = IR+ , alors : [−1, 1] ∈ P(E ∪ F )
mais
[−1, 1] �∈ P(E) ∪ P(F ).
4. • Supposons F ⊂ E . On a d’une part E = E ∪ F , donc P(E) = P(E ∪ F ) . D’autre part, P(F ) ⊂ P(E) donc P(E) ∪ P(F ) = P(E) = P(E ∪ F ) . De même, si E ⊂ F , alors P(E ∪ F ) = P(E) ∪ P(F ) . • Pour montrer l’autre implication, raisonnons par contraposition. Supposons F �⊂ E et E �⊂ F . Il existe alors e ∈ E \ F et f ∈ F \ E , et en posant A = {e, f } , on a : A ∈ P(E ∪ F )
et
A �∈ P(E) ∪ P(F ),
ce qui montre que P(E ∪ F ) �= P(E) ∪ P(F ) . 2.8 1. On a :
1A∆B = 1(A∪B)∩(A∩B) = 1A∪B 1A∩B = (1A + 1B − 1A 1B )(1 − 1A 1B )
= 1A + 1B − 1A 1B − 1A 1B − 1A 1B + 1A 1B .
Donc 1A∆B = 1A + 1B − 21A 1B . 2. • Si A = ∅ , on a facilement A∆B = B . • Réciproquement, supposons A∆B = B . On a alors 1A∆B = 1B , donc d’après la question précédente : 1A + 1B − 21A 1B = 1B
puis
1A × (1 − 21B ) = 0.
Soit x ∈ E . De ce qui précède, on a 1A (x) × (1 − 21B (x)) = 0 . Or, on a 21B (x) ∈ {0, 2} , donc 1 − 21B (x) �= 0 . On en déduit que 1A (x) = 0 . Cela étant vrai pour tout x ∈ E , on peut conclure que A = ∅ .
58
Solutions des exercices 2.9 1. Soit y ∈ f (E)\f (A) . Comme y ∈ f (E) , il existe x ∈ E tel que y = f (x) . Comme y �∈ f (A) , on a x �∈ A ; on en déduit que x ∈ A puis y ∈ f (A) .
2. Considérons la fonction f : IR x
−→ �−→
et A = IR+ . On a alors f (A) = IR+ = f (IR) ,
IR x2
donc f (IR) \ f (A) = ∅ . Pourtant, on a A = IR∗− , donc f (A) = IR∗+ �= ∅ .
2.10 1. Soit x ∈ A . On a f (x) ∈ f (A) , c’est-à-dire x ∈ f −1 f (A) . Ainsi, A ⊂ f −1 f (A) .
2. • Prouvons que f f −1 (B) ⊂ B . Soit y ∈ f f −1 (B) . Il existe alors x ∈ f −1 (B) tel que y = f (x) . Par définition de f −1 (B) , on a f (x) ∈ B donc y ∈ B . Cela prouve l’inclusion souhaitée. • Prouvons que f f −1 (B) = f (E) ∩ B . Procédons par double inclusion.
∗ Comme f −1 (B) ⊂ E , on a f f −1 (B) ⊂ f (E) . Grâce à l’inclusion déjà obtenue,
on en déduit l’inclusion f f −1 (B) ⊂ f (E) ∩ B . ∗ Réciproquement, soit y ∈ f (E) ∩ B . Il existe alors x ∈ E tel que y = f (x) . Comme f (x) = y ∈ B , on a x ∈ f −1 (B) , donc y = f (x) ∈ f f −1 (B) .
On en déduit la seconde inclusion f f −1 (B) ⊃ f (E) ∩ B .
2.11 Les égalités souhaitées sont justifiées par les chaînes d’équivalences suivantes, valables pour tout x ∈ E : x∈f
−1
Bi
i∈I
⇐⇒ f (x) ∈
i∈I
Bi ⇐⇒ ∃i ∈ I ⇐⇒ ∃i ∈ I
et x∈f
−1
i∈I
Bi
⇐⇒ f (x) ∈
i∈I
Bi ⇐⇒ ∀i ∈ I ⇐⇒ ∀i ∈ I
f (x) ∈ Bi x ∈ f −1 (Bi ) ⇐⇒ x ∈
i∈I
f −1 Bi .
f (x) ∈ Bi x ∈ f −1 (Bi ) ⇐⇒ x ∈
i∈I
f −1 Bi .
2.12 Considérons les applications f et g de E vers E , définies par : ∀x ∈ E
f (x) = a
et
∀x ∈ E
g(x) = b.
On a (g ◦ f )(a) = b et (f ◦ g)(a) = a , ce qui prouve g ◦ f �= f ◦ g . 2.13 • Si A = E , alors f est l’identité de P(E) ; elle est donc injective.
• Si A � E , alors on a f (A) = A = f (E) , donc f n’est pas injective.
2.14 • Si A = E , alors f est l’identité de P(E) ; elle est donc surjective.
• Si A � E , alors, pour tout X ∈ P(E) , on a f (X) = X ∩ A ⊂ A � E ; ainsi E n’a pas d’antécédent par f , d’où la non surjectivité de f .
59
Chapitre 2. Ensembles, applications et relations 2.15 • L’application f n’est pas injective car f (1, 2) = f (2, 1) alors que (1, 2) �= (2, 1) .
• L’application f n’est pas surjective car le couple (0, 1) n’a pas d’antécédent. En effet, si (x, y) ∈ IR2 vérifie (x + y, xy) = (0, 1) , alors on a y = −x , donc xy = −x2 , puis x2 = −1 , ce qui n’est pas possible.
2.16 1. Supposons g ◦ f injective et montrons que f est injective. Soit x et x′ deux éléments de E tels que f (x) = f (x′ ) . En appliquant g , on en dé duit g f (x) = g f (x′ ) et donc (g ◦ f )(x) = (g ◦ f )(x′ ) . Comme g ◦ f est injective, cela entraîne x = x′ , ce qui prouve que f est injective. 2. Supposons g ◦ f surjective et montrons que g est surjective. Soit z ∈ G . Comme g ◦ f est surjective, il existe x ∈ E tel que z = (g ◦ f )(x) . En posant y = f (x) , on a alors z = g(y) et y ∈ F , ce qui prouve que g est surjective.
2.17 1. Supposons g ◦ f surjective et g injective et prouvons la surjectivité de f .
Soit y ∈ F . Comme g(y) ∈ G , par surjectivité de g ◦ f , il existe x ∈ E tel que g ◦ f (x) = g(y) . On a alors : g(y) = (g ◦ f ) (x) = g (f (x)) .
Comme g est injective, on en déduit que y = f (x). Cela prouve que f est surjective. 2. Supposons g ◦ f injective et f surjective et prouvons l’injectivité de g .
Soit (y1 , y2 ) ∈ F 2 tels que g(y1 ) = g(y2 ) . Comme f est surjective, on peut trouver x1 ∈ E et x2 ∈ E tels que y1 = f (x1 ) et y2 = f (x2 ) . Comme g(y1 ) = g(y2 ) , on a (g ◦ f ) (x1 ) = (g ◦ f ) (x2 ) , ce qui, par injectivité de g ◦ f , entraîne x1 = x2 . Cela prouve que g est injective.
2.18 La réponse est non. Montrons-le par l’absurde. Si une telle fonction f existait, alors : • en remplaçant θ par 0 , on devrait avoir f (0) = 1 ,
• en remplaçant θ par π , on devrait avoir f (0) = −1 ,
ce qui est contradictoire.
2.19 1. • Supposons u injective, et montrons : ∀X ⊂ E
−1
u−1 u(X) = X . Soit X ⊂ E .
u(X) est vraie en toute généralité (cf. exercice 2.10 de la ∗ L’inclusion X ⊂ u page 54). ∗ Montrons l’autre inclusion. Soit x ∈ u−1 u(X) . Montrons que x ∈ X .
On a alors u(x) ∈ u(X) , donc il existe x′ ∈ X tel que u(x) = u(x′ ) . Comme u est injective, on en déduit x = x′ , ce qui prouve x ∈ X . • Réciproquement, supposons que : ∀X ⊂ E u−1 u(X) = X , et montrons que u est injective. Soit x et y deux éléments de E tels que u(x) = u(y) . Montrons que x = y . Posons X = {x} . L’égalité u(x) = u(y) nous dit que y ∈ u−1 u(X) . Or, par hypothèse, on a : u−1 u(X) = X = {x}. On en déduit y = x , ce qui prouve l’injectivité de u .
60
Solutions des exercices 2. Montrons que u est surjective si, et seulement si : ∀Y ⊂ F
u u−1 (Y ) = Y . Soit Y ⊂ F .
• Supposons u surjective, et montrons que : ∀Y ⊂ F
u u−1 (Y ) = Y .
L’inclusion u u−1 (Y ) ⊂ Y étant vraie en toute généralité (cf. exercice 2.10 de la page 54), il s’agit de montrer l’inclusion réciproque. Soit y ∈ Y . Montrons que y ∈ u u−1 (Y ) . Comme u est surjective, on peut trouver x ∈ E tel que y = u(x) . On a alors u(x) ∈ Y , autrement dit x ∈ u−1 (Y ) , ce qui donne bien :
y = u(x) ∈ u u−1 (Y ) .
• Réciproquement, supposons que : ∀Y ⊂ F
u u−1 (Y ) = Y , et montrons que u est
surjective. En appliquant la propriété supposée avec Y = F , on a u u−1 (F ) = F . Cela assure que tout élément de F possède au moins un antécédent par u , autrement que u est surjective.
2.20 1. Montrons que f est injective si, et seulement si, A ∪ B = E . • Supposons f injective. Comme on a f (A ∪ B) = (A, B) = f (E) , on en déduit A ∪ B = E . • Réciproquement, supposons A ∪ B = E et montrons que f est injective. Soit (X1 , X2 ) ∈ P(E)2 tel que f (X1 ) = f (X2 ) i.e. : X1 ∩ A = X2 ∩ A
et
On a alors X1 = X1 ∩ E = X1 ∩ (A ∪ B)
X1 ∩ B = X2 ∩ B.
= (X1 ∩ A) ∪ (X1 ∩ B) = (X2 ∩ A) ∪ (X2 ∩ B) = X2 ,
ce qui prouve l’injectivité de f . 2. Montrons que f est surjective si, et seulement si, A ∩ B = ∅ . • Supposons f surjective. On peut donc trouver une partie X ⊂ E telle que :
(∅, A ∩ B) = f (X) = (X ∩ A, X ∩ B).
On en déduit ∅ = X ∩ A ainsi que A ∩ B = X ∩ B et donc :
∅ = (X ∩ A) ∩ B = (X ∩ B) ∩ A = (A ∩ B) ∩ A = A ∩ B,
ce qui prouve l’égalité A ∩ B = ∅ . • Réciproquement, supposons A ∩ B = ∅ et montrons que f est surjective. Soit donc (Y1 , Y2 ) ∈ P(A) × P(B) . Posons X = Y1 ∪ Y2 , alors : X ∩ A = (Y1 ∪ Y2 ) ∩ A = (Y1 ∩ A) ∪ (Y2 ∩ A).
∗ Comme Y1 ⊂ A , on a Y1 ∩ A = Y1 . ∗ Comme Y2 ⊂ B et A ∩ B = ∅ , on a Y2 ∩ A = ∅ . On en déduit X ∩ A = Y1 . On prouve de même X ∩ B = Y2 . On en déduit (Y1 , Y2 ) = f (X) ce qui prouve la surjectivité de f .
3. Il résulte de l’étude précédente que f est bijective si, et seulement si, A = E \ B et dans ce cas, f −1 est l’application : P(A) × P(B) (Y1 , Y2 )
−→ �−→
P(E) Y1 ∪ Y2 .
61
Chapitre 2. Ensembles, applications et relations 2.21 Comme A △ B = (A ∩ B) ∪ (A ∩ B) , en utilisant les relations entre images réciproques, intersections et réunions (cf. exemple 24 de la page 43), on peut écrire :
u−1 (A △ B) = u−1 (A ∩ B) ∪ (A ∩ B)
= u−1 (A ∩ B) ∪ u−1 (A ∩ B)
= u−1 (A) ∩ u−1 (B) ∪ u−1 (A) ∩ u−1 (B)
= u−1 (A) ∩ u−1 (B) ∪ u−1 (A) ∩ u−1 (B) = u−1 (A) △ u−1 (B).
2.22 • Supposons u injective. Soit (A, B) ∈ P(E)2 . Montrons que u(A ∩ B) = u(A) ∩ u(B) . ∗ L’inclusion u(A ∩ B) ⊂ u(A) ∩ u(B) est vraie en toute généralité (cf. exemple 22 de la page 42). ∗ Montrons l’autre inclusion. Soit donc y ∈ u(A) ∩ u(B) . Montrons que y ∈ u(A ∩ B) . ⋆ Comme y ∈ u(A) , on peut trouver a ∈ A tel que y = u(a) . ⋆ Comme y ∈ u(B) , on peut trouver b ∈ B tel que y = u(b) . L’injectivité de u entraîne alors a = b et donc y ∈ u(A) ∩ u(B) . D’où le résultat. • Montrons l’implication réciproque par contraposition. Supposons u non injective. Alors on peut trouver deux éléments distincts dans E , a et b , tels que u(a) = u(b) . En posant alors A = {a} et B = {b} , on a A ∩ B = ∅ , donc u(A ∩ B) = ∅ , alors que u(A) ∩ u(B) = {u(a)} �= ∅ .
2.23 • Comme x R y équivaut à f (x) = f (y) , les propriétés de réflexivité, de symétrie et de transitivité de R découlent des propriétés correspondantes de l’égalité. • Soit x ∈ E . Pour y ∈ E , on a :
y ∈ cl(x) ⇐⇒ f (y) = f (x) ⇐⇒ f (y) ∈ {f (x)} ⇐⇒ y ∈ f −1 {f (x)} .
2.24 • Montrons que R est une relation d’équivalence. Réflexivité. Soit x ∈ E . Comme A = E , il existe A ∈ U tel que x ∈ A , ce qui A∈U entraîne x R x . Symétrie. C’est évident. Transitivité. Soit (x, y, z) ∈ E 3 tel que x R y et y R z . Par définition de R , on peut trouver A ∈ U et B ∈ U tels que d’une part x ∈ A et y ∈ A , et d’autre part y ∈ B et z ∈ B . Alors, A et B ayant y comme élément commun, on a A ∩ B �= ∅ puis A = B par définition d’une partition. On en déduit x R z . • Montrons que U est l’ensemble des classes d’équivalence de R . ∗ Soit A ∈ U . Montrons que A est une classe d’équivalence. Comme A est non vide, il existe x ∈ A . Montrons cl(x) = A . ⋆ Par définition de R , tout élément de A appartient à cl(x) et donc A ⊂ cl(x) . ⋆ Réciproquement, soit y ∈ cl(x) . Il existe donc B ∈ U tel que x ∈ B et y ∈ B .
Étant donné que x ∈ A ∩ B et que U est une partition de E , on a A = B et donc y ∈ A . On en déduit cl(x) ⊂ A . Par suite, on a cl(x) = A , ce qui prouve que tout élément de U est une classe d’équivalence. ∗ Réciproquement, considérons X une classe d’équivalence, et montrons que X ∈ U . Il existe x ∈ E tel que X = cl(x) . Comme U est une partition de E , il existe A ∈ U tel que x ∈ A . Les mêmes arguments que dans le point précédent entraînent cl(x) = A . Ainsi, toute classe d’équivalence est élément de U .
62
Solutions des exercices 2.25 La relation de divisibilité n’est pas une relation d’ordre sur ZZ , car elle n’est pas antisymétrique. En effet, on a −1 | 1 et 1 | −1 . 2.26 Pour une rédaction plus efficace, commençons par remarquer que : ∀(a, b) ∈ IR2
∀(a′ , b′ ) ∈ IR2
(a, b) (a′ , b′ ) =⇒ a a′ .
(∗)
1. Prouvons que l’ordre lexicographique est une relation d’ordre. Réflexivité. Pour tout (a, b) ∈ IR2 , on a (a = a et b b) et donc (a, b) (a, b) . Antisymétrie. Supposons (a, b) (a′ , b′ ) et (a′ , b′ ) (a, b) ; • d’après la relation (∗) , on a a a′ et a′ a , donc a = a′ ; • on en déduit b b′ et b′ b , et donc b = b′ ; par conséquent, on a (a, b) = (a′ , b′ ) , ce qui prouve l’antisymétrie. Transitivité. Supposons (a, b) (a′ , b′ ) et (a′ , b′ ) (a′′ , b′′ ) ; alors, d’après la relation (∗) , on a a a′ a′′ ; • si a < a′′ , alors immédiatement (a, b) (a′′ , b′′ ) ; • sinon, on a a = a′′ et donc a = a′ = a′′ ; mais on a alors b b′ et b′ b′′ , d’où b b′′ , et l’on déduit (a, b) (a′′ , b′′ ) ; d’où la transitivité. 2. Prouvons maintenant que l’ordre lexicographique est total. Soit (a, b) et (a′ , b′ ) deux éléments de IR2 . • Si a < a′ , alors (a, b) (a′ , b′ ) . • Si a′ < a , alors (a′ , b′ ) (a, b) . • Si a = a′ , alors : ∗ si b b′ , alors (a, b) (a′ , b′ ) ; ∗ sinon, alors b′ b et donc (a′ , b′ ) (a, b) .
Ainsi (a, b) et (a′ , b′ ) sont comparables, ce qui prouve que l’ordre est total. 2.27 • Il est facile de prouver que cette relation est réflexive, antisymétrique et transitive. C’est donc bien une relation d’ordre. • On n’a ni (1, 2) (2, 1) , ni (2, 1) (1, 2) . Ainsi, les éléments (1, 2) et (2, 1) ne sont pas comparables. Il s’agit donc d’un ordre partiel. 2.28 1.
Réflexivité. Pour tout x ∈ IR , on a x R x car x3 − x3 = 0 = 3(x − x) . Symétrie Pour (x, y) ∈ IR2 , on a : x R y ⇐⇒ x3 − y 3 = 3(x − y)
⇐⇒ y 3 − x3 = 3(y − x) ⇐⇒ y R y. Transitivité. Si x R y et y R z , alors on a x R z car :
x3 − z 3 = (x3 − y 3 ) + (y 3 − z 3 ) = 3(x − y) + 3(y − z) = 3(x − z).
Cela montre que R est une relation d’équivalence. 2. Notons cl(a) la classe de l’élément a . On a x R a si, et seulement si :
(x − a) x2 + a x + a2 − 3 = 0.
La classe de a contient donc, en plus de a , les solutions de l’équation : (E) : x2 + ax + a2 − 3 = 0.
63
Chapitre 2. Ensembles, applications et relations En notant ∆ le discriminant de cette équation (E) du second degré, on a : ∆ = a2 − 4(a2 − 3) = 3(4 − a2 ).
On distingue alors naturellement trois cas, selon le signe de ∆ . • Si |a| > 2 , l’équation (E) n’admet aucune solution réelle, et l’on obtient : cl(a) = {a}
• Si |a| = 2 , l’équation (E) possède
− a2
puis
card cl(a) = 1.
comme solution double et alors :
cl(a) =
a, −
a 2
;
comme a �= 0 , on a a �= − a2 et alors card cl(a) = 2 . • Si |a| < 2 , alors l’équation (E) possède deux solutions distinctes x1 et x2 ; le réel a est l’une de ces racines si, et seulement si, 3 a2 − 3 = 0 , i.e. a = ±1 ; on obtient alors : ∗ si |a| ∈ ]−2, 2[ \ {−1, 1} , alors card cl(a) = 3 ; ∗ si a = ±1 , alors card cl(a) = 2 .
64
(∗)
Chapitre 3 : Fonctions numériques de la variable réelle I
Inégalités dans IR . . . . . . . . . . . . . . . . . . . . Manipulations d’inégalités . . . . . . . . . . . . . . . Valeur absolue . . . . . . . . . . . . . . . . . . . . . Majorant, minorant . . . . . . . . . . . . . . . . . . Maximum, minimum . . . . . . . . . . . . . . . . . . II Fonctions réelles de la variable réelle . . . . . . . . . 1 Domaine de définition, graphe . . . . . . . . . . . . . 2 Fonctions paires, impaires, périodiques . . . . . . . . 3 Opérations sur les fonctions à valeurs réelles . . . . . 4 Monotonie . . . . . . . . . . . . . . . . . . . . . . . . 5 Cas des fonctions strictement monotones . . . . . . . 6 Fonctions majorées, minorées, bornées . . . . . . . . III Dérivation – Rappels du secondaire . . . . . . . . . 1 Nombre dérivé, fonction dérivée . . . . . . . . . . . . 2 Interprétations de la dérivée, premières applications 3 Opérations sur les fonctions dérivables . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . .
66 66 69 70 71 72 72 73 75 76 78 79 80 80 82 83
Fonctions de classe C 1 . . . . . . . . . . . . . . . . Dérivées successives . . . . . . . . . . . . . . . . . IV Variations d’une fonction sur un intervalle . . . . 1 Fonctions monotones / constantes sur un intervalle
. . . .
. . . .
. . . . . . .
85 85 86 86
2 Étude de variations . . 3 Fonctions réciproques Démonstrations . . . . . . . . . Exercices . . . . . . . . . . . . .
. . . .
. . . .
. . . . . .
88 90 93 95
1 2 3 4
4 5
. . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . . . . . . . .
Fonctions numériques de la variable réelle
I
3
Inégalités dans IR
Nous supposons connus l’ensemble IR des nombres réels, ses propriétés calculatoires élémentaires ainsi que sa relation d’ordre total dont il est naturellement muni. Soit a et x deux réels. • Quand on montre que x a, on dit que l’on majore x par a. • De même, quand on montre que x a, on dit que l’on minore x par a.
1
Manipulations d’inégalités
Les résultats de cette partie sont supposés connus. Somme Proposition 1 On peut ajouter terme à terme des inégalités de même sens.
Exo 3.1
Autrement dit, si x, y , z et t sont quatre réels, on a : x y et z t =⇒ x + z y + t.
Point méthode Pour majorer une somme, il est souvent utile de majorer séparément chaque terme. Il en est de même pour minorer une somme.
Remarque Une somme de termes positifs est positive. Ex. 1. Soit n ∈ IN∗ ; notons sn = 14 + · · · + n4 . Puisque tous les termes de la somme sont minorés par 1 , on a sn 1 + · · · + 1 = n . Puisque tous les termes de la somme sont majorés par n4 , on a sn n4 + · · · + n4 = n n4 = n5 .
I Inégalités dans IR Produit Proposition 2 • On peut multiplier terme à terme des inégalités de même sens entre des nombres positifs. • On peut multiplier une inégalité par un même nombre positif. Autrement dit : • si x, y , z et t sont quatre réels, on a : 0 x y et 0 z t =⇒ x z y t ; • si x, y et a sont trois réels, on a : x y et 0 a =⇒ a x a y.
En particulier : • le produit de deux réels positifs est positif ; • le produit de deux réels strictement positifs est positif et non nul, donc est strictement positif. Attention Multiplier une inégalité par un nombre négatif change son sens. C’est une conséquence de la règle des signes résumée dans le tableau : y0 y0
x0 xy 0 xy 0
x0 xy 0 xy 0
Point méthode Pour majorer un produit de termes positifs, il est souvent utile de majorer séparément chaque terme. Ex. 2. Soit x ∈ [0, 1] . En multipliant terme à terme l’inégalité 0 x 1 par elle-même, on
obtient 0 x2 1 . Par récurrence, on obtient plus généralement 0 xn 1 , pour n ∈ IN .
Point méthode Pour multiplier des inégalités, on se ramène à des nombres positifs. Ex. 3. Voyons ce que l’on peut déduire, en terme de produit, des inégalités 0 a b et d c 0 . • En multipliant d c 0 par −1 , on obtient 0 −c −d .
On peut alors multiplier les deux inégalités 0 a b et 0 −c −d , ce qui donne 0 −a c −b d et donc a c b d .
• En revanche, on ne peut pas comparer a d et b c : il est facile de trouver un exemple pour lequel a d > b c , et un pour lequel a d < b c .
67
Chapitre 3. Fonctions numériques de la variable réelle Quotient Si x et y sont des réels, alors 0 < x y =⇒ 0
0 et a2 +b2 0 , l’inégalité a+b 2a a
Ex. 4. Soit a et b deux réels strictement positifs tels que a b . Montrons
Obtention d’inégalités Point méthode Pour établir une inégalité, il est parfois utile de se ramener à l’étude du signe d’une expression et donc de chercher à la factoriser. Ex. 5. Soit a1 , a2 , b1 et b2 des réels tels que a1 a2 et b1 b2 . Montrons (a1 + a2 )(b1 + b2 ) 2(a1 b1 + a2 b2 ) . Puisque : (a1 + a2 )(b1 + b2 ) = a1 b1 + a1 b2 + a2 b1 + a2 b2 , il s’agit donc d’établir : a1 b2 + a2 b1 a1 b1 + a2 b2 , i.e. 0 a1 b1 + a2 b2 − a1 b2 − a2 b1 . Or : a1 b1 + a2 b2 − a1 b2 − a2 b1 = a1 (b1 − b2 ) + a2 (b2 − b1 ) = (a2 − a1 )(b2 − b1 ) 0.
0
L’inégalité recherchée est ainsi démontrée.
0
Lorsque l’on étudie le signe d’une expression, on peut résumer les résultats à l’aide d’un tableau de signes. Ce tableau est souvent facile à construire, utilisant la « règle des signes », si l’expression est déjà factorisée. Ex. 6. Déterminons le signe de 3 − x2 (x + 1) selon les valeurs de x ∈ IR .
√ √ On peut remarquer que (3 − x2 )(x + 1) = ( 3 + x)( 3 − x)(x + 1) . Cette expression est donc le produit de trois termes dont les signes sont simples à étudier. √ √ En notant e(x) = ( 3 + x)( 3 − x)(x + 1) : x √
3+x
x+1 √ 3−x e(x)
68
√ − 3
−∞ −
0
− + +
+ −
0
−
0
+
0
√
−1
3
+∞
+
+
+
+
+
0
+
0
− −
I Inégalités dans IR Cas d’égalité Soit a, b et c des réels tels que a b c. Alors, par transitivité a c. • Si c = a, alors a b et b c = a, donc a = b . • Par contraposition, si l’une des inégalités a b ou b c est stricte, alors a < c. Cela se généralise sans difficulté.
Point méthode Soit a1 , . . . , an des réels tels que a1 a2 · · · an−1 an . • Si a1 = an , alors a1 = · · · = an ;
• si l’une au moins de ces inégalités est stricte, alors a1 < an .
Ex. 7. Soit n 1 et a1 , . . . , an des réels positifs. Si l’un d’entre eux est strictement positif, alors a1 + · · · + an > 0 . En effet, on a : 0 a1 a1 + a2 · · · a1 + · · · + an , donc si l’un des ai est strictement positif, alors l’une des inégalités ci-dessus est stricte, donc 0 < a1 + · · · + an .
Point méthode Si une somme de termes positifs est nulle, alors tous les termes sont nuls.
Exo 3.2
2
Valeur absolue
Notation Le plus grand de deux réels a et b est noté max(a, b) et le plus petit min(a, b). Définition 1 On définit la valeur absolue d’un réel x par |x| =
x si x 0, −x si x 0.
Remarques • Cette définition est cohérente car, si x 0 et x 0 , alors x = 0 = −x.
• Pour tout x ∈ IR, on a |x| 0 . De plus, |x| = 0 si, et seulement si, x = 0 .
• Pour tout x réel, on a −|x| x |x|. • Pour tout x réel, on a |x| = max(−x, x). • Le point précédent donne que pour tout x réel on a |±x| = |x|. √ x2 . En effet, x2 est l’unique réel positif dont le carré est x2 , donc il est égal à |x| puisque |x| 0 et |x|2 = (±x)2 = x2 .
Ex. 8. Pour tout x réel, on a |x| =
√
69
Chapitre 3. Fonctions numériques de la variable réelle Proposition 3 Pour tout (x, y) ∈ IR2 , on a |xy| = |x| |y|. Démonstration.
On a x = ±|x| et y = ±|y| , donc x y = ±|x| |y| , ce qui donne |x y| = |x| |y| . Comme |x| |y| est positif, il est égal à sa valeur absolue, d’où le résultat.
Définition 2 La distance entre deux réels est la valeur absolue de leur différence.
|y − x| x
y
Proposition 4 Soit h ∈ IR+ et x ∈ IR. On a |x| h si, et seulement si, −h x h. Démonstration page 93
Corollaire 5 Pour tout a ∈ IR, x ∈ IR et h ∈ IR+ , on a : |x − a| h ⇐⇒ a − h x a + h.
a−h
a
x
a+h
Proposition 6 (Inégalités triangulaires) Si x et y sont deux réels quelconques, alors on a : |x| − |y| |x + y|. |x + y| |x| + |y| et
Démonstration page 93
Principe de démonstration.
• Pour la première, partir de −|x| x |x| et de −|y| y |y| .
• Pour la seconde, commencer par montrer |x| |x + y| + |y| en écrivant x = (x + y) − y et en appliquant le point précédent.
Remarque Puisque |−y| = |y|, il vient de la proposition précédente : |x| − |y| |x ± y| |x| + |y|.
3
Majorant, minorant
Définition 3 Soit A une partie de IR. • Un réel M est un majorant de A si ∀x ∈ A x M .
• Un réel m est un minorant de A si ∀x ∈ A x m.
Remarques • Si M est un majorant de A, alors tout réel M ′ M en est également un. Si m est un minorant de A, alors tout réel m′ m en est également un. • Le sous-ensemble vide de IR est majoré et minoré par tout réel. Rappelons en effet que toute assertion de la forme « ∀x ∈ ∅ . . . » est vraie. 70
I Inégalités dans IR Définition 4 Soit A une partie de IR. On dit que A est : • majorée si A admet un majorant ;
• minorée si A admet un minorant ;
• bornée si A est majorée et minorée. Remarque Tout sous-ensemble d’une partie de IR majorée (respectivement minorée, bornée) est majoré (respectivement minoré, borné).
Ex. 9. L’ensemble IR n’est ni majoré, ni minoré. En effet, si M était un majorant de IR , on aurait M + 1 M car M + 1 ∈ IR , ce qui est absurde. De même, IR n’est pas minoré.
Ex. 10. Le sous-ensemble n1 | n ∈ IN∗ de IR est une partie bornée. En effet, 1 en est un majorant et 0 un minorant. Ex. 11. Si A et B sont deux parties majorées, alors A ∪ B est majorée. En effet, en notant MA et MB un majorant de A et B respectivement, alors max{MA , MB } est un majorant de A et B , donc de A ∪ B .
Proposition 7 Une partie A de IR est bornée si, et seulement si, ∃R ∈ IR+
∀x ∈ A |x| R . Démonstration page 93
Traduction En d’autres termes, une partie A de IR est bornée si, et seulement s’il existe R ∈ IR+ tel que A ⊂ [−R, R].
4
Maximum, minimum
Les notions de plus grand élément et de plus petit élément d’une partie ont déjà été vues dans le cas général d’un ensemble ordonné (cf. page 51). Ces définitions s’appliquent en particulier à IR muni de son ordre usuel. Terminologie Dans le cas d’une partie A de IR, et en cas d’existence : • le plus grand élément de A est appelé maximum de A et noté max A ; • le plus petit élément de A est appelé minimum de A et noté min A.
Remarque S’il existe, le maximum de A est donc l’unique élément de A qui majore A.
Ex. 12. Si A = [a, b] , avec a < b , alors min A = a et max A = b . Ex. 13. La partie A = ]0, 1] admet un maximum, qui est 1 . En revanche, A est minorée par 0 , mais n’a pas de minimum puisque, pour tout x ∈ A , le x appartient à A et est strictement inférieur à x . réel 2
71
Chapitre 3. Fonctions numériques de la variable réelle
Attention Une partie minorée n’admet pas nécessairement de minimum, comme le montre l’exemple précédent. De même, une partie majorée n’admet pas nécessairement de maximum. Ex. 14. Si (a, b) ∈ IR2 , alors max(a, b) =
a + b − |b − a| a + b + |b − a| et min(a, b) = · 2 2
Ces relations, immédiates par disjonction de cas, sont illustrées par le dessin ci-dessous (dans le cas a < b ), qui permet de les retrouver facilement.
a+b 2
a
|b−a| 2
b
|b−a| 2
Ex. 15. Soit A et B deux parties de IR admettant chacune un plus grand élément. Il est alors clair que A ∪ B admet un plus grand élément et que max (A ∪ B) = max(max A, max B) . Ex. 16. Montrons que toute partie finie non vide de IR admet un maximum. Montrons par récurrence que, pour tout n ∈ IN∗ , on a Hn : « toute partie de IR ayant n éléments admet un maximum ». • H1 est vraie car il est clair qu’un singleton admet un maximum, qui est son unique élément. • Soit n ∈ IN∗ . Supposons Hn . Soit A = {a0 , . . . , an } un ensemble de n + 1 réels distincts. On peut alors écrire A = {a0 } ∪ a1 , . . . , an .
=B
L’ensemble B étant une partie de IR ayant n éléments, l’hypothèse de récurrence assure que B admet un maximum. Ainsi, d’après l’exemple précédent, A admet un maximum et :
max A = max a0 , max B .
II
Fonctions réelles de la variable réelle
Dans toute cette partie, X désigne une partie non vide de IR. Une application f : X → IR est une fonction réelle de la variable réelle, ou encore une fonction numérique. On rappelle que l’on note F (X, IR) ou IRX l’ensemble des fonctions de X dans IR.
1
Domaine de définition, graphe
Ensembles de départ, d’arrivée, domaine de définition d’une fonction Comme nous l’avons vu au chapitre 2, lorsque l’on définit une application, on doit préciser l’ensemble de départ et l’ensemble d’arrivée. Il arrive cependant que l’on cherche à définir une fonction à l’aide d’une expression f (x) qui dépend de la variable réelle x. Il faut alors impérativement donner le domaine de définition de f , c’est-à-dire l’ensemble des x ∈ IR pour lesquels f (x) a une valeur. Par ailleurs, une fonction f : X → Y , où X et Y sont des parties de IR, est encore considérée comme une fonction numérique. 72
II Fonctions réelles de la variable réelle Graphe d’une fonction de la variable réelle Le graphe d’une fonction f : X → IR est le sous-ensemble de IR2 suivant : Γf = x, f (x) | x ∈ X .
Le plan étant muni d’un repère orthonormé O,�ı, � , la courbe représentative de f est l’ensemble des points du plan de coordonnées x, f (x) dans ce repère. On parle également de la courbe d’équation y = f (x).
2
Fonctions paires, impaires, périodiques
Fonctions paires, impaires Notation Lorsque A est une partie de IR, on note −A = {−x | x ∈ A} . On dit que A est symétrique par rapport à 0 si −A = A. Définition 5 Soit f : X → IR où X est symétrique par rapport à 0 . • La fonction f est paire si :
∀x ∈ X
• La fonction f est impaire si :
f (−x) = f (x).
∀x ∈ X
f (−x) = −f (x).
Interprétation graphique de la parité / imparité • Si f : X → IR est une fonction paire, alors le graphe de f est symétrique par rapport à l’axe des ordonnées. Par conséquent, le graphe de la restriction de f à X ∩ IR− se déduit, par symétrie par rapport à l’axe des ordonnées, du graphe de la restriction de f à X ∩ IR+ (en gras sur le dessin ci-contre). • Si f : X → IR est une fonction impaire, alors le graphe de f est symétrique par rapport à l’origine. Par conséquent, le graphe de la restriction de f à X ∩ IR− se déduit, par symétrie par rapport à l’origine, du graphe de la restriction de f à X ∩ IR+ (en gras sur le dessin ci-contre).
y Γ
x
O
Graphe d’une fonction paire y
O
x Γ
Graphe d’une fonction impaire
Point méthode Si f : X → IR est paire ou impaire, alors on peut restreindre son étude à X ∩ IR+ . 73
Chapitre 3. Fonctions numériques de la variable réelle Fonction périodique Définition 6 Soit f : X → IR une fonction. Un réel T > 0 est une période de f si : ∀x ∈ IR x + T ∈ X ⇐⇒ x ∈ X et ∀x ∈ X f (x + T ) = f (x) . On dit que f est périodique s’il existe T > 0 qui soit une période de f .
Terminologie
Si T > 0 est une période de f , on dit que f est T -périodique.
Remarques • Plus simplement, lorsque X = IR, la fonction f : IR → IR est T -périodique si, et seulement si : ∀x ∈ IR f (x + T ) = f (x). • Si T est une période de f , alors k T est une période de f , pour tout k ∈ IN∗ .
Ex. 17. Les fonctions sin et cos sont périodiques, et 2π est l’une de leurs périodes. Ex. 18. La fonction cotan =
cos sin
est définie sur IR \ πZZ et π -périodique.
Ex. 19. Pour tout x ∈ IR , on note {x} = x − ⌊x⌋ la partie fractionnaire de x . Montrons que la fonction f définie sur IR par f (x) = {x} est 1 -périodique. Soit x ∈ IR . On a par définition ⌊x⌋ x < ⌊x⌋ + 1 , donc :
⌊x⌋ + 1 x + 1 < ⌊x⌋ + 2 ; Comme ⌊x⌋ + 1 est un entier, l’encadrement précédent assure que ⌊x + 1⌋ = ⌊x⌋ + 1 . Par suite : f (x + 1) = (x + 1) − ⌊x + 1⌋ = (x + 1) − (⌊x⌋ + 1) = x − ⌊x⌋ = f (x), d’où le caractère 1 -périodique de f . y
Interprétation graphique de la périodicité Soit f : X → IR une fonction T -périodique. Son graphe se déduit de celui de sa restriction à X ∩ [0, T ] par des translations successives de vecteur T �ı et des translations successives de vecteur −T �ı .
T �ı
O
T
2T x
Remarque On peut remplacer X ∩ [0, T ] par X ∩ [a, a + T ], avec a ∈ IR. Point méthode Si f : X → IR est T -périodique, on peut restreindre son domaine d’étude à X ∩ [a, a + T ], avec a ∈ IR. Dans la pratique, on restreint souvent le domaine d’étude à X ∩ [0, T ] ou X ∩ [−T /2, T /2], le second choix étant privilégié si l’on dispose de plus d’une propriété de parité.
74
II Fonctions réelles de la variable réelle
3
Opérations sur les fonctions à valeurs réelles
• Pour (f, g) ∈ F(X, IR)2 et λ ∈ IR, les fonctions λf , f + g et f g sont définies par : ∀x ∈ X
(λf )(x) = λf (x),
(f + g)(x) = f (x) + g(x)
et (f g)(x) = f (x)g(x).
• La relation d’ordre sur IR permet de définir sur F (X, IR) une relation d’ordre sur F (X, IR) : pour (f, g) ∈ F (X, IR)2 , on dit que f g si : ∀x ∈ X
f (x) g(x).
• On désigne par |f | la fonction définie sur X par : ∀x ∈ X Exo 3.6
Ex. 20. La somme et le produit de deux fonctions paires sont paires.
|f |(x) = f (x).
Attention La relation d’ordre définie sur F (X, IR) n’est pas totale, c’est-à-dire qu’étant donné deux fonctions f et g de F (X, IR), il se peut que ni f g , ni g f ne soient vérifiées. Ex. 21. La fonction définie sur IR par f (x) = x (l’identité) et g = −f ne sont pas comparables, ce qui se voit sur un dessin. Pour le justifier, on peut remarquer que : f (−1) = −1 < 1 = g(−1)
et
f (1) = 1 > −1 = g(1).
Attention Si f ∈ F(X, IR), on n’utilisera pas la notation « f > 0 ». Celle-ci est en effet ambiguë, car peut être interprétée de deux façons très différentes : ou bien (f 0 et f �= 0), ou bien ∀x ∈ X f (x) > 0 . Définition 7 Soit n ∈ IN∗ , ainsi que f1 , . . . , fn des fonctions de X dans IR et (λ1 , . . . , λn ) ∈ IRn . • La fonction λ1 f1 + · · · + λn fn est une combinaison linéaire des f1 , . . . , fn .
• Une combinaison linéaire de fonctions x �→ xk , avec k ∈ IN, est une fonction polynomiale. Ex. 22. La fonction définie par f (x) = 1 + x + · · · + x8 est une fonction polynomiale sur IR .
Sa restriction à X = IR \ {1} est la fonction x �→
1−x9 1−x
qui est donc également polynomiale
(malgré les apparences).
Définition 8 (Composition des fonctions) Soit f : X → IR et g : Y → IR telle que f (X) ⊂ Y .
La fonction X −→ IR est appelée fonction composée de f et g ou x �−→ g f (x) plus simplement composée de f et g et se note g ◦ f . 75
Chapitre 3. Fonctions numériques de la variable réelle
Attention Prendre garde que pour pouvoir considérer la composée g ◦ f , il est nécessaire d’avoir f (X) ⊂ Y . Ex. 23. Considérons f : IR
−→ �−→
x
IR 1 − x2
et g : IR+ t
−→ �−→
IR √
t.
On ne peut parler de la fonction g ◦ f , car f (IR) = ]−∞, 1] n’est pas inclus dans le domaine de définition de g . Mais puisque 1 − x2 0 si, et seulement si, x ∈ [−1, 1] , le domaine de définition de la fonction x �→ g f (x) est [−1, 1] .
4
Monotonie
Définition 9 Une fonction f : X → IR est :
• croissante si : ∀(x, y) ∈ X 2
x y =⇒ f (x) f (y) ;
• strictement croissante si : ∀(x, y) ∈ X 2
• décroissante si : ∀(x, y) ∈ X
2
x < y =⇒ f (x) < f (y) ;
x y =⇒ f (x) f (y) ;
• strictement décroissante si : ∀(x, y) ∈ X 2
x < y =⇒ f (x) > f (y).
Terminologie La fonction f est dite monotone si elle est croissante ou décroissante, et strictement monotone si elle est strictement croissante ou strictement décroissante. Remarque La fonction f est (strictement) décroissante si, et seulement si, −f est (strictement) croissante.
Ex. 24. La fonction
X x
IR x
−→ �−→
est strictement croissante.
Ex. 25. Une fonction est constante si, et seulement si, elle est croissante et décroissante. Ex. 26. La restriction à IR+ de la fonction x �→ x2 est strictement croissante sur IR+ et sa restriction à IR− est strictement décroissante. Par simplification de langage, on dit souvent : « la fonction x �→ x2 est strictement croissante sur IR+ et strictement décroissante sur IR− ». Ex. 27. • Les fonctions
IR∗+ x
−→ �−→
• En revanche, f : IR∗ x
76
et
IR
−→ �−→
1 x
IR 1 x
IR∗− x
−→ �−→
IR
sont strictement décroissantes.
1 x
n’est pas décroissante, car f (−1) = −1 < 1 = f (1) .
II Fonctions réelles de la variable réelle Propriétés immédiates Lorsque f et g sont deux fonctions croissantes définies sur X , on vérifie sans difficulté les propriétés ci-dessous. • La fonction f + g est croissante. • Si f est strictement croissante, alors f + g est strictement croissante.
Exo 3.7
• Si f et g sont positives, alors la fonction f g est croissante.
• En particulier, si λ ∈ IR+ , alors λ f est croissante. On adapte ces résultats sans difficulté au cas des fonctions décroissantes. Remarques • Pour montrer que f n’est pas croissante, il suffit d’exhiber un élément x ∈ X et un élément y ∈ X tels que x y et f (x) > f (y). • Pour montrer que f n’est pas monotone, il suffit d’exhiber trois éléments x ∈ X , y ∈ X et z ∈ X tels que x y z et tels que l’on ait : ∗ soit f (x) > f (y) et f (y) < f (z) ; ∗ soit f (x) < f (y) et f (y) > f (z).
Ex. 28.
La fonction définie sur [−1, 1] par f (x) = 2x2 − 1 n’est pas monotone, car on a −1 0 1 mais : f (−1) = 1 > −1 = f (0)
et
y
1 +
f (0) = −1 < 1 = f (1).
Puisque pour tout x ∈ [−1, 1] , on a :
O
√ √ f (x) = ( 2x − 1)( 2x + 1)
√ √ et que les fonctions x �→ 2x − 1 et x �→ 2x + 1 sont croissantes sur [−1, 1] , cela montre que l’on ne peut rien dire de la monotonie du produit de fonctions croissantes en général.
+
1 x
Graphe de f
Proposition 8 Soit f : X → IR et g : Y → IR telle que f (X) ⊂ Y.
Si f et g sont monotones, alors g ◦ f est monotone. Plus précisément, g ◦ f est croissante si f et g sont de même monotonie et décroissante sinon. De même, g ◦ f est strictement monotone lorsque f et g le sont.
Démonstration.
En notant ր pour « croissante » et ց pour « décroissante », si x et y sont deux éléments de X vérifiant x y , le tableau suivant récapitule les 4 cas possibles : fր
fց
f (x) f (y)
gր
g f (x) g f (y)
gց
g f (x) g f (y)
f (x) f (y)
g f (x) g f (y)
g f (x) g f (y)
On fait de même pour la stricte monotonie avec, partout, des inégalités strictes.
77
Chapitre 3. Fonctions numériques de la variable réelle Ex. 29. En composant par les fonctions strictement décroissantes
IR∗+ x
−→ �−→
IR 1 x
IR∗− −→ IR (cf. exemple 27 de la page 76), on obtient les résultats suivants. x �−→ x1 • Si f : X → IR est une fonction monotone à valeurs dans IR∗+ , alors la fonction 1/f est également monotone, de monotonie opposée à celle de f . On a le même résultat avec les fonctions strictement monotones. Ces résultats s’étendent aux fonctions à valeurs dans IR∗− . • En revanche, on ne peut rien dire de la monotonie de 1/f , lorsque f est monotone à valeurs dans IR∗ et n’est pas de signe constant.
et
5
Cas des fonctions strictement monotones
Proposition 9 Une fonction f : X → IR strictement monotone est injective.
Démonstration page 93
Tableau de variations Il est fréquent que l’on puisse découper le domaine de définition d’une fonction numérique f de la variable réelle en un nombre fini d’intervalles, de telle sorte que f soit strictement monotone sur chacun des intervalles. Dans ce cas, on a l’habitude de résumer les résultats dans un tableau de variations. Il est également d’usage, mais pas toujours obligatoire, de mettre dans le tableau les limites de f aux extrémités des différents intervalles. Ex. 30. Ci-contre le tableau de variations de la fonction : f : IR x
−→ �−→
x
IR x2
0
−∞
+∞
+∞
f
où, par convention, les flèches indiquent une fonction continue strictement monotone.
+∞
0
2
Ex. 31. Donnons le tableau de variations de f : x �→ (x − 1)2 + 3
.
La fonction f est évidemment définie sur IR . Étudions sa monotonie. • La fonction x �→ x − 1 est strictement croissante sur IR et la fonction t �→ t2 + 3 est strictement croissante sur IR+ , strictement décroissante sur IR− , ce qui se vérifie facilement. Par composition, la fonction x �→ (x − 1)2 + 3 est donc strictement croissante sur [1, +∞[ et strictement décroissante sur ]−∞, 1] . • Puisque x �→ (x − 1)2 + 3 est à valeurs positives, on obtient, toujours par composition, que f est strictement croissante sur [1, +∞[ et strictement décroissante sur ]−∞, −1] . Cela conduit au tableau de variations suivant. x
−∞
1
+∞ f
78
+∞ +∞
9
II Fonctions réelles de la variable réelle
6
Fonctions majorées, minorées, bornées
Définition 10 Soit f une fonction de X dans IR. On dit que f est : • majorée si ∃M ∈ IR
∀x ∈ X
• bornée si ∃R ∈ IR+
∀x ∈ X
• minorée si ∃m ∈ IR ∀x ∈ X
f (x) M ; f (x) m ; f (x) R .
Remarques • La fonction f est majorée si, et seulement si, l’ensemble image f (X) est une partie majorée de IR. • La fonction f est minorée si, et seulement si, −f est majorée.
• La fonction f est bornée si, et seulement si, elle est minorée et majorée.
• Si f est majorée, tout réel M vérifiant ∀x ∈ X f (x) M est appelé un majorant de f . De même, si f est minorée, tout réel m vérifiant ∀x ∈ X f (x) m est appelé un minorant de f . Interprétation graphique y
• La fonction f est majorée si, et seulement si, son graphe se trouve en dessous d’une droite horizontale.
M
• Plus précisément, la fonction f est majorée par M si, et seulement si, son graphe se trouve en dessous de la droite d’équation y = M .
O
x
Proposition 10 Soit f : X → IR et g : X → IR deux fonctions bornées. Les fonctions f + g et f g sont alors bornées.
Démonstration page 93
Principe de démonstration.
Introduire Mf et Mg tels que |f (x)| Mf et |g(x)| Mg
pour tout x ∈ X . Puis, pour x ∈ X , majorer (f + g)(x) et (f g)(x) à l’aide de Mf et Mg .
Remarque En s’inspirant de la démonstration de la proposition précédente, on montre que la somme de deux fonctions majorées est majorée. De même concernant les fonctions minorées.
Définition 11 Soit f une fonction de X dans IR. On dit que f admet : • un maximum en a ∈ X si ∀x ∈ X
• un minimum en a ∈ X si
∀x ∈ X
f (x) f (a) ; f (x) f (a) ;
• un extremum en a ∈ X si elle admet un maximum ou un minimum en a. 79
Chapitre 3. Fonctions numériques de la variable réelle Remarque La fonction f possède un maximum (respectivement un minimum) si, et seulement si, l’ensemble image f (X) possède un plus grand élément (respectivement un plus petit élément). Notation
Lorsque f admet un maximum, celui-ci est noté max f ou max f (x). X
x∈X
De même, le minimum d’une fonction, lorsqu’il existe, est noté min f ou min f (x). X
x∈X
Ex. 32. La fonction cos admet : • un maximum, 1 , qui est atteint en tous les multiples de 2π ; • un minimum, −1 , atteint en tous les points de la forme π + 2kπ , avec k ∈ ZZ .
Attention Une fonction majorée (resp. minorée) n’admet pas nécessairement de maximum (resp. minimum). Ex. 33. y
2
+
+
O
1 2
III
x
La fonction f définie sur [ 12 , +∞[ par f (x) = x1 est minorée par 0 . D’autre part, elle est strictement décroissante (cf. exemple 27 de la page 76). Si f admettait un minimum, atteint en a , on aurait alors f (a) f (a + 1) , ce qui est impossible. Par ailleurs, elle admet un maximum 2 atteint en 1/2 .
Dérivation – Rappels du secondaire
Dans toute cette partie, I désigne un intervalle de IR d’intérieur non vide (voir page 4), a un point de I , et f est une fonction définie sur I .
1
Nombre dérivé, fonction dérivée
Définition 12 Le taux d’accroissement de f en a est la fonction τa définie sur I \ {a} par : ∀x ∈ I \ {a} τa (x) =
f (x) − f (a) · x−a
La fonction f est dérivable en a si son taux d’accroissement en a possède une limite finie en a. Cette limite s’appelle alors nombre dérivé de f en a et se note f ′ (a).
Ex. 34. Une fonction constante définie sur I est dérivable en tout point de I , de dérivée nulle. Ex. 35. La fonction f : x �→ x est dérivable en tout a ∈ IR avec f ′ (a) = 1 .
Ex. 36. Supposons que I ne contienne pas 0 . Pour tout (x, a) ∈ I 2 vérifiant x �= a , on a : 1 x
− a1 1 1 =− −→ − · x−a xa x→a a2
Il s’ensuit que la fonction h : x �→
80
1 x
est dérivable en a et h′ (a) = − a12 ·
III Dérivation – Rappels du secondaire Ex. 37. La fonction f : IR+ x
−→ �−→
IR √
x
1 • est dérivable en tout point a ∈ IR∗+ et f ′ (a) = √ ; en effet, pour x > 0 , on a : 2 a f (x) − f (a) = x−a
√
√ 1 1 x− a √ −→ √ ; = √ x−a x + a x→a 2 a
• n’est pas dérivable en 0 , car, pour x > 0 :
√
√ 1 x− 0 = √ −→ +∞. x−0 x x→0
� xn est dérivable en tout Ex. 38. Montrons que pour tout n ∈ IN∗ , la fonction fn : x → ′ n−1 ∗ point a ∈ IR et fn (a) = n a . Fixons n ∈ IN et a ∈ IR . Pour x ∈ IR \ {a} , on a :
111
fn (x) − fn (a) xn − an = · x−a x−a Or, il sera vu que xn − an = (x − a)(xn−1 + xn−2 a + · · · + xan−2 + an−1 ) . On obtient le résultat souhaité, car : fn (x) − fn (a) = xn−1 + xn−2 a + · · · + xan−2 + an−1 −→ nan−1 . x→a x−a
Définition 13 Lorsque la fonction f est dérivable en tout point de I , on dit que f est dérivable sur I et la fonction définie sur I par x �→ f ′ (x) est appelée fonction dérivée de f ; elle se note f ′ . Remarques • La notation « ′ » ne s’applique qu’aux fonctions. On peut écrire f ′ (x), mais surtout pas f (x)′ . d f (x) pour le nombre dérivé de f en x peut être utilisée, nodx tamment lorsque l’on a une expression de l’image de x sans que l’on ait donné de d 2 nom à la fonction. On peut ainsi par exemple écrire (x ) = 2x. dx
• La notation
81
Chapitre 3. Fonctions numériques de la variable réelle
2
Interprétations de la dérivée, premières applications
Tangente à une courbe
a Soit f une fonction définie sur I . Pour x ∈ I \{a} , la droite joignant les points A f (a) x et M f (x) (avec a �= x) a pour pente : f (x) − f (a) · x−a • Si f est dérivable en a ∈ I , cette pente a pour limite f ′ (a) quand x tend vers a. • Le vecteur de composantes 1, τa (x) est un vecteur directeur de la corde (AM ), et il « tend » vers 1, f ′ (a) .
M
τa (x) =
A
O
a
x
Par définition, la droite passant par A et de pente f ′ (a) est la tangente en A à la courbe d’équation y = f (x). C’est la « position limite » des cordes (AM ) lorsque le point M tend vers A. Une équation de cette tangente est alors : y = f ′ (a) (x − a) + f (a). Remarques • Lorsque la fonction f est dérivable en a, la tangente en A est horizontale si, et seulement si, f ′ (a) = 0 . • Si f est continue en a et si son taux d’accroissement en a tend vers +∞ ou vers −∞, alors les cordes possèdent « une position limite verticale » que l’on appelle encore tangente à la courbe en A. On parle alors de tangente verticale. Dans ces conditions, une équation de la tangente est x = a. Vitesse instantanée Lorsque x(t) est l’abscisse à l’instant t d’un point en mouvement rectiligne, pour t �= a x(t) − x(a) le taux d’accroissement τa (t) = représente la vitesse moyenne entre les t−a instants a et t, et sa limite x′ (a), que l’on note aussi x(a) ˙ en cinématique, représente la vitesse instantanée à l’instant a. Approximation de la fonction Par définition de f ′ (a), on a
f (x) − f (a) = f ′ (a) + ε(x), ou encore : x−a
f (x) = f (a) + f ′ (a) (x − a) + (x − a) ε(x)
où ε est une fonction qui tend vers 0 en a. On utilise souvent cela en disant que x �→ f (a) + f ′ (a) (x − a) est la « meilleure approximation affine » de f en a, ou une approximation au premier ordre de f au voisinage de a. 82
III Dérivation – Rappels du secondaire Dérivées partielles On peut être amené à étudier des fonctions de plusieurs variables, c’est-à-dire définies sur des parties de IRn , avec n > 1 . C’est notamment le cas en Physique. Soit par exemple f : U → IR, où U ⊂ IR2 . Pour tout (a, b) ∈ U , on peut s’intéresser aux applications partielles x �→ f (x, b) et y �→ f (a, y). La dérivée de x �→ f (x, b) en a, si elle existe, est la dérivée partielle de f par rapport à x en (a, b) et elle ∂f ∂f (a, b). On définit de même (a, b). est notée ∂x ∂y Ex. 39. Soit f :
IR2 −→ IR (x, y) �−→ −x2 + xy 4 . La fonction f a des dérivées partielles en tout point (a, b) avec : ∂f (a, b) = −2a + b4 ∂x
1224
∂f (a, b) = 4ab3 . ∂y
L’étude des fonctions de deux variables sera faite en détail au chapitre 33.
3 422
et
Opérations sur les fonctions dérivables
Nous rappelons ici des résultats vus dans le secondaire et qui seront démontrés au chapitre 11. Proposition 11 Soit f et g deux fonctions définies sur I et dérivables en a ∈ I . • Si λ ∈ IR et µ ∈ IR, alors λ f + µ g est dérivable en a et l’on a : (λ f + µ g)′ (a) = λ f ′ (a) + µ g ′ (a).
Exo 3.8
872
• La fonction f g est dérivable en a et :
(f g)′ (a) = f ′ (a) g(a) + f (a) g ′ (a).
Remarque La première propriété ci-dessus est connue sous le nom de linéarité de la dérivation. Ex. 40. Considérons une fonction polynomiale : f : x �→ a0 + a1 x + · · · + an xn .
Par linéarité de la dérivation et du fait que la dérivée d’une fonction constante sur IR est nulle, il vient des exemples précédents que f est dérivable sur IR et que : ∀x ∈ IR
f ′ (x) = a1 + 2 a2 x + · · · + n an xn−1 .
Proposition 12
Exo 3.9
Soit f à valeurs dans un intervalle J de IR et soit g ∈ IRJ . Si f est dérivable en a et si g est dérivable en b = f (a), alors g ◦ f est dérivable en a et : (g ◦ f )′ (a) = g ′ (b) f ′ (a) = g ′ f (a) f ′ (a). 83
Chapitre 3. Fonctions numériques de la variable réelle Remarque On peut facilement avoir l’intuition du résultat précédent en considérant le cas particulier où l’on aurait f (x) �= f (a) pour tout x ∈ I \ {a} , et en observant : g f (x) − g f (a) f (x) − f (a) g ◦ f (x) − g ◦ f (a) = · x−a f (x) − f (a) x−a Ex. 41. Pour n ∈ IN∗ , la fonction fn : x �→ xn étant dérivable sur IR∗+ , à valeurs dans I = IR∗+ et t → 1t étant dérivable sur I , la fonction f−n : x �→ x1n est dérivable sur IR∗+ et pour tout a ∈ IR∗+ : ′ (a) = f−n
−
1 (an )2
n an−1 = −
n = (−n) a−n−1 . an+1
On obtient le même résultat sur IR∗− . Ex. 42. La dérivée d’une fonction paire dérivable est une fonction impaire. En effet, supposons I symétrique par rapport à 0 . Soit f une fonction paire dérivable. Alors : • d’une part, d’après la proposition précédente, la fonction x �→ f (−x) est dérivable, de dérivée x �→ −f ′ (−x) ; • d’autre part, par parité de f , les fonctions x �→ f (−x) et f coïncident.
Il s’ensuit que −f ′ (−x) = f ′ (x) pour tout x ∈ I , c’est-à-dire que f ′ est une fonction impaire.
On montre de même que la dérivée d’une fonction impaire dérivable est une fonction paire. Ex. 43. La dérivée d’une fonction T -périodique dérivable est une fonction T -périodique.
En effet, si f est une fonction T -périodique dérivable, d’après la proposition précédente, la fonction x �→ f (x + T ) est dérivable, de dérivée x �→ f ′ (x + T ) . Puisque les fonctions f et x �→ f (x + T ) sont les mêmes, elles ont mêmes dérivées.
Remarque Avant de poser un calcul de dérivée, il faut justifier la dérivabilité de la fonction. Le plus souvent, une justification est obtenue par l’application de l’une ou plusieurs des propositions ci-dessus. Pour faire référence à ces résultats on utilise parfois les locutions « par opérations sur les fonctions dérivables », ou bien « par les théorèmes généraux ». Proposition 13 Soit f : I → IR une fonction dérivable en a. • Pour tout n ∈ IN∗ , la fonction f n est dérivable en a et : (f n )′ (a) = n f (a)n−1 f ′ (a).
• Si f est à valeurs strictement positives (respectivement négatives), alors, pour n ∈ ZZ∗ , la fonction f n est dérivable en a et : (f n )′ (a) = n f (a)n−1 f ′ (a).
Démonstration page 94
Principe de démonstration. 84
Utiliser la proposition 12 avec g : x �→ xn .
III Dérivation – Rappels du secondaire Remarques • Le cas particulier n = −1 donne une formule pour la dérivée d’une fonction inverse : ′ f ′ (a) 1 (a) = − · f f (a)2 • En combinant avec le résultat sur le produit, on trouve une formule donnant la dérivée d’un quotient ; si g est dérivable en a et g(a) �= 0 , alors : ′ f ′ (a) g(a) − f (a) g ′ (a) f (a) = · (⋆) g g(a)2 ax+b est définie cx+d sur IR \ {−d/c} . En tant que quotient de fonctions dérivables, elle est dérivable sur chacun des
Ex. 44. Soit (a, b, c, d) quatre réels, avec c �= 0 . La fonction f : x �→
intervalles I1 = −∞, − dc
et I2 = − dc , +∞ de son domaine et :
∀x ∈ I1 ∪ I2
f ′ (x) =
a(cx + d) − c(ax + b) ad − bc = · (cx + d)2 (cx + d)2
Point méthode Lorsque l’on veut dériver une fonction qui s’écrit comme le quotient de deux fonctions f et g , on peut : • soit appliquer la formule (⋆) de dérivation d’un quotient ;
Exo 3.10
• soit dériver le produit f × (1/g).
4
Fonctions de classe C 1
Définition 14 Une fonction f : I → IR est de classe C 1 si elle est dérivable sur I et si sa fonction dérivée est continue. Ex. 45. Les fonctions polynomiales sont de classe C 1 sur IR (cf. exemple 40 de la page 83).
5
Dérivées successives
• Il se peut que la dérivée f ′ d’une fonction dérivable f : I → IR soit elle-même dérivable sur I . On dit alors que f est deux fois dérivable. La fonction (f ′ )′ est alors sa dérivée seconde, fonction que l’on note f (2) ou f ′′ . • La dérivée seconde f (2) d’une fonction deux fois dérivable peut éventuellement être dérivable. La fonction f est alors dite trois fois dérivable et sa dérivée ′ troisième est la fonction f (3) = f (2) . Ainsi de suite.
On esquisse ainsi un procédé, avec lequel on définirait ce que signifie, pour une fonction f : I → IR, d’être n fois dérivable, ainsi que la dérivée n-ième d’une telle fonction. Par convention, toute fonction f : I → IR est 0 fois dérivable et f (0) = f . 85
Chapitre 3. Fonctions numériques de la variable réelle Ex. 46. Posons f : IR∗
IR 1 · x �−→ x Utilisant les résultats de l’exemple 41 de la page 84, on obtient, pour x ∈ IR∗ : −→
f ′ (x) = −
1 x2
f (2) (x) =
2 x3
f (3) (x) = −
6 · x4
Il est alors naturel d’émettre l’hypothèse que f admet une dérivée à tout ordre et : ∀n ∈ IN
∀x ∈ IR∗
f (n) (x) = (−1)n
n! · xn+1
Cette assertion se démontre facilement par récurrence.
IV
Variations d’une fonction sur un intervalle
Dans cette partie encore, I désigne un intervalle de IR d’intérieur non vide, a un point de I et f est une fonction définie sur I .
1
Fonctions monotones / constantes sur un intervalle
La proposition ci-dessous sera démontrée au chapitre 11 (cf. théorème 18 de la page 431). Proposition 14 (Fonctions monotones sur un intervalle) Soit f une fonction dérivable de l’intervalle I dans IR. • La fonction f est croissante si, et seulement si, f ′ 0 .
• La fonction f est décroissante si, et seulement si, f ′ 0 .
Remarque Le second résultat de la proposition précédente se déduit évidemment du premier en changeant f en −f . C’est pourquoi, dans la suite, nous n’énoncerons plus ce type de résultats que pour les fonctions croissantes. Attention Quand on veut appliquer le résultat de la proposition précédente, il est indispensable de vérifier que l’on travaille sur un intervalle ! La fonction f : IR∗ −→ IR est dérivable en tout point de son domaine de définix �−→ x1 tion, sa dérivée est négative et, pourtant, f n’est pas décroissante, comme il a été vu à l’exemple 27 de la page 76. Corollaire 15 (Fonctions constantes sur un intervalle) • Une fonction dérivable sur l’intervalle I est constante si, et seulement si, sa dérivée est nulle. • Si f et g sont deux fonctions définies et dérivables sur l’intervalle I et telles que f ′ = g ′ , alors f et g diffèrent d’une constante. Principe de démonstration. • Montrer que si f ′ = 0 , alors f est croissante et décroissante. • Appliquer le premier point à f − g .
86
IV Variations d’une fonction sur un intervalle Démonstration page 94
Attention Comme pour la proposition précédente, avant d’appliquer ce résultat, il faut être sûr que l’on travaille bien sur un intervalle ! y Par exemple, la fonction f : IR∗ −→ IR 1 −1 si x < 0 x �−→ + 1 si x > 0 x 1 O est dérivable en tout point de son domaine de définition, et sa dérivée est nulle, mais f n’est pas constante. Stricte monotonie Le résultat ci-dessous donne une condition suffisante pour qu’une fonction réelle soit strictement croissante sur un intervalle. C’est un cas particulier d’une condition nécessaire et suffisante qui sera donnée au chapitre 11 (voir le théorème 21 de la page 432). Proposition 16 Soit f une fonction dérivable sur l’intervalle I . Si f ′ est positive et ne s’annule qu’en un nombre fini de points, alors f est strictement croissante. Remarque En considérant −f , il vient que si f est une fonction dérivable dont la dérivée est négative et ne s’annule qu’en un nombre fini de points, alors f est strictement décroissante.
Exo 3.11
Point méthode La plupart du temps, l’étude du signe de la dérivée d’une fonction f permet de déterminer un certain nombre d’intervalles sur lesquels cette dérivée garde un signe constant, en ne s’annulant qu’un nombre fini de fois. La fonction f est alors strictement monotone sur chacun de ces intervalles, ce qui permet d’en dresser le tableau de variations (cf. page 78). 2 1 x x La fonction f est définie sur ]0, +∞[ . Par les théorèmes généraux, f est dérivable et :
Ex. 47. Étudions les variations de f : x �→ √ − ·
∀x ∈ IR∗+
√ 1 1− x 1 f ′ (x) = − √ + 2 = · x x2 x x
L’étude du signe de f ′ est immédiate. On en déduit le tableau de variations de f , puis une allure de son graphe : x
0
f ′ (x)
1 +
0 1
y
+∞ −
1
+
f −∞
0
O
+
1
x
87
Chapitre 3. Fonctions numériques de la variable réelle
2
Étude de variations
Applications des études de variations L’étude des variations d’une fonction f permet entre autres : • de donner l’allure du graphe de f , comme nous venons de le voir ; • de déterminer les extrema de f ;
• d’étudier le nombre de solutions d’une équation du type f (x) = γ ;
• d’étudier le signe de f et donc de prouver des inégalités. Exemple de recherche d’extrema
Reprenons l’exemple 47 de la page précédente, à savoir f : ]0, +∞[ −→ IR x �−→ √2x − x1 ·
L’examen du tableau de variations montre que f admet un maximum, atteint uniquement en 1 . Plus précisément : • la fonction f est strictement croissante sur ]0, 1], donc f (x) f (1) = 1 pour tout x de cet intervalle et il y a égalité si, et seulement si, x = 1 ; • la fonction f est strictement décroissante sur [1, +∞[ , donc f (x) f 1 = 1 pour tout x de cet intervalle et il y a égalité si, et seulement si, x = 1 . On en conclut : • que f est majorée par 1 , puis que 1 est le maximum de f , car la valeur est atteinte par f ; • le maximum de f est atteint uniquement en 1 .
Exemple de discussion d’équation Considérons encore l’exemple 47 de la page précédente. La représentation ci-dessous permet de déterminer le nombre de solutions de l’équation f (x) = γ , lorsque γ ∈ IR est fixé, puisque toute solution de cette équation est l’abscisse d’un point d’intersection de la courbe d’équation y = f (x) et de la droite d’équation y = γ . y Il est graphiquement « évident » que : • si γ 0 , l’équation donnée possède une 1 + unique solution, élément de ]0, 1[ ; γ • si γ ∈ ]0, 1[ , l’équation donnée possède exactement deux solutions, l’une étant élément de ]0, 1[ et l’autre de ]1, +∞[ ;
O
+
1
x
• si γ = 1 , l’équation donnée possède une unique solution, qui vaut 1 ;
• si γ > 1 , l’équation n’a aucune solution.
392
Justifions cela à l’aide du tableau de variations de f et du théorème des valeurs intermédiaires. • Supposons γ 1 . Nous avons vu que f possède un maximum, qui vaut 1 et qui n’est atteint qu’en 1 . Il s’ensuit que : ∗ l’équation f (x) = γ n’a pas de solution si γ > 1 ; ∗ elle admet le réel 1 comme unique solution si γ = 1 . 88
IV Variations d’une fonction sur un intervalle • Supposons γ ∈ ]0, 1[ .
∗ La fonction f est strictement croissante et continue sur l’intervalle ]0, 1]. Comme f (1) = 1 > γ et lim f = −∞, l’équation f (x) = γ possède exac0
tement une solution sur ]0, 1], qui est dans ]0, 1[ . ∗ Comme la fonction f et strictement décroissante et continue sur l’intervalle [1, +∞[ , et que f (1) = 1 > γ > 0 = lim f , l’équation f (x) = γ possède +∞
exactement une solution sur [1, +∞[ , qui est dans ]1, +∞[ . L’équation f (x) = γ a donc exactement deux solutions. • On traite de même le cas γ 0 .
Exemple d’inégalité démontrée à l’aide d’une étude de fonction Montrons l’inégalité : π ∀x ∈ 0, x cos(x) < sin(x). 2 Pour cela, introduisons la fonction g : [0, π/2] −→ IR x �−→ sin(x) − x cos(x). La fonction g est bien définie et dérivable sur l’intervalle I = [0, π/2], et : ∀x ∈ I
(∗)
g ′ (x) = x sin(x).
La proposition 16 de la page 87 montre que la fonction g est strictement croissante. Par suite : π ∀x ∈ 0, g(x) > g(0) = 0, 2 assertion qui est équivalente à l’inégalité (∗).
x
0
g ′ (x)
0
π/2 + 1
g
0 Plan général d’étude d’une fonction • On commence par identifier le domaine de définition X de la fonction.
• On recherche ensuite si f possède des propriétés de parité ou de périodicité ; si c’est le cas, alors on peut réduire le domaine d’étude.
• On dresse alors le tableau de variations de f sur le domaine d’étude, ce qui se fait le plus souvent en étudiant le signe de la dérivée mais peut aussi parfois se faire directement à l’aide des résultats de la partie II.4. • On étudie d’éventuelles asymptotes horizontales ou verticales.
∗ Lorsque le domaine d’étude est non borné et que f possède une limite finie b en +∞ ou en −∞ alors la droite d’équation y = b est appelée asymptote (horizontale) au graphe de f . ∗ Lorsqu’en a la fonction f possède une limite infinie alors la droite d’équation x = a est appelée asymptote (verticale) au graphe de f .
• On peut alors donner l’allure du graphe en commençant par placer les points correspondant aux valeurs introduites dans le tableau de variations (avec leurs tangentes quand elles existent), et les asymptotes (s’il en existe) ; ensuite préciser le tracé. 89
Chapitre 3. Fonctions numériques de la variable réelle Remarque Il existe quelques situations qui permettent de se ramener à une fonction paire ou impaire et donc de réduire le domaine d’étude. (x + 1)2 · x2 + 1 • Il est clair que le domaine de définition de f est IR .
Ex. 48. Étudions la fonction définie par f (x) =
• On peut remarquer que pour tout x ∈ IR on a f (x) = 1 + f (−x) = 1 −
2x = 2 − f (x) x2 + 1
i.e.
2x x2 +1
. Ainsi, pour tout x ∈ IR :
f (−x) − 1 = − f (x) − 1 .
La fonction x �→ f (x) − 1 est donc impaire. Il s’ensuit que A = (0, 1) est un centre de symétrie du graphe de f , et l’on peut restreindre l’étude de f à [0, +∞[ . • La fonction f est dérivable comme quotient de fonctions dérivables. De plus, appliquant la formule de dérivation d’un quotient, pour x ∈ IR , on a : f ′ (x) =
2 (x2 + 1) − (2x) (2x) 2(1 − x)(1 + x) = · (x2 + 1)2 (x2 + 1)2
L’étude du signe de la dérivée ne pose pas de problème. • Par ailleurs, f admet une limite finie en +∞ :
lim f (x) = 1 .
x→+∞
Par conséquent le graphe de f admet une asymptote en +∞ , qui est la droite d’équation y = 1 . • On peut maintenant donner le tableau de variations de f et tracer son graphe. y x
0
′
f (x)
1 +
0 2
+∞ −
1 +
f 1
1
O
+
1
x
• Le tableau de variations montre que f admet un maximum, qui vaut 2 , atteint en 1 . Par symétrie, f admet un minimum atteint en −1 qui vaut 0 .
3
Fonctions réciproques
Propriétés des bijections réciproques Proposition 17 Soit Y une partie de IR et f : X → Y une bijection.
Les graphes de f et de f −1 sont symétriques l’un de l’autre par rapport à la première bissectrice. Démonstration page 94
90
IV Variations d’une fonction sur un intervalle Proposition 18 Soit f : X → Y une bijection strictement monotone. Alors la fonction f −1 est strictement monotone, de même monotonie que f . Démonstration page 94
Remarque Si f : X → Y est une bijection impaire, alors sa bijection réciproque f −1 est aussi impaire. En effet, soit y ∈ Y . Puisque f −1 (y) ∈ X , alors −f −1 (y) ∈ X et : (imparité de f ) f −f −1 (y) = −f f −1 (y) = −y = f f −1 (−y)
(bjections réciproques) (idem et −y ∈ Im f ).
L’injectivité de f permet alors d’en déduire que f −1 (−y) = −f −1 (y). Cas d’une fonction dérivable, bijective d’un intervalle sur un autre Considérons un intervalle J et f : I → J une bijection, ainsi que a ∈ I et b = f (a). Supposons que f soit dérivable en a et f −1 dérivable en b . Puisque f −1 f (x) = x pour tout x ∈ I , par dérivée d’une composée de fonctions dérivables, on obtient : (f −1 )′ (b) f ′ (a) = 1, 427
ce qui montre que f ′ (a) �= 0 est une condition nécessaire pour que f −1 soit dérivable en b . Cela est précisé dans la proposition suivante, qui sera prouvée au chapitre 11. Proposition 19 Soit J un intervalle, f : I → J une bijection dérivable, b ∈ J et a = f −1 (b). • La fonction f −1 est dérivable en b si, et seulement si, f ′ (a) �= 0 .
• Si f ′ (a) �= 0 , on a alors (f −1 )′ (b) =
1 · f ′ (a)
Comme f est dérivable en a, le graphe de f admet une tangente T en A = (a, b), de pente f ′ (a). • Si f ′ (a) �= 0 , alors f −1 est dérivable en b , donc le graphe de f −1 admet une tangente T ′ en B = (b, a) de pente 1/f ′(a). En d’autres termes T ′ est l’image de T par la symétrie orthogonale par rapport à la première bissectrice.
y B
O
A
x
• Dans le cas où f ′ (a) = 0 , la droite T est horizontale. On peut alors montrer que la limite du taux d’accroissement de f −1 en b est ±∞. Le graphe de f −1 admet une tangente verticale T ′ en (b, a). Ces résultats sont cohérents avec le fait que les graphes de f et f −1 sont symétriques par rapport à la première bissectrice. 91
Chapitre 3. Fonctions numériques de la variable réelle Remarque On rencontre souvent la situation suivante : f : I → IR est une fonction dérivable et strictement monotone. Alors : • la fonction f est injective (cf. proposition 9 de la page 78) ;
392
• d’après le théorème des valeurs intermédiaires, J = f (I) est un intervalle, car f est dérivable, donc continue. Dans ces conditions, f induit une bijection f de I sur J à laquelle on peut appliquer la proposition 19 de la page précédente. Ex. 49. La fonction f : IR x
−→ �−→
IR x3
est une bijection strictement croissante de IR sur IR .
En effet, f est dérivable sur IR et pour tout x ∈ IR on a f ′ (x) = 3 x2 . Puisque f ′ est à valeurs positives et s’annule exactement une seule fois, f est strictement croissante sur l’intervalle IR , donc définit une bijection de IR sur f (IR) . Puisque IR est un intervalle, lim f = −∞ −∞
et lim f = +∞ , le théorème des valeurs intermédiaires donne f (IR) = IR . +∞ √ √ Pour y ∈ IR , on note 3 y = f −1 (y) et l’on dit que 3 y est y = x3 y la racine cubique de y . √ √ Le graphe de y �→ 3 y se déduit de celui de f par symétrie y= 3x + 1 par rapport à la première bissectrice. Puisque f ′ ne s’annule √ O qu’en 0 et que 03 = 0 , la fonction y �→ 3 y est dérivable + x ∗ ∗ 1 sur IR+ et sur IR− , mais pas en 0 . Par ailleurs : ∀y ∈ IR∗
1 d √ 3 y = √ 2 · dy 3 3 y
Remarque Plus généralement : • si n est un entier impair supérieur à 3 , la fonction x �→ xn définit une bijection continue strictement croissante de IR sur IR ; son application réciproque se √ note n , et elle est continue sur IR, dérivable sur IR∗ ; • si n ∈ IN∗ est pair, la fonction x �→ xn induit une bijection continue strictement √ croissante de IR+ sur IR+ ; son application réciproque se note encore n , et elle est continue sur IR+ , dérivable sur IR∗+ .
92
Démonstrations
Démonstrations Proposition 4 Comme −|x| x |x| , si |x| h , on a a fortiori −h −|x| x |x| h . Réciproquement, supposons −h x h . Si x 0 , alors |x| = x h . Si x 0 , alors |x| = −x h . Dans les deux cas, |x| h . Proposition 6 Première inégalité. Soit x et y deux réels. Par définition, on a −|x| x |x| et −|y| y |y| . Par addition, on en déduit : −(|x| + |y|) x + y |x| + |y|
ce qui, d’après la proposition 4 de la page 70, entraîne |x + y| |x| + |y| . Seconde inégalité. En appliquant la première inégalité avec (x + y) et −y , on obtient : |x| = |(x + y) − y)| |x + y| + |−y| = |x + y| + |y|
et donc |x| − |y| |x + y| . En permutant x et y , on en déduit |y| − |x| |y + x| = |x + y| .
Comme |x| − |y| = max |x| − |y|, |y| − |x| , cela donne :
|x| − |y| |x + y|.
Proposition 7 • Supposons qu’il existe R ∈ IR+ tel que ∀x ∈ A |x| R . Pour tout x ∈ A , d’après la proposition 4 de la page 70, on a −R x R . Ainsi R est un majorant de A et −R un minorant, ce qui prouve que A est une partie bornée de IR . • Réciproquement, supposons A bornée. Soit M un majorant (respectivement m un minorant) de A . Soit x ∈ A . On a :
x M |M | max |m|, |M |
x m −|m| min −|m|, −|M | = − max |m|, |M | . Par suite, en posant :
R = max |m|, |M | ,
on a −R x R pour tout x ∈ A , ou encore ∀x ∈ A |x| R .
m
A
0
M R Proposition 9 Soit (x, y) ∈ X 2 tel que x �= y . Quitte à échanger x et y , on peut supposer x < y . Puisque la fonction f est strictement monotone, on a soit f (x) < f (y) (cas croissant), soit f (x) > f (y) (cas décroissant). Dans tous les cas, on a f (x) �= f (y) . Par définition, cela implique que f est injective. Proposition 10
Prenons Mf et Mg deux réels tels que : ∀x ∈ X
f (x) Mf
ce qui est possible car f et g sont bornées. • Soit x ∈ X . Par l’inégalité triangulaire :
•
et
∀x ∈ X
g(x) Mg ,
(f + g)(x) = f (x) + g(x) f (x) + g(x) Mf + Mg .
Il s’ensuit que Mf + Mg majore |f + g| , donc que f + g est bornée. Soit x ∈ X . On a :
(f g)(x) = f (x)g(x) f (x) g(x) Mf Mg , car f (x) 0 et g(x) 0 . Il s’ensuit que Mf Mg majore |f g| , donc que f g est bornée. 93
Chapitre 3. Fonctions numériques de la variable réelle Proposition 13 •
•
Supposons n ∈ IN∗ . D’après l’exemple 38 de la page 81, g : IR x
−→ �−→
IR xn
est dérivable
en tout b ∈ IR et g ′ (b) = n bn−1 . Le résultat découle alors directement de la proposition précédente. Supposons n < 0 . Si f à valeurs strictement positives, comme la fonction g : IR∗+ x
IR est dérivable en xn
−→ �−→
tout b ∈ IR∗+ et g ′ (b) = n bn−1 (cf. exemple 41 de la page 84), on conclut alors à l’aide de la proposition 12 de la page 83. Même constat lorsque f est à valeurs strictement négatives. Corollaire 15 • ∗ Si f est constante sur I , alors f ′ = 0 (cf. exemple 34 de la page 80). ∗ Si f ′ = 0 , alors f ′ 0 , donc f est croissante sur l’intervalle I . De même, f est décroissante, donc elle est constante. • Par linéarité de la dérivation, si f ′ = g ′ , alors (f − g)′ = 0 , donc la fonction f − g est constante sur l’intervalle I . Proposition 17 Soit (x, y) ∈ Γf . Par définition du graphe, on a x ∈ X et y = f (x) . On en déduit que y ∈ Y et x = f −1 (y) , ce qui prouve que (y, x) ∈ Γf −1 .
y
y = f −1 (x)
y = f (x)
Comme f est la fonction réciproque de f −1 , on en déduit de même que si (y, x) ∈ Γf −1 , alors (x, y) ∈ Γf . Ainsi, les graphes de f et f −1 sont symétriques par rapport à la première bissectrice.
Proposition 18 •
•
94
O x
Supposons f strictement croissante. Considérons y = f (x) et y ′ = f (x′ ) des éléments de Y , avec y < y ′ . Si x x′ , on aurait y = f (x) f (x′ ) = y ′ , ce qui est impossible. Ainsi x < x′ , c’est-à-dire f −1 (y) < f −1 (y ′ ) . On en déduit que f −1 est strictement croissante. On raisonne de même lorsque f est strictement décroissante.
Exercices
S’entraîner et approfondir Relation d’ordre sur IR 3.1 Montrer : 2n 1
→66
∀n ∈ IN∗
k=n+1
k
1 · 2
3.2 Soit n un entier naturel non nul et x1 , . . . , xn des éléments de [0, 1] . →69
1. Pour x ∈ [0, 1] , quel est le signe de x(1 − x) ?
2. Montrer que si x1 + · · · + xn = x21 + · · · + x2n , alors xi ∈ {0, 1} pour tout i ∈ [[1, n]] .
3.3 Soit n un entier naturel non nul et x0 , . . . , xn des éléments de [0, 1[ tels que x0 < · · · < xn . 1 Montrer qu’il existe i ∈ [[0, n − 1]] tel que xi+1 − xi < · n 3.4 Résoudre l’équation |x + 3| − |x − 1| = |2 x + 1| .
3.5 Pour x ∈ [−π, π] donner le signe de sin(x) sin(x) − 1
Fonctions de la variable réelle
2 cos(x) − 1 .
3.6 Soit f et g deux fonctions numériques définies sur IR . 1. Que dire de la parité de f + g et f g lorsque f et g sont impaires ? 2. Que dire de la parité de f + g et f g lorsque f est paire et g impaire ?
→75
3.7 Soit f et g deux fonctions définies sur X croissantes et négatives. Que peut-on dire de la monotonie de la fonction f g ?
→77
3.8 Soit n ∈ IN∗ . On pose fn : IR x
→83
IR xn .
−→ �−→
Montrer par récurrence, en utilisant la proposition 11 de la page 83, que f est dérivable sur IR et, pour (a, n) ∈ IR × IN∗ , que l’on a fn′ (a) = nan−1 . 3.9 Si x est un réel donné, que penser des relations suivantes ? →83
(a) sin′ (2x) = cos(2x)
(b) sin′ (2x) = 2 cos(2x)
(c) sin(2x)′ = cos(2x)
(d) sin(2x)′ = 2 cos(2x)
3.10 Soit a ∈ ]0, π[ . Calculer la dérivée de f : x �→ →85
x − cos a , (x2 − 2 x cos a + 1)5
• à l’aide de la formule donnant la dérivée d’un quotient ;
−5
• en dérivant le produit ( x − cos a) x2 − 2x cos a + 1
.
95
Chapitre 3. Fonctions numériques de la variable réelle 3.11 Dresser le tableau de variations de f : x �→ →87
3.12 Montrer que la fonction f : x �→ ln
x2 + x + 1 · (x − 1)3
2ex + 1 ex + 2
est définie et monotone sur IR .
|f | + f |f | − f et f − = · 2 2 + − 1. Pour tout x ∈ X , simplifier f (x) et f (x) , suivant le signe de f (x) .
3.13 Soit f ∈ IRX . On pose f + =
2. Représenter graphiquement f , |f | , f + et f − lorsque f : IR x
−→ �−→
IR x2 − 2 x.
3.14 Déterminer en fonction du paramètre réel m le nombre de solutions dans l’intervalle [0, 1] de l’équation x3 − m x − 1 = 0 .
96
Solutions des exercices
Solutions des exercices 3.1 Soit n ∈ IN∗ . Pour tout k ∈ [[n + 1, 2n]] , on a on obtient : 2n 1
k=n+1
k
2n
k=n+1
1 k
1 2n
, donc en additionnant ces inégalités,
1 1 1 = n× = · 2n 2n 2
3.2 1. Lorsque x ∈ [0, 1] , le réel x(1 − x) est le produit de deux réels positifs, donc est positif. 2. Supposons que x1 + · · · + xn = x21 + · · · + x2n . On a donc :
0 = x1 + · · · + xn − x21 − · · · − x2n = x1 (1 − x1 ) + · · · + xn (1 − xn ) .
0
0
Puisque qu’une somme de termes positifs est nulle si, et seulement si, chacun des termes est nul, on en déduit, pour tout i ∈ [[1, n]] : xi (1 − xi ) = 0
c’est-à-dire
(xi = 0
3.3 Raisonnons par l’absurde en supposant : ∀i ∈ [[0, n − 1]] En sommant ces inégalités, il vient :
ou
xi = 1) .
1 xi+1 − xi . n
1 1 + · · · + x1 − x0 + · · · + xn − xn−1 , n n n fois
donc 1 xn − x0 . C’est impossible car xn − x0 < 1 .
En conclusion, il existe i ∈ [[0, n − 1]] tel que xi+1 − xi
0 ;
• si x ∈ [1, +∞[ , alors on a :
f (x) = (x + 3) − (x − 1) − (2 x + 1) = −2x + 3
qui s’annule si, et seulement si, x = 32 ·
Les solutions de l’équation donnée sont donc x = −
3 3 et x = · 4 2
3.5 Pour x ∈ [−π, π] , étudions le signe de chacun des facteurs. On a :
• sin(x) 0 si, et seulement si, x ∈ [0, π] et sin x = 0 si, et seulement si, x = −π , x = 0 ou x = π ; • sin(x) − 1 0 et sin x − 1 = 0 si, et seulement si, x = π2 ;
• 2 cos(x) − 1 0 si, et seulement si, x ∈ − π3 , si, x = ± π3 ·
En notant e(x) = sin(x) sin(x) − 1 x
−π
sin(x)
0
sin(x) − 1
2 cos(x) − 1 e(x)
0
−
−
, et 2 cos(x) − 1 = 0 si, et seulement
2 cos(x) − 1 : − π3
−
−
π 3
−
0 0
π 3
0
0
−
+ +
0
π 2
+
+
−
−
0
+
0
+
0
−
0
π +
−
0
− −
+
0
3.6 1. • Pour tout x ∈ IR , on a :
(f + g)(−x) = f (−x) + g(−x) = −f (x) − g(x) = −(f + g)(x).
La fonction f + g est donc impaire. • Pour tout x ∈ IR , on a :
(f g)(−x) = f (−x)g(−x) = −f (x) La fonction f g est donc paire. 2. • Pour tout x ∈ IR , on a :
−g(x) = (f g)(x).
(f g)(−x) = f (−x)g(−x) = f (x) −g(x) = −(f g)(x). La fonction f g est donc impaire. • On ne peut rien dire en général de la somme. Pour tout x ∈ IR , on a : (f + g)(−x) = f (−x) + g(−x) = f (x) − g(x).
∗ La fonction f + g sera donc paire si, et seulement si, pour tout x ∈ IR : f (x) − g(x) = f (x) + g(x),
c’est-à-dire si, et seulement si, g est la fonction nulle. ∗ De même f + g sera donc impaire si, et seulement si, f = 0 . 3.7 Le plus simple est de se ramener à des fonctions positives. Puisque les fonctions f et g sont croissantes et négatives, les fonctions −f et −g sont décroissantes et positives. Par suite, la fonction f g = (−f )(−g) est décroissante (et positive).
98
Solutions des exercices 3.8 Pour n ∈ IN∗ , posons Hn : « fn est dérivable en tout a ∈ IR et fn′ (a) = n an−1 ». Montons que Hn est vraie. Initialisation. Le cas de la propriété H1 est déjà traité (cf. exemple 35 de la page 80).
Hérédité. Soit n ∈ IN∗ tel que Hn et a ∈ IR . Par hypothèse de récurrence fn′ (a) = nan−1 et l’on sait que f1′ (a) = 1 . Comme fn+1 = fn × f1 , on déduit alors de la proposition 11 de la page 83 que fn+1 est dérivable en a et que : ′ (a) = fn′ (a)f1 (a) + fn (a)f1′ (a) = n an−1 a + an 1 = (n + 1) an . fn+1
Cela démontre le résultat par récurrence. 3.9 • Les relations (c) et (d) n’ont aucun sens car le symbole « des fonctions alors que sin(2x) est un réel.
′
» ne peut s’appliquer qu’à
• Entre (a) et (b) , c’est la relation (a) qui est correcte car sin′ (2x) représente la valeur en 2x de la dérivée de la fonction sin , c’est-à-dire cos(2x) . • La valeur 2 cos(2x) est égale à f ′ (x) lorsque f : x �→ sin(2x) .
D’ailleurs, au lieu d’introduire f et d’écrire f ′ (x) = 2 cos(2x) , on peut aussi écrire d sin(2x) = 2 cos(2x) . directement dx
3.10 La fonction donnée est définie sur IR puisque : ∀x ∈ IR
x2 − 2x cos a + 1 = (x − cos a)2 + sin2 a sin2 a > 0.
• En dérivant comme un quotient, on obtient, pour tout x ∈ IR : ′
f (x) =
5
x2 − 2 x cos a + 1
(x2 − 2 x cos a + 1)10
4
expression qu’il ne faut pas oublier de simplifier par x2 − 2 x cos a + 1
• En dérivant comme un produit, on obtient, pour tout x ∈ IR :
−5
f ′ (x) = x2 − 2 x cos a + 1 qui donne directement : ′
f (x) =
4
− 5 ( x − cos a) (2 x − 2 cos a) x2 − 2 x cos a + 1
−
,
.
(5 x − 5 cos a) (2 x − 2 cos a) (x2 − 2 x cos a + 1)6
x2 − 2 x cos a + 1 − (5 x − 5 cos a) (2 x − 2 cos a)
=−
(x2 − 2 x cos a + 1)6
9 x2 − 18 x cos a − 1 + 10 (cos a)2 · (x2 − 2 x cos a + 1)6
3.11 • Le domaine de définition de f est Df = ]−∞, 1[ ∪ ]1, +∞[ . • La fonction f est dérivable sur ces deux intervalles comme quotient de fonctions dérivables dont le dénominateur ne s’annule pas et, pour x ∈ Df , on a : f ′ (x) = =
2x + 1 −3 + (x2 + x + 1) (x − 1)3 (x − 1)4
(x + 2)2 (2x + 1)(x − 1) − 3(x2 + x + 1) −x2 − 4x − 4 = =− · 4 4 (x − 1) (x − 1) (x − 1)4
Cette dérivée est donc négative en tout point et ne s’annule qu’en −2 .
99
Chapitre 3. Fonctions numériques de la variable réelle • On en déduit que la fonction f est strictement décroissante sur chacun des intervalles de son domaine de définition, ce qui permet de dresser son tableau de variations : x
1
−∞ 0
+∞
+∞
f 0
−∞ 3.12 La fonction f : x �→ ln
2ex + 1 ex + 2
est définie sur IR car :
2 ex + 1 > 0. ex + 2 Elle est monotone comme composée de trois fonctions monotones : • la fonction exp (à valeurs positives), (cf. exemple 27 de la page 76), • la fonction homographique IR+ −→ IR∗+ t+1 t �−→ 2t+2 • la fonction ln . ∀x ∈ IR
ex + 2 �= 0
et
On en déduit que f est monotone en tant que composée de trois fonctions monotones. Comme f (0) = 0 et f (ln 2) = ln(5/4) > 0 , la fonction f est croissante. Remarque Pour la monotonie, on peut évidemment dériver ; dans ce cas, il est alors préférable d’écrire auparavant f (x) = ln(2ex + 1) − ln(ex + 2) . 3.13 1. Si f (x) 0 , alors |f |(x) = f (x) et donc f + (x) = f (x) et f − (x) = 0 .
Si f (x) 0 alors |f |(x) = −f (x) et donc f + (x) = 0 et f − (x) = −f (x) .
2. Pour f : IR x y
−→ �−→
IR , on obtient les graphes suivants : x2 − 2 x y y
f
O
f+
|f | 2
x
O
2
y
x
O
2
f−
x
O
x
2
3.14 Comme x = 0 n’est pas solution de l’équation donnée, cette équation possède autant de solutions que l’équation : 1 x3 − 1 = x2 − d’inconnue x ∈ ]0, 1] . x x La fonction f : ]0, 1] −→ IR est dérivable et : x 1 x �−→ x2 − x f (x) 1 ′ ∀x ∈ ]0, 1] f (x) = 2x + 2 , x m=
0
−∞
d’où le tableau de variations ci-dessus duquel on déduit les conclusions suivantes : • si m 0 l’équation donnée possède une solution dans ]0, 1] ; • si m > 0 l’équation donnée ne possède aucune solution dans ]0, 1] .
100
1 0
Chapitre 4 : Calculs algébriques et trigonométrie
I
Symboles 1 2 3 4 5 6
et
. . . . . . . . . . . . . . . . . . . . . .
Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . Changements d’indice . . . . . . . . . . . . . . . . . . . . Regroupements de termes . . . . . . . . . . . . . . . . . . Sommes télescopiques, produits télescopiques . . . . . . . Quelques calculs remarquables . . . . . . . . . . . . . . . Sommes doubles . . . . . . . . . . . . . . . . . . . . . . . II Coefficients binomiaux, formule du binôme . . . . . . . 1 Coefficients binomiaux . . . . . . . . . . . . . . . . . . . . 2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Formule du binôme . . . . . . . . . . . . . . . . . . . . . . III Petits systèmes linéaires, méthode du pivot . . . . . . 1 Résolution par la méthode du pivot de Gauss . . . . . . . 2 Interprétation géométrique . . . . . . . . . . . . . . . . . 3 Cas particulier des systèmes de 2 équations à 2 inconnues IV Trigonométrie . . . . . . . . . . . . . . . . . . . . . . . . 1 Cercle trigonométrique, cos et sin . . . . . . . . . . . . . 2 Premières formules trigonométriques utilisant cos et sin . 3 Formules d’addition . . . . . . . . . . . . . . . . . . . . . 4 Tangente . . . . . . . . . . . . . . . . . . . . . . . . . . .
102 102 105 108 109 110 112 116 116 117 118 119 119 122 123 124 124 126 129 130
5 Équations et inéquations trigonométriques . . . . . . . . . 133 Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
Calculs algébriques et trigonométrie
4
Nous introduisons dans ce chapitre des outils de calculs algébriques (les symboles et , les coefficients binomiaux et la formule du binôme, les systèmes linéaires et la méthode du pivot), ainsi que des notions de trigonométrie.
I
Symboles
1
Définitions
et
Étant donné des nombres réels a1 , . . . , an , il arrive fréquemment que l’on ait besoin de considérer leur somme et/ou leur produit. Une première possibilité est d’utiliser les notations suivantes : • a1 + a2 + · · · + an pour désigner la somme des n nombres a1 , . . . , an ;
• a1 × a2 × · · · × an pour désigner le produit des n nombres a1 , . . . , an .
Dans les notations ci-dessus, il faut bien comprendre que si n vaut 1 , alors la somme et le produit considérés valent simplement a1 (l’écriture du terme a2 avant les points de suspension ne sert qu’à bien expliciter la liste utilisée). Pour pallier cet inconvénient et éviter toute ambiguïté, on introduit les notations suivantes : n • ak pour désigner la somme de ces n nombres ; k=1
•
n
ak pour désigner le produit de ces n nombres.
k=1
Ex. 1. Pour x ∈ IR et n ∈ IN∗ , on pose xn = x × · · · × x =
n termes
n
x.
k=1
Ex. 2. Pour n ∈ IN∗ , on appelle factorielle n , et l’on note n! , le nombre entier : n! = 1 × 2 × · · · × (n − 1) × n = On a ainsi 1! = 1 , 2! = 2 , 3! = 6 , 4! = 24 , 5! = 120, . . .
n
k=1
k.
I Symboles
et
Plus généralement, si p et q sont deux entiers vérifiant p q , et si l’on dispose de q − p + 1 nombres réels numérotés de p à q : ap , . . . , aq , on note : q • ap + · · · + aq , ou ak , leur somme ; k=p
• ap × · · · × aq , ou
q
ak , leur produit.
k=p
Attention Dans une somme ou un produit dont l’indice varie de p à q , le nombre de termes est égal à q − p + 1 .
Notation
On utilise indifféremment les notations suivantes : q • d’une part ak ou encore ak , ak ; k=p
• d’autre part
pkq
k∈[[p,q]]
q
k=p
ak ,
ak
ou encore
ak .
pkq
k∈[[p,q]]
Cas d’une famille finie quelconque On étend les notions introduites ci-dessus au cas de n’importe quelle famille (ak )k∈I , où l’ensemble d’indexation I est fini et non vide : ak désigne la somme de tous les termes de la famille ; • k∈I
•
ak désigne le produit de tous les termes de la famille.
k∈I
Ex. 3. La somme des termes de la famille (k2 )k∈[[−2,2]] vaut :
k2 = 4 + 1 + 0 + 1 + 4 = 10.
k∈[[−2,2]]
On voit dans cet exemple que les termes d’une famille ne sont pas nécessairement deux à deux distincts. Une valeur peut donc être comptée plusieurs fois dans une somme.
Attention La lettre k intervenant dans les notations précédentes désigne une variable muette servant à décrire l’ensemble d’indexation. On peut choisir d’utiliser n’importe quelle autre lettre ! Ainsi on a : ak = aℓ . k∈I
ℓ∈I
Remarque Lorsque tous les termes de la famille (ak )k∈I sont égaux, les calculs de ak et ak sont immédiats. En effet, en notant alors n le nombre de termes de k∈I
k∈I
la famille (c’est-à-dire le nombre d’éléments de I ), et α leur valeur commune, on a : ak = α + · · · + α = n α et ak = α · · × α = αn . × · k∈I
n termes
k∈I
n termes
103
Chapitre 4. Calculs algébriques et trigonométrie Somme vide, produit vide • On étend les notions de somme et produit au cas où l’ensemble d’indexation est vide, en convenant qu’une somme vide vaut 0 et qu’un produit vide vaut 1 : ak = 0 et ak = 1. k∈∅
k∈∅
• Si p = q + 1 , on convient que
q
q
ak = 0 et
k=p
ak = 1 .
k=p
Cette convention permet d’étendre naturellement : Ex. 4. la notation xn pour x ∈ IR et n = 0 : x0 = Ex. 5. la notation n! pour n = 0 : 0! =
0
0
x=1;
k=1
k = 1.
k=1
Exo 4.1
Premières règles de calcul Les règles de calculs dans IR nous donnent les propriétés de calcul suivantes. 1. Séparation : (ak + bk ) = ak + bk et (ak bk ) = ak bk . k∈I
k∈I
k∈I
k∈I
k∈I
k∈I
2. Diverses opérations (λ est un nombre réel, p un entier naturel, et n désigne le nombre d’éléments de I ) : p p (λ ak ) = λ ak (ak ) = ak k∈I
k∈I
n
(λ ak ) = λ
k∈I
k∈I
ak
k∈I
(ak + λ) =
k∈I
3. Relation de Chasles : si l’on a p r q , alors : q
ak =
k=p
r
ak +
k=p
q
k∈I
ak .
k=r+1
et
q
ak =
k=p
r
ak
k∈I
k=p
ak
+ n λ.
q
ak .
k=r+1
Attention Quand on utilise la relation de Chasles, il faut bien prendre garde à ne pas compter deux fois le terme ar ! 4. Additivité par rapport à l’ensemble d’indexation : si I1 et I2 sont deux ensembles finis disjoints, alors : ak × ak . ak + ak et ak = ak = k∈I1 ∪I2
k∈I1
k∈I2
k∈I1 ∪I2
k∈I1
k∈I2
Cette dernière propriété est une généralisation de la relation de Chasles.
104
I Symboles
2
Changements d’indice
et
Dans certaines situations il est intéressant de modifier l’indexation d’une somme ou d’un produit. Décalage d’indice Si r est un entier, alors, dans la somme S =
q
ak , on peut effectuer un décalage
k=p
d’indice en utilisant le changement d’indice [j = k + r] et en écrivant : S=
q+r
aj−r .
j=p+r
Ex. 6. Étant donné une somme S =
q
k=p
ak , le changement d’indice [j = k − p] permet de se
ramener à une somme indexée à partir de 0 : S=
q−p
aj+p .
j=0
Ex. 7. Pour n 2 , on souhaite calculer la somme S =
n k=1
2 · k(k + 2)
2 1 1 L’identité = − , valable pour tout k ∈ IN∗ , et donc pour tout k ∈ [[1, n]] , k(k + 2) k k+2 nous donne S =
n 1 k=1
k
−
n k=1
1 · k+2
Effectuons le changement d’indice [j = k + 2] dans la deuxième somme : n k=1
n+2
n+2
j=3
k=3
1 1 1 = = , k+2 j k
la dernière égalité étant justifiée par le caractère muet de la variable de sommation. On obtient : S=
n 1 k=1
= = Attention
k
−
n+2 1 k=3
k
n
1 1 1+ + 2 k k=3
−
1 1 3 − − · 2 n+1 n+2
n 1 k=3
1 1 + + k n+1 n+2
(car n 2)
À l’avant dernière égalité du calcul précédent, on notera la justification « n 2 ».
En effet, pour pouvoir sortir deux termes des sommes
n
k=1
comporter au moins deux.
1 k
et
n+2 k=3
1 k
, celles-ci doivent en
105
Chapitre 4. Calculs algébriques et trigonométrie Symétrisation Dans certains calculs, il peut être judicieux d’inverser l’ordre dans lequel les termes sont considérés. Ex. 8. Pour n ∈ IN , considérons une somme de la forme : S=
n
ak .
(⋆)
k=0
Pour inverser l’ordre de sommation, effectuons le changement d’indice [j = n − k] . Lorsque k décrit l’ensemble [[0, n]] , alors j décrit sans redondance le même ensemble [[0, n]] . On a donc : S=
n
an−j .
(⋆⋆)
j=0
Si l’on écrit les sommes avec des points de suspension : • l’écriture (⋆) correspond à S = a0 + a1 + · · · + an ;
• l’écriture (⋆⋆) correspond à S = an + an−1 + · · · + a0 .
Ex. 9. Pour (p, q) ∈ IN2 tel que p q , on souhaite inverser l’ordre de sommation dans un produit P =
q
ak .
k=p
• En effectuant le changement d’indice [j = p+q−k] , alors lorsque k décrit l’ensemble [[p, q]] , j décrit le même ensemble [[p, q]] . Cela donne l’écriture suivante pour P : P =
q
ap+q−j .
j=p
• En effectuant le changement d’indice [j = q − k] , alors lorsque k décrit l’ensemble [[p, q]] , j décrit l’ensemble [[0, q − p]] . Cela donne l’écriture suivante pour P : q−p
P =
aq−j .
j=0
Remarque Dans ce qui précède, les indices k et j intervenant étant des variables muettes, on peut utiliser la même lettre avant et après le changement d’indice. Ainsi, il est correct d’écrire : q q−1 ak = ak+1 . k=p
k=p−1
Cependant, l’utilisation d’une nouvelle lettre permet de réduire les risques d’erreurs dans la détermination des nouvelles bornes. En particulier, cela permet de faire de tête les raisonnements suivants : • « quand k vaut p, combien vaut j , . . . et quand k vaut q , combien vaut j . . . » • « quand k décrit l’ensemble I , alors j décrit l’ensemble . . . »
106
I Symboles
et
La formule donnant la somme des n premiers entiers est, vis-à-vis de sa démonstration, une bonne illustration du principe de symétrisation. Proposition 1 n
Pour n ∈ IN, on a
k=
k=1
n(n + 1) · 2
Démonstration.
Le résultat est évident pour n = 0 , puisqu’une somme vide vaut 0 . Donnons-nous n ∈ IN∗ . Optons pour une démonstration intuitive, en utilisant des points de suspension. Notons S la somme considérée, et sommons une fois dans un sens, et une fois dans l’autre : S
=
1
+
2
+
S
=
n
+
(n − 1)
+
···
+
2S
=
(n + 1)
+
(n + 1)
+
···
+
On a donc 2 S = n(n + 1) , c’est-à-dire S = Remarque
···
+
(n − 1)
+
n
2
+
1
(n + 1)
+
(n + 1)
n(n + 1) · 2
On peut écrire le raisonnement précédent sans points de suspension en effectuant
le changement d’indice [j = n − k + 1] dans la somme. Cela donne S = 2S =
n
k+
k=1
=
n k=1
=
n
n j=1
k+
n k=1
n
(n − j + 1) puis :
j=1
(n − j + 1) (n − k + 1)
(on renomme j en k dans la deuxième somme)
(n + 1)
k=1
= n (n + 1)
(somme dont le terme général est constant),
Plus généralement, on dispose d’une formule donnant la somme des termes d’une suite arithmétique, c’est-à-dire une suite (un )n∈IN de la forme : ∀n ∈ IN un = a + n b.
Proposition 2 (Somme des termes d’une suite arithmétique)
Soit (uk )k∈IN une suite arithmétique. Alors, pour (p, n) ∈ IN2 tel que p n, on a : n up + un · uk = (n − p + 1) 2 k=p
Démonstration page 136
Point méthode La somme de termes consécutifs d’une suite arithmétique vaut le produit entre : • d’une part, la moyenne arithmétique du premier et du dernier terme ; • d’autre part le nombre de termes présents dans la somme.
107
Chapitre 4. Calculs algébriques et trigonométrie
3
Regroupements de termes
Sélection des termes d’indice pair ou impair Dans ce qui suit, I désigne un ensemble fini d’entiers. Étant donné une somme S = ak , il peut être intéressant de traiter séparément les k∈I
termes d’indices pairs et ceux d’indices impairs ; cela consiste à écrire : ak + ak , S= k∈I1
k∈I2
où • l’ensemble I1 est l’ensemble des éléments pairs de I : I1 = I ∩ (2IN) ;
• l’ensemble I2 est l’ensemble des éléments impairs de I : I2 = I ∩ (2IN + 1). Remarque Bien que cela soit un abus de notation, la décomposition précédente s’écrit le plus souvent ainsi : S= ak + ak . k∈I k pair
k∈I k impair
2n+1
Ex. 10. Considérons une somme S =
k=1
ak , avec n ∈ IN∗ , dans laquelle on souhaite séparer
les termes d’indices pairs et ceux d’indices impairs. On peut, bien-sûr, écrire : S=
ak +
k∈[[1,2n+1]] k pair
ak .
k∈[[1,2n+1]] k impair
Pour rendre la formule plus explicite, constatons que, dans l’ensemble [[1, 2n + 1]] : • les éléments pairs sont les entiers de la forme 2j tels que 1 2j 2n + 1 , autrement dit 1 j n + 21 , c’est-à-dire, puisque j est un entier, 1 j n ; 2 • les éléments impairs sont les entiers de la forme 2j + 1 tels que 1 2j + 1 2n + 1 , autrement dit 0 j n . On aboutit à la formule suivante : S =
n
a2j +
j=1
n
a2j+1 .
j=0
Sommation par paquets Dans certains calculs, le fait de regrouper les termes par paquets permet de faire apparaître des simplifications. Ex. 11. Soit n ∈ IN∗ . On souhaite calculer S =
2n
(−1)k k . Remarquons que l’on a :
k=1
S = −1 + 2 − 3 + 4 − 5 + 6 − · · · − (2n − 1) + 2n. Ainsi, en regroupant les termes deux à deux, il vient : S = (−1 + 2) + (−3 + 4) + (−5 + 6) + · · · + (−(2n − 1) + 2n) = 1 + 1 + 1 + · · · + 1 = n.
108
n termes
I Symboles
et
Remarque Dans l’exemple précédent, si l’on veut éviter le recours aux points de suspension, alors on peut écrire, en notant ak = (−1)k k : 2n
ak =
n a2j−1 + a2j , j=1
k=1
puis constater que : ∀j ∈ [[1, n]] a2j−1 + a2j = −(2j − 1) + 2j = 1 , et conclure n n 2n ak = 1 = n. a2j−1 + a2j = que j=1
k=1
j=1
Point méthode Le plus souvent, pour mettre en évidence un regroupement de termes pertinent, il est plus facile d’utiliser l’écriture avec des points de suspension. Effectuer une sommation par paquets revient alors à placer judicieusement les parenthèses.
Exo 4.2
4
Sommes télescopiques, produits télescopiques
Dans ce qui suit, on suppose p q . • On appelle somme télescopique toute somme de la forme
q
k=p
(ak+1 − ak ).
L’intérêt de ce type de somme est que sa simplification est immédiate, car tous les termes, sauf le premier et le dernier, se simplifient. En effet, on a : q k=p
(ak+1 − ak ) = (aq+1 − aq ) + (aq − aq−1 ) + · · · + (ap+2 − ap+1 ) + (ap+1 − ap ) = aq+1 + (−aq + aq ) + · · · + (−ap+1 + ap+1 ) − ap = aq+1 − ap .
Une autre manière de voir les choses est la suivante : q
k=p
(ak+1 − ak ) = =
q
k=p
ak+1 −
q+1
j=p+1
aj −
= aq+1 +
q
ak
q
ak
k=p
q
j=p+1
= aq+1 − ap .
([j = k + 1] dans la première somme)
k=p
aj −
=0
q
k=p+1
ak − ap 109
Chapitre 4. Calculs algébriques et trigonométrie • On appelle produit télescopique tout produit de la forme
q ak+1 , où les ak ak
k=p
sont supposés tous non nuls. La simplification d’un tel produit est immédiate. De façon analogue au calcul précédent, on a : q ap+1 ap+2 aq aq+1 ak+1 = · ··· · ak ap ap+1 aq−1 aq
k=p
=
aq aq+1 1 ap+1 · ··· · aq+1 = , ap ap+1 aq ap
ou, d’une autre manière plus formelle : q
k=p
ak+1 = ak
q
ak+1
k=p q
= ak
k=p
q+1
aj
j=p+1 q
([j = k + 1] dans le produit du haut)
ak
k=p
=
q
j=p+1
ap
aj aq+1
q
=
aj
aq+1 · ap
j=p+1
Ex. 12. Soit n ∈ IN∗ . On souhaite simplifier la somme S =
k+1 1 Pour k ∈ [[1, n]] , on a ln 1 + = ln k k On est donc devant une somme télescopique : S=
n k=1
5
n k=1
ln 1 +
1 . k
= ln(k + 1) − ln k .
ln(k + 1) − ln k = ln(n + 1) − ln 1 = ln(n + 1).
Quelques calculs remarquables
Somme des carrés des n premiers entiers Proposition 3 Pour n ∈ IN, on a
n
k=1
k2 =
n(n + 1)(2n + 1) · 6 Démonstration page 136
Principe de démonstration. Une preuve par récurrence est envisageable, mais nécessite de connaître à l’avance le résultat. Nous optons pour une autre démonstration, qui consiste à calculer de deux manières la somme télescopique
n
k=1
110
(k + 1)3 − k3 .
I Symboles Somme des termes d’une suite géométrique
et
Proposition 4 Pour a ∈ IR et (p, n) ∈ IN2 tel que p n, on a : n (1 − a) ak = ap − an+1 . k=p
Démonstration.
Pour a ∈ IR et p n on a, par télescopage : (1 − a)
Conséquence n
k=p
n
ak =
k=p
n k=p
(ak − ak+1 ) = ap − an+1 .
Si a �= 1 , alors pour tout (p, n) ∈ IN2 tel que p n, on a : ak =
ap − an+1 1−a
n
et en particulier
ak =
k=0
1 − an+1 · 1−a
Corollaire 5 Soit (un )n∈IN une suite géométrique de raison a �= 1 . Alors pour tout (p, n) ∈ IN2 tel que p n, on a : n up − un+1 · uk = 1−a k=p
Démonstration page 137
u −u
Point méthode Le numérateur de l’expression p 1−an+1 est la différence entre le premier terme de la somme et le premier terme manquant. Remarque La formule du corollaire 5 s’écrit aussi
n
uk = up
k=p
1 − an−p+1 , et l’on 1−a
peut remarquer que n − p + 1 est le nombre de termes de la somme. Factorisation de an − bn Proposition 6 Pour n ∈ IN∗ et (a, b) ∈ IR2 , on a : an − bn = (a − b)(an−1 + an−2 b + · · · + a bn−2 + bn−1 ) = (a − b) Démonstration. k=0
ak bn−1−k .
k=0
On a, en partant du membre de droite de l’égalité souhaitée :
n−1
(a − b)
n−1
ak bn−1−k =
n−1 k=0
ak+1 bn−1−k − ak bn−k =
n−1 k=0
ak+1 bn−(k+1) − ak bn−k .
On reconnaît alors une somme télescopique qui vaut an b0 − a0 bn , i.e. an − bn .
111
Chapitre 4. Calculs algébriques et trigonométrie Ex. 13. Factorisation de a2n+1 + b2n+1 . Soit n ∈ IN∗ et (a, b) ∈ IR2 . On a a2n+1 + b2n+1 = a2n+1 − (−b)2n+1 . Ainsi, en appliquant la formule de factorisation de la proposition 6 de la page précédente, on a :
a2n+1 + b2n+1 = a − (−b)
2n
ak (−b)(2n+1)−1−k
k=0
2n
= (a + b)
(−1)2n−k ak b2n−k
k=0
= (a + b)
2n
(−1)k ak b2n−k
(k et 2n − k ont la même parité).
k=0
6
Sommes doubles
Sommes sur un rectangle de la forme [[1, n]] × [[1, p]] Commençons par un exemple. j
Ex. 14.
1
2
3
4
1
−1
−2
1
4
2
2
0
0
2
1
3
3
−9
6
2
2
1
i
On considère (ai,j )(i,j)∈[[1,3]]×[[1,4]] une famille dont les termes sont indiqués dans le tableau ci-contre, et dont on souhaite calculer la somme : S=
ai,j .
−10 7 4 5 6 L’addition des réels étant commutative, l’ordre dans lequel on additionne les termes n’a pas d’importance. Présentons deux manières naturelles de calculer cette somme S : • on peut sommer d’abord les termes de chaque ligne du tableau, puis additionner les trois sommes ainsi obtenues : (i,j)∈[[1,3]]×[[1,4]]
S=
3 i=1
4
ai,j
j=1
=2+3+1 =6 ;
• on peut sommer d’abord les termes de chaque colonne du tableau, puis additionner les quatre sommes ainsi obtenues : S=
4 j=1
3
ai,j
i=1
= −10 + 4 + 5 + 7 = 6.
Plus généralement, pour toute famille de la forme (ai,j )(i,j)∈[[1,n]]×[[1,p]] , on a : n p p n ai,j . ai,j = ai,j = (i,j)∈[[1,n]]×[[1,p]]
i=1
j=1
j=1
i=1
Ainsi, le calcul d’une somme double sur un rectangle se ramène au calcul de deux sommes simples imbriquées. 112
I Symboles
et
Un cas particulièrement favorable est celui où la famille (ai,j )(i,j)∈[[1,n]]×[[1,p]] est telle qu’il existe deux familles (bi )i∈[[1,n]] et (cj )j∈[[1,p]] telles que : ∀(i, j) ∈ [[1, n]] × [[1, p]] ai,j = bi cj .
La somme double se ramène alors à un produit de deux sommes simples, comme l’énonce la proposition suivante : Proposition 7 Soit (bi )i∈[[1,n]] et (cj )j∈[[1,p]] deux familles de réels. On a : n p cj . bi b i cj = j=1
i=1
(i,j)∈[[1,n]]×[[1,p]]
Démonstration page 137
Ex. 15. Pour n ∈ IN∗ , on souhaite calculer S =
i 2j .
(i,j)∈[[1,n]]2
Étant dans le cadre de la proposition précédente, on a directement : S=
n i=1
i
n
j
2
j=1
=
n (n + 1) n+1 − 2) = n(n + 1)(2n − 1). (2 2
Ex. 16. (Formule de développement du carré d’une somme) Soit (ak )k∈[[1,n]] une famille de réels. En écrivant
n
ak
k=1
sition précédente donne :
n
ak
k=1
2
=
2
=
n
i=1
ai
n
j=1
aj , la propo-
ai aj .
(i,j)∈[[1,n]]2
En écrivant alors [[1, n]]2 comme une union disjointe :
[[1, n]]2 = (k, k) | k ∈ [[1, n]] ∪ (i, j) ∈ [[1, n]]2 : i < j ∪ (i, j) ∈ [[1, n]]2 : i > j , on obtient :
n k=1
ak
2
=
n
a2k +
k=1
ai aj +
1i sin 2θ . →135
4.27 Résoudre dans IR l’équation (E) : sin(θ) = cos(2θ) . 4.28 Résoudre l’inéquation (I) : sin2 θ 21 ·
144
Solutions des exercices
Solutions des exercices 4.1 1. Le produit des entiers pairs compris entre 1 et 2n s’écrit An =
(2k) .
k=1
Les règles de calculs du symbole
n
nous donnent alors :
An = 2n
n
k = 2n n! .
k=1
2. On a Bn = 1×3×· · ·×(2n−1)×(2n+1) . En multipliant le numérateur et le dénominateur par An , on voit apparaître : • au numérateur, le produit de tous les entiers compris entre 1 et 2n + 1 , c’est-à-dire (2n + 1)! ; • au dénominateur An , c’est-à-dire, d’après la première question, 2n n! . On en déduit : (2n + 1)! Bn = · 2n n! 4.2 1. Soit k ∈ IN∗ . En réduisant au même dénominateur, on a :
ka + (k + 1)b k(a + b) + b b a + = = · k+1 k k(k + 1) k(k + 1)
On constate alors que le couple (a, b) = (−1, 1) convient, c’est-à-dire que l’on a : 1 1 1 = − · k(k + 1) k k+1
∀k ∈ IN∗ ∗
2. Soit n ∈ IN . De ce qui précède on a n
Puis, par télescopage, on obtient
k=1
4.3 À i fixé, on a
i
n k=1
n
k=1
Intervertissons les deux symboles S=
2i =
1in 1ji
1 1 =1− · k(k + 1) n+1
2i = i 2i , ce qui explique que S =
j=1
1 1 1 = − · k(k + 1) k k+1
n i
2i .
i=1 j=1
:
2i =
1jin
2i =
1jn jin
n n
2i .
j=1 i=j
La somme interne est le somme des termes d’une suite géométrique (cf.proposition 4 de la page 111), que l’on sait donc calculer :
n
i=j
On obtient : S=
n j=1
2i = 2n+1 − 2j .
(2n+1 − 2j ) =
n j=1
2n+1 −
n
2j
j=1
et donc, à nouveau en reconnaissant une somme géométrique (la seconde somme ci-dessus) : S = n 2n+1 − (2n+1 − 2) = (n − 1)2n+1 + 2.
145
Chapitre 4. Calculs algébriques et trigonométrie 4.4 Pour tout k ∈ [[p, n]] , la formule de Pascal donne :
k+1 p+1
On a alors :
=
k p
+
k p+1
n k k=p
p
=
k+1 p+1
k p
=
n k+1
i.e.
p+1
k=p
k . p+1
k p+1
−
−
.
On reconnaît alors une somme télescopique, qui se simplifie en : n k
p
k=p
=
n+1 p+1
−
p , p+1
=0
d’où le résultat.
4.5 Soit x ∈ IR+ et n ∈ IN . • Si n = 0 , le résultat est vrai car les membres de droite et de gauche de l’inégalité valent tous les deux 1. • Supposons n 1 . D’après la formule du binôme on a : (1 + x)n =
n n
k
k=0
n n
xk = 1 + n x +
k=2
d’où le résultat. Remarque ture
n n
k=0
k
k
0
xk ,
Nous avons traité le cas n = 0 séparément afin de rendre licite l’écrixk = 1 + n x +
n n
k=2
k
xk (dans le cas n 1 ). Il se trouve que, comme le
terme nx est nul si n est nul, cette écriture est valable même dans ce cas. 4.6 1. On reconnaît la formule du binôme appliquée à (1 − 1)n , et l’on a (1 − 1)n = 0 puisque n 1 . 2. • De la relation précédente on déduit que
n k
k∈[[0,n]] k pair
=
n
• La formule du binôme donne de plus (1 + 1)n =
n
k∈[[0,n]] k pair
Il en résulte que :
n
k∈[[0,n]] k pair
1068
k
k
=
+
n n
k=0
n
k∈[[0,n]] k impair
k
n
k∈[[0,n]] k impair
k
.
k
k∈[[0,n]] k impair
k
, ce qui s’écrit :
= 2n .
= 2n−1 .
Remarque Nous venons d’obtenir que, si E est un ensemble à n éléments, alors il y a dans P(E) autant de parties de cardinal pair que de parties de cardinal impair.
146
Solutions des exercices 4.7 Pour k ∈ [[2, n]] , on a : ln donc :
k2 − 1 k2
= ln
S=
(k + 1)(k − 1)
n k=2
ln(k + 1) − ln(k) −
n k=2
ln(k) − ln(k − 1) .
On reconnaît alors deux sommes télescopiques, ce qui donne :
S = ln(n + 1) − ln(2) − ln(n) − ln(1) = ln
4.8 Afin d’alléger l’écriture, notons ak = cos
Un dessin nous donne l’intuition que les termes de la somme se compensent deux à deux : le terme d’indice k est l’opposé du terme d’indice 2n − k . En effet, pour k ∈ [[0, 2n]] , on a : a2n−k = cos
(2n − k) π
= ln(k + 1) − ln(k) − ln(k) − ln(k − 1) ,
k2
n+1 . 2n
kπ · 2n
π 2n
π 2n
π 2n
π 2n
a2n−1 2n | | | | kπ a2n−2 a2n a2 a1 a0 = cos π − 2n kπ = − cos = −ak . 2n Effectuons dans S le changement d’indice [j = 2n − k] . Lorsque k décrit [[0, 2n]] , j décrit le même ensemble. On a donc :
2n
S=
a2n−j .
j=0
Or, on a vu que pour tout j ∈ [[0, 2n]] , on a a2n−j = −aj . On en déduit que : S=
2n j=0
D’où S = 0 .
(−aj ) = −
2n j=0
aj = −S.
4.9 On remarque que tous les termes d’indice impair de la somme sont nuls, car pour k impair k π on a cos = 0 . On peut donc réécrire la somme en ne sommant que les termes d’indice 2 pair. Plus précisément, si l’on note I l’ensemble des entiers pairs appartenant à l’intervalle [[0, 2n]] , on a : k kπ 2 cos . S= 2 k∈I
En effectuant le changement d’indice [k = 2 j] , la somme S se réécrit : S=
n j=0
22j cos
2j π 2
=
n
4j cos(j π).
j=0
147
Chapitre 4. Calculs algébriques et trigonométrie Comme cos(j π) = (−1)j , cela permet de terminer le calcul, en reconnaissant la somme des termes d’une suite géométrique (cf. la proposition 4 de la page 111) : n
S=
(−4)j =
j=0
1 − (−4)n+1 · 5
4.10 On a : • d’une part,
n
(2k + 1) = 2
k=1
• d’autre part,
k+
k=1
n
k=1
n
n
1=2
k=1
n
k+n;
k=1
(k + 1)2 − k2 = (n + 1)2 − 1 (somme télescopique).
En identifiant les deux résultats obtenus et en simplifiant, on obtient bien : n
k=
k=1
n(n + 1) · 2
4.11 Le résultat est évidemment vrai pour n = 0 . Fixons n ∈ IN∗ . Comme suggéré par l’énoncé, calculons la somme S =
n
(k + 1)4 − k4
k=1
différentes. • D’une part, par télescopage, on a S = (n + 1)4 − 1 . • D’autre part, la formule du binôme donne : ∀k ∈ [[1, n]]
et donc :
S=4
n
n
de deux manières
(k + 1)4 − k4 = 4k3 + 6k2 + 4k + 1
k3 + 6
k=1
=4
n
k2 + 4
k=1
n
k+
k=1
n
1
k=1
k3 + n(n + 1)(2n + 1) + 2n(n + 1) + n.
k=1
En identifiant les deux expressions obtenues pour S et en simplifiant, on obtient bien : n
k3 =
k=1
4.12 Écrivons Sn =
n n
i=0 j=0 n
Puis :
Sn = −
n(n + 1) 2
i j=0
j+
n
j=i+1
i=
·
i (i + 1) i2 2n + 1 + (n − i) i = − + i. 2 2 2
n n n (n + 1) n (n + 1) (2n + 1) 2n + 1 1 2 2n + 1 + × · i + i=− 2 2 12 2 2 i=0
i=0
n(n + 1)(2n + 1) En simplifiant, il vient Sn = · 6
148
2
min(i, j) . Pour i ∈ [[0, n]] fixé, on a :
min(i, j) =
j=0
Solutions des exercices 4.13 1. Soit (i, j) ∈ [[1, n]]2 . Montrons que (ai − aj )(bi − bj ) 0 .
• Si i = j , c’est évident, car alors (ai − aj )(bi − bj ) = 0 . • Si i < j , alors on a ai − aj 0 et bi − bj 0 , donc (ai − aj )(bi − bj ) 0 . • Si i > j , alors on a ai − aj 0 et bi − bj 0 , donc (ai − aj )(bi − bj ) 0 .
2. Pour alléger les écritures, notons : A=
n
ak ;
B=
k=1
n
et
bk
C=
k=1
n
a k bk .
k=1
AB C , i.e. nC AB . Comme n n n somme de termes positifs, on a, pour tout j ∈ [[1, n]] :
Avec ces notations, nous souhaitons montrer que n i=1
(ai − aj )(bi − bj ) 0 ;
en développant et en séparant les sommes, il vient : n
a i bi +
i=1
ce qui se réécrit ainsi :
n i=1
a j bj −
n i=1
a i bj −
n
a j bi 0
i=1
C + naj bj − bj A − aj B 0.
Sommons pour j ∈ [[1, n]] l’inégalité obtenue : n j=1
C + naj bj − bj A − aj B 0
puis
2nC − 2AB 0.
On en déduit nC AB , ce qui est le résultat souhaité.
4.14 La formule du binôme donne (3x − 7y)
12
=
12 12 k=0
(3x)k (−7y)12−k .
k
Le terme qui nous intéresse est celui correspondant à k = 4 dans le somme ci-dessus. Le coefficient de x4 y 8 est donc 34 (−7)8 12 , ou encore, en simplifiant : 36 × 5 × 78 × 11 . 4 4.15 Notons S =
n n k
k=0
k
. Le terme d’indice 0 de la somme étant nul, on a :
S=
n n k
k=1
• Si n = 0 , alors S = 0 .
k
• Supposons n ∈ IN∗ . Pour tout k ∈ [[1, n]] , on a page 117). On a ainsi : S=
n n−1 n
k=1
k−1
=n
.
n k
=
n n−1 k k−1
(cf. exemple de la
n n−1 k=1
k−1
.
149
Chapitre 4. Calculs algébriques et trigonométrie Effectuons le changement d’indice [j = k − 1] : S=n
n−1 n−1 j
j=0
= n2n−1 ,
après avoir reconnu la formule du binôme appliquée à (1 + 1)n−1 .
4.16 Fixons m ∈ IN . Notons Hn l’assertion :
m+n p
Hn : ∀p ∈ [[0, m + n]]
p m n
=
k
k=0
p−k
et montrons par récurrence sur n que Hn est vrai pour tout n ∈ IN .
• Initialisation. Montrons H0 . Fixons p ∈ [[0, m]] , et montrons que :
m p
=
k
k=0
=
p−k
k
k=0
Cette formule est vraie car :
p m 0
p m 0
p−1 m 0 k
k=0
.
p−k
+
p−k
0 0
m p
=
=0 car p−k>0
m . p
=1
• Hérédité. Soit n ∈ IN . Supposons Hn et montrons Hn+1 . Fixons p ∈ [[0, m]] , et montrons que :
m+n+1 p
=
p m n+1 k
k=0
∗ Si p = 0 , la relation devient 1 = 1 , donc est vraie. ∗ Supposons p ∈ IN∗ . La relation de Pascal donne :
m+n+1 p
=
.
p−k
m+n p
+
m+n . p−1
En appliquant deux fois la propriété Hn , on a :
m+n+1 p
=
p m n k=0
k
p−k
+
p−1 m k=0
k
n . p−1−k
On peut, sans changer sa valeur, étendre la seconde somme jusqu’à k ∈ [[0, p]] , car le terme d’indice k = p est nul. On obtient alors le résultat souhaité en rassemblant les deux sommes puis en appliquant la relation de Pascal :
m+n+1 p
=
p m n k=0
=
p−k
p m n+1 k=0
150
k
k
p−k
.
+
n p−1−k
Solutions des exercices 4.17 L’opération élémentaire L2 ← 5L2 − 2L1 transforme (S) en un système triangulaire, que l’on résout du bas vers le haut : (S) ⇐⇒
5x + 3y −y
= =
−2 ⇐⇒ 19
x y
= =
11 −19.
En conclusion, le système (S) possède le couple (11, −19) comme unique solution.
Remarque Lors de la résolution précédente, nous avons préféré réaliser l’opération élémentaire L2 ← 5L2 − 2L1 plutôt que L2 ← L2 − 25 L1 , afin de conserver des coefficients entiers. C’est un léger abus de notation car L2 ← 5L2 − 2L1 n’est pas une opération élémentaire mais une succession de deux opérations élémentaires : L2 ← L2 − 25 L1 suivi de L2 ← 5L2 . 4.18 1. Afin de pouvoir choisir un pivot plus facilement, échangeons les deux lignes du système, puis l’ordre d’apparition des inconnues : (S) ⇐⇒
2x + y λx + 3y
= =
µ ⇐⇒ −2
y + 2x 3y + λx
L’opération élémentaire L2 ← L2 − 3L1 donne alors : (S) ⇐⇒
y + 2x (λ − 6)x
= =
= =
µ −2.
µ −2 − 3µ.
• Si λ �= 6 , alors le système (S) est triangulaire et possède une unique solution. On −2 − 3µ λµ + 4 , trouve comme unique solution le couple . λ−6 λ−6 • Si λ = 6 , alors on a : (S) ⇐⇒
y + 2x 0
= =
Deux cas se présentent : ∗ si µ �= − 32 , alors le système est incompatible ;
µ −2 − 3µ.
∗ si µ = − 23 , alors on a (S) ⇐⇒ y + 2x = − 23 ⇐⇒ y = − 32 − 2x ; il y a alors une infinité de solutions ; plus précisément, l’ensemble des solutions 2 x, − − 2x | x ∈ IR . est 3
4.19 • Méthode 1 : interprétation géométrique. Comme les triplets (1, 2, 3) et (3, 6, 9) sont proportionnels, les deux équations du système (S) correspondent géométriquement à deux plans parallèles. Ces deux plans sont alors disjoints (c’est-à-dire d’intersection vide) ou confondus. Pour savoir dans quel cas on se trouve (disjoints ou confondus), il s’agit de regarder si leurs équations sont proportionnelles ou non. On constate que ces deux équations sont proportionnelles si, et seulement si, λ = 9 . ∗ Si λ �= 9 , alors le système est incompatible. ∗ Si λ = 9 , alors le système (S) se réduit à la seule équation : (S) ⇐⇒ x + 2 y + 3 z = 3.
L’ensemble solution est alors l’ensemble des coordonnées des points du plan d’équation x + 2 y + 3 z = 3 , que l’on peut paramétrer en exprimant par exemple x en fonction de y et z : (3 − 2y − 3z, y, z) | (y, z) ∈ IR2 .
151
Chapitre 4. Calculs algébriques et trigonométrie • Méthode 2 : par la méthode du pivot.
x +2y + 3z = 3 0 = λ − 9. On voit apparaître une équation de compatibilité, qui mène à la même conclusion :
L’opération élémentaire L2 ← L2 − 3L1 donne : (S) ⇐⇒ ∗ si λ �= 9 , alors le système est incompatible ; ∗ si λ = 9 , alors (S) ⇐⇒ x + 2y + 3z = 3 .
4.20 • Pour un choix de pivot plus facile, commençons par échanger les lignes 1 et 3 :
(S) ⇐⇒
x + by + az = 1 x + aby + z = b ax + by + z = 1.
• Les opérations L2 ← L2 − L1 et L3 ← L3 − aL1 donnent alors : (S) ⇐⇒
+
x
by b(a − 1)y b(1 − a)y
+ + +
az (1 − a)z (1 − a2 )z
= = =
1 b−1 1 − a,
puis, l’opération L3 ← L3 + L2 donne : (S) ⇐⇒
x
+
by b(a − 1)y
+ +
az (1 − a)z (a + 2)(1 − a)z
= = =
1 b−1 b − a.
• Si b �= 0 et a ∈ / {1, −2} , alors le système (S) est triangulaire ; il possède une unique solution, que l’on obtient en déterminant successivement z , y puis x :
ab + b − 2 a−b a−b , , (a + 2)(a − 1) b(a + 2)(a − 1) (a + 2)(a − 1)
• Si a = 1 , alors : (S) ⇐⇒
+
x
by
+
z 0 0
= = =
.
1 b−1 b − 1.
Le système est compatible si, et seulement si, b = 1 , auquel cas (S) ⇐⇒ x + y + z = 1, et alors l’ensemble solution de (S) est : (1 − y − z, y, z) | (y, z) ∈ IR2 .
• Si a = −2 , alors :
(S) ⇐⇒
x
+
by −3by
− +
2z 3z 0
= = =
1 b−1 b + 2.
Ce système est compatible si, et seulement si, b = −2 , auquel cas : (S) ⇐⇒
x
−
et l’on obtient comme ensemble solution :
z, −
152
2y 6y
− +
2z 3z
= =
z+1 , z | z ∈ IR . 2
1 −3
Solutions des exercices • Considérons pour finir le seul cas non encore traité : b = 0 et a ∈ / {1, −2} . Alors :
�
(S) ⇐⇒
+
x
= = =
az (1 − a)z (a + 2)(1 − a)z
1 −1 −a.
L’opération L3 ← L3 − (a + 2)L2 donne alors : (S) ⇐⇒
�
+
x
= = =
az (1 − a)z 0
1 −1 2,
et met en évidence que le système (S) est incompatible. 4.21 Effectuons les opérations L2 ← L2 − 2L1 , L3 ← L3 − 7L1 et L4 ← L4 + 4L1 : (S) ⇐⇒
x
3y 10y 30y 30y
− −
+ − − +
2z 3z 9z 9z
+
Effectuons alors L3 ← L3 − 3L2 et L4 ← L4 + 3L2 : (S) ⇐⇒
x
−
3y 10y
+ −
2z 3z
= = = =
t
+
−2 8 24 −24.
= = = =
t 0 0
−2 8 0 0.
On voit apparaître deux équations de compatibilités vérifiées, et l’on a : (S) ⇐⇒
�
x
−
3y 10y
+ −
2z 3z
+
t
= =
−2 8
− +
2z 3z.
−2 8.
Prenons z et t comme inconnues secondaires : (S) ⇐⇒
�
x
−
3y 10y
= =
−
t
Après calcul, on obtient comme ensemble solution :
��
�
�
11z 8 + 3z 2 − − t, , z, t | (z, t) ∈ IR2 · 5 10 10
4.22 Rappelons que, comme conséquence des formules de duplication (cf.corollaire 21 de la page 129), on a : cos2 (a) =
∀a ∈ IR
1 + cos(2a) 2
On obtient dans notre cas : 2
cos Puisque cos
�π� 4
=
� � π 8
√ 2 2
1 + cos = 2
�π� 4
sin2 (a) =
et
2
et
sin
et
sin2
, cela donne :
cos2
� � π 8
=
√ 2+ 2 4
1 − cos(2a) · 2
� �
1 − cos = 2
� �
=
π 8
π 8
�π� 4
·
√ 2− 2 · 4
153
Chapitre 4. Calculs algébriques et trigonométrie Enfin, puisque 0
π 8
π 2
, on a cos
π cos 8
=
2+ 2
π 8
√
0 et sin
2
et
π 8
0 , donc :
π sin 8
=
2− 2
√
2
·
4.23 L’équation (E) est définie sur IR et l’on a, d’après la proposition 25 de la page 134 :
(E) ⇐⇒ θ ≡ 2θ [2π] ⇐⇒
ou
− θ ≡ 0 [2π]
⇐⇒ θ ≡ 0 [2π]
θ ≡ π − 2θ [2π]
ou
3θ ≡ π [2π]
π θ≡ 3
ou
2π 3
M π3 2π 3
Mπ
.
S = {2kπ | k ∈ ZZ} ∪ Remarque
4.24 • Si θ ≡
π 2
M0
2π 3
Ainsi, l’ensemble des solutions de (E) est :
π 3
M− π3
2kπ π + | k ∈ ZZ . 3 3
Cela correspond géométriquement à 4 points sur le cercle trigonométrique.
[π] , alors sin θ = ±1 et cos θ = 0 .
Par suite une telle valeur n’est pas solution de (E) .
• Supposons θ �≡ Puisque
√
π 2
[π] . Alors on a cos θ �= 0 et donc :
θ solution de (E) ⇐⇒ tan θ =
3 = tan
π 3
, l’ensemble des solutions de (E) est : S=
√ 3 .
π + k π | k ∈ ZZ . 3
4.25 Résolvons (I) par équivalences successives, le point central étant de se ramener à utiliser la formule d’addition de sin : √ √ 3 1 cos θ 0 (I) ⇐⇒ sin θ − 3 cos θ 0 ⇐⇒ sin θ − 2 2 π ⇐⇒ sin θ − 0 3 π ⇐⇒ θ − ∈ 2kπ, (2k + 1)π 3 k∈Z Z
⇐⇒ θ ∈ Ainsi, l’ensemble solution de (I) est :
k∈Z Z
π
k∈Z Z
3
+ 2kπ,
π + (2k + 1)π . 3
π π + 2kπ, + (2k + 1)π . 3 3
Remarque De manière générale, il est possible de transformer toute expression de la forme a cos θ + b sin θ avec (a, b) ∈ IR2 \ {(0, 0)} en une expression de la forme r cos(θ − ϕ) avec (r, ϕ) ∈ IR∗+ × IR (cf.proposition 18 de la page 172).
154
Solutions des exercices 4.26 L’équation (I) est définie sur IR et l’on a : (I) ⇐⇒ sin θ > 2 sin θ cos θ ⇐⇒ (1 − 2 cos θ) sin θ > 0
⇐⇒ 1 − 2 cos θ > 0 ⇐⇒
cos θ
0
sin θ > 0
ou
ou
1 − 2 cos θ < 0
cos θ >
1 2
et
En visualisant ces conditions sur le cercle trigonométrique, nous pouvons conclure que l’ensemble solution de l’inéquation (I) vaut S1 ∪ S2 avec : S1 =
π
k∈Z Z
et S2 =
3
+ 2kπ, π + 2kπ
π
k∈Z Z
−
3
et
sin θ < 0
sin θ < 0
M π3 2π 3
π 3
Mπ
M0
2π 3
M− π3
+ 2kπ, 2kπ .
4.27 On a : (E) ⇐⇒ sin θ = 1 − 2 sin2 θ ⇐⇒ 2 sin2 θ + sin θ − 1 = 0
L’équation 2x2 + x − 1 = 0 ayant comme racines réelles −1 et (E) ⇐⇒ sin θ ∈
1 2
, on a :
1 − 1, . 2
Cela correspond à 3 points sur le cercle trigonométrique, et l’on obtient comme ensemble solution de (E) :
−
π + 2kπ | k ∈ ZZ ∪ 2
π + 2kπ | k ∈ ZZ ∪ 6
5π + 2kπ | k ∈ ZZ . 6
4.28 On a :
M 3π
M π4
4
√ 2 2 (I) ⇐⇒ sin θ ∈ − , . 2 2
√
y=
√
2 2
π 4
Sur le cercle trigonométrique, cet encadrement de sin θ correspond à deux arcs de cercles, indiqués en gras sur le dessin ci-contre.
M 5π
M− π4
4
y=−
√ 2 2
On obtient comme ensemble des solutions de l’inéquation (I) :
π
k∈Z Z
−
4
+ kπ,
π + kπ . 4
155
Chapitre 5 : Nombres complexes I
L’ensemble des nombres complexes . . . . . Définition . . . . . . . . . . . . . . . . . . . Conjugué d’un nombre complexe . . . . . . Module d’un nombre complexe . . . . . . . Nombres complexes de module 1 . . . . . . Formules d’Euler . . . . . . . . . . . . . . . Formule de Moivre . . . . . . . . . . . . . . Forme trigonométrique, argument . . . . . Exponentielle complexe . . . . . . . . . . . Résolution d’équations dans C . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . .
Équation du second degré dans C . . . . . Racines n -ièmes d’un nombre complexe . . III Applications géométriques . . . . . . . . . . 1 Alignement et orthogonalité . . . . . . . . . 2 Transformations remarquables du plan . . . Démonstrations . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. 175 . 179 181 . 181 . 182 185 189
1 2 3 4 5 6 7 8 II 1 2
159 159 161 162 166 168 169 171 173 175
Nombres complexes
5
Un peu d’histoire Dans son Ars Magna (1545), Jérôme Cardan (1501-1576) donne une formule permettant d’exprimer algébriquement la racine réelle de l’équation x3 + p x + q = 0 dans le cas où −∆ = 4 p3 + 27 q 2 > 0 , racine qui vaut alors : 3 3 q q −∆ −∆ + − − · x= − + 2 108 2 108 Par la suite, Raphaël Bombelli eut l’audace de vouloir appliquer cette formule à l’équation x3 = 15 x + 4 pour laquelle on a ∆ = 121 × 108 et imagina un nombre que √ l’on noterait aujourd’hui −1 dont le carré est égal à −1 . Il obtint ainsi : √ √ 3 3 x = 2 + 11 −1 + 2 − 11 −1. √ En utilisant avec ce −1 les mêmes règles de calcul que dans IR, il trouva : √ 3 √ 2 + −1 = 2 + 11 −1, √ √ puis x = 2 + −1 + 2 − −1 = 4 , qui est effectivement racine de l’équation donnée. Leonhard Euler (1707-1783) a introduit la notation i pour représenter un tel nombre dont le carré vaut −1 . C’est cette notation que l’on utilise encore de nos jours, puisque les nombres complexes sont maintenant notés x + i y avec x et y réels.
I L’ensemble des nombres complexes
I
L’ensemble des nombres complexes
1
Définition
La construction de l’ensemble des nombres complexes est hors-programme. On admet donc 1 qu’il existe un ensemble C contenant IR, • muni d’une addition notée + et d’une multiplication notée × , ou le plus souvent implicitement (c’est-à-dire sans symbole, comme dans IR), avec lesquelles on calcule comme dans IR, • possédant un élément noté i dont le carré vaut −1 ,
• dont tout élément, appelé nombre complexe ou complexe, s’écrit de manière unique sous la forme x + i × y ou encore x + i y , avec x et y réels. Ainsi : • pour tout élément z de C, il existe un unique couple (x, y) ∈ IR2 tel que z = x + i y ; les réels x et y sont alors respectivement appelés partie réelle et partie imaginaire du complexe z , et l’on note alors : x = Re z
et
y = Im z ;
• si z ∈ C, z ′ ∈ C et si l’on pose x = Re z , y = Im z , x′ = Re z ′ , y ′ = Im z ′ , alors (en utilisant les mêmes règles de calcul que dans IR) on a : z + z ′ = (x + x′ ) + i (y + y ′ ) z z ′ = (x x′ − y y ′ ) + i (x y ′ + y x′ ) ; • un complexe z est réel si, et seulement si, Im z = 0 (autrement dit le réel x s’identifie au nombre complexe x + 0 i ) ; • en particulier, le complexe 0 + 0 i se note simplement 0 . Il coïncide avec le 0 de IR. Un nombre complexe z est nul s’il est égal à 0 , ce qui est encore équivalent à Re z = Im z = 0 ; • les complexes dont la partie réelle est nulle sont appelés imaginaires purs ; z est donc imaginaire pur si, et seulement s’il existe y ∈ IR tel que z = i y . L’ensemble des imaginaires purs est noté i IR. Conséquences de l’unicité de l’écriture • Deux nombres complexes sont égaux si, et seulement s’ils ont même partie réelle et même partie imaginaire. • On a, pour tout (z, z ′ ) ∈ C2 :
Re(z + z ′ ) = Re z + Re z ′ Re(z z ′ ) = Re z Re z ′ − Im z Im z ′
et Im(z + z ′ ) = Im z + Im z ′ , et Im(z z ′ ) = Re z Im z ′ + Re z ′ Im z.
• Pour tout complexe z , le complexe −z = − Re z − i Im z est appelé opposé de z . C’est l’unique nombre complexe z ′ tel que z + z ′ = 0 . • Tout complexe z �= 0 possède un inverse unique (pour la multiplication) car, si x = Re z et y = Im z , alors : x y − 2 i vérifie z z ′ = z ′ z = 1. z′ = 2 x + y2 x + y2 1. On pourra trouver page 733 une construction effective de C .
159
Chapitre 5. Nombres complexes On peut trouver z ′ en cherchant x′ et y ′ vérifiant le système : x x′ − y y ′ = 1
et
x y ′ + y x′ = 0,
mais la proposition 6 de la page 164 donnera une méthode plus immédiate pour trouver ce résultat. Cet inverse z ′ est noté z −1 ou
1 z·
• On en déduit, comme dans IR, que si les complexes z et z ′ vérifient z z ′ = 0 , alors on a z = 0 ou z ′ = 0 . En effet, si z �= 0 , alors en multipliant l’égalité z z ′ = 0 par z −1 , on obtient z ′ = 0 . Remarques • Les règles de calcul étant les mêmes dans C et IR, toutes les formules qui n’utilisent que ces règles de calcul et qui sont valables dans IR le sont dans C. C’est vrai en particulier de la formule du binôme : n n k n−k 2 ′ n ∀n ∈ IN ∀(z1 , z2 ) ∈ C (z + z ) = z z2 , k 1 k=0
de la formule donnant la somme de termes consécutifs d’une suite géométrique : ∀(p, n) ∈ IN
2
∀z ∈ C \ {1}
n+p k=p
zk =
z n+p+1 − z p z−1
et de la factorisation : ∀n ∈ IN∗
∀(a, b) ∈ C2
an − bn = (a − b)
n−1
ak bn−1−k .
k=0
De même, les méthodes de résolution d’un système linéaire (pivot de Gauss par exemple) sont les mêmes et un système linéaire de deux équations à deux inconnues : ax+ by = e c x + d y = f. a b = ad − bc admet une unique solution si, et seulement si, son déterminant c d est non nul.
• Contrairement à IR, l’ensemble C ne peut pas être muni d’une relation d’ordre compatible avec les opérations, c’est-à-dire pour laquelle le produit de deux nombres positifs est positif et l’opposé d’un nombre positif est négatif. En effet, si une telle relation d’ordre existait, le carré d’un complexe non nul quelconque serait toujours strictement positif, car, pour tout z ∈ C, on a z 2 = (−z)2 et l’un des deux nombres z ou −z serait positif. On aurait alors 1 = 12 > 0 et i2 = −1 > 0 , ce qui est contradictoire.
Nous ne pourrons donc pas dire qu’un complexe est positif ou qu’il est inférieur à un autre. 160
I L’ensemble des nombres complexes Représentation géométrique Le plan usuel étant muni d’un repère orthonormé direct (O,�ı, �), tout point M est −−→ caractérisé par un unique couple de coordonnées (x, y) vérifiant OM = x�ı + y � : • le complexe z = x + i y est alors appelé affixe de M ;
y Im z
• le point M est aussi appelé image de z .
Mz
Dans toute la suite de ce chapitre, l’image de z x O est notée Mz . Re z De même, pour tout vecteur �u = x�ı + y �, le complexe z = x + i y est aussi appelé affixe du vecteur u �. Proposition 1 Si �u1 et �u2 sont deux vecteurs d’affixes z1 ∈ C et z2 ∈ C, et λ un réel, alors l’affixe → est z + z et celle de λ − → est λ z . →+− u u de − u 1 2 1 2 1 1 − − → Si A et B sont deux points d’affixes a et b , alors l’affixe de AB est b − a. Démonstration.
Cela résulte des règles de calcul sur les complexes et sur les composantes
des vecteurs du plan.
2
Conjugué d’un nombre complexe
Définition 1 Pour tout complexe z , on appelle conjugué de z le complexe z¯, défini par : z¯ = Re z − i Im z. Ex. 1. On représente les points M1 , M−1 , Mi et M−i . Plus généralement, on remarque
que Mz et M−z sont symétriques par rapport à O et que Mz et Mz¯ sont symétriques par rapport à l’axe des abscisses. y
M−1
y
Mi
O
Mz M1 x
x
O M−z
M−i
Mz¯
Proposition 2 Pour tout z ∈ C, on a : Démonstration.
Re z =
z + z¯ 2
Im z =
z − z¯ 2i
et
z¯ = z .
Il suffit de faire le calcul.
161
Chapitre 5. Nombres complexes Corollaire 3 Un complexe z est réel si, et seulement si, z = z¯ . Un complexe z est imaginaire pur si, et seulement si, z = − z¯ . Proposition 4 Pour tous z1 et z2 dans C, on a : z1 + z2 = z1 + z2 , z1 z2 = z1 z2
et
z1 z2
=
z1 z2
si z2 �= 0. Démonstration page 185
Principe de démonstration. • Pour la somme et le produit, faire le calcul à l’aide des parties réelles et imaginaires. • Pour le quotient, poser u =
z1 z2
et utiliser le résultat précédent avec z1 = u z2 .
Remarque On en déduit, par une récurrence immédiate, que pour tous complexes z1 , . . . , zn , on a z1 + · · · + zn = z1 + · · · + zn et z1 · · · zn = z1 · · · zn . En particulier, pour tout complexe z et tout n ∈ IN, on a z n = z n . Point méthode Les règles de calcul précédentes permettent de calculer des conjugués souvent bien plus efficacement qu’en utilisant les parties réelle et imaginaire. Ex. 2. Soit n ∈ IN , (a0 , . . . , an ) ∈ IRn+1 et la fonction polynomiale P définie, sur C , n k
par P : z �→
ak z .
k=0
D’après les règles de calcul sur les conjugués, on a, pour tout z ∈ C : P (z) =
n k=0
ak z k =
n
ak z k =
k=0
n
ak z¯k = P (¯ z ).
k=0
En effet, pour tout k ∈ [[0, n]] , on a ak = ak car ak ∈ IR .
3
Module d’un nombre complexe
Soit z ∈ C. On a alors : Exo 5.1 Exo 5.2 Exo 5.3
z z¯ = (Re z + i Im z) (Re z − i Im z) = (Re z)2 + (Im z)2 ,
et donc z z¯ ∈ IR+ , ce qui permet de valider la définition suivante.
Définition 2 Pour tout z ∈ C, le module de z est le réel positif noté |z| défini par : √ |z| = z z¯ = (Re z)2 + (Im z)2 . 162
I L’ensemble des nombres complexes Compatibilité Lorsque le complexe z est réel, le module de z est égal à sa valeur absolue et ils se notent l’un et l’autre |z|. Point méthode Pour calculer |z| ou l’utiliser, ne pas vouloir systématiquement √ appliquer la formule |z| = (Re z)2 + (Im z)2 ; penser aussi à |z| = z z¯ . Ex. 3. Soit z ∈ C \ {−i} et z ′ =
z−i · Cherchons à quelle condition on a |z ′ | = 1 . On a : z+i
|z ′ |2 = z ′ z¯′ =
z z¯ + i z − i z¯ + 1 z − i z¯ + i · = · z + i z¯ − i z z¯ − iz + i¯ z +1
On en déduit : |z ′ | = 1 ⇔ |z ′ |2 = 1 ⇔ z z¯ + i z − i z¯ + 1 = z z¯ − i z + i z¯ + 1 ⇔ z = z¯. On a donc |z ′ | = 1 si, et seulement si, z est réel.
Interprétation géométrique Si z1 ∈ C et z2 ∈ C, alors |z1 − z2 | est la distance entre les points Mz1 et Mz2 . En effet, posons z1 = x1 + i y1 et z2 = x2 + i y2 avec x1 , y1 , x2 et y2 réels. Par définition du module, on a alors : |z1 − z2 | = (x1 − x2 )2 + (y1 − y2 )2 = Mz1 Mz2 .
On en déduit que, ω ∈ C et r ∈ IR∗+ étant donnés, l’ensemble des points Mz tels que |ω −z| = r (resp. |ω −z| r ) est le cercle (resp. le disque) de centre Ω, d’affixe ω , et de rayon r . y y
r
r
Ω O Cercle
Ω O
x
Mz : |ω − z| = r
Disque
Mz : |ω − z| r
Ex. 4. Reprenons l’exemple 3 pour en donner une solution géométrique. Soit z ∈ C \ {−i} et z ′ = z−i · Cherchons à quelle condition on a |z ′ | = 1 . z+i
x
Notons A, B, M les points d’affixe i, −i, z . On a :
|z ′ | = 1 ⇔ |z − i| = |z + i| ⇔ M A = M B. Ainsi |z ′ | = 1 équivaut à M appartient à la médiatrice de [AB] , c’est-à-dire à la droite (O,�ı) . La condition cherchée est donc « z réel ».
163
Chapitre 5. Nombres complexes Proposition 5 Pour tout complexe z , on a : • |z| = |−z| = |¯ z |,
• z = 0 si, et seulement si, |z| = 0 , • Re z |z| et Im z |z|.
Principe de démonstration.
Utiliser |z| =
Cas d’égalité
Démonstration page 185
(Re z)2 + (Im z)2 .
L’égalité | Re z| = |z| équivaut à z réel. En effet, on a : | Re z| = |z| ⇔ (Re z)2 = (Re z)2 + (Im z)2 ⇔ Im z = 0 ⇔ z ∈ IR. De plus Re z = |z| ⇔ (| Re z| = |z| et Re z 0) , donc Re z = |z| équivaut à z ∈ IR+ . On montre de même que | Im z| = |z| équivaut à z imaginaire pur.
Proposition 6 Pour tout z ∈ C∗ on a
z¯ 1 1 = 2 · De plus, |z| = 1 équivaut à = z¯ . z |z| z
Démonstration page 185
Remarque On retrouve ainsi l’expression de l’inverse donnée page 159. En effet, z¯ x−iy 1 · si z = x + i y , avec x et y réels, alors = 2 = 2 z |z| x + y2 Proposition 7 (Module d’un produit et d’un quotient) Exo 5.4
Pour tout (z1 , z2 ) ∈ C2 , on a :
Exo 5.5
|z1 z2 | = |z1 | |z2 |
et,
si z2 �= 0 ,
z1 |z1 | = z2 |z2 | ·
Démonstration page 185
Principe de démonstration.
• Pour la première relation, utiliser |z|2 = z z¯ . • Pour la seconde, partir de z1 = zz21 z2 , et utiliser le premier point.
Remarque On en déduit, par une récurrence immédiate, que pour tous complexes z1, . . . , zn , on a |z1 · · · zn | = |z1 | · · · |zn |. En particulier, pour z ∈ C et n ∈ IN, on a z n = |z|n .
Proposition 8 (Inégalité triangulaire) Pour z1 ∈ C et z2 ∈ C, on a :
|z1 + z2 | |z1 | + |z2 |,
avec égalité si, et seulement si, z1 = 0 ou ∃u ∈ IR+ 164
z2 = u z1 .
I L’ensemble des nombres complexes Démonstration.
Soit z1 et z2 deux nombres complexes.
• On a, d’une part :
|z1 + z2 |2 = (z1 + z2 )(z1 + z2 ) = |z1 |2 + |z2 |2 + z1 z2 + z1 z2
et, d’autre part :
= |z1 |2 + |z2 |2 + z1 z2 + z1 z2 = |z1 |2 + |z2 |2 + 2 Re (z1 z2 ) ,
(|z1 | + |z2 |)2 = |z1 |2 + |z2 |2 + 2|z1 | |z2 |. L’inégalité |z1 + z2 | |z1 | + |z2 | équivaut donc à Re (z1 z2 ) |z1 | |z2 | , ce qui est vrai car : Re (z1 z2 ) |Re (z1 z2 )| |z1 z2 | = |z1 | |z2 | = |z1 | |z2 |.
• On a égalité si, et seulement si, Re(z1 z2 ) = |z1 | |z2 | , c’est-à-dire Re(z1 z2 ) = |z1 z2 | . On a montré page 164 que cela équivaut à z1 z2 ∈ IR+ . Cela est vérifiée si z1 = 0 . z2 z2 Si z1 �= 0 , alors z1 z2 = |z1 |2 . Comme |z1 |2 ∈ IR∗+ , alors z1 z2 ∈ IR+ équivaut à ∈ IR+ , z1 z1 c’est-à-dire à l’existence de u ∈ IR+ tel que z2 = u z1 .
Interprétation géométrique Soit z1 ∈ C et z2 ∈ C. −−→ −−−→ −−−→ On pose N = Mz1 +z2 . On a ON = OMz1 + OMz2 si bien que OMz1 N Mz2 est un parallélogramme. −−−−→ Alors z2 est l’affixe de Mz1 N , si bien que l’inégalité |z1 + z2 | |z1 | + |z2 | correspond à :
N = Mz1 +z2
y M z2
ON OMz1 + Mz1 N.
On retrouve l’inégalité triangulaire au sens de la géométrie plane. La condition « z1 = 0 ou z2 = u z1 avec u ∈ IR+ » de la proposition précédente signifie −−−−→ −−−→ géométriquement que les vecteurs OMz1 et Mz1 N sont colinéaires et de même sens, c’est-à-dire que Mz1 appartient au segment [ON ].
M z1 O
x
Remarque Il résulte de l’inégalité triangulaire, par une récurrence immédiate que, n n ∗ n pour n ∈ IN et (z1 , . . . , zn ) ∈ C on a : zk |zk |. k=1
k=1
Ex. 5. Étudions le cas d’égalité : |z1 + z2 + z3 | = |z1 | + |z2 | + |z3 | , pour trois complexes non nuls z1 , z2 , z3 . • Supposons cette égalité réalisée. On a, par inégalité triangulaire :
|z1 + z2 + z3 | |z1 + z2 | + |z3 | |z1 | + |z2 | + |z3 |.
Comme les termes extrêmes sont égaux, on a en fait deux égalités. On a donc : |z1 + z2 + z3 | = |z1 + z2 | + |z3 |
et
|z1 + z2 | = |z1 | + |z2 |.
On utilise alors le cas d’égalité dans l’inégalité triangulaire pour deux nombres complexes (cf.proposition 8 de la page précédente). ∗ Par hypothèse, z1 et z2 sont non nuls, donc l’égalité |z1 + z2 | = |z1 + |z2 | implique l’existence de u ∈ IR∗+ tel que z2 = u z1 .
165
Chapitre 5. Nombres complexes ∗ On a alors z1 + z2 = (1 + u)z1 �= 0 , donc l’égalité |(z1 + z2 ) + z3 | = |z1 + z2 | + |z3 | implique l’existence de u′ ∈ IR∗+ tel que z3 = u′ (z1 + z2 ) = u′ (1 + u)z1 . En posant v = u′ (1 + u) , on a v ∈ IR∗+ et z3 = vz1 .
• Réciproquement, s’il existe u et v dans IR∗+ tels que z2 = u z1 et z3 = v z1 , on a : |z1 + z2 + z3 | = |(1 + u + v)z1 | = (1 + u + v)|z1 | = |z1 | + u |z1 | + v |z1 | = |z1 | + |z2 | + |z3 |, car u et v sont des réels positifs, donc sont égaux à leur module.
Corollaire 9 (Seconde inégalité triangulaire) Pour z1 ∈ C et z2 ∈ C, on a : |z1 | − |z2 | |z1 − z2 |. Principe de démonstration.
Démonstration page 185
Utiliser la première inégalité et l’écriture z1 = (z1 − z2 ) + z2 .
Corollaire 10 Pour tout z1 ∈ C et tout z2 ∈ C, on a : |z1 | − |z2 | |z1 ± z2 | |z1 | + |z2 |.
4
Nombres complexes de module 1
Notation
L’ensemble des nombres complexes de module 1 est noté U .
Les règles de calcul sur les modules des produits et quotients de nombres complexes nous donnent immédiatement les résultats de la proposition suivante. Proposition 11 • Le produit de deux éléments de U est élément de U. • L’inverse de tout élément de U est élément de U.
z Remarque Pour tout z ∈ C, non nul, |z| ∈ U. En effet, on a, puisque |z| ∈ IR+ : z = |z| = |z| = 1. |z| |z| |z|
Définition 3
Pour tout réel θ , on note eiθ le nombre complexe défini par eiθ = cos θ + i sin θ. Remarque Lorsque θ = 0 , alors on a eiθ = 1 ; ainsi, cette nouvelle définition est compatible avec la valeur que donne en 0 la fonction exponentielle déjà connue sur IR. Les résultats de la page 124 concernant le paramétrage du cercle trigonométrique se traduisent alors par la proposition suivante. 166
I L’ensemble des nombres complexes Proposition 12 • Pour tout θ ∈ IR, on a |eiθ | = 1 et donc eiθ ∈ U .
• Réciproquement, pour z ∈ U, il existe θ ∈ IR tel que z = eiθ .
• Si θ et ϕ sont deux réels, on a eiθ = eiϕ si, et seulement si, θ ≡ ϕ [2π]. π
π
Ex. 6. On a en particulier ei 2 = i , e−i 2 = −i et eiπ = −1 . Remarque La proposition 12 montre que l’application θ �→ eiθ va de IR dans U , qu’elle est surjective, mais pas injective. Proposition 13 Pour θ ∈ IR et ϕ ∈ IR, on a : eiθ × eiϕ = ei(θ+ϕ)
e−iϕ =
1 = eiϕ eiϕ
eiθ = ei(θ−ϕ) . eiϕ
et
Démonstration page 185
Principe de démonstration. • La première relation est conséquence directe des formules d’addition vues en trigonométrie. • Les autres découlent immédiatement de la première.
Remarque La formule eiθ × eiϕ = ei(θ+ϕ) justifie l’utilisation de la notation exponentielle. Représentation géométrique Soit θ ∈ IR. • D’après ce que l’on a vu en trigonométrie, le point Uθ d’affixe eiθ est le point du −−→ cercle trigonométrique tel que �ı, OUθ ≡ θ [2π]. • On en déduit les symétries existant entre les divers points Uθ , Uπ−θ , Uπ+θ et U−θ , comme on le voit, ci-dessous, sur le dessin de gauche. π
π
• Sur le dessin de droite sont représentés les points d’affixe ei 2 , eiπ et e−i 2 . y
y
eiθ
ei(π−θ) θ
x
O ei(π+θ)
π
ei 2 = i
eiπ = −1
x
O
e−iθ π
e−i 2 = −i
Point méthode Si l’on écrit la formule précédente sous la forme : (cos θ + i sin θ) (cos ϕ + i sin ϕ) = cos(θ + ϕ) + i sin(θ + ϕ), cela permet, en développant et en identifiant parties réelles et imaginaires, de retrouver, de tête, les formules d’addition.
167
Chapitre 5. Nombres complexes
5
Formules d’Euler
Proposition 14 (Formules d’Euler) Pour θ ∈ IR, on a
eiθ + e−iθ 2
cos θ =
et
sin θ =
eiθ − e−iθ · 2i
Démonstration. Ces formules résultent de la proposition 2 de la page 161, car eiθ = e−iθ . Application des formules d’Euler à la trigonométrie, linéarisation Point méthode Soit θ ∈ IR. En développant avec la formule du bin n iθ iθ + e−iθ e e − e−iθ n n ou sin θ = et en regroupant ensuite nôme cos θ = 2 2i les termes deux à deux, on obtient une expression de cosn θ en fonction des cos(kθ) ou des sin(kθ) pour 0 k n. On dit qu’ainsi on a linéarisé cosn θ et sinn θ . Ex. 7. Pour n = 2 , on trouve les formules bien connues : cos2 θ =
1 + cos(2θ) 2
et
sin2 θ =
1 − cos(2θ) · 2
Traitons le cas n = 3 . On a : cos3 θ = = et de même : 3
sin θ =
=−
Exo 5.6
ei θ + e−i θ 2
3
1 i 3θ e + 3ei θ + 3e−i θ + e−3i θ 8
=
1 1 3i θ e + e−3i θ + 3 ei θ + e−i θ = cos(3θ) + 3 cos θ , 8 4
ei θ − e−i θ 2i
3
=−
1 i 3θ e − 3ei θ + 3e−i θ − e−3i θ 8i
1 1 3i θ e − e−3i θ − 3 ei θ − e−i θ = − sin(3θ) + 3 sin θ . 8i 4
Plus généralement, étant donnés deux entiers naturels m et n, les formules d’Euler permettent de linéariser cosm θ sinn θ , c’est-à-dire de l’écrire comme combinaison linéaire de termes de la forme sin(kθ) et cos(kθ) (avec k ∈ IN). Il suffit de remplaiθ
−iθ
iθ
−iθ
et e −e cer cos θ et sin θ par e +e 2 2i Mais on peut parfois aller plus vite : Ex. 8. On sait que sin θ cos θ = On en déduit que sin2 θ cos2 θ =
168
, de développer et de regrouper les termes.
1 sin(2θ) . 2 1 sin2 (2θ) = 81 4
(1 − cos(4θ)) .
I L’ensemble des nombres complexes Point méthode (Technique de l’angle moitié) En utilisant les formules d’Euler, on θ1 +θ2 peut factoriser une expression de la forme eiθ1 ±eiθ2 en mettant en facteur ei( 2 ) ; le deuxième facteur sera alors un réel ou un imaginaire pur.
En considérant des expressions de la forme cos p ± cos q et sin p ± sin q comme les parties réelles ou imaginaires de eip ± eiq , on retrouve les formules trigonométriques qui en donnent une factorisation.
Ex. 9. Examinons le cas particulier θ1 = 0 . On a, pour tout réel θ : θ
1 + eiθ = ei 2 θ
1 − eiθ = ei 2
θ
θ
θ
θ
e−i 2 + ei 2 e−i 2 − ei 2
Ex. 10. Soit p ∈ IR et q ∈ IR . On a : eip + eiq = ei
p+q 2
ei
p−q 2
+ ei
θ
= ei 2 θ
= ei 2
q−p 2
= ei
2 cos
θ 2
−2i sin
p+q 2
θ · 2
2 cos
p−q · 2
En séparant la partie réelle et la partie imaginaire des deux membres de l’égalité, on obtient : cos p + cos q = 2 cos
p+q 2
En écrivant eip − eiq = ei cos p − cos q = −2 sin
6
p+q 2
p−q 2
cos
ei
p−q 2
p−q 2
sin
− ei
q−p 2
p+q 2
sin p + sin q = 2 sin
et
= ei
et
p+q 2
2i sin
p−q 2
p+q 2
cos
p−q . 2
, on trouve de même :
sin p − sin q = 2 sin
p−q 2
cos
p+q . 2
Formule de Moivre
Proposition 15 (Formule de Moivre) n Pour θ ∈ IR et n ∈ ZZ, on a eiθ = einθ ou encore, par définition de eiθ : (cos θ + i sin θ)n = cos(nθ) + i sin(nθ).
Démonstration.
On démontre la relation eiθ
n
= einθ :
• pour n ∈ IN , par récurrence, en utilisant la proposition 13 de la page 167 ; • par passage à l’inverse, pour n entier négatif.
169
Chapitre 5. Nombres complexes Ex. 11. Calcul de
1
√
100
+ i 23 · En utilisant la formule de Moivre on obtient : 2
Comme
√ 100 100iπ 1 3 iπ 100 +i = exp = exp · 2 2 3 3
100π (96 + 4)π 4π = ≡ [2π] , on a donc : 3 3 3
√ 100 √ 1 3 4iπ iπ 3 1 +i · = exp = − exp =− −i 2 2 3 3 2 2
Remarque Le développement de la puissance 100 avec la formule du binôme de Newton n’est évidemment pas envisageable ici !
Calcul de
n
cos(kθ) et
k=0
n
sin(kθ)
k=0
Pour n ∈ IN et θ ∈ IR, on pose Sn =
n
k=0
cos(kθ) et Sn′ =
puis Σn = Sn + iSn′ . On a alors, d’après la formule de Moivre : Σn =
n
eikθ =
k=0
n
sin(kθ),
k=0
n iθ k e . k=0
• Si e �= 1 , c’est-à-dire θ �≡ 0 [2π], on obtient, en utilisant la technique de l’angle moitié : (n+1)θ (n+1)θ (n+1)θ i 2 −i 2 i 2 e e − e i(n+1)θ sin (n+1)θ e −1 i nθ 2 2 = = e · Σn = θ θ θ eiθ − 1 sin 2θ ei 2 ei 2 − e−i 2 iθ
On en déduit :
Sn = Re Σn =
(n+1)θ cos nθ 2 sin 2
sin θ2
et Sn′ = Im Σn =
(n+1)θ sin nθ 2 sin 2
sin θ2
·
• Si θ ≡ 0 [2π], on trouve directement Σn = n + 1 et donc Sn = n + 1 et Sn′ = 0 . Application de la formule de Moivre à la trigonométrie Point méthode Pour n ∈ IN∗ , la formule de Moivre, sous la forme : (cos θ + i sin θ)n = cos(nθ) + i sin(nθ),
permet d’exprimer cos(nθ) et sin(nθ) en fonction de cos θ et sin θ .
170
I L’ensemble des nombres complexes Ex. 12. Pour n = 3 , on obtient par la formule du binôme : cos(3θ) + i sin(3θ) = (cos θ + i sin θ)3 = cos3 θ + 3i cos2 θ sin θ − 3 cos θ sin2 θ − i sin3 θ et donc en séparant partie réelle et partie imaginaire : cos(3θ) = cos3 θ − 3 cos θ sin2 θ = 4 cos3 θ − 3 cos θ sin(3θ) = 3 cos2 θ sin θ − sin3 θ = 3 sin θ − 4 sin3 θ, en utilisant l’égalité cos2 θ + sin2 θ = 1 .
7
Forme trigonométrique, argument
Proposition 16 Soit z un complexe non nul. 1. Il existe r0 ∈ IR∗+ et θ0 ∈ IR tels que z = r0 eiθ0 . 2. Si r ∈ IR+ et θ ∈ IR sont tels que z = r eiθ alors r = |z|.
3. Si θ ∈ IR vérifie z = |z| eiθ , alors θ ≡ θ0 [2π]. Principe de démonstration. 1. Il suffit de s’intéresser à
Démonstration page 186
z · |z|
2. Le module de z = r eiθ est facile à calculer. 3. Comme |z| = r0 �= 0 il s’agit en fait de l’égalité de deux exponentielles.
Définition 4 (Forme trigonométrique d’un complexe non nul) Soit z ∈ C∗ . • Tout réel θ tel que z = |z| eiθ est appelé un argument de z .
• On appelle forme trigonométrique de z toute écriture de la forme : z = |z| (cos θ + i sin θ) = |z| eiθ
avec θ ∈ IR.
Ex. 13. Soit z un nombre complexe non nul. On note θ un argument de z . Alors : • z réel équivaut à θ ≡ 0 [π] ; plus précisément z ∈ IR∗+ (respectivement z ∈ IR∗− ) équivaut à θ ≡ 0 [2π] (respectivement à θ ≡ π [2π] ) ; • z imaginaire pur équivaut à θ ≡ π2 [π] .
Attention • Le module d’un nombre complexe est défini de façon unique ; tout complexe, même 0 , possède un module. • En revanche, on ne parle d’argument que pour un complexe non nul, et un tel argument n’est défini que modulo 2π . • Bien que 0 n’ait pas d’argument, on peut quand même écrire 0 = r eiθ , avec r = 0 et θ un réel quelconque. 171
Chapitre 5. Nombres complexes Remarque D’après ce qui précède, tout complexe z non nul admet un unique argument dans l’intervalle ]−π, π]. On l’appelle argument principal de z .
Corollaire 17 Deux nombres complexes non nuls sont égaux si, et seulement si, ils ont même module et des arguments égaux modulo 2 π . Représentation géométrique y
Exo 5.7
Lorsqu’un nombre complexe z est mis sous forme trigonométrique z = r eiθ , alors, comme on le voit sur la figure ci-contre, r = OMz et θ est une mesure −−→ de l’angle �ı, OM z , donc les réels r et θ forment un couple de coordonnées polaires de Mz .
Mz
Im z r θ
Re z
O
x
Proposition 18 (Transformation de a cos x + b sin x) Soit a et b des réels non tous deux nuls. Il existe un réel θ tel que, pour tout réel x : a cos x + b sin x = r cos(x − θ),
√ où r = a2 + b2 .
Démonstration page 186
Attention Si un complexe z s’écrit z = a eiθ avec a ∈ IR et θ ∈ IR, il ne s’agit pas nécessairement de la forme trigonométrique de z . En effet, on a |z| = |a| et donc : • si a > 0 , alors |z| = a, et un argument de z est θ , • si a < 0 , alors |z| = −a, et un argument de z est θ + π , • si a = 0 alors |z| = 0 , et z n’a pas d’argument.
Point méthode Si z = eiθ1 ± eiθ2 , alors la mise en facteur de ei( mettre facilement en évidence le module et un argument de z .
Ex. 14. Soit θ ∈ [0, 2π[ et z = 1 + eiθ . θ θ θ e−i 2 + ei 2
On a : z = 1 + eiθ = ei 2
• Si θ ∈ [0, π[ alors cos
θ 2
• Si θ ∈ ]π, 2π[ alors cos
= 2 cos
θ 2
> 0 , donc |z| = 2 cos
θ 2
172
) permet de
θ
ei 2 . θ 2
et un argument de z est
< 0 , donc |z| = −2 cos
• Si θ = π alors z = 0 et il n’a pas d’argument.
θ1 +θ2 2
θ 2
θ · 2
et un argument de z est
θ 2
+ π.
I L’ensemble des nombres complexes y
y eiθ θ O
1 + eiθ θ 2
θ
θ 2
O
1 x e
iθ
1 x
1 + eiθ
Calculs usuels Il est aisé de calculer des produits, des quotients et des puissances de nombres complexes non nuls écrits sous forme trigonométrique. En effet, pour θ1 ∈ IR et θ2 ∈ IR, si z1 = |z1 | eiθ1 et z2 = |z2 | eiθ2 , alors : • on a z1 z2 = |z1 | eiθ1 |z2 | eiθ2 = |z1 | |z2 | eiθ1 eiθ2 = |z1 | |z2 | ei(θ1 +θ2 ) ; • on a de même
z1 |z1 | i(θ1 −θ2 ) e = ; z2 |z2 |
• pour tout n ∈ ZZ, on a z1n = |z1 |n einθ1 . On en déduit le corollaire suivant. Corollaire 19 Soit z1 ∈ C∗ et z2 ∈ C∗ , d’arguments respectifs θ1 et θ2 . Alors : • −θ1 est un argument de z¯ et de
1 z
;
• θ1 + θ2 est un argument de z1 z2 ; z1 • θ1 − θ2 est un argument de ; z2
Exo 5.8
• si n ∈ ZZ, alors n θ1 est un argument de z1n . Ex. 15. Soit z1 et z2 deux complexes non nuls, d’arguments θ1 et θ2 respectivement.
z1 z1 réel équivaut à θ1 ≡ θ2 [π] . Plus précisément ∈ IR∗+ équivaut à θ1 ≡ θ2 [2π] . z2 z2 z1 Autrement dit, ∈ IR∗+ équivaut à dire que z1 et z2 ont mêmes arguments. z2 On déduit alors de la proposition 8 de la page 164 que |z1 + z2 | = |z1 | + |z2 | équivaut également à dire que z1 et z2 ont mêmes arguments. z1 • imaginaire pur équivaut à θ1 ≡ θ2 + π2 [π] . z2
•
8
Exponentielle complexe
Dans cette partie, on suppose connues les propriétés de la fonction exponentielle réelle étudiée en classe de première (cf. chapitre 10). Définition 5 Pour tout z ∈ C, on définit le nombre complexe ez par : ez = eRe z ei Im z . 173
Chapitre 5. Nombres complexes Remarques • La fonction exponentielle z �→ ez , notée exp, ainsi définie de C dans C :
∗ prolonge la fonction exponentielle définie sur IR, puisque, si z ∈ IR, alors on a Im z = 0 et donc ei Im z = 1 ; ∗ est compatible avec la notation eiθ puisque, si z = iθ avec θ ∈ IR alors, on a Re z = 0 et donc eRe z = 1 .
1204
• Dans le chapitre 32, on donnera une autre définition de l’exponentielle complexe permettant de définir rigoureusement les fonctions sinus et cosinus. Proposition 20 Pour tout z ∈ C, on a |ez | = eRe z ∈ IR∗+ et donc ez ∈ C∗ . Le nombre réel Im z est un argument de ez . Démonstration.
Cela découle de l’écriture ez = eRe z ei Im z et de la proposition 16 de la
page 171.
Proposition 21 ′
′
• Si z et z ′ sont deux complexes, alors on a ez+z = ez ez . • Pour tout z ∈ C , on a ez �= 0 et (ez )−1 = e−z .
Démonstration page 186
Principe de démonstration.
• Faire le calcul en introduisant les parties réelles et imaginaires de z et z ′ . • Conséquence immédiate du point précédent.
Remarque Le premier des résultats précédents explique et justifie l’utilisation de la notation ez pour l’exponentielle d’un nombre complexe z . Ex. 16. Pour tout z ∈ C , on a : ez = eRe z−i Im z = eRe z e−i Im z = eRe z ei Im z = ez .
Proposition 22 Soit a un nombre complexe non nul. • Il existe (au moins) un complexe z tel que ez = a.
• Si z0 est un nombre complexe vérifiant ez0 = a, alors pour tout z ∈ C, on a ez = a si, et seulement s’il existe k ∈ ZZ tel que z = z0 + 2i k π.
Démonstration page 186
Principe de démonstration.
Écrire a sous forme trigonométrique puis chercher z sous forme algébrique.
Ex. 17. Résolvons l’équations ez = 1 + i , d’inconnue z ∈ C .
√ π On écrit z = x + i y , avec (x, y) ∈ IR2 . On a alors ez = ex eiy . Comme 1 + i = 2 ei 4 , √ l’égalité ez = 1 + i équivaut à ex = 2 et y ≡ π4 [2π] . L’ensemble des solutions est donc :
174
π 1 ln 2 + i + 2kπ 2 4
k ∈ ZZ .
II Résolution d’équations dans C
II 1
Résolution d’équations dans C Équation du second degré dans C
Racines carrées d’un complexe Définition 6 On appelle racine carrée d’un complexe z tout complexe Z tel que Z 2 = z . Rappel : √ • On sait que tout réel strictement positif a possède deux racines carrées qui sont a √ √ et − a ; rappelons que a désigne la racine positive de a. • Le réel 0 ne possède qu’une seule racine carrée qui est 0 .
Exo 5.9
Proposition 23 Tout complexe non nul admet exactement deux racines carrées opposées. Démonstration page 186
Principe de démonstration.
Écrire z = r e
iθ
et chercher Z sous la forme Z = ρ ei ϕ .
Ex. 18. Si a est un réel strictement négatif, alors c’est un complexe de module −a et d’argu π
ment π ; ainsi ses deux racines carrées sont ±
|a| exp(i 2 ) = ±i
|a| .
On peut aussi trouver directement ces deux racines carrées en factorisant :
0 = Z 2 − a = Z 2 − i2 |a| = Z − i
|a|
Z +i
|a| .
Attention On ne sait pas, dans C, privilégier l’une des deux racines d’un complexe z , contrairement à ce qui se passe lorsque z ∈ IR+ où l’on choisit, parmi les √ deux racines carrées de z , celle qui est positive que l’on note alors z . Par suite : √ • il est impossible d’utiliser la notation z pour un complexe z quelconque ;
Exo 5.10
• il faut donc parler d’une (article indéfini) racine carrée de z et non pas de la (article défini) racine carrée de z . Méthode algébrique. L’utilisation de formes trigonométriques donne facilement les expressions des racines carrées d’un nombre complexe non nul quelconque, mais on a parfois besoin d’exprimer une racine de z sous forme algébrique, i.e. sans utilisation de fonctions trigonométriques. On a vu ci-dessus comment faire lorsque z ∈ IR. Supposons donc z �∈ IR et prenons z = x+iy avec x ∈ IR et y ∈ IR∗ . Soit Z = X +i Y avec (X, Y ) ∈ IR2 tel que Z 2 = z . • On en déduit : ∗ par égalité des parties réelles, X 2 − Y 2 = x ; ∗ par égalité des modules, X 2 + Y 2 = x2 + y 2 ;
∗ par égalité des parties imaginaires, 2 X Y = y
(i)
(ii) (iii)
(comme y �= 0 , cela entraîne X �= 0 et Y �= 0 ). 175
Chapitre 5. Nombres complexes Par somme et différence de (i) et (ii), on obtient X 2 et Y 2 , et donc X et Y au signe près, soit quatre possibilités puisque X �= 0 et Y �= 0 .
• D’après (iii) le produit X Y est du signe de y et il existe donc seulement deux couples (X, Y ) vérifiant ces trois conditions, couples que l’on peut alors exprimer en fonction de x et de y . • Bien que n’utilisant que des conditions nécessaires (implications), le raisonnement précédent donne toutes les racines de z puisqu’il en donne au plus deux et que l’on sait qu’il en existe exactement deux. Ex. 19. Déterminons sous forme algébrique les racines carrées de 21 − 20 i . D’après la méthode précédente, si (X + iY )2 = 21 − 20 i , alors :
X 2 − Y 2 = 21 √ X 2 + Y 2 = 212 + 202 = 29
et
2X Y = −20.
Par somme et différence des deux équations, on déduit : X 2 = 25 et Y 2 = 4 , et donc X = ±5 et Y = ±2 . Comme 2 X Y 0 , les racines carrées de 21 − 20 i sont 5 − 2i et −5 + 2i .
Résolution de l’équation du second degré Proposition 24 Soit a ∈ C∗ , b ∈ C et c ∈ C ainsi que l’équation :
a z 2 + b z + c = 0.
(E)
On note ∆ = b − 4 a c son discriminant. 2
Exo 5.11 Exo 5.12
• Si ∆ �= 0 , alors en appelant δ une racine carrée de ∆, l’équation (E) admet −b − δ −b + δ et z2 = · deux racines distinctes : z1 = 2a 2a b • Si ∆ = 0 , alors l’équation (E) admet une racine double z0 = − · 2a
Démonstration page 186 Transformer le trinôme en utilisant : c b b 2 a z2 + b z + c = a z2 + z + =a z+ − ··· . a a 2a
Principe de démonstration.
Remarques • Soit a ∈ C∗ et (b, c) ∈ C2 . Déterminer (α, β) ∈ C2 tel que : ∀z ∈ C
a z 2 + b z + c = a (z + α)2 + β
s’appelle mettre le trinôme az 2 + bz + c sous la forme canonique. • On parle en général de solutions d’une équation mais, si P est une fonction polynomiale à coefficients complexes, un complexe z tel que P (z) = 0 est appelé une racine de P . • Si on remplace ∆ par 0 dans les formules donnant les deux racines z1 et z2 dans le cas ∆ �= 0 , on obtient z0 . C’est pourquoi on dit parfois que l’équation du second degré possède deux racines distinctes ou confondues. 176
II Résolution d’équations dans C Ex. 20. Résolvons l’équation z 2 − (3 + 4 i) z − 1 + 5 i = 0 . Le discriminant de l’équation est : ∆ = (3 + 4 i)2 − 4 (−1 + 5 i) = −3 + 4 i. La recherche d’une racine carrée u + i v de ∆ mène à : u2 − v 2 = −3,
u2 + v 2 = 5
et
2 u v = 4.
Par addition et soustraction, on en déduit u2 = 1 et v 2 = 4 , et donc : u = ±1
et
v = ±2.
Le signe de u v entraîne que les deux racines de ∆ sont ± (1 + 2i) . (3 + 4 i) ± (1 + 2i) c’est-à-dire : Par suite les racines de l’équation donnée sont 2 2 + 3i
et
1 + i.
Corollaire 25 Soit a, b et c trois réels, a étant non nul, ainsi que l’équation : a z 2 + b z + c = 0.
(E)
On note ∆ = b2 − 4 a c son discriminant.
Exo 5.13
• Si ∆ > 0 , alors (E) a deux racines réelles distinctes : √ √ −b + ∆ −b − ∆ et z2 = · z1 = 2a 2a b • Si ∆ = 0 , alors (E) a une racine double réelle z0 = − · 2a • Si ∆ < 0 , alors (E) a deux racines complexes distinctes conjuguées : √ √ −b + i −∆ −b − i −∆ et z2 = . z1 = 2a 2a
Démonstration.
C’est un cas particulier de la proposition précédente.
Ex. 21. Étant donné un réel θ , considérons l’équation z 2 − 2z cos θ + 1 = 0 .
Le discriminant est ∆ = −4 sin2 θ . • Si θ ≡ 0 [π] , alors ∆ = 0 et l’équation admet une racine double : z0 = 1
si
θ ≡ 0 [2π]
ou
z0 = −1
si
θ ≡ π [2π].
• Si θ �≡ 0 [π] , alors ∆ < 0 et l’équation admet deux racines distinctes : z1 = cos θ + i sin θ = eiθ
et
z2 = cos θ − i sin θ = e−iθ .
177
Chapitre 5. Nombres complexes Relations entre coefficients et racines Corollaire 26 Soit a, b et c trois complexes, avec a �= 0 . Si z1 et z2 sont les racines (éventuellement confondues) de l’équation a z 2 + b z + c = 0 , alors on a : Exo 5.14
z1 + z2 = − Démonstration.
b a
et
z1 z2 =
c · a
Cela résulte immédiatement des formules donnant les racines.
Point méthode On utilise ce corollaire sous plusieurs formes. • Si z1 et z2 sont les racines de l’équation a z 2 + b z + c = 0 , et si l’on connaît une de ces racines, alors on peut facilement en déduire l’autre. • Si l’on sait que z1 et z2 sont les racines de l’équation a z 2 + b z + c = 0 , alors on peut exprimer toute expression symétrique en z1 et z2 (c’est-à-dire invariante quand on échange z1 et z2 ), en fonction de z1 + z2 et z1 z2 , et donc de a, b et c, sans avoir à expliciter z1 et z2 .
Ex. 22. Les racines de l’équation z 2 − 2 z cos θ + 1 sont les deux nombres complexes dont la somme est 2 cos θ et le produit 1 . D’après les formules d’Euler, on sait que ce sont eiθ et e−iθ . Ex. 23. Soit z1 et z2 les deux racines de l’équation z 2 − z + 4 = 0 . Calculons z12 + z22 − z1 z2 sans expliciter z1 et z2 . On a : z12 + z22 − z1 z2 = (z1 + z2 )2 − 3 z1 z2 = 12 − 3 × 4 = −11.
Exo 5.15 Exo 5.16
Proposition 27 Soit s et p deux nombres complexes. Alors les nombres complexes z1 et z2 vérifient z1 + z2 = s le système si, et seulement si, z1 et z2 sont les deux racines z1 z2 =p (éventuellement confondues) de l’équation z 2 − sz + p = 0 .
Démonstration page 187
Remarque Si s et p sont réels et si l’on cherche z1 et z2 réels, le système précédent n’a de solution que si s2 − 4p 0 , car l’équation du second degré z 2 − sz + p = 0 n’a des solutions réelles que si son discriminant est positif.
178
II Résolution d’équations dans C
2
Racines n-ièmes d’un nombre complexe
Dans toute cette partie, n désigne un entier naturel non nul. Définition 7 • Si z ∈ C , on appelle racine n-ième de z tout complexe Z tel que Z n = z .
• Les racines n-ièmes de 1 sont encore appelées racines n-ièmes de l’unité.
Racines n-ièmes de l’unité Notation
Exo 5.17
L’ensemble des racines n-ièmes de l’unité est noté Un .
Proposition 28 Il existe exactement n racines n-ièmes de l’unité, qui sont les complexes : 2 π k 2kπ , avec k ∈ [[0, n − 1]]. ei n = e i n Démonstration.
Comme |z n | = |z|n , les racines de l’équation z n = 1 sont de module 1 .
De plus, un complexe z = eiϕ , avec ϕ réel, vérifie z n = 1 si, et seulement si, l’on a n ϕ ≡ 0 [2π] ce qui équivaut à : ∃ k ∈ ZZ
n ϕ = 2k π
ou encore à
ϕ=
∃k ∈ ZZ
• À tout entier relatif k , associons le complexe ξk = ei
2kπ n
2k π · n
.
D’après ce qui précède, l’ensemble des racines n -ièmes de 1 est l’ensemble {ξk | k ∈ ZZ } .
Soit k un entier relatif. On pose q = nk et r = k − n q . Par définition, on a q et donc 0 r < n . De k = r + n q , on déduit : ξk = ei(
2rπ n
+2q π)
k n
< q+1
= ξr .
L’ensemble des racines n -ièmes de 1 est donc l’ensemble
ξr r ∈ [[0, n − 1]] .
• Pour terminer, vérifions qu’il y a exactement n racines n -ièmes, c’est-à-dire que les nombres complexes ξ0, ξ1 , . . . , ξn−1 sont distincts deux à deux. Soit k et ℓ deux entiers de [[0, n − 1]] tels que ξk = ξℓ ; on a alors
2ℓ π 2k π ≡ [2π] , et il n n
2k π 2ℓ π = + 2q π , soit encore k − ℓ = n q . n n Comme k et ℓ sont dans [[0, n − 1]] , leur différence appartient à [[−(n − 1), n − 1]] et ne peut être multiple de n que si k et ℓ sont égaux. existe donc un entier relatif q tel que
Proposition 29 Soit n un entier supérieur ou égal à 2 . Exo 5.18 Exo 5.19
• Si ξ est une racine n-ième de l’unité différente de 1, on a : 1 + ξ + ξ 2 + · · · + ξ n−1 = 0.
• La somme des racines n-ièmes de l’unité est égale à 0 .
Démonstration page 187
179
Chapitre 5. Nombres complexes Ex. 24. Les racines cubiques de l’unité sont 1 , j et j 2 = exp
4iπ 3
=
exp
2i π 3
Mj
= ¯ j . Les images de ces racines, M1 , Mj
y
2π 3
O
et Mj 2 , forment le triangle équilatéral ci-contre. Comme j est une racine cubique de l’unité, différente de 1 , on a :
M1 x
Mj 2
1 + j + j 2 = 0.
Notation Dans ce contexte, la lettre j représente classiquement le nombre com plexe exp 2i3π . Ne pas confondre avec la physique où il représente souvent i . Racines n-ièmes d’un nombre complexe Proposition 30 Soit z ∈ C. Si Z0 est une racine n-ième de z , alors l’ensemble des racines n-ièmes de z est : {Z0 ξ | ξ ∈ Un } .
Démonstration page 187
Exo 5.20
Point méthode Pour trouver toutes les racines n-ièmes de z , il suffit donc d’en exhiber une et de la multiplier par toutes les racines n-ièmes de l’unité.
Corollaire 31 Soit un entier naturel n �= 0 et un complexe z �= 0 de module r et d’argument θ . Le complexe z admet n racines n-ièmes qui sont les complexes : 1
θ
Zk = r n ei( n +
Démonstration. 1 n
complexe Z0 = r e
2kπ n )
avec k ∈ [[0, n − 1]].
Il suffit d’appliquer la proposition précédente après avoir remarqué que le θ in
est une racine n -ième de z .
Ex. 25. Images des racines n -ièmes d’un nombre complexe On garde les notations du corollaire 31. On nomme (Zk )k∈[[0,n−1]] les racines n -ièmes de z = reiθ , avec r > 0 , et (Ak )k∈[[0,n−1]] leurs images dans le plan. On pose de plus Zn = Z0 et An = A0 .
180
III Applications géométriques On a, pour tout k ∈ [[0, n − 1]] :
y 1 n
OAk = |Zk | = r , donc les points Ak sont sur D’autre part, pour tout −−→ l’angle (�ı, OAk ) a pour · de Zk , c’est-à-dire 2kπ n tout k ∈ [[0, n − 1]] :
A1
A2
un cercle de centre O . k ∈ [[0, n − 1]] ,
A0
2π n
mesure un argument On en déduit, pour
x
O
An−1
−−→ −−−−→ 2(k + 1)π 2kπ 2π − = · (OAk , OAk+1 ) = n n n Les points A0 , A1 , . . . , An−1 sont donc les sommets d’un polygone régulier centré en O . √
Ex. 26. Déterminons les racines cinquièmes de 1 + i . Comme 1 + i = ses racines cinquièmes est :
1
π
2 10 ei( 20 +
III 1
2kπ ) 5
2e
iπ 4
, l’ensemble de
k ∈ [[0, 4]] .
Applications géométriques Alignement et orthogonalité
Proposition 32 Soit �u1 et �u2 deux vecteurs non nuls d’affixes respectives z1 et z2 . Alors le complexe zz21 a pour argument toute mesure de l’angle �u1 , �u2 . Par suite :
(i) les vecteurs �u1 et �u2 sont colinéaires si, et seulement si,
z2 z1
(ii) les vecteurs �u1 et �u2 sont orthogonaux si, et seulement si,
∈ IR ;
z2 z1
∈ i IR.
Démonstration page 187
Exo 5.21 Exo 5.22
Corollaire 33 Soit A, B et C trois points du plan, distincts et d’affixes respectives a, b et c. Le − − → −→ complexe c−a a pour argument toute mesure de l’angle AB, AC . Par suite : b−a • les points A, B et C sont alignés si, et seulement si,
c−a b−a
∈ IR ;
− − → −→ • les vecteurs AB et AC sont orthogonaux si, et seulement si,
c−a b−a
∈ i IR.
Remarque Les deux équivalences du corollaire 33 restent vérifiées si C = A. Point méthode Pour exprimer c−a b−a ∈ IR ou de cette quantité (cf. méthode page 162).
c−a b−a
∈ i IR, penser à utiliser le conjugué
181
Chapitre 5. Nombres complexes Ex. 27. Soit A et B deux points distincts du plan, d’affixes respectives a et b . Le point M
−−→ −−→ d’affixe z appartient au cercle Γ de diamètre [AB] si, et seulement si, les vecteurs M A et M B z−b ∈ iIR , ou encore à : sont orthogonaux, ce qui équivaut, si M �= A , à z−a
z−b z−b =− z−a z−a
2
=−
z¯ − ¯b · z¯ − a ¯
Transformations remarquables du plan
Si F est une application du plan dans lui-même, on peut lui associer une unique application f de C dans C telle que pour tous points M et M ′ d’affixes respectives z et z ′ on ait M ′ = F (M ) si, et seulement si, z ′ = f (z). Réciproquement, l’application f caractérise F . On dit que F est représentée par f dans le plan complexe. Translations, homothéties Définition 8 Soit �u un vecteur du plan. La translation de vecteur �u est l’application du plan −−−→ dans lui-même qui, à tout point M , associe l’unique point M ′ tel que M M ′ = �u . Proposition 34 Soit �u un vecteur du plan et a son affixe. La translation de vecteur �u est représentée dans le plan complexe par l’application C −→ C z �−→ z + a.
Démonstration page 188
Définition 9 Soit Ω un point du plan et λ ∈ IR∗ . L’homothétie de centre Ω et de rapport λ est l’application du plan dans lui-même qui, à tout M , associe l’unique point M ′ −−→ −−→ tel que ΩM ′ = λ ΩM . Proposition 35 L’homothétie de centre Ω, d’affixe ω , et de rapport λ est représentée dans le plan complexe par l’application C −→ C z �−→ λ (z − ω) + ω.
Démonstration page 188
Ex. 28. La symétrie par rapport au point Ω , d’affixe ω , est l’homothétie de centre Ω et de rapport −1 . Elle est donc représentée par l’application z �→ −z + 2ω .
182
III Applications géométriques Rotations Définition 10 Soit Ω un point du plan et θ ∈ IR. La rotation de centre Ω et d’angle θ est l’application du plan dans luimême qui transforme Ω en Ω, et tout point M �= Ω en l’unique point M ′ tel que : −−→ −−→ ΩM = ΩM ′ et ΩM , ΩM ′ ≡ θ [2π].
M′
θ
M
Ω
Proposition 36 La rotation r de centre Ω, d’affixe ω , et d’angle θ est représentée dans le plan complexe par l’application C −→ C z �−→ eiθ (z − ω) + ω.
Démonstration page 188
Ex. 29. La rotation de centre 1 + i et d’angle de mesure tion f : C → C définie par :
π 2
est représentée par l’applica-
f (z) = i(z − 1 − i) + 1 + i = iz + 2.
Similitudes directes Définition 11 On appelle similitude directe du plan toute application du plan dans lui-même représentée dans le plan complexe par z �→ a z + b , avec (a, b) ∈ C∗ × C. Remarque D’après les propositions précédentes, on voit que translations, homothéties et rotations sont des similitudes directes. Proposition 37 La composée de deux similitudes directes est une similitude directe. Démonstration page 188
Ex. 30. Une similitude directe conserve les angles et les rapports des distances. Soit une similitude représentée par z �→ a z + b . Considérons A1 , A2 , A3 et A4 , des points tels que A1 �= A2 et A3 �= A4 . Notons z1 , z2 , z3 et z4 leurs affixes respectives ainsi que z1′ , z2′ , z3′ et z4′ les affixes de leurs images A′1 , A′2 , A′3 et A′4 . On a alors : z4′ − z3′ z4 − z3 z2′ − z1′ = a (z2 − z1 ) et z4′ − z3′ = a (z4 − z3 ) et donc = · ′ ′ z − z z 2 − z1 2 1 A′3 A′4 A3 A4 • Par égalité des modules, on déduit ′ ′ = · A1 , A2 A1 , A2 −−−→ −−−→ −−−→ −−−→ • Par comparaison des arguments, on déduit : A′1 A′2 , A′3 A′4 ≡ A1 A2 , A3 A4 [2π].
183
Chapitre 5. Nombres complexes Proposition 38 Soit a ∈ C∗ , b ∈ C et F la similitude du plan représentée par z �→ a z + b . • Si a = 1 , alors l’application F est la translation de vecteur d’affixe b .
Exo 5.23
• Si a �= 1 , alors l’application F admet un unique point invariant Ω, appelé centre de la similitude. En désignant par α un argument de a, l’application F s’écrit alors F = H ◦ R = R ◦ H , avec : ∗ R la rotation de centre Ω et d’angle α , ∗ H l’homothétie de centre Ω et de rapport |a|.
Le réel |a| est appelé rapport de la similitude et α une mesure de l’angle de la similitude.
Exo 5.24
Démonstration page 188
Remarque Avec les notations de la proposition précédente : • si a ∈ IR∗ \ {1} , l’application F est l’homothétie de centre Ω et de rapport a ; • si |a| = 1 et a �= 1 , l’application F est la rotation de centre Ω et d’angle α .
Interprétation géométrique de la conjugaison Proposition 39 L’application z �→ z¯ représente la symétrie du plan par rapport à la droite (O,�ı).
Démonstration page 188
Remarque Il existe aussi des similitudes indirectes (qui ne sont pas au programme). Ce sont les transformations du plan représentées par les applications z �→ a¯ z + b, où a ∈ C∗ et b ∈ C. La symétrie de la proposition 39 est un exemple de similitude indirecte.
184
Démonstrations
Démonstrations Proposition 4 Soit deux complexes z1 = x1 + i y1 et z2 = x2 + i y2 avec x1 , x2 , y1 , y2 réels. 1. 2.
Alors, z1 + z2 = x1 + x2 + i (y1 + y2 ) = x1 + x2 − i (y1 + y2 ) = z1 + z2 . De même : z1 z2 = x1 x2 − y1 y2 + i (x1 y2 + x2 y1 ) = x1 x2 − y1 y2 − i (x1 y2 + x2 y1 ) = z1 z2 .
3.
Supposons z2 �= 0 et posons u =
z1 · z2
Comme z1 = u z2 , en utilisant le résultat précédent, on obtient : z1 = u z2 . Il suffit alors de diviser par z2 (non nul) pour avoir
z1 z2
=u=
z1 · z2
Proposition 5 En posant z = x + iy , avec x et y réels, on a |z|2 = x2 + y 2 . Les deux premiers résultats sont alors évidents, et les deux derniers découlent des inégalités : √ |Re z| = |x| = x2 x2 + y 2 = |z| |Im z| = |y| =
Soit z ∈ C∗ .
Proposition 6
On a alors z¯ �= 0 et par suite z =
y2
x2 + y 2 = |z| .
z¯ z¯ = · z z¯ |z|2
1 = z¯ ⇔ z z¯ = 1 ⇔ |z|2 = 1 ⇔ |z| = 1 . z Proposition 7 Soit z1 ∈ C et z2 ∈ C . On a
• •
2
On a immédiatement |z1 z2 |2 = z1 z2 z1 z2 = z1 z2 z1 z2 = z1 z1 × z2 z2 = |z1 | |z2 |
Comme |z1 z2 | et |z1 | |z2 | sont des réels positifs, on en déduit |z1 z2 | = |z1 | |z2 | . z1 z1 En supposant z2 �= 0 on a z1 = z2 et donc |z1 | = |z2 | . z2 z2 On en déduit le résultat en divisant par |z2 | qui est non nul.
Corollaire 9
.
En écrivant z1 = z1 − z2 + z2 , la proposition 8 de la page 164 donne : |z1 | |z1 − z2 | + |z2 |
et donc
En échangeant les rôles de z1 et z2 , on en déduit : et donc la double inégalité :
|z2 | − |z1 | |z2 − z1 | = |z1 − z2 |
−z1 − z2 |z1 | − |z2 | |z1 − z2 |
Proposition 13
|z1 | − |z2 | |z1 − z2 | .
ou encore
Soit θ et ϕ deux réels. On a :
eiθ eiϕ = (cos θ + i sin θ) (cos ϕ + i sin ϕ)
|z1 | − |z2 | |z1 − z2 | .
= (cos θ cos ϕ − sin θ sin ϕ) + i(sin θ cos ϕ + cos θ sin ϕ) = cos(θ + ϕ) + i sin(θ + ϕ) = ei(θ+ϕ) . 1 eiϕ = iϕ = eiϕ . eiϕ |e | Enfin, la dernière relation est une conséquence immédiate des deux premières. En particulier eiϕ e−iϕ = ei 0 = 1 , ce qui prouve que e−iϕ =
185
Chapitre 5. Nombres complexes Proposition 16 1. Comme z �= 0 , on a |z| �= 0 , donc on peut poser u =
2. 3.
z · |z|
On a alors |u| = 1 , et la proposition 12 de la page 167 nous dit qu’il existe θ0 ∈ IR tel que u = eiθ0 . Le résultat est alors immédiat en prenant r0 = |z| . Si z = r eiθ alors on a |z| = |r| |eiθ | = |r| puisque |eiθ | = 1 .
Comme r ∈ IR+ , on a r = |r| = |z| .
Soit θ tel que z = |z| eiθ = |z| eiθ0 .
Comme |z| �= 0 , on a alors eiθ0 = eiθ et la proposition 12 de la page 167 nous dit qu’il existe k ∈ ZZ tel que θ = θ0 + 2kπ , ou encore θ ≡ θ0 [2π] . √ Proposition 18 Par hypothèse, le complexe a + i b est non nul. En notant r = a2 + b2 son module et θ l’un de ses arguments, on peut écrire : a cos x + b sin x = r cos θ cos x + r sin θ sin x = r cos(x − θ). Proposition 21 • Si l’on pose x = Re z , y = Im z , x′ = Re z ′ et y ′ = Im z ′ , alors on a : ′
′
ez+z = e(x+x )+i (y+y = ex+x ei (y+y
′
′
′
′
= ex ex eiy eiy
= ex eiy •
′
)
)
′
définition de l’exponentielle complexe
ex eiy
′
propriétés de l’exponentielle réelle et de t �→ eit ′
= ez ez .
En utilisant le résultat précédent avec z ′ = −z , on obtient ez e−z = e0 = 1 ; on retrouve ainsi ez �= 0 et l’on en déduit (ez )−1 = e−z .
Proposition 22 Écrivons a sous forme trigonométrique a = ρ eiθ , avec ρ > 0 et θ ∈ IR . Pour tout z ∈ C , on a ez = eRe z ei Im z . Deux nombres complexes sont égaux si, et seulement s’ils ont même module et même argument modulo 2π . Ainsi, l’égalité ez = a équivaut à ρ = eRe z , soit Re z = ln ρ , et θ ≡ Im z [2π] , c’est-à-dire à l’existence de k ∈ ZZ tel que z = ln ρ + i (θ + 2kπ) . On a donc prouvé que z0 = ln ρ + i θ est une solution de l’équation ez = a , et que z est solution de cette équation si, et seulement s’il existe k ∈ ZZ tel que z − z0 = 2i kπ . Proposition 23 Soit z ∈ C∗ , de forme trigonométrique z = r eiθ . Comme z est non nul, 0 n’est pas une racine carrée de z . Soit donc Z ∈ C∗ , de forme trigonométrique Z = ρ ei ϕ . Alors Z est une racine carrée de z si, et seulement si, ρ2 ei 2ϕ = r eiθ . Comme ρ2 > 0 et r > 0 , l’équation précédente équivaut à ρ2 = r et 2ϕ ≡ θ [2π] . √ Comme ρ > 0 , cela équivaut aussi à ρ = r et ϕ ≡ 2θ [π] . √ √ √ θ θ θ Par suite, z admet deux racines opposées r ei 2 et r ei ( 2 +π) = − r ei 2 . Proposition 24
Pour tout z ∈ C , on a : 2
az + bz + c = a
c b z + z+ a a 2
=a =a
186
b z+ 2a z+
b 2a
2 2
b2 − 4ac − 4a2 −
∆ 4a2
·
Démonstrations •
Supposons ∆ �= 0 ; en notant δ une racine carrée de ∆ , on a : a z2 + b z + c = a
z+
b 2a
2
−
δ2 4a2
=a z+
b−δ 2a
z+
b+δ 2a
·
−b − δ −b + δ et · 2a 2a 2 b Supposons ∆ = 0 ; alors a z 2 + b z + c = a z + et (E) admet une racine 2a b double z0 = − · 2a L’équation (E) admet donc deux racines distinctes :
•
Proposition 27 •
Si z1 et z2 sont les deux racines de l’équation z 2 − sz + p = 0 , le corollaire 26 de la page 178 montre que : z1 + z 2 = s et z1 z2 = p.
•
Si z1 + z2 = s et z1 z2 = p , alors, pour tout z ∈ C : (z − z1 ) (z − z2 ) = z 2 − (z1 + z2 ) z + z1 z2 = z 2 − sz + p, donc l’équation z 2 − sz + p = 0 a pour racines z1 et z2 .
Proposition 29 1 − ξn , ce qui vaut 0 car ξ n = 1 . 1−ξ
•
Comme ξ �= 1, on a 1 + ξ + ξ 2 + · · · + ξ n−1 =
•
On prend ξ = ei n . Comme n 2 , on a ξ �= 1 . Les racines n -ièmes de l’unité sont alors 1, ξ, . . . , ξ n−1 et, d’après le premier point leur somme S est nulle.
2π
Proposition 30 • Dans le cas où z = 0 , le résultat est évident puisque le nombre complexe 0 a une seule racine n -ième qui est 0 , et que {Z0 ξ | ξ ∈ Un } = {0} . •
Supposons donc z �= 0 . Comme Z0n = z , l’équation Z n = z s’écrit aussi Z n = Z0n . n Z Étant donné que Z0 �= 0 , elle est équivalente à = 1. Z0 Par suite, on a Z n = z si, et seulement si : ∃ξ ∈ Un
Proposition 32 •
Z =ξ Z0
ou encore
∃ξ ∈ Un
Z = ξ Z0 .
Écrivons sous forme trigonométrique z1 = ρ1 eiθ1 et z2 = ρ2 eiθ2 .
Le plan étant rapporté à un repère orthonormé direct (O,�ı, �) , on sait que l’on a alors : θ1 ≡ (�ı, � u1 ) [2π]
et
θ2 ≡ (�ı, � u2 ) [2π].
On en déduit le premier résultat, puisque (� u1 , �u2 ) = (�ı, � u2 ) − (�ı, u�1 ) ≡ θ2 − θ1 [2π] et que le nombre réel θ2 − θ1 est un argument de zz12 ·
•
Les résultats (i) et (ii) s’en déduisent immédiatement, puisque : ∗ ∗
les vecteurs u � 1 et � u2 sont colinéaires si, et seulement si, (� u1 , � u2 ) ≡ 0 [π] c’est-àdire θ2 − θ1 ≡ 0 [π] , ce qui équivaut à zz21 est réel ;
les vecteurs � u1 et � u2 sont orthogonaux si, et seulement si, (� u1 , � u2 ) ≡ dire θ2 − θ1 ≡ π2 [π] , ce qui équivaut à zz12 est imaginaire pur.
π 2
[π] c’est-à-
187
Chapitre 5. Nombres complexes Si les points M et M ′ ont pour affixes z et z ′ , alors M ′ est l’image de M par −−−→ − u est vérifiée, ce qui équivaut la translation de vecteur → u , si, et seulement si, l’égalité M M ′ = � à l’égalité des affixes z ′ − z = a et donc à z ′ = z + a .
Proposition 34
Si les points M et M ′ ont pour affixes z et z ′ , alors M ′ est l’image de M −−→ −−→ par l’homothétie de centre Ω et de rapport λ , si, et seulement si, l’égalité ΩM ′ = λ ΩM est vérifiée, ce qui équivaut à l’égalité des affixes z ′ − ω = λ(z − a) et donc à z ′ = λ(z − ω) + ω .
Proposition 35
Proposition 36 Soit M �= Ω d’affixe z et r(M ) = M ′ �= Ω d’affixe z ′ . Par définition de la rotation r , on a : −−→ −−→ ΩM = ΩM ′ et ΩM , ΩM ′ ≡ θ [2π] −−→ −−→ ce qui se traduit, sur les affixes z ′ − ω et z − ω des vecteurs ΩM ′ et ΩM , par : z ′ − ω = eiθ (z − ω).
Cela reste vrai si z = ω , puisque r(Ω) = Ω .
Proposition 37 Si s et s′ sont deux similitudes directes représentées respectivement par les applications f : z �→ a z + b et f ′ : z �→ a′ z + b′ , alors s ◦ s′ est représentée par l’application f ◦ f ′ . Pour tout z ∈ C : f ◦ f ′ (z) = f (f ′ (z)) = a f ′ (z) + b = a(a′ z + b′ ) + b = (aa′ )z + (ab′ + b),
avec a a′ �= 0 , donc s ◦ s′ est une similitude directe.
Proposition 38 • Lorsque a = 1 , c’est le résultat de la proposition 34 de la page 182. • Supposons a �= 1 . Un point M d’affixe z est invariant par F si, et seulement si, z vérifie b l’équation z = az + b , qui a pour unique solution car a �= 1 . 1−a b L’unique point invariant par F est donc le point Ω d’affixe ω = · 1−a De plus, pour tout point M d’affixe z , l’affixe z ′ du point F (M ) vérifie : z ′ − ω = az + b − (a ω + b) = a (z − ω). Soit R la rotation de centre Ω et d’angle α et H l’homothétie de centre Ω et de rapport |a| . Vérifions que F = H ◦ R .
Soit M un point d’affixe z , z1 l’affixe de R(M ) et z2 l’affixe de H R(M ) . On a, d’après les propositions 36 et 35, les relations :
ce qui donne :
z1 − ω = eiα (z − ω)
et
z2 − ω = |a| (z1 − ω),
z2 − ω = |a| eiα (z − ω) = a (z − ω).
Le complexe z2 est donc l’affixe du point F (M ) , ce qui montre l’égalité F = H ◦ R . On montre de même l’égalité F = R ◦ H . Si M et M ′ sont les deux points d’affixes z et z¯ , alors le milieu de [M M ′ ] −−−→ est réelle, et M M ′ colinéaire à � . Donc M ′ est le appartient à (O,�ı) , car son affixe z+z 2 symétrique de M par rapport à (O,�ı) .
Proposition 39
188
Exercices
S’entraîner et approfondir 5.1 Pour z ∈ C∗ , établir que z +
→162
1 ∈ IR si, et seulement si, |z| = 1 ou z ∈ IR∗ . z
5.2 Déterminer les couples (z, z ′ ) de complexes tels que |z + z ′ | = |1 + z¯z ′ | .
→162
5.3 Soit u et v deux complexes. On pose z = u + iv . →162
Montrer que |z|2 = u2 + v 2 si, et seulement si, z = 0 ou u et v sont réels ;
5.4 Soit a, b, c trois complexes de module 1 . Montrer que |ab + bc + ca| = |a + b + c| .
→164
5.5 Soit deux entiers dont chacun est la somme de deux carrés d’entiers. Montrer que leur produit est aussi la somme de deux carrés d’entiers.
→164
5.6 Exprimer cos5 θ et sin5 θ en fonction des cos(kθ) ou des sin(kθ) pour 0 k 5 . →168
5.7 Soit z un nombre complexe qui n’appartient pas à IR− . Montrer que si θ est un argument z de z , on a tan 2θ = ReIm · z+|z|
→172
√ 5.8 Pour quelles valeurs de n ∈ IN le nombre complexe (1 + i 3)n appartient-il à IR− ?
→173
5.9 Déterminer les racines carrées de 1 − i
√
3.
→175
5.10 1. Déterminer sous forme algébrique les racines carrées de z = 1 + i . →175 π π 2. En déduire cos et sin · 8 8 5.11 Résoudre dans C l’équation 6 z 2 − (5 − i) z + 2 − →176
5i = 0. 6
5.12 Résoudre dans C l’équation ez + e−z = 2i . →176
5.13 Étant donné un réel θ ∈ ]− π2 , π2 [ , résoudre l’équation z 4 − 2 sin θz 2 + tan2 θ = 0 . Combien →177 a-t-elle de solutions distinctes ? 5.14 Résoudre l’équation z 2 − (1 + a + a2 ) z + a + a3 = 0 , où a ∈ C . →178
5.15 Soit p et q dans C , q �= 0 . On note z1 et z2 les solutions de l’équation z 2 + pz + q = 0 . →178 1 2 Déterminer une équation du second degré dont les solutions sont 1+z et 1+z · z2 z1 5.16 On pose z = ei →178
2π 7
, S = z + z 2 + z 4 et T = z 3 + z 5 + z 6 . 1. Montrer que S¯ = T et Im S > 0 . 2. Calculer S + T et ST . En déduire S et T .
189
Chapitre 5. Nombres complexes 5.17 Soit m et n dans IN∗ . Montrons que Un ⊂ Um si, et seulement si, n divise m . →179
5.18 Soit n ∈ IN∗ . Calculer le produit des racines n -ièmes de 1 . →179
5.19 Soit n ∈ IN∗ et ξ0 , . . . , ξn−1 les racines n -ièmes de l’unité. →179
1. Calculer Sp =
n−1 k=0
2. Montrer que
ξkp , pour p ∈ IN∗ .
ξk ξℓ = 0 si n 3 .
0k,ℓn−1 k�=ℓ
5.20 Pour n ∈ IN , résoudre l’équation z 2n+1 + 1 = 0 . →180
5.21 Soit A et B deux points distincts du plan, d’affixes respectives a et b . Démontrer, en utili→181 sant les nombres complexes, que le point M du plan appartient au cercle Γ de diamètre [AB] −−→ −−→ si, et seulement si, les vecteurs M A et M B sont orthogonaux. 5.22 Soit A, B, C trois points distincts du cercle trigonométrique, d’affixes respectives a, b, c . →181 Montrer que le point H d’affixe h = a + b + c est l’orthocentre du triangle ABC , c’est-à-dire le point de concours des hauteurs. √ 5.23 Caractériser la similitude directe s dont l’expression complexe est z �→ (− 3 + i)z + i . →184
5.24 Soit F et G deux applications du plan dans lui-même. →184 1. Démontrer que si chacune des applications F et G est une homothétie ou une translation, il en est de même de F ◦ G . Préciser la composée de deux homothéties. 2. Démontrer que si chacune des applications F et G est une rotation ou une translation, il en est de même de F ◦ G . Préciser la composée de deux rotations. 5.25 Soit θ un réel tel que θ �≡
π 2
A(θ) =
[π] . Déterminer le module et un argument des complexes : 1 − i tan θ 1 + i tan θ
et
B(θ) = 1 + i tan θ.
5.26 Soit α et β deux réels. Mettre sous forme algébrique les nombres complexes : √ 50 1+i 3 1 + cos α + i sin α A= · et B= 1−i 1 + cos β + i sin β 5.27 Soit (z1 , z2 ) ∈ C2 tels que |z1 | = |z2 | = 1 et z1 z2 �= −1 . On pose Z =
z1 + z2 · 1 + z1 z2
1. Montrer que Z est réel. 2. On désigne respectivement par θ1 et θ2 des arguments de ces complexes. Évaluer Z en fonction de θ1 et de θ2 .
190
Exercices 5.28 Étant donné deux complexes z et z ′ , établir :
|z + z ′ |2 + |z − z ′ |2 = 2 |z|2 + |z ′ |2 .
En donner une interprétation géométrique.
5.29 Soit z ∈ C , z ′ ∈ C et u une racine carrée du produit z z ′ . Montrer que :
z + z′
|z| + |z ′ | =
2
5.30 1. Montrer que pour tout (a, b) ∈ (C∗ )2 :
z + z′ − u + + u 2
a |a − b| b |a|2 − |b|2 = |a| |b| .
2. Montrer que pour tout (x, y, z) ∈ C3 ,
|x| · |y − z| |y| · |z − x| + |z| · |x − y|.
3. En déduire, pour (x, y, z, w) ∈ C4 , l’inégalité de Ptolémée :
|x − y| · |z − w| |x − z| · |y − w| + |x − w| · |y − z|.
n
5.31 Soit z1 , . . . , zn des nombres complexes non nuls. Démontrer que
k=1
zk =
n
k=1
|zk | si, et
seulement si, z1 , . . . , zn ont mêmes arguments. On pourra raisonner par récurrence pour la réciproque.
5.32 1. Pour x ∈ IR , calculer cos(5x) en fonction de cos x . π 2. En déduire une expression de cos · 10 5.33 Résoudre de deux façons différentes l’équation : (1 + i z)5 = (1 − i z)5 et en déduire la valeur de tan π5 · 5.34 Soit n ∈ IN∗ . Résoudre dans C les équations suivantes : 1. (z + 1)n = (z − 1)n ;
2. (z + 1)n = (1 − z)n .
5.35 Soit n ∈ IN∗ . 1. Déterminer le module et un argument de (1 + i)n . 2. En déduire : S=
⌊n/2⌋
(−1)k
k=0
n 2k
S′ =
et
⌊(n−1)/2⌋
k=0
(−1)k
n . 2k + 1
5.36 Calcul des coefficients binomiaux de 3 en 3 Pour n ∈ IN∗ , calculer, en utilisant les racines cubiques de l’unité, les trois sommes : S0 =
n
03kn
3k
, S1 =
03k+1n
n , S2 = 3k + 1
03k+2n
n . 3k + 2
191
Chapitre 5. Nombres complexes 5.37 Soit n ∈ IN et θ ∈ IR . 1. Montrer que n
cos(nθ) =
⌊2⌋
(−1)
p=0
⌊
sin(nθ) =
p
n 2p
n−1
⌋ 2
(−1)p
p=0
2. On suppose θ �≡ de tan θ et n .
π 2
[π] et nθ �≡
π 2
C∗
→
n 2p + 1
(a)
cosn−(2p+1) θ sin2p+1 θ.
(b)
[π] . En déduire une expression de tan(nθ) en fonction
5.38 Pour n ∈ IN et x ∈ IR , simplifier An = 5.39 Soit f :
cosn−2p θ sin2p θ
n
cos2 (k x) et Bn =
k=0
n cos(k x)
k=0
cosk x
(pour x �≡
π 2
[π] ).
C
1 · z 1. L’application f est-elle injective ? surjective ? z
�→
z+
2. Déterminer l’image par f de IR∗ , de U = {z ∈ C : |z| = 1} . 5.40 Soit f : C z
−→ �−→
C z 2 + z + 1.
1. Déterminer f (C) , f (C∗ ) , f ( IR) . 2. Déterminer f −1 (C) , f −1 (C∗ ) , f −1 ( IR) . ⋆ 5.41 1. Montrer que l’application ϕ : z �→
z−i définit une bijection de C \ {−i} sur C \ {1} . z+i
Préciser ϕ−1 . 2. Déterminer ϕ−1 (IR) , ϕ(IR) et ϕ(U \ {−i}) . 5.42 Montrer que les points distincts A , B et C , d’affixes a , b et c , forment un triangle équilatéral si, et seulement si, on a a2 + b2 + c2 = ab + bc + ca . 5.43 Déterminer z ∈ C pour que les points d’affixes z, z 2 , z 3 : 1. soient alignés ; 2. forment un triangle rectangle ; 3. forment un triangle rectangle et isocèle.
192
Solutions des exercices
Solutions des exercices 5.1 On a z +
1 ∈ IR si, et seulement si : z z+
1 1 1 = z + = z¯ + , z z z¯
ce qui équivaut à (z − z¯) (z z¯ − 1) = 0 . D’où le résultat. 5.2 On calcule les carrés des modules : |z + z ′ |2 = (z + z ′ )(¯ z + z¯′ ) = |z|2 + |z ′ |2 + z z¯′ + z ′ z¯ |1 + z¯z ′ |2 = (1 + z¯z ′ )(1 + z z¯′ ) = 1 + |z|2 |z ′ |2 + z z¯′ + z ′ z¯. L’égalité |z + z ′ | = |1 + z¯z ′ | équivaut donc à |z|2 + |z ′ |2 = 1 + |z|2 |z ′ |2 . On remarque que :
1 + |z|2 |z ′ |2 − |z|2 − |z ′ |2 = 1 − |z|2
1 − |z ′ |2 .
Ainsi l’égalité |z + z ′ | = |1 + z¯z ′ | est réalisée si, et seulement si, |z|2 = 1 ou |z ′ |2 = 1 , c’est-à-dire si, et seulement si, |z| = 1 ou |z ′ | = 1 . u − i¯ v ) et u2 + v 2 = u2 − (iv)2 = (u + iv)(u − iv) . 5.3 On a |z|2 = (u + iv) (u + iv) = (u + iv)(¯
¯ − i¯ v = u − iv . L’égalité |z|2 = u2 + v 2 équivaut donc à u + iv = 0 , c’est-à-dire z = 0 , ou u Examinons cette dernière égalité. On a : u ¯ − i¯ v = u − iv ⇔ u − u ¯ − i(v − v¯) = 0 ⇔ 2i Im u + 2 Im v = 0.
Comme Im u et Im v sont des réels, cette dernière égalité équivaut à Im u = Im v = 0 , c’est-à-dire à u et v réels.
5.4 Comme a, b, c sont de module 1 , on a a ¯=
1 ¯ 1 1 , b = , c¯ = et donc : a b c
1 1 a + b + c 1 |ab + bc + ca| = ab + bc + ca = |¯ + = a¯b + ¯b¯ c + c¯a ¯| = + . ab bc ca abc
On en déduit :
|ab + bc + ca| =
|a + b + c| = |a + b + c|. |a| |b| |c|
5.5 Soit m et n les deux entiers considérés. Il existe (a, b, c, d) ∈ IN4 tel que m = a2 + b2 et n = c2 + d2 . On a alors :
donc :
mn = (a2 + b2 )(c2 + d2 ) = |a + i b|2 |c + i d|2 = |(a + i b)(c + i d)|2 mn = |(ac − bd) + i (ad + bc)|2 = (ac − bd)2 + (ad + bc)2 .
Comme ac − bd et ad + bc sont des entiers, le résultat est démontré.
193
Chapitre 5. Nombres complexes 5.6 On a : 5
cos θ =
eiθ + e−iθ 2
5
=
1 i5θ e + 5e3iθ + 10eiθ + 10e−iθ + 5e−3iθ + ei5θ . 25
En regroupant les termes symétriques, on obtient :
1 i5θ e + e−i5θ + 5 e3iθ + e−3iθ + 10 eiθ + e−iθ 32 1 = cos(5θ) + 5 cos(3θ) + 10 cos θ . 16
cos5 θ =
De même, on a : 5
sin θ =
eiθ − e−iθ 2i
5
=
1 i5θ e − 5e3iθ + 10eiθ − 10e−iθ + 5e−3iθ − ei5θ (2i)5
1 i5θ e − e−i5θ − 5 e3iθ − e−3iθ + 10 eiθ − e−iθ 32i 1 sin(5θ) − 5 sin(3θ) + 10 sin θ . = 16 =
5.7 Le complexe z n’est pas nul, donc il possède un argument θ . On remarque que Re z + |z| �= 0 , car sinon (Re z)2 = |z|2 = (Re z)2 + (Im z)2 donc Im z = 0 Im z est défini et l’on a : et z = Re(z) = −|z| ∈ IR− . Ainsi Re z + |z| 2 sin 2θ cos |z| sin θ Im z sin θ = = = Re z + |z| |z| cos θ + |z| cos θ + 1 2 cos2 θ2
θ 2
θ = tan · 2
y θ 2
|z|
√ 5.8 On a 1 + i 3 = 2 12 + i
√ 3 2
= 2ei
π 3
θ O x
√ nπ et donc, pour n ∈ IN , (1 + i 3)n = 2n ei 3 . nπ
Ce nombre complexe appartient à IR− si, et seulement si, ei 3 ∈ IR− . Cela équivaut à nπ ≡ π [2π] , c’est-à-dire à l’existence de k ∈ IN tel que nπ = π+2kπ ou encore n = 3+6k . 3 3
5.9 On a : 1 − i de 1 − i
194
√
√
3 = 2
1 2
−i
√
3 2
= 2 exp −i π3 . On en déduit que les racines carrées
√ √ √ π 3 sont ± 2 e−i 6 , c’est-à-dire ± 2 23 − i 21 .
Solutions des exercices √ 5.10 1. Si X + iY est une racine carrée de 1 + i , on a X 2 − Y 2 = 1 , X 2 + Y 2 = 2 et 2X Y = 1 . √ √ 1+ 2 −1 + 2 et Y 2 = · Comme X Y 0 , Par somme et différence, on déduit X 2 = 2 2 les racines carrées de 1 + i sont : √ √ √ √ 1+ 2 −1 + 2 1+ 2 −1 + 2 +i et Z2 = − −i · Z1 = 2 2 2 2 √ iπ 2. Mais, par ailleurs, 1 + i = 2 e 4 , donc les racines carrées de 1 + i s’écrivent π aussi ±21/4 ei 8 . π π Puisque cos > 0 , on a Z1 = 21/4 ei 8 , et donc : 8 π cos = 8
√ √ 1+ 2 2+ 2 √ = 2 2 2
et
π sin = 8
2− 2
√
2
·
5.11 On calcule le discriminant : ∆ = −24 + 10 i . On cherche une racine de ∆ sous forme algébrique a + i b . On doit avoir : a2 − b2 = −24, a2 + b2 =
242 + 102 = 26
ce qui donne a = ±1 , b = ±5 et ab > 0 . On obtient z = z=
5.12 Comme e−z = 2
1 ez
i 1 + 2 3
ou
z=
1 12
et
2ab = 10,
(5 − i ± (1 + 5 i)) et donc :
1 i − · 3 2
, l’équation ez + e−z = 2i équivaut à (ez )2 − 2i ez + 1 = 0 . On résout
l’équation Z − 2i Z + 1 = 0 . On trouve ∆ = −8 . Les solutions sont : √ √ √ √ π π Z1 = (1 + 2)i = (1 + 2) ei 2 et Z2 = (1 − 2)i = ( 2 − 1) e−i 2 .
L’équation équivaut à ez = Z1 ou Z2 . On écrit z = x + i y , avec (x, y) ∈ IR2 . On a √ π alors ez = ex eiy . L’égalité ez = Z1 équivaut à ex = 1 + 2 et ei y = ei 2 , et donc π √ à z = ln(1 + 2) + i 2 + 2kπ avec k ∈ ZZ . √ De même, l’équation ez = Z2 donne z = ln( 2 − 1) + i − π2 + 2kπ . L’ensemble des solutions de l’équation ez + e−z = 2i est donc : √ √ π π + 2kπ k ∈ ZZ ∪ ln( 2 − 1) + i − + 2kπ k ∈ ZZ . ln(1 + 2) + i 2 2
5.13 On note E l’équation donnée. On pose Z = z 2 et on résout Z 2 − 2 sin θ Z + tan2 θ = 0 . On 4 sin4 θ · obtient ∆ = 4(sin2 θ − tan2 θ) = − cos2 θ Les solutions de l’équation du second degré sont donc : Z1 = sin θ + i
sin2 θ = tan θ eiθ cos θ
et
Z2 = tan θ e−iθ .
• Si θ = 0 , alors Z1 = Z2 = 0 et l’équation E a une seule solution 0 .
195
Chapitre 5. Nombres complexes • si θ ∈ ]0, π2 [ , alors tan θ > 0 ; la forme trigonométrique de Z1 est Z1 = tan θ eiθ ; celle
de Z2 est Z2 = tan θ e−iθ . Les solutions de E sont les racines carrées de Z1 et Z2 , c’est-à-dire : √ √ √ √ θ θ θ θ tan θ ei 2 , − tan θ ei 2 , tan θ e−i 2 , − tan θ e−i 2 .
Comme Z1 et Z2 sont distincts et non nuls, les racines carrées de Z1 sont distinctes, et distinctes de celles de Z2 : l’équation E possède 4 solutions distinctes.
• si
θ
∈
]− π2 , 0[ ,
alors
tan θ
0, + sin = sin 7 7 7
Im S = sin
car la fonction sin est croissante et positive sur [0, π2 ] .
196
Solutions des exercices 2. On a, puisque z �= 1 : S +T =
6 k=0
7
car z = e
i 2π
zk − 1 =
1 − z7 − 1 = −1, 1−z
= 1 . On a, en utilisant le fait que z 7 = 1 : ST = z 4 + z 6 + z 7 + z 5 + z 7 + z 8 + z 7 + z 9 + z 10 = z4 + z6 + 1 + z5 + 1 + z + 1 + z2 + z3 = S + T + 3 = 2.
Ainsi S et T sont les solutions de l’équation x2 + x + 2 = 0 . Le discriminant est −7 et les racines
−1±i 2
√ 7
· Comme Im S > 0 , on a : √ −1 + i 7 et S= 2
5.17 • Si Un ⊂ Um , alors, en particulier ei que
2mπ n
2π n
√ −1 − i 7 T = · 2
∈ Um , donc
m
2π n
ei
est un multiple de 2π donc que n divise m .
= ei
2mπ n
= 1 . On en déduit
• Si n divise m , alors il existe p ∈ IN∗ tel que m = np . Soit z ∈ Un . On a z n = 1 . On en déduit z m = (z n )p = 1 , donc z ∈ Um . On a donc Un ⊂ Um . 5.18 Le produit des racines n -ièmes de 1 est égal à : n−1
e
i
2kπ n
= exp
k=0
n−1 2π i k n k=0
2π n(n − 1) = exp i × n 2
5.19 1. Les racines n -ièmes de l’unité sont les complexes e n−1
Sp =
e
2ikpπ n
2ikπ n
n−1
=
e
= ei (n−1)π = (−1)n−1 .
, pour 0 k n − 1 . On a donc
2ipπ n
k=0
k=0
k
.
2ipπ
Le complexe e n est égal à 1 si, et seulement si, n divise p . On en déduit que : • si n divise p , alors Sp = n ; • si n ne divise pas p , alors Sp = 2. On note S ′ =
2ipπ
1− e n
n
2ipπ 1−e n
=
1−e2ipπ 1−e
2ipπ n
= 0.
ξk ξℓ = 0 . On a S12 = S2 + S ′ . Si n 3 , alors n ne divise ni 1 ,
0k,ℓn−1 k�=ℓ
ni 2 , donc S1 = S2 = 0 , d’où l’on déduit S ′ = 0 .
5.20 On remarque que −1 est une solution évidente. Les solutions sont donc les opposées des racines (2n + 1) -ièmes de l’unité.
197
Chapitre 5. Nombres complexes et de rayon R = 5.21 Le cercle Γ est de centre Ω , milieu de [AB] , d’affixe ω = a+b 2 L’équivalence est vérifiée si M = A . On a, si M est un point d’affixe z �= a :
|b−a| · 2
−−→ −−→ z¯ − ¯b z−b z−b ∈ iIR ⇐⇒ =− M A ⊥ M B ⇐⇒ z−a z¯ − a ¯ z−a ⇐⇒ (¯ z − ¯b)(z − a) = −(¯ z−a ¯)(z − b)
⇐⇒ 2z z¯ − z(¯ a + ¯b) − z¯(a + b) + (¯ a b − a ¯b) = 0 ⇐⇒ z z¯ − z ω ¯ − z¯ω +
1 (¯ a b − a ¯b) = 0. 2
On simplifie : z z¯ − z ω ¯ − z¯ω +
1 1 (¯ a b − a ¯b) = (z − ω)(¯ z−ω ¯) − ω ω ¯ + (¯ a b − a ¯b). 2 2
Mais on a : 1 1 1 1 (¯ a b − a ¯b) = (a + b)(¯ a + ¯b) − (¯ a b − a ¯b) = (b − a)(¯b − a ¯) = R 2 . 2 4 2 4 Finalement, on conclut que : −−→ −−→ M A ⊥ M B ⇐⇒ M Ω2 − R2 = 0 ⇐⇒ M Ω = R ⇐⇒ M ∈ Γ. ωω ¯−
−−→ − −→ 5.22 Il s’agit de démontrer que AH ⊥ BC ainsi que les deux relations d’orthogonalité obtenues par permutations circulaires. On a : −−→ −−→ c+b h−a ∈ i IR ⇐⇒ ∈ i IR. AH ⊥ BC ⇐⇒ c−b c−b
On a, puisque b et c appartiennent à U :
1 + 1b b+c c¯ + ¯b c+b c+b = 1c = = =− · 1 c−b b − c c−b − c¯ − ¯b c b −−→ − −→ Ainsi h−a ∈ i IR et donc AH ⊥ BC . Les deux autres relations d’orthogonalité s’obtiennent c−b de la même façon.
√ 5.23 Comme − 3 + i �= 1 , s possède un point fixe unique Ω d’affixe ω = √ D’autre part, on a − 3 + i = 2
√ − 23
+ 12 i = 2 ei
5π 6
1+
√i
3−i
·
.
L’application s est donc la similitude de centre Ω , de rapport 2 et d’angle
5π · 6
5.24 1. D’après la proposition 34 de la page 182 et la proposition 35 de la page 182, F a une expression complexe de la forme z �→ az+b , avec a ∈ IR∗ (si a = 1 , F est une translation, sinon c’est une homothétie de rapport a ). De même, G a une expression complexe de la forme z �→ a′ z + b′ , avec a′ ∈ IR∗ . La composée F ◦ G a pour expression complexe z �→ a(a′ z + b′ ) + b = aa′ z + (ab′ + b) . Comme aa′ ∈ IR∗ , la proposition 38 de la page 184 et la remarque qui suit montrent que F ◦ G est une homothétie ou une translation.
En particulier, si F est une homothétie de rapport a et G un homothétie de rapport a′ , alors F ◦ G est une homothétie de rapport aa′ si aa′ �= 1 et une translation sinon.
198
Solutions des exercices 2. D’après la proposition 34 de la page 182 et la proposition 36 de la page 183, F a une expression complexe de la forme z �→ az + b , avec a complexe tel que |a| = 1 (si a = 1 , alors F est une translation, sinon c’est une rotation dont l’angle a pour mesure un argument de a ). De même, G a une expression complexe de la forme z �→ a′ z + b′ , avec a′ complexe tel que |a′ | = 1 . La composée F ◦ G a pour expression complexe z �→ a(a′ z + b′ ) + b = aa′ z + (ab′ + b) . Comme |aa′ | = 1 , la proposition 38 de la page 184 et la remarque qui suit montrent que F ◦ G est une rotation ou une translation. ′
Si F est une rotation d’angle θ et G une rotation d’angle θ′ , on a a = ei θ et a′ = ei θ . ′
On a donc aa′ = ei(θ+θ ) . Ainsi F ◦ G est une rotation d’angle θ + θ′ si θ + θ′ �≡ 0 [2π] et une translation sinon. 5.25 1. On a 1 + i tan θ �= 0 , donc l’expression A(θ) est définie et : A(θ) =
1 − i tan θ exp(−iθ) = = exp (−2 iθ) . 1 + i tan θ exp(iθ)
On en déduit que |A(θ)| = 1 et qu’un argument de A(θ) est −2 θ . 2. On a : exp(i θ) B(θ) = 1 + i tan θ = · cos θ 1 • Si cos θ > 0 , alors |B(θ)| = cos θ et B(θ) a pour argument θ .
• Si cos θ < 0 , alors |B(θ)| = − cos1 θ et B(θ) a pour argument θ + π .
5.26 1. En mettant sous forme trigonométrique, on a : 50 √ 50 iπ −5 i π 175 i π 1+i 3 2e 3 = 225 e 6 = 225 e 6 . = √ A= − i4π 1−i 2e √ 24 24 3 − i2 . On en déduit A = −2 1 + ei α 1 + cos α + i sin α = est défini pour β �= π [2π] , et : 2. Le complexe B = 1 + cos β + i sin β 1 + ei β B=
donc B =
iα
z1 + z2 Z¯ = 1 + z1 z2 =
1 z1
1+
=Z
iα 2
e−
iα 2
+e
iα 2
cos(α/2) i(α−β) 1+e = e 2 , = iβ iβ i β iβ 1+e cos(β/2) e 2 e− 2 + e 2
cos(α/2) α−β cos cos(β/2) 2
5.27 1. On a :
e
+
1 z2 1 1 z1 z2
+ i sin
α−β 2
.
règles de calculs des conjugués car |z1 | = |z2 | = 1 en réduisant aux mêmes dénominateurs.
Comme Z = Z , on en déduit que Z est réel. 2. On a z1 = eiθ1 et z2 = eiθ2 avec θ1 + θ2 �= π [2π] car z1 z2 �= −1 . Donc :
2 cos θ1 −θ ei (θ1 +θ2 )/2 ei (θ1 −θ2 )/2 + ei (−θ1 +θ2 )/2 eiθ1 + eiθ2 2 · = = Z= 2 1 + ei(θ1 +θ2 ) ei (θ1 +θ2 )/2 e−i (θ1 +θ2 )/2 + ei (θ1 +θ2 )/2 cos θ1 +θ 2
199
Chapitre 5. Nombres complexes 5.28 • En développant le membre de gauche de l’égalité, on obtient :
|z + z ′ |2 + |z − z ′ |2 = z + z ′
z + z′ + z − z′
z − z′
= zz + zz ′ + z ′ z + z ′ z ′ + zz − zz ′ − z ′ z + z ′ z ′
= 2zz + 2z ′ z ′ = 2 |z|2 + |z ′ |2 . • Les points O , M , N et M ′ d’affixes 0 , z , z + z ′ et z ′ respectivement forment un parallélogramme. On a : |z + z ′ |2 + |z − z ′ |2 = ON 2 + M M ′
2
2
2
2 |z|2 + |z ′ |2 = 2(OM 2 + OM ′ ) = OM 2 + OM ′ + M N 2 + M ′ N 2 , N
ce qui signifie que, dans ce parallélogramme, la somme des carrés des longueurs des diagonales est égale à la somme des carrés des longueurs des quatre côtés.
M
′
M O
5.29 Soit v une racine carrée de z et v ′ une racine carrée de z ′ . Alors on a u = ±v v ′ et, dans les deux cas :
z + z′ 2 −u
2 z + z′ v + v ′2 + = + u − v v′ 2 2
Le membre de droite de l’égalité s’écrit :
(v − v ′ )2 2
(v + v ′ )2 + 2
2 v + v ′2 + + v v′ 2
1 ′ 2 ′ 2 = 2 |v − v | + |v + v | =
.
1 1 v − v ′ v¯ − v¯′ + v + v ′ v¯ + v¯′ 2 2 2
= |v|2 + v ′ = |z| + z ′ . 5.30 1. On a :
b 1 1 1 a 1 − 2 = − = − · ¯b |a|2 |b| a ¯ a b On sait que, pour tout nombre complexe z , on a |¯ z | = |z| et | − z| = |z| . On obtient donc : a b 1 |b − a| 1 b − a |a − b| − = = − = · = |a|2 |b|2 a b ab |b| |a| |b| |a|
2. Si x , y et z sont différents de 0 , alors l’inégalité demandée est équivalente à : |z − x| |x − y| |y − z| + , |y| |z| |z| |x| |x| |y|
c’est-à-dire, d’après la question 1, à :
200
y z z x x y + − − − |y|2 |z|2 |z|2 |x|2 |x|2 |y|2 .
Solutions des exercices Cette dernière inégalité résulte de l’inégalité triangulaire. En effet, on a :
y z z y z x y x − = − = − + − 2 2 |y|2 |z|2 |z|2 |y|2 |z|2 |x|2 |x| |y| z x x y + − 2. 2 − |z| |x|2 |x|2 |y|
Si x = 0 , l’inégalité à démontrer est évidente, car le membre de gauche est nul et le membre de droite positif ; si y = 0 ou z = 0 , l’inégalité est une égalité. 3. On pose X = x − y , Y = x − z et Z = x − w . On a alors, d’après la question 2 : |X| |Y − Z| |Y | |Z − X| + |Z| |X − Y |
ce qui équivaut à :
|x − y| · |w − z| |x − z| · |y − w| + |x − w| · |z − y|,
qui est l’inégalité demandée.
5.31 • Si z1 , . . . , zn ont un même argument θ , on a, pour 1 k n , zk = |zk | eiθ . On en déduit n
zk =
k=1
n k=1
n n n zk = |zk | |eiθ | = |zk |. k=1 k=1 k=1
|zk | eiθ puis
n n zk = |zk | implique que z1 , . . . , zn ont mêmes arguments, par • Démontrons que k=1
k=1
récurrence sur n . La propriété est évidente pour n = 1 . Supposons qu’elle soit vérifiée à un rang n 1 et considérons n + 1 complexes non nuls z1 , . . . , zn , zn+1
n+1 n+1 tels que zk = |zk | . k=1
k=1
Par inégalité triangulaire, on a :
n+1 n n n n+1 zk = zk + zn+1 zk + |zn+1 | |zk | + |zn+1 | = zk , k=1
k=1
k=1
k=1
k=1
cette dernière égalité résultant de l’hypothèse. Les deux termes extrêmes étant égaux, toutes les inégalités sont des égalités. On a donc :
n n zk + |zn+1 | zk + zn+1 = k=1
k=1
et
n n zk = |zk |. k=1
k=1
La deuxième égalité implique, par hypothèse de récurrence, que z1 , . . . , zn ont mêmes arguments. En appelant θ un tel argument, on en déduit que Z =
n
k=1
avec
n
k=1
|zk | > 0 . Donc Z a pour argument θ .
zk =
n
k=1
|zk | eiθ ,
La première égalité |Z + zn+1 | = |Z| + |zn+1 | implique alors d’après l’exemple 15 de la page 173 que zn+1 et Z ont mêmes arguments. Ainsi, θ est aussi un argument de zn+1 , ce qui termine la récurrence.
201
Chapitre 5. Nombres complexes 5.32 1. En utilisant la formule de Moivre et la formule du binôme, on trouve, pour x ∈ IR : e
i5x
= e
ix 5
5
= (cos x + i sin x) =
5 5 k=0
k
cosk x (i sin x)5−k .
Les termes réels de cette somme sont ceux pour lesquels 5 − k est pair, i.e. k impair. On a donc :
cos(5 x) = Re ei 5 x = cos5 x − 10 cos3 x sin2 x + 5 cos x sin4 x = cos5 x − 10 cos3 x (1 − cos2 x) + 5 cos x(1 − cos2 x)2 = 16 cos5 x − 20 cos3 x + 5 cos x. 2. Comme 5
π 10
=
π 2
, le réel u = cos
est racine de l’équation :
π 10
0 = 16 u5 − 20 u3 + 5 u = u 16 u4 − 20 u2 + 5 . Si u �= 0 , alors z = u2 vérifie 16 z 2 − 20 z + 5 = 0 , équation dont les solutions sont Les valeurs possibles de u sont donc : √ √ √ √ 10 + 2 5 10 + 2 5 10 − 2 5 10 − 2 5 , − , , − · 0, 4 4 4 4 √ √ π π π π 3 10 + 2 5 Comme , on a cos ∈ 0, ∈ , 1 et donc cos = · 10 6 10 2 10 4
Remarque Les cinq racines trouvées sont les cos (2 k + 1)
π 5
√ 5± 5 · 8
pour k ∈ [[0, 4]] .
1 + iz 5 = 1 , car −i n’est pas solution. Par suite, z 1 − iz en est solution si, et seulement si, l’on peut trouver k ∈ [[0, 4]] tel que :
5.33 Méthode 1 : l’équation équivaut à
Comme e
2iπk 5
2iπk 1 +iz =e 5 . 1 −iz
�= −1 , cela équivaut à : e
2iπk 5
iπk 5
e
iπk 5
−e
−iπk 5
−1 kπ e = iπk iπk = tan · z= −iπk 2iπk 5 5 5 5 5 +1 e +e i e ie
Méthode 2 : on développe en utilisant la formule du binôme. Pour tout nombre complexe u , on a (1 + u)5 = u5 + 5 u4 + 10 u3 + 10 u2 + 5 u + 1 . L’équation équivaut donc à : i z 5 + 5 z 4 − 10 i z 3 − 10 z 2 + 5 i z + 1 = −i z 5 + 5 z 4 + 10 i z 3 − 10 z 2 − 5 i z + 1,
c’est-à-dire à :
z z 4 − 10 z 2 + 5 = 0,
qui se résout facilement (si z �= 0 , z 2 est solution d’une équation du second degré). On trouve comme solutions : √ √ √ √ − 5 + 2 5, − 5 − 2 5, 0, 5 − 2 5, 5 + 2 5 . Comme tan
202
π π ∈ ]0, 1] , on a tan = 5 5
5−2
√
5.
Solutions des exercices 5.34 1. Après avoir vérifié que 1 n’est pas solution, on résout l’équation Comme
z+1 z−1
n
= 1.
z+1 �= 1 , z est solution si, et seulement s’il existe k ∈ [[1, n − 1]] tel que : z−1 2ik π z+1 =e n , z−1
ce qui, puisque e
2ik π n
�= 1 , équivaut à : z=
e
2ik π n
+1
e
2ik π n
−1
On trouve n − 1 solutions : zk = −i
kπ n 2i sin knπ
2 cos
=
cos knπ
= −i
cos sin
kπ n kπ n
,
, avec k ∈ [[1, n − 1]].
sin knπ
x Montrons qu’elles sont distinctes. La fonction f : x �→ − cos est définie et dérivable sin x
sur ]0, π[ . Sa dérivée f ′ : x �→
est strictement positive ]0, π[ , donc f est strictement
1 sin2 x
croissante sur ]0, π[ . Comme zk = if solutions sont donc distinctes.
kπ n
, avec kπ ∈ ]0, π[ , pour k ∈ [[1, n − 1]] , les n n
2. On raisonne comme dans la première question : z est une solution de cette équation si, et seulement s’il existe k ∈ [[0, n−1]] tel que on obtient : z= 2k n
< 2, e Comme 0 On peut conclure que :
2ik π n
e
2ik π n
e
2ik π n
z+1 1−z
−1
+1
2ik π n
=e
= i tan 2k n
= −1 équivaut à
. Pour tout k tel que e
�= −1 ,
kπ · n
= 1 , ce qui nécessite que n soit pair.
kπ avec k ∈ [[1, n − 1]] ; n tan knπ avec k ∈ [[1, n − 1]]
• si n est impair, on a n solutions : zk = i tan • si n est pair, on a n − 1 solutions : zk = i
2ik π n
et k �=
n · 2
On montre comme dans la première question que ces solutions sont distinctes. La fonction tan , dont la dérivée est x �→ cos12 x , est strictement croissante sur ]0, π2 [ et sur ] π2 , π[ . De plus tan(x) > 0 si x ∈ ]0, π2 [ et tan(x) < 0 si x ∈ ] π2 , π[ , donc les solutions sont distinctes.
5.35 1. On a 1 + i =
√
π
n
2 ei 4 et donc (1 + i)n = 2 2 ei
nπ 4
2. On a d’après la formule du binôme, (1 + i)n =
.
n n p
p=0
ip .
Si p = 2k , alors ip = (−1)k ; si p = 2k + 1 , alors ip = (−1)k i . En séparant les termes correspondant à p pair et à p impair, on obtient n
(1 + i) =
n
⌊n/2⌋ k=0
2k
k
(−1) +
⌊(n−1)/2⌋
k=0
n (−1)k i = S + iS ′ . 2k + 1
En effet, par exemple dans le cas p = 2k , il faut 2k n , soit k n
On en déduit S = Re((1 + i) ) = 2
n 2
cos
nπ 4
′
n
n 2
et S = Im((1 + i) ) = 2
et donc k ⌊ n2 ⌋ .
n 2
sin
nπ · 4
203
Chapitre 5. Nombres complexes 5.36 On a : n
(1 + 1) =
n n p=0
p
n n
n
, (1 + j) =
p
p
p=0
p
2 n
j , (1 + j ) =
n n
p
p=0
3
j 2p .
La valeur de j ne dépend que du reste de p modulo 3 , puisque j = 1 . On en déduit que si 3 divise p , alors 1 + j p + j 2p = 3 et que sinon, 1 + j p + j 2p = 1 + j + j 2 = 0 . • En faisant la somme des trois égalités, on obtient : n
n
2 n
(1 + 1) + (1 + j) + (1 + j ) = Comme (1 + j)n =
√
1+i 3 2
n
n n p=0
= ei
nπ 3
S0 =
(1 + j p + j 2p ) = 3S0 .
p
et (1 + j 2 )n = (1 + j)n , on en déduit :
1 n nπ 2 + 2 cos 3 3
·
• Pour déterminer S1 , on calcule (1 + 1)n + j 2 (1 + j)n + j(1 + j 2 )n . On obtient : (1 + 1)n + j 2 (1 + j)n + j(1 + j 2 )n =
n n p=0
Comme j 2 (1 + j)n = e−i
2π 3
ei
nπ 3
= ei
1 S1 = 3
(n−2)π 3
p
(1 + j p+2 + j 2(p+2) ) = 3S1 .
et j(1 + j 2 )n = j 2 (1 + j)n , on en déduit :
(n − 2)π 2 + 2 cos 3 n
.
• En calculant (1 + 1)n + j(1 + j)n + j 2 (1 + j 2 )n , on obtient de même : S2 =
1 1 (1 + 1)n + j (1 + j)n + j 2 (1 + j 2 )n = 3 3
2n + 2 cos
(n + 2)π 3
·
5.37 1. En utilisant la formule de Moivre et la formule du binôme, on a : n
cos(nθ) + i sin(nθ) = (cos θ + i sin θ) =
n n k=0
k
cosn−k θ (i sin θ)k .
Les termes réels de cette somme correspondent aux valeurs paires de l’indice, de la forme k = 2p , avec p n2 , c’est-à-dire p ⌊ n2 ⌋· On a alors ik = (−1)p .
Les termes imaginaires de la somme correspondent aux valeurs impaires de l’indice k , de la forme k = 2p + 1 avec 2p + 1 n , c’est-à-dire p ⌊ n−1 ⌋· On a alors ik = i (−1)p . 2 En séparant partie réelle et partie imaginaire, on obtient : n
cos(nθ) =
⌊2⌋
(−1)
p=0
p
⌊ n−1 ⌋ 2
sin(nθ) =
p=0
(−1)
n cosn−2p θ sin2p θ, 2p
p
n cosn−(2p+1) θ sin2p+1 θ. 2p + 1
Remarque Comme l’expression de cos(nθ) ci-dessus ne contient que des puissances paires de sin θ , on peut aussi obtenir cos(nθ) comme un polynôme en cos θ ; il suffit de remplacer sin2 θ par 1 − cos2 θ .
204
Solutions des exercices 2. Par hypothèse, tan(nθ) et tan θ sont définis. On peut écrire : ⌊
sin(nθ) = tan(nθ) = cos(nθ)
n−1 ⌋ 2
�
(−1)p
p=0 ⌊n ⌋ 2
�
�
�
n 2p+1
(−1)
p
cosn−(2p+1) θ sin2p+1 θ
�n�
cosn−2p
2p
p=0
θ sin
·
2p
θ
En divisant numérateur et dénominateur par cosn θ , on obtient : ⌋ ⌊ n−1 2
�
sin(nθ) = tan(nθ) = cos(nθ)
(−1)p
p=0 ⌋ ⌊n 2
�
(−1)
�
p
p=0
5.38 1. Soit x ∈ IR . On a : An =
� n � � 1 + cos (2k x) 2
k=0
�
n 2p+1
�n�
An =
1 n+1 + Re 2 2
1 n+1 + Re = 2 2
�
1 n+1 + Re = 2 2
�
�
1 − ei 2(n+1)x 1 − ei2x
·
tan2p θ
2p
Par suite : • si e2i x �= 1 , c’est-à-dire x �≡ 0 [π] , on a :
tan2p+1 θ
n � �
e
�
2i x k
k=0
�
�
ei (n+1)x 2i sin (n + 1)x ei x 2i sin x
�
�
�
.
��
cos(n x) sin (n + 1)x n+1 = + ; 2 2 sin x • si x ≡ 0 [π] , alors An = n + 1 . 2. On a Bn = Re
�
n � ei kx
k=0
cosk x
�
= Re
�
• Si x ≡ 0 [π] , alors Bn = n + 1. ix • Sinon, exp �= 1 et on obtient : cos x
n �
k=0
�
ei x cos x
�k �
et
eix cos x
=1+
i sin x cos x
.
ei(n+1)x � � 1 cosn+1 x − ei (n+1) x cosn+1 x = Re Bn = Re cosn x −i sin x eix 1− cos x
1 −
=
�
�
� � � � sin (n + 1)x 1 Re i cosn+1 x − e(n+1) i x · = n sin x cos x sin x cosn x � �
5.39 1. • L’application f n’est pas injective car f (2) = f 21 · • L’application f est surjective. En effet, pour tout complexe Z , l’équation du second degré : z2 − Z z + 1 = 0 possède au moins une solution z , qui est non nulle (car 0 n’est pas solution), et il est alors immédiat de vérifier que l’on f (z) = Z .
205
Chapitre 5. Nombres complexes
2. • Par définition, on a f (IR∗ ) = x + de variations montre que :
1 x
| x ∈ IR∗ . C’est une partie de IR , et une étude
f (IR∗ ) = ]−∞, −2] ∪ [2, +∞[.
• Comme U = ei t t ∈ [0, 2 π] , on a : f (U) = ei t + e−i t t ∈ [0, 2 π] = 2 cos t t ∈ [0, 2 π] = [−2, 2].
5.40 1. • Comme f est une application de C dans C et que, pour tout Z ∈ C , l’équation du second degré f (z) = Z possède au moins une racine complexe z , l’application f est surjective. Par suite f (C) = C . • Pour tout Z ∈ C , l’équation du second degré z 2 + z + 1 = Z possède au moins une racine non nulle puisque la somme de ses racines vaut −1 ; par suite, on a C ⊂ f (C∗ ) . Comme f (C∗ ) ⊂ C est évident, on en déduit f (C∗ ) = C . • Comme f (IR) = x2 + x + 1 | x ∈ IR = (x + 21 )2 + 34 | x ∈ IR , on en déduit que f ( IR) est l’intervalle [ 34 , +∞[ de IR .
2. • Comme C est l’ensemble d’arrivée de f , alors f −1 (C) en est l’ensemble de départ, et on a donc f −1 (C) = C . • On a f −1 (C∗ ) = {z ∈ C | f (z) �= 0 } = C \ {j , j 2 } . • Pour z ∈ C , on a : z ∈ f −1 ( IR) ⇔ f (z) = f (z) ⇔ (z − z) (z + z + 1) = 0 ⇔ (z = z
ou
z + z = −1).
Ainsi, l’ensemble f −1 ( IR) est la réunion de IR et de l’ensemble des complexes dont la partie réelle est − 21 · 5.41 1. Pour tout z ∈ C \ {−i} , ϕ(z) est défini et ϕ(z) �= 1 , car z − i �= z + i . Donc ϕ est une application de C \ {−i} dans C \ {1} . Montrons qu’elle est bijective. Soit z ′ ∈ C \ {1} . Pour tout z ∈ C \ {−i} , on a :
ϕ(z) = z ′ ⇐⇒ z − i = (z + i)z ′ ⇐⇒ z(1 − z ′ ) = i(1 + z ′ ) ⇐⇒ z =
i(1 + z ′ ) · 1 − z′
1 + z′ �= 1 . Ainsi −1 + z ′ ′ −1 est définie tout z ∈ C \ {1} a un antécédent unique donc ϕ est bijective. De plus ϕ par : i(1 + z ′ ) · ∀z ′ ∈ C \ {1}, ϕ−1 (z ′ ) = 1 − z′ Ce dernier quotient est défini car z ′ �= 1 et on a z �= −i , car
2. (a) Déterminons ϕ−1 (IR) . Il s’agit des éléments z ∈ C \ {−i} tels que ϕ(z) ∈ IR . On a : ϕ(z) ∈ IR ⇐⇒ ϕ(z) = ϕ(z) ⇐⇒
z−i z¯ + i = z¯ − i z+i
⇐⇒ (¯ z + i)(z + i) = (¯ z − i)(z − i) ⇐⇒ z¯ = −z ⇐⇒ z ∈ iIR. On a donc ϕ−1 (IR) = iIR \ {−i} .
206
Solutions des exercices (b) Déterminons ϕ(IR) . Il s’agit des éléments de C qui sont les images par ϕ d’un réel, autrement dit des éléments z ′ ∈ C \ {1} tels que ϕ−1 (z ′ ) soit réel, puisque ϕ est bijective. −i(1 + z¯′ ) Comme ϕ−1 (z ′ ) = , on a : 1 − z¯′ i(1 + z ′ ) −i(1 + z¯′ ) = ′ 1−z 1 − z¯′ ⇐⇒ (1 + z ′ )(1 − z¯′ ) = −(1 + z¯′ )(1 − z ′ )
ϕ−1 (z ′ ) ∈ IR ⇐⇒
⇐⇒ |z ′ |2 = 1 ⇐⇒ |z ′ | = 1. Ainsi ϕ(IR) est l’ensemble des nombres complexes de module 1 , privé de 1 , c’est-àdire U \ {1} . (c) Déterminons ϕ U \ {−i} . Il s’agit des éléments de C qui sont les images par ϕ d’un élément de U\{−i} , autrement des éléments z ′ ∈ C \{1} tels que ϕ−1 (z ′ ) ∈ U\{−i} . On a : i(1 + z ′ ) |1 + z ′ | = |ϕ−1 (z ′ )| = , 1 − z′ |1 − z ′ | donc :
|ϕ−1 (z ′ )| = 1 ⇐⇒ |1 + z ′ | = |1 − z ′ | ⇐⇒ |1 + z ′ |2 = |1 − z ′ |2
⇐⇒ (1 + z ′ )(1 + z¯′ ) = (1 − z ′ )(1 − z¯′ ) ⇐⇒ z¯′ = −z ′ ⇐⇒ z ′ ∈ iIR.
On a donc ϕ(U \ {−i}) = iIR .
−→ −→ 5.42 Le triangle équilatéral ABC est dit direct (resp. indirect) si l’angle AB, AC a pour mesure π3 (resp. − π3 ). Le triangle ABC est équilatéral direct si, et seulement si, C est l’image de B par la rotation de centre A et d’angle π3 , ce qui s’écrit : (c − a) = ei
π 3
(b − a) = −j 2 (b − a)
c’est-à-dire, après réduction, a j + b j 2 + c = 0 (car 1 + j + j 2 = 0 ). De même ABC est équilatéral indirect si, et seulement si, (c − a) = e−i
π 3
(b − a) = −j (b − a)
2
c’est-à-dire a j + b j + c = 0 . La condition cherchée s’écrit donc :
a j + b j2 + c
a j 2 + b j + c = 0.
Après simplification, en utilisant 1+j +j 2 = 0 , on obtient : a2 +b2 +c2 −(b c + a c + a b) = 0. 5.43 On note M, M ′ , M ′′ les points d’affixes z, z 2 , z 3 . 1. Si z = 1 ou z = 0 , les points sont confondus donc alignés ; sinon, ils sont alignés si, et 3
−z = z + 1 est réel, ce qui équivaut à z réel. Comme 0 et 1 sont réels, seulement si, zz 2 −z on conclut que les trois points sont alignés si, et seulement si, z est réel.
207
Chapitre 5. Nombres complexes 2. On suppose que les points sont distincts, c’est-à-dire que z ∈ C \ {−1, 0, 1} . Le triangle M M ′ M ′′ est rectangle en M si, et seulement si, pur.
z 3 −z z 2 −z
= z + 1 est imaginaire 3
2
−z De même M M ′ M ′′ est rectangle en M ′ (resp. en M ′′ ) si, et seulement si, zz−z 2 = −z
(resp.
z−z 3 z 2 −z 3
=1+
1 z
) est imaginaire pur.
Les deux premiers cas équivalent à Re z = −1 ou 0 , c’est-à-dire géométriquement au fait que M appartient à la réunion de deux droites d1 et d2 . La dernière condition est 1 +
1 z ¯
= −1 −
1 z
, soit 2z z¯ = −(z + z¯) = −2 Re z . En no-
tant z = x + i y , avec x et y réels, on obtient x2 + y 2 = −x , donc :
x+
1 2
2
+ y2 =
1 . 4
On reconnaît l’équation du cercle C de centre Ω , d’affixe − 21 et de rayon est tangent aux droites d1 et d2 ).
1 2
(ce cercle
Finalement le triangle M M ′ M ′′ est rectangle si, et seulement si, l’image M de z appartient à d1 ∪ d2 ∪ C \ {O, A} , où A est le point d’affixe −1 . 3. En plus d’être imaginaire pur, il faut que dans chaque cas le rapport soit de module 1 . Ce qui donne, dans le premier cas z + 1 = ±i , dans le second cas z = ±i et dans le troisième cas 1 + 1z = ±i . Finalement le triangle M M ′ M ′′ est rectangle et isocèle si, et seulement si, z appartient à :
208
1 1 − 1 − i, −1 + i, −i, i, (−1 − i), (−1 + i) . 2 2
Chapitre 6 : Fonctions usuelles I
Fonctions logarithmes et exponentielles . . . . . . Fonction logarithme népérien . . . . . . . . . . . . Fonction exponentielle . . . . . . . . . . . . . . . . Représentation graphique des fonctions ln et exp Logarithmes de base quelconque . . . . . . . . . . II Fonctions puissances . . . . . . . . . . . . . . . . . . 1 Définition . . . . . . . . . . . . . . . . . . . . . . . 2 Croissances comparées . . . . . . . . . . . . . . . . III Fonctions circulaires . . . . . . . . . . . . . . . . . . 1 Fonctions sinus et cosinus . . . . . . . . . . . . . . 2 Fonction tangente . . . . . . . . . . . . . . . . . . 3 Fonctions circulaires réciproques . . . . . . . . . . IV Fonctions hyperboliques . . . . . . . . . . . . . . . 1 Fonctions sinus et cosinus hyperboliques . . . . . . 2 Fonction tangente hyperbolique . . . . . . . . . . . V Fonctions à valeurs complexes . . . . . . . . . . . . 1 Généralités . . . . . . . . . . . . . . . . . . . . . . 2 Dérivée d’une fonction complexe . . . . . . . . . . 3 Opérations sur les fonctions dérivables . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
4 Dérivée de ef . . . . . . . . . . . . . . . . 5 Caractérisation des fonctions constantes . . 6 Dérivées successives . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . 230 . . 231 . . 231 . 232 . 237
1 2 3 4
. . . . .
. . . . .
. . . . .
. . . . .
. . . . . . . . . . . . . .
210 210 212 212 213 213 213 216 217 218 219 220 225 225 227 228 228 228 229
Fonctions usuelles
6
Nous donnons ici les définitions et propriétés de base des fonctions dites usuelles.
I
Fonctions logarithmes et exponentielles
Préliminaire Dans ce chapitre, nous utiliserons les résultats suivants, qui ont été rencontrés dans le secondaire et qui seront démontrés ultérieurement. On suppose ci-dessous que I est un intervalle d’intérieur non vide. 257
• Toute fonction réelle f continue sur I admet une primitive sur I , c’est-à-dire qu’il existe une fonction dérivable F : I → IR telle que F ′ = f . D’après ce qui a été vu au chapitre 3, deux primitives de f diffèrent d’une fonction constante (cf.corollaire 15 de la page 86).
• Comme nous l’avons remarqué au chapitre 3, si f : I → IR est une fonction dérivable, dont la dérivée a un signe fixe et ne s’annule qu’un nombre fini de fois, alors f définit une bijection de I sur l’intervalle J = f (I) (proposition 16 de la page 87). 388
• Si f est monotone sur I , alors en chaque extrémité de I , la fonction f admet une limite, finie ou infinie.
1
Fonction logarithme népérien
En classe de Première, la fonction exponentielle a été introduite comme l’unique solution de l’équation différentielle y ′ = y (mais sans en prouver l’existence) vérifiant y(0) = 1 . En classe de Terminale, la fonction logarithme a elle été introduite comme fonction réciproque de la précédente, ce qui a permis de montrer que la dérivée de la fonction logarithme est la fonction x �→ x1 ·
Pour l’instant nous ne pouvons pas encore justifier directement l’existence d’une solution de l’équation différentielle y ′ = y ; c’est pourquoi, nous allons commencer par introduire la fonction logarithme en tant que primitive de x �→ x1 , puis en déduire la fonction exp comme fonction réciproque.
I Fonctions logarithmes et exponentielles
Exo 6.1
Définition 1 La fonction logarithme népérien, notée ln , est l’unique primitive sur IR∗+ qui 1 s’annule en 1 de la fonction x �→ , ce qui s’écrit aussi : x x du ∗ · ∀x ∈ IR+ ln x = u 1 Proposition 1 La fonction logarithme vérifie : ∀x ∈ IR∗+
∀y ∈ IR∗+
ln(x y) = ln x + ln y. Démonstration page 232
Principe de démonstration. Fixer y ∈ IR∗+ et dériver la fonction uy : IR∗+ x
Corollaire 2 1. On a : ∀x ∈
IR∗+
2. On a : ∀x ∈ IR∗+ Démonstration.
∀y ∈
IR∗+
∀n ∈ ZZ
−→ �−→
IR ln(x y).
x = ln x − ln y . ln y
ln(xn ) = n ln x.
Conséquences immédiates de la proposition précédente et de x = y
Remarque En particulier, on a
∀x ∈ IR∗+
ln
1 x
x · y
= − ln x.
Proposition 3 La fonction logarithme népérien est une bijection strictement croissante de ]0, +∞[ sur IR vérifiant : lim ln x = −∞
x→0
et
Puisque la fonction logarithme a une dérivée à valeurs strictement positives sur l’intervalle ]0, +∞[ , elle est strictement croissante et la proposition précédente permet de donner le tableau de variations complet pour la fonction logarithme.
lim ln x = +∞.
x→+∞
Démonstration page 232
x f (x)
0
′
1 +
+∞ +∞
0
f −∞
Remarques • Comme le montre le tableau, x étant un réel strictement positif, on a ln x > 0 si, et seulement si, x > 1 et ln x < 0 si, et seulement si, x < 1 . • Il existe un unique réel, noté e , tel que ln e = 1 . Un outil de calcul permet, par exemple, d’obtenir l’encadrement suivant : 2, 718 281 e 2, 718 282. 211
Chapitre 6. Fonctions usuelles Proposition 4 Pour x ∈ ]−1, +∞[ , on a ln(1 + x) x, avec égalité si, et seulement si, x = 0 . Principe de démonstration.
2
Démonstration page 232 Étudier la fonction x �→ x − ln(1 + x) .
Fonction exponentielle
Définition 2 La fonction exponentielle, notée exp, est la fonction réciproque de la fonction logarithme népérien. Proposition 5 La fonction exponentielle est une bijection strictement croissante de IR sur IR∗+ , vérifiant exp 0 = 1 ainsi que : lim exp x = 0
x→−∞
et
lim exp x = +∞.
x→+∞
Elle est dérivable sur IR et l’on a exp′ = exp. Principe de démonstration.
Démonstration page 232 Utiliser les propriétés de la fonction ln et des fonctions réci-
proques.
Proposition 6 Pour tout x ∈ IR, y ∈ IR et n ∈ ZZ, on a : exp(x + y) = exp x exp y ,
exp(x − y) =
exp x exp y
et
exp(n x) = (exp x)n .
Démonstration page 233 Utiliser les résultats de la proposition 1 de la page précédente et de son corollaire, en posant u = exp x et v = exp y .
Principe de démonstration.
Proposition 7 Pour x ∈ IR, on a 1 + x exp(x) avec égalité si, et seulement si, x = 0 . Principe de démonstration.
3
Démonstration page 233 Utiliser l’inégalité de la proposition 4.
Représentation graphique des fonctions ln et exp
De ce qui précède, on déduit les tableaux de variations des fonctions ln et exp ainsi que leurs représentations graphiques. y = exp x x
0
1
ln −∞ x
−∞
exp 0 212
e 1
0 0 1
+∞ +∞
e
y = ln x
1 1 e
+∞ +∞
O
1
e
II Fonctions puissances
4
Logarithmes de base quelconque
Définition 3 Si a est un réel strictement positif et différent de 1 , on appelle logarithme de base a la fonction, notée loga , définie sur IR∗+ par : loga x =
ln x · ln a
Ex. 1. Si a = e , on retrouve le logarithme népérien. Ex. 2. Si a = 10 , on obtient le logarithme décimal que l’on note aussi log et qui, historiquement, a joué un rôle important car il a permis de faire de nombreux calculs avant l’avènement des ordinateurs et des calculatrices. Il est toujours utilisé en physique (décibels) et en chimie (pH). Ex. 3. Si a = 2 , on obtient le logarithme binaire utile notamment en informatique.
Propriétés Soit a ∈ IR∗+ \ {1} . Des propriétés de la fonction ln , on déduit : • loga est une bijection de IR∗+ sur IR vérifiant loga 1 = 0 et loga a = 1 ; ∗ si a > 1 , alors la fonction loga est strictement croissante ; ∗ si 0 < a < 1 , alors la fonction loga est strictement décroissante ;
• pour tout x ∈ IR∗+ et y ∈ IR∗+ , on a : loga (x y) = loga x + loga y Exo 6.2
et
x = loga x − loga y ; loga y
• pour tout x ∈ IR∗+ et tout n ∈ ZZ, on a :
loga (xn ) = n loga x.
II 1
Fonctions puissances Définition
Pour tout x ∈ IR∗+ , par définition de la fonction exp, on a x = exp ln x . D’après les propriétés usuelles de la fonction exponentielle, pour tout n ∈ ZZ on a : n (∗) xn = exp (ln x) = exp(n ln x).
Cela conduit naturellement à la définition suivante.
Définition 4 Pour tout réel x > 0 et a ∈ IR on définit le réel x puissance a , noté xa , par : xa = exp a ln x . Notation
Pour a ∈ IR, dans toute la suite de ce chapitre on note : ϕa : IR∗+ −→ IR∗+ x �−→ xa = exp(a ln x).
Les fonctions ϕa sont appelées fonctions puissances.
213
Chapitre 6. Fonctions usuelles Cas particuliers • La fonction ϕ0 est la fonction constante égale à 1 . • La fonction ϕ1 est l’identité de IR∗+ .
• Par définition de la notation xn lorsque n ∈ IN, la fonction fn : x �→ xn est définie sur IR. Ainsi d’après la relation (∗), la fonction ϕn est la restriction à IR∗+ de fn . De même, lorsque n ∈ ZZ∗− , la fonction fn : x �→ xn est définie sur IR∗ et ϕn est la restriction à IR∗+ de fn . √ • Lorsque n ∈ IN∗ et x ∈ IR∗+ , on a ϕ n1 (x) = n x (voir page 92). Proposition 8 Pour a et b réels, x > 0 et y > 0 , on a : xa y a = (x y)a
xa xb = xa+b
1a = 1
(xa )b = xab
x0 = 1
Principe de démonstration.
ln(xa ) = a ln x.
Démonstration page 233 Conséquences des propriétés de la fonction exponentielle.
Remarque Les résultats ci-dessus confortent le bien fondé de la notation puissance prise page 213, puisqu’ils généralisent les règles de calcul que l’on connaît déjà sur les puissances entières. Proposition 9 Pour tout tout a ∈ IR, la fonction ϕa est dérivable sur IR∗+ et : ∀x ∈ IR∗+ Principe de démonstration.
lim xa = 0
x→0
lim xa = +∞
x→0
Principe de démonstration.
Démonstration page 233
Revenir à la définition de ϕa .
Proposition 10 • Lorsque a > 0 , on a :
• et lorsque a < 0 , on a :
ϕ′a (x) = a xa−1 .
lim xa = +∞ ;
et
x→+∞
et
lim xa = 0.
x→+∞
Démonstration page 233
Utiliser l’écriture xa = exp a ln x .
Prolongement à IR+ dans le cas a > 0 Comme le montre la proposition précédente, si a > 0 , on peut prolonger ϕa en une fonction continue en 0 en posant ϕa (0) = 0 . ϕa (x) = ϕa−1 (x), on en déduit que : Comme, pour tout x ∈ IR∗+ , on a x • si a > 1 , alors la fonction ϕa est dérivable en 0 et ϕ′a (0) = 0 ; 214
II Fonctions puissances • si 0 < a < 1 , alors la fonction ϕa n’est pas dérivable en 0 mais son graphe possède une tangente verticale à l’origine ; • si a = 1 , alors ϕa est l’identité, qui est donc dérivable en 0 , et ϕ′a (0) = 1 . Représentation graphique des fonctions puissances En fonction du signe de a, on en déduit immédiatement les variations de ϕa ainsi que sa courbe représentative : cas a > 0 x ϕa
0
+∞ +∞
1
a>1
y
1
a=1
0
cas a < 0 x ϕa
0 +∞
0 0 , l’expression xln x a un sens. Le domaine de définition de f est donc IR∗+ et : ∀x ∈ IR∗+
f (x) = exp ln2 x .
• Par les théorèmes généraux, les fonctions exp et ln étant dérivables, f est dérivable et : ∀x ∈ IR∗+
f ′ (x) = 2
Le signe de f ′ (x) est donc celui de ln x .
1 ln(x) exp ln2 x . x
215
Chapitre 6. Fonctions usuelles • Par opérations sur les limites, sachant que lim ln2 (x) = +∞ et x→0
obtient lim f (x) = +∞ . De même x→0
x
0
1
lim exp(t) = +∞ , on
t→+∞
lim f (x) = +∞ . y
x→+∞
+∞
+∞
+∞
f 1 O
2
x
Croissances comparées
Proposition 11 Exo 6.4
+
1
On a
lim
x→+∞
ln x x
=0
et
Principe de démonstration. • Pour x 1 , on peut majorer ln x =
lim (x ln x) = 0 .
x→0
Démonstration page 234
x 1
dt par t
1
x
dt √ qui s’exprime facilement (sans ln ). t
Le théorème d’existence de limite par encadrement donne alors • Pour la seconde limite, changer x en
lim
x→+∞
ln x x
= 0.
1 · x
Corollaire 12 (Propriété de croissances comparées) (ln x)b ∗ ∗ = 0 et lim xa | ln x|b = 0. Si a ∈ IR+ et b ∈ IR+ , on a : lim x→+∞ x→0 xa
Démonstration page 234 (ln x)b ln xα β Principe de démonstration. Écrire sous la forme k · xa xα La seconde limite se déduit de la première.
Attention La valeur absolue est indispensable dans la seconde relation car la fonction logarithme est négative sur l’intervalle ]0, 1]. Remarque Le corollaire précédent ne traite que les cas a > 0 et b > 0 . Dans les autres cas : • si a < 0 et b < 0 , on s’y ramène facilement par passage à l’inverse, • sinon, les opérations sur les limites permettent de conclure directement.
Proposition 13 Si a et b sont deux réels strictement positifs, on a : exp(a x) = +∞ et lim |x|b exp(a x) = 0. lim b x→+∞ x→−∞ x Démonstration. 216
Il suffit de remplacer x par exp x dans le corollaire 12.
III Fonctions circulaires Corollaire 14 En particulier, on a :
lim
x→+∞
exp x x
= +∞
et
lim
x→−∞
x exp x = 0 .
Point méthode On utilise les résultats précédents pour justifier l’existence de limites dans certains « cas d’indétermination », et quand on y fait appel, on utilise la formulation « par croissances comparées des fonctions . . . ». 2
Ex. 5. Déterminons la limite en +∞ de f : x �→ x1/x . 1
Pour tout x > 0 , on a f (x) = exp et logarithme, on a
lim 12 x→+∞ x
x2
ln x . Par croissances comparées des fonctions puissances
ln x = 0.
Par composition de limites, on en déduit
III
lim f (x) = 1 .
x→+∞
Fonctions trigonométriques circulaires
Rappels et résultats admis Au chapitre 4, à partir du cercle trigonométrique, nous avons donné pour t ∈ IR la définition de cos t et sin t. Cela permet de parler des fonctions cos et sin , définies sur IR. De la définition des fonctions sinus et cosinus il vient la relation cos2 + sin2 = 1 . Rappelons les valeurs particulières : π π cos 0 = 1, sin 0 = 0, cos = 0, sin = 1. 2 2 On dispose également des formules d’addition. Pour tout (t, t′ ) ∈ IR2 , on a : cos(t + t′ ) = cos(t) cos(t′ ) − sin(t) sin(t′ )
sin(t + t′ ) = sin(t) cos(t′ ) + cos(t) sin(t′ ). Par ailleurs, il a été établi que la fonction cos est paire et la fonction sin est impaire. Pour aller plus loin dans l’étude des fonctions trigonométriques, nous admettons la proposition suivante, dont le contenu est intuitif, notamment au vu des considérations du chapitre 4. Proposition 15 sin(h) −→ 1 ; • On a h h→0 cos(t) > 0 et • ∀t ∈ 0, π2
sin(t) > 0 .
217
Chapitre 6. Fonctions usuelles
1
Fonctions sinus et cosinus
Nous sommes maintenant en mesure de démontrer la proposition suivante. Proposition 16 Les fonctions cos et sin sont dérivables sur IR et : sin′ = cos
et
cos′ = − sin .
Démonstration page 234
Principe de démonstration. Commencer par démontrer que sin′ (0) = 1 et lim
h→0
cos(h)−1 h
= 0.
Ensuite utiliser les formules d’addition.
Remarque On trouvera au chapitre 32 une démonstration du fait que la fonction sinus est dérivable qui ne présuppose pas la proposition 15 de la page précédente (voir page 1204). Corollaire 17 Les fonctions sin et cos ont des dérivées à tout ordre et pour tout n ∈ IN et x ∈ IR : π π et cos(n) (x) = cos x + n · sin(n) (x) = sin x + n 2 2 Démonstration.
• Cas n = 1 . D’après les formules d’addition, pour tout x ∈ IR , on a sin x +
et cos x +
π 2
= − sin(x) . On conclut à l’aide de la proposition précédente.
π 2
= cos(x)
• Le cas général se démontre alors aisément par récurrence.
Étude et représentation graphique des fonctions sin et cos Étude de la fonction cos • Elle est définie sur IR et 2π -périodique. On peut restreindre l’étude à [−π, π].
La fonction cos est paire : on peut restreindre l’étude à [0, π] ; en effet le graphe de la restriction de cos à [−π, 0] se déduit de celui de la restriction à [0, π] par une symétrie d’axe (O, �).
De plus, pour tout t ∈ IR, on a cos(π − t) = − cos(t). On peut ainsi restreindre l’étude à 0, π2 , le graphe de la restriction de cos à π2 , π se déduisant de π π celui de la restriction à 0, 2 par une symétrie de centre 2 , 0 .
• La fonction cos est dérivable et pour tout t ∈ 0, π2 , on a cos′ (t) = − sin(t). Comme sin est à valeurs strictement positives sur 0, π2 , sin 0 = 0 et sin π2 = 1 , on obtient facilement le tableau de variations et la représentation graphique de la fonction cos . 218
t
0
cos′ (t)
0 1
π 2
−
cos 0
III Fonctions circulaires Étude de la fonction sin • La parité de la fonction cos et l’égalité sin(t) = cos π2 − t montrent que : π . ∀t ∈ IR sin(t) = cos t − 2 Ainsi le graphe de la fonction sin se déduit de celui de la fonction cos par une translation de vecteur π2�ı.
t sin′ (t)
• On déduit ainsi de l’étude de la fonction cos, le tableau de variations et la représentation graphique de la fonction sin . Graphes de cos et sin y
+
0 1
sin 0
1 3π 2
− π2 −π
π 2
0
π 2
O
2π
π
x
−1
Courbe d’équation y = cos x
y 1
− π2
3π 2
O π 2
−π
π
2π
x
−1
Courbe d’équation y = sin x
2
Fonction tangente
On déduit des propriétés des fonctions sinus et cosinus, les propriété suivantes de la fonction tan , dont certaines ont été établies au chapitre 4. • La fonction tan est définie sur IR\ π2 + kπ k ∈ ZZ . Elle est de plus π -périodique et impaire. On peut donc restreindre l’étude à 0, π2 . • En tant que quotient de fonctions dérivables, la fonction tan est dérivable sur chaque intervalle de son domaine de définition.
Proposition 18 Pour tout t �≡ π2 [π], on a : tan′ (t) = 1 + tan2 (t) = Principe de démonstration.
1 · cos2 (t)
Démonstration page 235 Dériver tan soit comme un produit, soit comme un quotient.
219
Chapitre 6. Fonctions usuelles • Puisque tan′ est strictement positive sur tout intervalle du domaine, la fonction tan est strictement croissante sur ces intervalles. • Comme cos(t) −→ 0+ et sin(t) −→ 1 , on a tan(t) −→ +∞. π π π t→ 2 −
t→ 2 −
t→ 2 −
• On en déduit le tableau de variations et le graphe de la fonction tan . y
t
0
tan′ (t)
1
π 2
+ +∞
− 3π 2
−π
O
π π 2
− π2
3π 2
x
tan 0
Courbe d’équation y = tan x
3 Fonctions circulaires réciproques Fonction Arc tangente Définition 5 La fonction tangente est continue et strictement croissante sur ]− π2 , π2 [ ; elle induit une bijection de l’intervalle ]− π2 , π2 [ sur IR, dont la réciproque est appelée Arc tangente et notée Arctan . Conséquence La fonction Arc tangente est donc une bijection strictement croissante et continue de IR sur ]− π2 , π2 [ . Elle est impaire, puisque c’est la réciproque d’une fonction impaire. Représentation graphique de la fonction Arctan Arctan étant la fonction réciproque de la restriction de la fonction tan à ]− π2 , π2 [ , on en déduit son tableau de variations et son graphe qui s’obtient en prenant le symétrique du graphe de tan|]− π2 , π2 [ . x
−∞
− π2
+∞ π 2
0
Arctan
220
0
y = tan x
π 2
y = Arctan x
O π 2
III Fonctions circulaires De la définition de la fonction Arc tangente, on déduit le résultat suivant. Corollaire 19 Pour tout nombre réel x, le réel Arctan x est l’unique élément de ]− π2 , π2 [ dont la tangente vaut x. Valeurs remarquables immédiatement :
Les valeurs remarquables de la fonction tangente donnent
1 π Arctan √ = , 6 3
Arctan 0 = 0,
Arctan 1 =
π , 4
Arctan
√ π 3 = · 3
Relations fondamentales Il vient de la définition que : • pour tout x ∈ IR, on a tan(Arctan x) = x puisque la tangente de « l’unique élément de ]− π2 , π2 [ dont la tangente vaut x » est évidemment x ; • pour tout α ∈ ]− π2 , π2 [ , on a Arctan(tan α) = α puisque « l’unique élément de ]− π2 , π2 [ dont la tangente vaut tan α » est évidemment α . Bien remarquer la dissymétrie entre les deux points précédents : • tan(Arctan x) est défini pour tout x ∈ IR, et tan(Arctan x) = x ;
• Arctan(tan α) est défini pour tout réel α �≡ π2 [π] et si α ∈ / ]− π2 , π2 [ , la rela tion Arctan tan α = α ne peut pas être vérifiée, puisque la fonction Arctan est à valeurs dans ]− π2 , π2 [·
Exo 6.7 Exo 6.8
Point méthode Soit (x, y) ∈ IR2 .
Pour justifier la relation y = Arctan x, il suffit de prouver : π π · x = tan y et y∈ − , 2 2
Ex. 6. Donnons une relation entre Arctan x et Arctan x1 · Plus précisément, soit x ∈ IR∗+ . Puisque Arctan x ∈ 0, π2 , on a : π π • d’une part
2
− Arctan x ∈ 0,
• d’autre part, tan réel t �≡ 0
π 2
.
π
On en déduit Arctan
2
,
− Arctan x =
1 x
2
=
π 2
1 tan(Arctan x)
=
1 x
, car tan
π 2
−t =
1 tan t
, pour tout
− Arctan x .
Par ailleurs, la fonction Arctan étant impaire, la fonction x �→ Arctan x + Arctan x1 est également impaire. On en déduit : ∀x ∈ IR
∗
1 Arctan x + Arctan = x
π 2
− π2
si x > 0 ; si x < 0.
Point méthode Cette formule permet de ramener l’étude d’une forme indéterminée impliquant la fonction Arc tangente en l’infini à son étude en 0 .
221
Chapitre 6. Fonctions usuelles Ex. 7. Montrons que le graphe de la fonction définie par f (x) = x Arctan x admet une asymptote en +∞ . En effet, pour x > 0 , on a : f (x) − et en posant u =
1 x
π π x = x Arctan x − 2 2
:
x Arctan
= −x Arctan
1 , x
Arctan u Arctan u 1 1 −→ = = = 1, ′ x→+∞ x u tan (0) tan Arctan u
car Arctan u tend vers 0 lorsque x tend vers +∞ . Par suite f (x) − prouve que la droite d’équation y = de f .
π 2
π 2
x + 1 −→ 0 , ce qui x→+∞
x−1 est une asymptote en +∞ à la courbe représentative
Dérivabilité et dérivée de la fonction Arctan Proposition 20 La fonction Arctan est dérivable sur IR et : ∀x ∈ IR Exo 6.9
Principe de démonstration.
Arctan′ (x) =
Utiliser (f
−1 ′
) (x) =
Fonctions Arc sinus et Arc cosinus
1 · 1 + x2
1
f ′ f −1 (x)
Démonstration page 235
·
Définition 6 La fonction sinus est continue et elle est strictement croissante sur [− π2 , π2 ] ; elle induit une bijection de l’intervalle [− π2 , π2 ] sur l’intervalle [−1, 1], dont la réciproque est appelée Arc sinus et notée Arcsin . Conséquence La fonction Arc sinus est donc une bijection strictement croissante et continue de [−1, 1] sur [− π2 , π2 ]. Elle est impaire, puisque c’est la réciproque d’une fonction impaire. De la définition de la fonction Arc sinus, on déduit le résultat suivant. Corollaire 21 Pour tout nombre réel x de l’intervalle [−1, 1], le réel Arcsin x est l’unique élément de [− π2 , π2 ] dont le sinus vaut x. Valeurs remarquables
Des valeurs remarquables de la fonction sinus on déduit : √ Arcsin 1 = π2 Arcsin 0 = 0 Arcsin 22 = π4 √ Arcsin 21 = π6 Arcsin 23 = π3
222
III Fonctions circulaires Relations fondamentales Il vient de la définition que : • pour tout x ∈ [−1, 1], on a sin(Arcsin x) = x ; • pour tout α ∈ [− π2 , π2 ], on a Arcsin(sin α) = α .
(∗)
Bien remarquer la dissymétrie entre les deux points précédents : • sin(Arcsin x) n’est défini que pour x ∈ [−1, 1] ; • Arcsin(sin α) est défini pour tout α ∈ IR mais on n’a prouvé l’égalité (∗) que pour α ∈ [− π2 , π2 ] et clairement l’égalité ne peut pas être vérifiée lorsque α ∈ / [− π2 , π2 ], car la fonction Arcsin est à valeurs dans [− π2 , π2 ]· Point méthode Soit (x, y) ∈ [−1, 1] × IR. Exo 6.10
Pour justifier la relation y = Arcsin x, il suffit de montrer : x = sin y et y ∈ − π2 , π2 · Définition 7 La fonction cosinus est continue et elle est strictement décroissante sur [0, π] ; elle induit une bijection de l’intervalle [0, π] sur l’intervalle [−1, 1], dont la réciproque est appelée Arc cosinus et notée Arccos. Conséquence La fonction Arc cosinus est donc une bijection strictement décroissante et continue de [−1, 1] sur [0, π]. Valeurs remarquables Arccos 0 =
π 2
Des valeurs remarquables de la fonction cosinus on déduit : √ Arccos 22 = π4 Arccos 1 = 0 √ 3 1 π π Arccos 2 = 6 · Arccos 2 = 3
Comme pour la fonction Arc sinus, on a immédiatement le résultat suivant.
Corollaire 22 Pour tout nombre réel x de l’intervalle [−1, 1], le réel Arccos x est l’unique élément de [0, π] dont le cosinus vaut x. Relations fondamentales Comme pour Arc sinus, on prouve que : • pour tout x ∈ [−1, 1], on a cos(Arccos x) = x ; • pour tout α ∈ [0, π], on a Arccos(cos α) = α . On retrouve la même dissymétrie entre les deux points puisque : • cos(Arccos x) n’est définie que pour x ∈ [−1, 1] ; • Arccos(cos α) est défini pour tout α ∈ IR mais l’égalité Arccos(cos α) = α est vraie si, et seulement si, α ∈ [0, π]. 223
Chapitre 6. Fonctions usuelles Point méthode Soit (x, y) ∈ [−1, 1] × IR.
Pour justifier la relation y = Arccos x, il suffit de montrer : x = cos y
et
y ∈ [0, π] .
Ex. 8. Donnons une relation entre Arccos π πxet Arcsin x . Soit x ∈ [−1, 1] . Puisque Arcsin x ∈ − 2 , • d’une part π2 − Arcsin x ∈ [0, π] ;
• d’autre part cos On en déduit que : Exo 6.11
Exo 6.12
π 2
2
, on a :
− Arcsin x = sin (Arcsin x) = x . ∀x ∈ [−1, 1]
Arccos x + Arcsin x =
π · 2
Point méthode Des quantités telles que cos(Arcsin x) ou sin(Arccos x) peuvent se simplifier. Ex. 9. Soit x ∈ [−1, 1] . Cherchons à simplifier cos(Arcsin x) . La relation cos2 = 1 − sin2 donne :
cos2 (Arcsin x) = 1 − sin2 (Arcsin x) = 1 − x2 .
Comme Arcsin(x) ∈ − π2 ,
π 2
, on a cos(Arcsin x) 0 et donc cos(Arcsin x) =
√ 1 − x2 .
Représentation graphique des fonctions Arcsin et Arccos On peut maintenant tracer les représentations graphiques de ces fonctions. • Le graphe Γs de Arcsin est le symétrique, par rapport à la première bissectrice, du graphe γs de la fonction sin|[− π2 , π2 ] . Comme γs possède des tangentes horizontales en ses extrémités, le graphe Γs possède des tangentes verticales en ses extrémités, ce qui signifie que la fonction Arcsin n’est pas dérivable en ±1 . • En symétrisant le graphe γc de la fonction cos|[0,π] , on obtient le graphe Γc de Arccos qui possède des tangentes verticales aux points d’abscisses ±1 . y = Arccos x
π 2
y = Arcsin x π 2
y = sin x − π2
π
O π 2
O π
− π2
224
y = cos x
IV Fonctions hyperboliques Tableaux de variations (qui se lisent aussi sur les graphes précédents) : x
0
−1
Arcsin
+1 π 2
0
x
0
−1 π
π 2
Arccos
− π2
+1
0
Dérivation des fonctions Arcsin et Arccos Proposition 23 Les fonctions Arcsin et Arccos sont dérivables sur ]−1, 1[ et : ∀x ∈ ]−1, 1[
1 Arcsin′ (x) = √ 1 − x2
Principe de démonstration.
et
−1 Arccos′ (x) = √ · 1 − x2
Démonstration page 235
Utiliser le théorème de dérivation d’une fonction réciproque.
Remarque La fonction Arcsin (resp. Arccos) n’est pas dérivable en ±1 , puisque la dérivée de sa fonction réciproque s’annule en ± π2 (resp. en 0 et π ).
Cette non-dérivabilité se « voit » immédiatement sur les représentations graphiques, par la présence des tangentes verticales.
IV 1
Fonctions hyperboliques Fonctions sinus et cosinus hyperboliques
Définition 8 Les deux fonctions sinus hyperbolique, notée sh, et cosinus hyperbolique, notée ch , sont définies sur IR par : ∀x ∈ IR
sh x =
ex − e−x 2
et
ch x =
ex + e−x · 2
Remarque On rencontre aussi parfois les notations sinh et cosh pour ces fonctions. On en déduit immédiatement les résultats de la proposition suivante. Proposition 24 La fonction sinus hyperbolique est impaire, la fonction cosinus hyperbolique est paire. Elles sont toutes deux dérivables, avec sh′ = ch et ch′ = sh . 225
Chapitre 6. Fonctions usuelles Représentation graphique des fonctions sh et ch La fonction cosinus hyperbolique étant strictement positive, on en déduit d’abord les variations de sinus hyperbolique, puis celles de cosinus hyperbolique. Par ailleurs, on déduit simplement les limites en +∞ et −∞ des fonctions ch et sh par opérations sur les limites à partir des limites de la fonction exponentielle. x
−∞
sh
0
y = ch x
1 O 1
+∞ +∞
0 −∞ +∞
y = sh x
+∞
ch 1 La continuité de ces fonctions ainsi que leurs variations montrent que : • la fonction sinus hyperbolique est une bijection de IR sur IR ;
• la fonction cosinus hyperbolique induit une bijection de IR+ sur [1, +∞[ .
Formules de base de la trigonométrie hyperbolique Proposition 25 Pour tout réel t, on a : exp t = ch t + sh t, Démonstration.
exp(−t) = ch t − sh t
et
ch2 t − sh2 t = 1.
Les deux premières relations sont évidentes, et la dernière en découle
puisque : ch2 t − sh2 t = (ch t − sh t)(ch t + sh t) = exp(−t) exp t = 1.
Application géométrique De même que les fonctions sinus et cosinus permettent de paramétrer un cercle, la relation ch2 t − sh2 t = 1 peut s’interpréter géométriquement en considérant l’hyperbole équilatère H d’équation x2 − y 2 = 1 . Comme la fonction sinus hyperbolique réalise une bijection de IR dans IR , pour tout point (x, y) de H d’abscisse positive, il existe un unique réel t tel y = sh t. On a alors x = y 2 + 1 = ch2 (t) = ch t. Donc la sh t fonction :
IR −→ IR2 t �−→ (ch t, sh t)
est un paramétrage de la branche de droite de l’hyperbole H , l’autre branche étant paramétrée par : IR t 226
−→ IR2 �−→ (− ch t, sh t).
ch t
IV Fonctions hyperboliques
2
Exo 6.17
Fonction tangente hyperbolique
Définition 9 La fonction tangente hyperbolique, notée th , est définie, pour tout réel x, sh x · par th x = ch x Remarques • Pour tout x ∈ IR, on a ch x > 0 , ce qui prouve que cette fonction est bien définie sur IR. • Pour x ∈ IR, il est clair que − ch x < sh x < ch x et donc la fonction th est à valeurs dans ]−1, 1[ . • On rencontre aussi parfois la notation tanh à la place de th . Proposition 26 La fonction tangente hyperbolique est impaire ; elle est dérivable sur IR et : ∀x ∈ IR
th′ (x) =
1 = 1 − th2 x. ch2 x
Démonstration page 235
Principe de démonstration. Pour dériver, faire le calcul de deux manières : comme quotient et comme produit.
Représentation graphique de la fonction th On en déduit le tableau de variations et la représentation graphique. x
0
−∞
+∞ +1
th
0 −1 +1 O
−1
227
Chapitre 6. Fonctions usuelles
V 1
Fonctions à valeurs complexes Généralités
Dans toute la suite du chapitre, I est un intervalle d’intérieur non vide de IR. Les fonctions à valeurs complexes seront étudiées en détail dans les chapitres suivants, mais nous allons ici en donner quelques propriétés dont nous aurons besoin pour le calcul de primitives et la résolution des équations différentielles. Une fonction f définie sur I et à valeurs dans C est une fonction complexe de la variable réelle. Notation Pour une telle fonction f , on définit alors les fonctions : • partie réelle de f , notée Re f , définie par I −→ C t �−→ Re f (t) ; • partie imaginaire de f , notée Im f , définie par I −→ C t − � → Im f (t) ;
• module de f , notée |f |, définie par I −→ C t �−→ |f (t)| ;
• conjuguée de f , notée f¯, définie par I −→ C t �−→ f (t).
Remarque En définissant les opérations comme pour les fonctions à valeurs réelles, on a : f = Re f + i Im f et |f |2 = (Re f )2 + (Im f )2 = f f¯. Définition 10 Une fonction f : I → C est bornée si la fonction réelle |f | est bornée. Proposition 27 Soit f : I → C. La fonction f est bornée si, et seulement si, les fonctions réelles Re f et Im f sont bornées. Principe de démonstration.
Démonstration page 235 Utiliser les inégalités | Re z| |z| et | Im z| |z| .
Proposition 28 Soit f : I → C et g : I → C deux fonctions bornées et λ ∈ C. Alors les fonctions f + g , f g et λf sont bornées. Démonstration page 236
2
Exo 6.19
Dérivée d’une fonction complexe
Définition 11 Une fonction f : I → C est dérivable sur I si ses parties réelle et imaginaire sont dérivables sur I . La dérivée de f = Re f + i Im f est alors f ′ = (Re f )′ + i (Im f )′ . 228
V Fonctions à valeurs complexes
Ex. 10. Si f : I → IR est dérivable, alors la fonction I t
−→ �−→
C est dérivable. f (t)
Ex. 11. Toute fonction constante est dérivable, et sa dérivée est nulle.
Définition 12 Une fonction f , définie sur un intervalle I de IR, et à valeurs dans C est de classe C 1 si f est dérivable et f ′ est continue, c’est-à-dire que les fonctions (Re f )′ et (Im f )′ sont continues.
3
Opérations sur les fonctions dérivables
Proposition 29 Soit f et g deux fonctions à valeurs complexes, définies et dérivables sur I ainsi que λ et µ deux complexes. Alors : 1. la fonction λ f + µ g est dérivable sur I et (λ f + µ g)′ = λ f ′ + µ g ′ ; cette propriété s’appelle linéarité de la dérivation ; 2. la fonction f g est dérivable sur I et (f g)′ = f ′ g + f g ′ . Démonstration page 236
Principe de démonstration.
Regarder les parties réelles et imaginaires.
Ex. 12. Soit f : I → C dérivable. On prouve aisément, par récurrence sur n ∈ IN∗ , que la fonction f n est dérivable sur I et que (f n )′ = n f ′ f n−1 . Ex. 13. Considérons (ak )k∈[[0,n]] ∈ Cn+1 . La fonction polynomiale p : IR
−→
t
�−→
est dérivable sur IR et : ∀t ∈ IR
′
p (t) =
n
k ak t
k−1
.
C
n
ak tk
k=0
k=1
Proposition 30 Soit f et g deux fonctions dérivables sur I . Si g ne s’annule pas sur I , alors la fonction fg est définie et dérivable sur I , et l’on a : ′ f ′ g − f g′ f = · g g2 Principe de démonstration.
Démonstration page 236 f 1 Écrire f sous la forme = f ×g× et remarquer que la g gg
fonction gg est à valeurs réelles.
229
Chapitre 6. Fonctions usuelles
Ex. 14. Soit f une fonction dérivable sur I , et qui ne s’annule pas sur I . Si n ∈ ZZ , alors la fonction f n est dérivable sur I et sa dérivée est nf ′ f n−1 . On a déjà vu cette propriété lorsque n ∈ IN , et on la justifie par passage à l’inverse lorsque n ∈ ZZ∗− . Ex. 15. Soit n ∈ ZZ et a un complexe non réel. La fonction fn : IR t
−→ �−→
C (t − a)n
∀t ∈ IR
est dérivable sur IR , et sa dérivée vérifie :
fn′ (t) = n (t − a)n−1 .
Proposition 31 Soit J un intervalle de IR, soit ϕ une fonction dérivable de I dans J , et f une fonction dérivable de J dans C. Alors f ◦ ϕ est dérivable sur I et : (f ◦ ϕ)′ = (f ′ ◦ ϕ) ϕ′ .
Principe de démonstration.
Démonstration page 236
Appliquer la propriété correspondante aux parties réelle et
imaginaire de la fonction g .
Attention
4
Dans la proposition précédente, ϕ est à valeurs réelles !
Dérivée de ef
Proposition 32 Soit f une fonction dérivable de I dans C . ′ Alors la fonction ef : I −→ C est dérivable sur I , et ef = f ′ ef . t − � → ef (t)
Démonstration page 236
Principe de démonstration. On ne peut pas ici appliquer la proposition 31 puisque la fonction f n’est pas supposée réelle. Nous allons nous intéresser aux parties réelle et imaginaire de ef . Ex. 16. Si ρ et θ sont deux fonctions réelles dérivables sur I , alors la fonction f définie sur I par f (t) = ρ(t) eiθ(t) est dérivable, et pour tout t ∈ I , on a : f ′ (t) = ρ′ (t) eiθ(t) + i ρ(t) θ′ (t) eiθ(t) . Le calcul précédent permet, en physique ou en SI, d’obtenir les composantes du vecteur vitesse en coordonnées polaires.
Corollaire 33 Si a ∈ C , la fonction ϕa : t �→ eat est dérivable sur IR et vérifie ϕ′a = a ϕa . 230
V Fonctions à valeurs complexes
5
Caractérisation des fonctions constantes
Proposition 34 Soit f une fonction dérivable de l’intervalle I dans C . La fonction f est constante si, et seulement si : ∀t ∈ I Principe de démonstration.
f ′ (t) = 0 .
Démonstration page 236 Appliquer la propriété correspondante aux parties réelle et
imaginaire de la fonction f . Exo 6.20 Exo 6.21
6
Dérivées successives
Comme pour les fonctions à valeurs réelles, on introduit les dérivées successives d’une fonction à valeurs complexes. • Il se peut que la dérivée f ′ d’une fonction dérivable f : I → C soit elle-même dérivable sur I . On dit alors que f est deux fois dérivable. La fonction (f ′ )′ est alors sa dérivée seconde, fonction que l’on note f (2) ou f ′′ . • La dérivée seconde f (2) d’une fonction deux fois dérivable peut éventuellement être dérivable. La fonction f est alors dite trois fois dérivable et sa dérivée ′ troisième est la fonction f (3) = f (2) . Ainsi de suite. On esquisse ainsi un procédé, avec lequel on définirait ce que signifie, pour une fonction f : I → C , d’être n fois dérivable, ainsi que la dérivée n-ième d’une telle fonction. Par convention, toute fonction f : I → C est 0 fois dérivable et f (0) = f . Remarque La fonction complexe f admet une dérivée n-ième sur I si, et seulement si, ses parties réelle et imaginaire admettent une dérivée n-ième sur l’intervalle I et alors : (n) (n) Re f (n) = Re f et Im f (n) = Im f .
Proposition 35 Soit f et g deux fonctions complexes n fois dérivables sur I ainsi que λ et µ deux complexes. Alors λ f + µ g est n fois dérivable sur I , et l’on a : (λ f + µ g)(n) = λ f (n) + µ g (n) . Démonstration.
Immédiat par récurrence.
231
Chapitre 6. Fonctions usuelles
Démonstrations IR∗+ −→ IR est dérivable d’après x �−→ ln(xy) les théorèmes généraux ; en dérivant comme une fonction composée, on a :
Proposition 1
Soit y ∈
IR∗+ .
Alors, la fonction uy :
u′y (x) =
∀x ∈ ]0, +∞[
1 y = · xy x
Les fonctions uy et ln ayant même dérivée sur l’intervalle ]0, +∞[ , leur différence uy − ln est constante sur IR∗+ . Pour déterminer cette constante, il suffit d’évaluer uy − ln en un point. Comme (uy − ln)(1) = ln y , on en déduit : ∀x ∈ ]0, +∞[
ln(x y) = ln x + ln y.
Proposition 3 • La fonction ln est dérivable et sa dérivée est à valeurs strictement positives sur l’intervalle I = ]0, +∞[ . Elle définit donc une bijection de I sur J = f (I) , qui est un intervalle. • Comme la fonction ln est croissante, elle admet une limite finie ou infinie en +∞ . Notons ℓ cette limite. Pour tout n ∈ IN , on a ln(2n ) = n ln 2 . Comme 2 > 1 , par stricte croissance de la fonction ln on a ln 2 > 0 , ce qui implique lim n ln 2 = +∞ . Par ailleurs, la suite n→+∞
géométrique (2n )n∈IN tend vers +∞ (cf. exemple 26 de la page 321). On en déduit d’une part ln(2n ) = n ln 2 −→ +∞ , d’autre part ln(2n ) −→ ℓ . Par suite ℓ = +∞ . n→+∞
• •
n→+∞
En particulier, J est un intervalle non majoré. 1 Comme ln = − ln x , on a (par composition) lim ln = −∞ et J est non minoré. 0 x Ainsi J est un intervalle ni minoré, ni majoré, donc J = IR . En conclusion, la fonction logarithme est une bijection strictement croissante de l’intervalle IR∗+ sur l’intervalle IR .
Proposition 4 Posons g la fonction définie sur ]−1, +∞[ par g(x) = x − ln(1 + x) . • Par les théorèmes généraux la fonction g est bien définie et dérivable. De plus : ∀x ∈ ]−1, +∞[ •
g ′ (x) = 1 −
x 1 = · 1+x 1+x
L’étude du signe de g ′ est immédiate. On en déduit le tableau de variations de g : x ′
g (x)
0
−1 −
0
+∞ +
g 0 •
Il vient du tableau de variations que g est à valeurs positives et g ne s’annule que pour x = 0 .
Remarque On peut obtenir cette inégalité de manière très naturelle en utilisant la concavité de la fonction logarithme (voir chapitre 12).
Proposition 5 • La fonction exponentielle est la réciproque de la fonction logarithme népérien qui est une bijection strictement croissante de IR∗+ sur IR . Par suite, c’est une bijection strictement croissante de IR sur IR∗+ .
232
Démonstrations •
Elle est croissante et, comme son image est IR∗+ , on a : lim exp x = 0
•
lim exp x = +∞.
et
x→−∞
x→+∞
La fonction logarithme népérien est dérivable sur IR∗+ , et sa dérivée ne s’annule pas. Sa fonction réciproque, l’exponentielle, est donc dérivable en tout point x de IR avec : exp′ x =
Proposition 6
1 = exp x. ln′ (exp x)
Soit x ∈ IR et y ∈ IR . Posons u = exp x et v = exp y . On a alors :
exp(x + y) = exp(ln u + ln v) = exp ln(u v) = u v = exp x exp y. On en déduit exp(x − y) exp y = exp x ; comme exp y �= 0 , on a donc exp(x − y) = Pour n ∈ ZZ , on a aussi :
exp x · exp y
exp(n x) = exp n ln u = exp ln(un ) = un = (exp x)n . Proposition 7 • •
Puisque la fonction exp est à valeurs strictement positives, l’inégalité est immédiate (et stricte) lorsque x −1 . Lorsque x > −1 , il vient de ln(1 + x) x (cf. proposition 4 de la page 212), par croissance
de la fonction exponentielle, exp ln(1 + x) exp(x) , c’est-à-dire 1 + x exp(x) .
La stricte croissance de la fonction exp donne que l’égalité a lieu dans l’inégalité précédente si, et seulement si, ln(1 + x) = x , i.e. x = 0 . Proposition 8
Soit x ∈ IR∗+ , y ∈ IR∗+ et a ∈ IR . On a alors :
xa y a = exp(a ln x) exp(a ln y) = exp a (ln x + ln y) = exp a ln(x y) = (x y)a . De même, si b est un réel, on a :
xa xb = exp(a ln x) exp(b ln x) = exp (a + b) ln x = xa+b . Démonstrations analogues pour les autres relations. Proposition 9
La fonction ϕa :
IR∗+ x
−→ �−→
IR exp(a ln x)
est dérivable d’après les théorèmes
généraux et, pour tout x ∈ IR∗+ , on a ϕ′a (x) = exp(a ln x) xa = a xa−1 . Par suite, on a ϕ′a = a ϕa−1 .
Proposition 10 •
•
Si a > 0 , alors lim (a ln x) = −∞ et x→0
lim (a ln x) = +∞ . On en déduit alors :
x→+∞
lim exp(a ln x) = 0 , ce qui s’écrit aussi lim ϕa (x) = 0 .
∗
x→0
∗
x→+∞
x→0
lim exp(a ln x) = +∞ , ce qui s’écrit aussi
lim ϕa (x) = +∞ .
x→+∞
Si a < 0 , on démontre de façon analogue : lim ϕa (x) = +∞
x→0
et
lim ϕa (x) = 0.
x→+∞
233
Chapitre 6. Fonctions usuelles Proposition 11 •
ln x = 0. Commençons par prouver lim x→+∞ x √ Pour t 1 , on a t t ; pour x 1 , on en déduit : 0 ln x =
x
1
dt t
x 1
√ √ dt √ = 2 x − 2 2 x. t
En divisant par x > 0 cette double inégalité, on obtient •
d’encadrement. Quand x → 0 par valeurs strictement positives, ln(1/x) 1/x
dent, lim
x→0
1 x
lim
x→+∞
ln x x
= 0 par théorème
tend vers +∞ . D’après le point précé-
= 0 , ce qui donne lim (−x ln x) = 0 puis lim (x ln x) = 0 . x→0
x→0
Corollaire 12 • Pour a et b strictement positifs quelconques et x > 1 , on peut écrire : (ln x)b = xa Comme
a
lim x b = +∞ , on a :
ln x b xa/b
=
b b ln(xa/b ) b xa/b
a
·
x→+∞
ln(u) ln(xa/b ) =0 = lim u→+∞ x→+∞ u xa/b lim
et donc •
lim
x→+∞
(ln x)b xa
= 0.
En remplaçant x par 1/x et en faisant tendre x vers 0 , on a donc lim xa | ln x|b = 0. x→0
Proposition 16 • Puisque sin(0) = 0 , d’après la proposition 15 de la page 217, on a :
sin(h) sin(h) − sin(0) = −→ 1, h−0 h h→0 ce qui prouve que la fonction sin est dérivable en 0 . Puisque sin est dérivable en 0 , elle est continue en 0 , c’est-à-dire sin(h) −→ 0 .
•
Soit h ∈ − π2 ,
π 2
h→0
\ {0} .
Puisque cos2 (h) = 1 − sin2 (h) et cos(h) > 0 , on a cos(h) = cos(h) − 1 = h
1 − sin2 (h) − 1 h sin2 (h)
=− = −h h 1 + 1 − sin2 (h) •
∗
sin(h) h
1 − sin2 (h) . On en déduit :
2
1+
1
1 − sin2 (h)
=0. −→ −0×12 × 1 2
h→0
Soit a ∈ IR et h ∈ IR . Les formules d’additions donnent, avec les limites précédentes : sin(a + h) − sin(a) cos(h) − 1 sin(h) = sin(a) + cos(a) h h h −→ sin(a) 0 + cos(a) 1 = cos(a). h→0
Il s’ensuit que la fonction sin est dérivable sur IR et sin′ = cos .
234
Démonstrations De même : cos(h) − 1 sin(h) cos(a + h) − cos(a) = cos(a) − sin(a) h h h −→ cos(a) 0 − sin(a) 1 = − sin(a). h→0
Il s’ensuit que cos est dérivable sur IR et cos′ = − sin .
Proposition 18 •
Soit I un intervalle du domaine de définition de la fonction tan et t ∈ I .
1 En remarquant que tan et sin × cos coïncident sur I , il vient en appliquant la formule donnant la dérivée d’un produit :
tan′ (t) = sin′ (t) × •
1 + sin(t) × cos(t)
−
cos′ (t) cos2 (t)
En appliquant la formule donnant la dérivée d’un quotient : tan′ (t) =
Proposition 20
= 1 + tan2 (t).
sin′ (t) cos(t) − sin(t) cos′ (t) cos2 (t) + sin2 (t) 1 = = · 2 cos (t) cos2 (t) cos2 (t)
La restriction à ]− π2 , π2 [ de la fonction tan est dérivable et : ∀x ∈ ]− π2 , π2 [
tan′ x = 1 + tan2 x �= 0.
Sa fonction réciproque Arctan est donc dérivable sur IR , et l’on a : 1 1 = ∀y ∈ IR Arctan′ y = · 1 + tan2 (Arctan y) 1 + y2 Proposition 23 • La restriction à [− π2 , π2 ] de la fonction sin est dérivable et : ∀x ∈ [− π2 , π2 ]
sin′ (x) = cos x.
Sa fonction réciproque Arcsin est donc dérivable en toute valeur y = sin x pour laquelle cos x �= 0 , c’est-à-dire pour tout y ∈ ]−1, 1[ , et l’on a : Arcsin′ (y) = •
1 1 · = cos(Arcsin y) 1 − y2
Démonstration similaire pour la seconde relation, mais on peut aussi utiliser la relation : π Arccos x = − Arcsin x. 2
Proposition 26 • La fonction tangente hyperbolique est le quotient d’une fonction impaire, sh , par une fonction paire, ch ; elle est donc impaire. sh comme un quotient, et en utilisant la relation fondamentale de la • En dérivant th = ch 1 ch2 x − sh2 x = 2 · trigonométrie hyperbolique, on trouve : ∀x ∈ IR th′ x = ch2 x ch x 1 En dérivant th = sh comme un produit, on trouve : ∀x ∈ IR th′ x = 1 − th2 x. ch Proposition 27 • Supposons f bornée et prenons M un majorant de |f | . On a, pour tout t ∈ I :
Re f (t) f (t) M.
On en déduit que la fonction réelle Re f est bornée. On montre de même que Im f est bornée.
235
Chapitre 6. Fonctions usuelles •
Supposons Re f et Im f bornées. Prenons M et M ′ des majorants de |Re f | et |Im f | respectivement. On a, pour tout t ∈ I :
f (t)2 = Re f (t) 2 + Im f (t) 2 M 2 + M ′2 .
On en déduit que la fonction réelle |f | est majorée, donc que f est bornée.
Proposition 28 Soit M et M ′ des majorants de |f | et |g| respectivement. • On a, pour tout t ∈ I , par définition des opérations et l’inégalité triangulaire :
•
f + g (t) = f (t) + g(t) f (t) + g(t) M + M ′ .
On en déduit que |f + g| est bornée, donc f + g l’est également. De même, pour tout t ∈ I :
f g (t) = f (t) g(t) = f (t) g(t) M M ′ .
•
Il s’agit d’un cas particulier du point précédent, en prenant g la fonction constante égale à λ .
1. 2.
Évident en revenant à la définition. Si l’on pose f1 = Re f , f2 = Im f , g1 = Re g , g2 = Im g , on a :
Proposition 29
f g = (f1 g1 − f2 g2 ) + i (f1 g2 + f2 g1 ),
ce qui prouve la dérivabilité de f g en utilisant les propriétés des fonctions réelles. De plus : Re (f g)′ = (f1′ g1 + f1 g1′ − f2′ g2 − f2 g2′ ) = Re(f ′ g + f g ′ ),
et de même Im (f g)′ = Im(f ′ g + f g ′ ) . On a donc prouvé (f g)′ = f ′ g + f g ′ .
1 f =f ×g× · g gg La fonction gg est dérivable sur I en tant que produit de deux fonctions dérivables. Comme c’est une fonction réelle qui ne s’annule pas, son inverse est dérivable. f 1 La fonction h = = f ×g× , étant alors produit de trois fonctions dérivables sur I , est g gg donc dérivable sur I . On a alors f = gh et donc f ′ = g ′ h + g h′ , ce qui donne :
Proposition 30
On peut écrire
h′ = Proposition 31
g′ h f ′ g − g′ f f′ − = · g g g2
On a : Re(f ◦ ϕ) = (Re f ) ◦ ϕ
et
Im(f ◦ ϕ) = (Im f ) ◦ ϕ
ce qui prouve le résultat en utilisant les résultats correspondants pour les fonctions réelles. Proposition 32 Si g = Re f et h = Im f , alors Re(ef ) = eg cos h et Im(ef ) = eg sin h. En utilisant les propriétés des fonctions dérivables à valeurs réelles, on obtient la dérivabilité de ef et :
f ′ e
= (g ′ eg cos h − h′ eg sin h) + i(g ′ eg sin h + h′ eg cos h)
= eg (g ′ + ih′ )(cos h + i sin h) = eg f ′ eih = f ′ ef .
Proposition 34 La fonction f est constante si, et seulement si, ses parties réelle et imaginaire sont constantes. Comme ces deux fonctions à valeurs réelles sont définies sur un intervalle, elles sont constantes si, et seulement si, leurs dérivées sont nulles c’est-à-dire si, et seulement si, la dérivée de f est nulle.
236
Exercices
S’entraîner et approfondir Fonctions logarithmes, exponentielles et puissances 6.1 Montrer la dérivabilité et calculer la dérivée de la fonction f : ]−1, 1[ x
→211
−→ �−→
6.2 Soit n un entier strictement positif que l’on écrit ainsi en base 2 :
IR 1+x · ln 1−x
→213
n=
p−1
ai 2i
p ∈ IN∗ , ap−1 = 1
avec
i=0
et
∀i ∈ [[0, p − 2]]
ai ∈ {0, 1}.
Montrer que p = 1 + ⌊log 2 (n)⌋ . 6.3 Soit I un intervalle de IR ainsi que u ∈ IRI et v ∈ IRI dérivables, avec u(x) > 0 pour tout x ∈ I . Calculer la dérivée de f : I −→ IR x �−→ u(x)v(x) .
→215
6.4 Soit f : IR∗+ x
→216
−→ �−→
IR xx .
1. Donner les limites de f en 0 et +∞ . 2. Étudier les variations de f . 3. On prolonge f par continuité, en posant f (0) = 1 . En utilisant lim
u→0
eu −1 u
= 1 , vérifier
que le graphe de f possède une tangente verticale au point d’abscisse 0 . 6.5 1. Étudier g : IR∗+ x
−→ �−→
IR
et montrer que g admet une limite finie en +∞ .
ln x x
2. Pour tout n ∈ IN , montrer n 2n .
3. Retrouver le théorème de croissances comparées :
6.6 Résoudre le système
lim
x→+∞
ln x x
= 0.
x2 − y 2 = 12 ln x − ln y = ln 2.
Fonctions trigonométriques 6.7 Soit f : x �→ Arctan(tan x) . 1. Quel est le domaine de définition de f ? 2. Vérifier que f est périodique. Qu’en déduit-on pour son graphe ? 3. Vérifier que le graphe de f admet O comme centre de symétrie. 4. En déduire le graphe de f .
→221
6.8 Soit x un réel quelconque. →221
1. En utilisant la relation classique entre cos2 et tan2 , simplifier cos2 (Arctan x) . 2. En déduire cos(Arctan x) = √
1 1+x2
puis sin(Arctan x) = √
x 1+x2
·
237
Chapitre 6. Fonctions usuelles 6.9 Calculer la dérivée de la fonction x �→ Arctan x + Arctan x1 et retrouver la simplification de cette expression.
→222
6.10 Soit f : x �→ Arcsin(sin x) . →223
1. Quel est le domaine de définition de f ? 2. Vérifier que f est périodique. Qu’en déduit-on pour son graphe Γf ?
3. Quelle autre propriété permet de réduire l’étude de f à [0, π] ? 4. Vérifier que Γf admet la droite d’équation x =
π 2
comme axe de symétrie.
En déduire le graphe de f . 6.11 1. Quelle symétrie voit-on entre les graphes des fonctions sin|[− π2 , π2 ] et cos|[0,π] ? Justifier →224 cette propriété. 2. Retrouver la relation entre Arcsin et Arccos vue dans l’exemple 8 de la page 224. 6.12 Pour x ∈ [−1, 1] , simplifier sin(Arccos x) . →224
6.13 Établir
1 3 π = 5 Arctan + 2 Arctan · 4 7 79
⋆ 6.14 Que pensez-vous de la relation Arctan x + Arctan y = Arctan
x+y ? 1 − xy
6.15 Résoudre les équations : 1. Arctan(x − 1) + Arctan x + Arctan(x + 1) = π/2 ; 2x = 2 Arctan x . 2. Arcsin 1 + x2 6.16 Simplifier les fonctions définies par les relations suivantes : 1. f (x) = Arccos 2. f (x) = Arcsin
1 − x2 1 + x2 2x 1 + x2
; + Arccos
1 − x2 · 1 + x2
Fonctions hyperboliques 6.17 1. Pour tout x ∈ IR , exprimer th x à l’aide de e2x . →227 2. Pour tout x ∈ IR , exprimer ch x et sh x à l’aide de t = th x2 · 6.18 Simplifier : 1. ln
1 + th x ; 1 − th x
2. Sn =
n
k=0
238
sh(x + k y) et Cn =
n
k=0
ch(x + k y) .
Exercices
Fonctions à valeurs complexes 6.19 Soit f : I → C dérivable. Montrer que f¯ est dérivable. →228
6.20 Soit r ∈ C et f définie sur IR par f (t) = er t . Exprimer les dérivées successives de f . →231
6.21 Soit a ∈ C \ IR et f : IR →231
−→
C
1 · t−a Pour n ∈ IN , donner l’expression de sa dérivée n -ième. t
�−→
239
Chapitre 6. Fonctions usuelles
Solutions des exercices 6.1 Pour tout x ∈ ]−1, 1[ , on a 1 − x > 0 et 1 + x > 0 donc : f (x) = ln puis f est dérivable et : f ′ (x) =
1+x 1−x
= ln(1 + x) − ln(1 − x),
−1 1 1 2 1 − = + = · 1+x 1−x 1+x 1−x 1 − x2
Remarque Dériver f comme la fonction composée de la fonction x �→ logarithme aurait été bien moins efficace !
6.2 On a n =
p−1 i=0
1+x 1−x
et de la fonction
ai 2i avec ap−1 = 1 et ai ∈ {0, 1} pour tout i ∈ [[0, p − 2]] .
On en déduit alors : 2p−1 n
p−1 i=0
2i = 2p − 1.
La stricte croissance de la fonction log2 nous donne alors p − 1 log 2 n < p , c’est-àdire p − 1 = ⌊log2 n⌋ . 6.3 Avant tout, il est indispensable d’écrire : ∀x ∈ I
f (x) = exp v(x) ln u(x) .
Par suite, f est dérivable d’après les théorèmes généraux, et la formule de dérivation d’une fonction composée donne alors : ∀x ∈ I
f ′ (x) = f (x) v ′ (x) ln u(x) + v(x)
u′ (x) u(x)
·
6.4 On a pour tout x ∈ IR∗+ , f (x) = exp(x ln x) .
1. • Par croissances comparées, lim x ln x = 0 . x→0
• Puisque
lim ln x = +∞ , par opérations sur les limites,
x→+∞
Par composition des limites, on en déduit lim f (x) = 1 et x→0
lim x ln x = +∞ .
x→+∞
lim f (x) = +∞ .
x→+∞
2. La fonction f est dérivable d’après les théorèmes généraux, et pour tout x ∈ IR∗+ , on a : f ′ (x) = f (x)(1 + ln x). On en déduit le tableau de variations : x
1 e
0 1
f
+∞
1 1e e
240
+∞
Solutions des exercices 3. Pour connaître la tangente au point d’abscisse 0 , étudions, pour x ∈ ]0, 1[ : exp(x ln x) − 1 exp(x ln x) − 1 f (x) − f (0) = = ln x · x x x ln x Comme le nombre dérivé de la fonction exponentielle en 0 vaut 1 et que lim x ln x par x→0
croissance comparée, on a : lim
u→0
eu − 1 =1 u
et donc
lim
x→0
exp(x ln x) − 1 = 1. x ln x
(0) Par suite, le taux d’accroissement f (x)−f tend vers −∞ en 0 , et le graphe de f x possède donc une tangente verticale en ce point.
6.5 1. Posons g la fonction définie sur ]0, +∞[ par g(x) =
ln x · x
Par les théorèmes généraux, g est dérivable sur l’intervalle ]0, +∞[ et : ∀x ∈ IR∗+
g ′ (x) =
1 − ln x · x2
Puisque g ′ (e) = 0 et ln est décroissante, la fonction g est décroissante sur [e, +∞[ . D’après le théorème de limite monotone, elle admet donc une limite ℓ en +∞ . 2. On vérifie sans difficulté par récurrence que n 2n pour tout entier naturel n . On peut également établir cette inégalité pour n 1 en utilisant la formule du binôme et en remarquant que n1 = n : n
n
2 = (1 + 1) =
n n k=0
k
n 1
= n.
3. Pour n ∈ IN , on a 1 4n , donc : 0 g(4n ) = D’après la question précédente,
n 2n
n 2 ln(2) 2n ln 2 = n · 4n 2 2n
1 . Comme
0 g(4n ) Par encadrement,
2 ln(2) 2n
> 0 , on a :
2 ln(2) −→ 0. 2n n→+∞
lim g(4n ) = 0 et par le théorème de composition des limites, ℓ = 0 .
n→+∞
6.6 L’ensemble de définition de ce système est
(x, y) : x > 0 et y > 0 .
• Condition nécessaire : la seconde équation entraîne x/y = 2.
En reportant dans la première, on trouve 3 y 2 = 12 et donc y = 2 (car y > 0 ) ; on en déduit x = 4.
• Réciproquement, le couple (4, 2) est évidemment solution.
241
Chapitre 6. Fonctions usuelles 6.7 1. Comme la fonction Arctan est définie sur IR , le réel f (x) est défini dès que tan x est défini, c’est-à-dire pour x �≡ π2 [π] .
2. Comme la fonction tan est périodique de période π , il en est de même de f . Par suite, son graphe est invariant par des translations de vecteur k π�ı avec k ∈ ZZ . 3. Les fonctions tan et Arctan étant impaires, la fonction f = Arctan ◦ tan est une fonction impaire. Ainsi, O est centre de symétrie de son graphe. 4. Par définition de la fonction Arctan , on a : ∀x ∈ ]− π2 , π2 [ f (x) = x ; il est alors facile de tracer le graphe de f . y π 2
−π
O − π2
π
π 2
x
1 = 1 + tan2 , on obtient : cos2 1 1 = cos2 (Arctan x) = · 1 + tan2 (Arctan x) 1 + x2
6.8 1. Soit x ∈ IR . En utilisant l’égalité
2. Comme Arctan x ∈ − π2 ,
π 2
, on sait que son cosinus est positif, ce qui entraîne : cos(Arctan x) = √
1 · 1 + x2
On en déduit : sin(Arctan x) = tan(Arctan x) cos(Arctan x) = √ 6.9 La fonction f : IR∗ −→ IR x �−→ Arctan x + Arctan raux, et pour x ∈ IR∗ , on a : f ′ (x) =
x · 1 + x2
est dérivable d’après les théorèmes géné1 x
1 1 + 1 + x2 1 + x12
−
1 x2
= 0.
Par suite, cette fonction est constante sur chacun des intervalles ]−∞, 0[ et ]0, +∞[ , ce qui donne : π π ∀x ∈ IR∗+ f (x) = f (1) = et ∀x ∈ IR∗− f (x) = f (−1) = − · 2 2 6.10 1. Étant donné que sin prend ses valeurs dans [−1, 1] et que la fonction Arcsin est définie sur cet intervalle, la fonction f est définie sur IR . 2. La fonction sin étant 2π -périodique, il en est de même pour f . Par suite, son graphe Γf est invariant par des translations de vecteurs 2 kπ�ı avec k ∈ ZZ , et l’on peut limiter l’étude de f à un intervalle de longueur 2π .
242
Solutions des exercices 3. Comme f est la composée de deux fonctions impaires, elle est impaire. Ainsi Γf est symétrique par rapport à O . On choisit donc, comme intervalle de longueur 2π , l’intervalle [−π, π] , que l’on restreint à [0, π] . 4. Comme : ∀x ∈ [0, π] f (x) = f (π − x) , y la courbe est symétrique par rapport à π la droite d’équation x = π2 , et l’on peut 2 π limiter l’étude à l’intervalle [0, π2 ]· −2 π O Pour x ∈ [0, π2 ] , on a f (x) = x , et il est x π −π 2 alors aisé de tracer la courbe.
6.11 1. La représentation de ces deux graphes laisse penser qu’ils sont symétriques par rapport à la droite d’équation x = π4 ; cela est justifié par la relation : ∀x ∈ [− π2 , π2 ]
sin x = cos
π 2
−x .
2. Par suite, les graphes des fonctions réciproques Arcsin et Arccos , symétriques des précédents par rapport à la première bissectrice, sont donc symétriques par rapport à la droite d’équation y = π4 · En notant ΓArccos et ΓArcsin les graphes des fonctions Arccos et Arcsin , cette symétrie se traduit par : π ∀x ∈ [−1, 1] ∀y ∈ IR (x, y) ∈ ΓArccos ⇐⇒ x, − y ∈ ΓArcsin 2 c’est-à-dire Arcsin x = π2 − Arccos x , pour tout x ∈ [−1, 1] . 6.12 Soit x ∈ [−1, 1] . La relation sin2 = 1 − cos2 donne :
sin2 (Arccos x) = 1 − cos2 (Arccos x) = 1 − x2 .
Comme Arccos x ∈ [0, π] , on a sin(Arccos x) 0 et donc sin(Arccos x) =
6.13 • Commençons par prouver que tan 5 Arctan
1 7
+ 2 Arctan
La formule de Moivre permet d’obtenir : tan 5t =
3 79
1 − x2 .
= 1.
sin 5 t 5 tan t − 10 tan t3 + tan t5 · = cos 5 t 1 − 10 tan t2 + 5 tan t4
En remplaçant t par Arctan(1/7) , on obtient tan(5 Arctan 17 ) = On trouve de même tan(2 Arctan nant tan(a + b) , on en déduit que :
√
tan 5 Arctan
3 ) 79
237 = 3116 ·
En utilisant la formule d’addition don-
3 1 + 2 Arctan 7 79
• Vérifions maintenant 0 5 Arctan C’est une conséquence de :
0 Arctan
2879 · 3353
=
237 2879 + 3116 3353 2879 237 1 − 3353 3116
= 1.
3 5π 1 + 2 Arctan < · 7 79 4
3 1 1 π Arctan Arctan √ = 79 7 6 3
et de : 0 5 Arctan
3 7π 5π 1 + 2 Arctan < · 7 79 6 4
On en déduit alors l’égalité demandée.
243
Chapitre 6. Fonctions usuelles 6.14 Cette relation ne peut avoir de sens que si x y �= 1 . Sous cette condition, on a Arctan x + Arctan y �≡ π2 [π] et : tan(Arctan x + Arctan y) =
x+y · 1 − xy
Procédons par disjonction de cas. • Si |x| < 1 et |y| < 1 , alors : π π − < Arctan x + Arctan y < · 2 2 Cet encadrement et l’égalité (⋆) montrent que l’égalité proposée est vraie. • Si x = 0 ou y = 0 l’égalité proposée est évidemment vraie. • Supposons x �= 0 et, par exemple, x > 0. ∗ Si y 0 , alors les relations : π π 0 < Arctan x < et − < Arctan y 0 2 2 entraînent : π π − < Arctan x + Arctan y < · 2 2 L’égalité (⋆) permet alors de conclure : l’égalité proposée est vraie. ∗ Si y > 0 , alors on a : 0 Arctan x + Arctan y, et la relation donnée est vraie si, et seulement si : π Arctan x + Arctan y < , 2 soit encore : π Arctan y < − Arctan x. 2 Étant donné que la fonction tan est croissante sur [0, π2 [ , et que : π π π 0 Arctan y < et 0 − Arctan x < , 2 2 2 la relation (⋆⋆) est équivalente à : π 1 1 − Arctan x = = · y < tan 2 tan(Arctan x) x Pour x > 0 , la relation donnée est donc vraie si, et seulement si, x y < 1. • Supposons x < 0 . La relation : x+y Arctan x + Arctan y = Arctan 1 −xy est vraie si, et seulement si : Arctan(−x) + Arctan(−y) = Arctan c’est-à-dire si, et seulement si :
(−x) + (−y) , 1 − (−x)(− y)
(−x)(−y) = x y < 1. En conclusion la relation proposée est vraie si, et seulement si, x y < 1 . Si x y > 1 , on peut prouver que x+y • si x > 0 (et y > 0 ) alors Arctan x + Arctan y = π + Arctan , 1−xy x+y · • si x < 0 (et y < 0 ) alors Arctan x + Arctan y = −π + Arctan 1 − xy
244
(⋆)
(⋆⋆)
Solutions des exercices 6.15 1. • Prouvons que l’équation possède une unique solution. La fonction :
u : x �→ Arctan(x − 1) + Arctan x + Arctan(x + 1)
est continue et strictement croissante (somme de trois applications strictement crois santes) et réalise donc une bijection de IR sur lim u, lim u = − 32π , 32π . −∞
+∞
L’équation donnée possède donc une unique solution. On peut même préciser que cette racine est positive car u(0) = 0 . • Déterminons cette racine. L’équation donnée s’écrit encore : π Arctan(x − 1) + Arctan(x + 1) = − Arctan x. 2 Soit x une solution de cette équation. On a : π 0 < − Arctan x < π 2 et comme 0 n’est évidemment pas solution, on peut appliquer la fonction tangente à chacun des membres, ce qui donne : 1 tan Arctan(x − 1) + Arctan(x + 1) = tan(π/2 − Arctan x) = , x soit encore
2x 2−x2
=
1 x
et donc x = ±
2 3
·
2 Comme la racine cherchée est positive, on en déduit x = ; il est inutile de faire 3 une réciproque puisque l’on a prouvé que l’équation donnée possède une unique racine. 2. L’ensemble de définition de l’équation est l’ensemble IR . • Comme : 2x π π , ∀x ∈ IR − Arcsin 2 1 + x2 2 toute solution x de l’équation donnée doit vérifier : π π − 2 Arctan x et donc − 1 x 1. 2 2
• Réciproquement, soit x ∈ [−1, 1] et t = Arctan x . Alors t ∈ − π4 , Arcsin
2x 1 + x2
= Arcsin
2 tan t 1 + tan2 t
= Arcsin(sin 2t) = 2t
π 4
et :
car 2 t ∈
= 2 Arctan x.
−
π π , 2 2
L’ensemble solution de l’équation est donc le segment [−1, 1] . 6.16 1. • Méthode de simplification directe
2
1 , cette fonction est Étant donné que 1 + x2 ne s’annule pas sur IR et que 1−x 1+x2 définie sur IR . Elle est paire ; donc on peut en restreindre l’étude à IR+ . En posant x = tan t avec t ∈ ]− π2 , π2 [ ou, ce qui est équivalent, t = Arctan x on obtient : f (tan t) = Arccos (cos 2 t) . Pour x 0 on a alors t ∈ ]0, π2 [ , et donc 2t ∈ ]0, π[ ; on en déduit f (tan t) = 2 t , ce qui entraîne : f (x) = 2 Arctan x. Par parité, on en déduit : ∀x ∈ IR f (x) = 2 Arctan |x| . 245
Chapitre 6. Fonctions usuelles • Méthode utilisant la dérivée
2
Étant donné que 1 + x2 ne s’annule pas sur IR et que 1−x 1 cette fonction est 1+x2
2
définie sur IR . Elle est dérivable pour 1−x �= 1 c’est-à-dire pour x �= 0 . 1+x2
Elle est paire, et on peut donc en restreindre l’étude à IR+ . Pour x > 0 on a : 2 −4 x −1 x 2 f ′ (x) = 1−x2 2 (1 + x2 )2 = |x| 1 + x2 = 1 + x2 · 1 − 1+x2
Ainsi, la fonction x �→ f (x) − 2 Arctan x , est continue sur l’intervalle IR+ , et sa dérivée est nulle sur IR∗+ ; on en déduit qu’elle est constante sur IR+ . Comme elle est nulle en 0 , on en déduit : ∀x ∈ IR+ f (x) = 2 Arctan x. Par parité, on obtient alors : ∀x ∈ IR f (x) = 2 Arctan |x| .
2. Comme, pour x réel, on a :
2x 1 − x2 1 et − 1 1, 2 1+x 1 + x2 la fonction est définie sur tout IR ; de plus elle est dérivable en tout réel x vérifiant : 2x 1 − x2 −1 < < 1 et − 1 < < 1, 1 + x2 1 + x2 c’est-à-dire pour x ∈ ]−∞, −1[ ∪ ]−1, 0[ ∪ ]0, 1[ ∪ ]1, +∞[ . Après simplifications, on trouve : −1
x < −1
−1 < x < 0
f ′ (x) = − x24+1
f ′ (x) = 0
0 0 , l’intégrale
x
1/x x
2. Retrouver ce résultat en dérivant f : x �→ 7.14 On pose I =
π/2
sin2 x dx et J =
0
1/x
1 dt . t(1 + t4 ) 1 dt . t(1 + t4 )
π/2
cos2 x dx . 0
1. Calculer I + J . 2. À l’aide d’un changement de variable affine, montrer que I = J et en déduire leur valeur commune. 3. Donner, sans faire de calcul de primitive, la valeur de K =
π/2
cos2 x sin2 x dx .
0
7.15 Calculer I =
π/8
Arctan
−π/8
7.16 Calculer I =
1
−1
π
1 + x4 1 + x2
√ 3
sin x3 sin
1 − x2
dx .
x2 + x4 dx .
1 dx . 1 + sin x 0 On utilisera une symétrie pour réduire le domaine d’intégration. On posera en suite t = tan x2 .
⋆ 7.17 Calculer
⋆ 7.18 En posant le changement de variable x = cos t , calculer
0
⋆⋆ 7.19 1. En utilisant le changement de variable t = tan 1 · de f : x �→ 2 + cos x 2. Donner une primitive sur IR de f .
x 2
1
1−x dx . 1+x
, déterminer une primitive sur ]−π, π[
265
Chapitre 7. Primitives et calculs d’intégrales
Solutions des exercices √ 7.1 On cherche une primitive sous la forme x �→ C(3x + 2)−1/2+1 = C 3x + 2 avec C ∈ IK . La dérivée de cette fonction étant la fonction x �→ 2√3C , on en déduit qu’une primitive est la 3x+2 2√ 3x + 2. fonction x �→ 3 7.2 On remarque que : ln x = ln′ (x) ln x. x 1 Par conséquent, une primitive de h sur IR∗+ est x �→ (ln x)2 . 2 ∀x ∈ IR∗+
7.3 En linéarisant, on obtient : 1 (sin(5x) + sin x) . 2 Par conséquent, une primitive de x �→ cos(2x) sin(3x) sur IR est : ∀x ∈ IR
cos(2x) sin(3x) =
x �→ −
cos(5x) cos x − · 10 2
7.4 1. On remarque que : 1 1 1 = − · x2 − 3x + 2 x−2 x−1 Une primitive de f1 sur ]−∞, 1[ , sur ]1, 2[ ou sur ]2, +∞[ est donc : ∀x ∈ IR \ {1, 2}
x − 2 ·
x �→ ln
2. On remarque que :
x−1
1 1 = · x2 − 4x + 4 (x − 2)2
∀x ∈ IR \ {2}
Une primitive de f2 sur ]−∞, 2[ ou sur ]2, +∞[ est donc x �→ 3. On remarque que : ∀x ∈ IR
−1 · x−2
1 1 4 1 = = · 2 x2 + x + 1 3 1 2 3 2 1 x+ + √ x+ +1 2 4 2 3
Donc une primitive de f3 sur IR est :
2 x �→ √ Arctan 3
2x + 1 √ 3
·
1 est continue sur l’intervalle ]1, +∞[ . ; elle admet donc une primitive. t ln t Pour tout x ∈]1, +∞[ , on a :
7.5 La fonction t �→
x
2
1 dt = t ln t
Ainsi, une primitive sur ]1, +∞[ de x �→
266
2
x
x ln′ t dt = ln |ln t| 2 . ln t
1 est x �→ ln (ln t). t ln t
Solutions des exercices 7.6 Soit x ∈ ]−1, 1[ . Calculons
x 0
Arcsin t dt . Les fonctions u : t �→ Arcsin t et v : t �→ t sont
de classe C 1 sur ]−1, 1[ . Une intégration par parties donne :
x
Arcsin t dt = 0
x
u(t)v ′ (t) dt
0
= [u v]x0 −
x
u′ (t)v(t) dt
0
= [t Arcsin t]x0 −
x
0
√
t dt = x Arcsin x − 1 − t2 u′ (t)
x 0
√
t dt. 1 − t2
avec u : t �→ 1 − t2 . Par On reconnaît l’intégrale d’une fonction de la forme t �→ 2 u(t) conséquent :
x
Arcsin t dt = x Arcsin x +
0
1 − t2
x
= x Arcsin x +
0
Une primitive sur ]−1, 1[ de la fonction x �→ Arcsin x est donc : x �→ x Arcsin x +
1 − x2 − 1.
1 − x2 .
Remarque La technique de calcul utilisée (qui nécessite une fonction de classe C 1 ) ne nous a permis d’en faire le calcul que sur ]−1, 1[ . D’après le théorème 4 de la page 257, la fonction Arcsin étant continue sur [−1, 1] , elle admet une primitive sur [−1, 1] . Si l’on note F la primitive de Arcsin sur [−1, 1] s’annulant en 0 , on a : ∀x ∈ ]−1, 1[ F (x) = x Arcsin x + Comme F est continue en 1 , on a :
F (1) = lim F (x) = lim x Arcsin x + x→1−
x→1−
et, de même F (−1) = − Arcsin(−1) donc :
1 − x2 .
1 − x2 = Arcsin 1
F (x) = x Arcsin x + 1 − x2 . √ On en déduit que x �→ x Arcsin x + 1 − x2 est dérivable sur [−1, 1] de dérivée Arcsin . ∀x ∈ [−1, 1]
√ 7.7 1. La fonction F : x �→ ln x + x2 + 1 est définie sur IR . En effet, pour tout x réel, par stricte croissance de la fonction racine carrée : √ |x| = x2 < x2 + 1, √ √ et donc 0 x + |x| < x + x2 + 1 . Notons ϕ : x �→ x + x2 + 1 . La fonction ϕ est de classe C 1 sur IR par les théorèmes généraux donc F aussi. Par ailleurs, pour tout x ∈ IR : √ x + x2 + 1 x ϕ′ (x) = 1 + √ = √ · x2 + 1 x2 + 1 Par conséquent, la formule de dérivation des fonctions composées donne : √ 1 1 x + x2 + 1 ′ √ ∀x ∈ IR F (x) = √ = √ · x2 + 1 x + x2 + 1 x2 + 1
267
Chapitre 7. Primitives et calculs d’intégrales √ 2. Considérons les fonctions u : t �→ t et v : t �→ t2 + 1 . Elles sont évidemment de 1 ′ classe C sur IR et l’on a, pour tout t réel, u (t) = 1 et v ′ (t) = √ t2 · t +1
Ainsi, une intégration par parties donne, pour tout réel x :
x
t2 + 1 dt =
0
x
u′ (t) v(t) dt
0
t2 + 1
= t On a également :
x
√
0
t2 dt = 2 t +1 =
2
x
0
x
t2 + 1 dt −
t2 + 1 dt = t
0
t2 + 1 − 1 √ dt t2 + 1
0
On en déduit que :
−
x
0
x
x
t2 + 1
+
0
x
√
0
t2 dt. t2 + 1
x
√
0
1 dt. t2 + 1
x
0
√
1 dt t2 + 1
√ et donc qu’une primitive sur IR de x �→ x2 + 1 est donnée par : x �→
1 x x2 + 1 + ln x + x2 + 1 2 q+1
7.8 1. Les fonctions u : x �→ xp et v : x �→ − (1−x) q+1
sont de classe C 1 sur IR et on a, pour
tout réel x , u′ (x) = pxp−1 et v ′ (x) = (1 − x)q . Ainsi : Ip,q =
1
u(x)v ′ (x) dx = −
0
1 xp (1 − x)q+1 La quantité − q+1
1 xp (1 − x)q+1 q+1
1
.
1
+
0
p q+1
0
1
xp−1 (1 − x)q+1 dx.
étant nulle car p > 0 et q + 1 > 0 , on en déduit :
0
Ip,q =
p Ip−1,q+1 . q+1
2. Lorsque p ∈ IN , on a donc, en itérant : Ip,q =
1 p! q! p p−1 ··· I0,p+q = I0,p+q . q+1 q+2 q+p (p + q)!
Il est par ailleurs clair que I0,p+q =
1 · p+q+1
Ip,q =
En conclusion :
p! q! · (p + q + 1)!
7.9 1. On a immédiatement : I0 =
0
268
π/2
dx =
π 2
et
I1 =
0
π/2
sin x dx = − cos x
π/2 0
= 1.
Solutions des exercices 2. Les fonctions u : x �→ − cos x et v : x �→ sinn−1 x sont de classe C 1 sur [0, π2 ] et, pour
tout x ∈ 0,
π 2
, on a :
u′ (x) = sin(x)
v ′ (x) = (n − 1) cos(x) sinn−2 (x).
et
Ainsi : In =
π/2
u′ (x)v(x) dx
0
= − cos(x) sinn−1 (x)
π/2 0
+ (n − 1)
π/2
cos2 (x) sinn−2 (x) dx.
0
Puisque n 2 , on a − cos(0) sinn−1 (0) = 0 et − cos(π/2) sinn−1 (π/2) = 0 . Par conséquent : In = (n − 1) = (n − 1)
π/2
cos2 (x) sinn−2 (x) dx
0
π/2
1 − sin2 (x) sinn−2 (x) dx
0
= (n − 1) (In−2 − In ) .
Ainsi, nIn = (n − 1)In−2 . En multipliant par In−1 , on a : nIn In−1 = (n − 1) In−1 In−2 , ce qui prouve que la suite (nIn In−1 )n∈IN∗ est constante. On en déduit que : ∀n ∈ IN∗ 3. À partir de la relation In =
n−1 In−2 , n
I2p =
n In In−1 =
π · 2
on obtient, pour tout entier naturel p :
(2p − 1) (2p − 3) 1 · · · I0 . (2p) (2p − 2) 2
Par ailleurs, (2p)(2p − 2) · · · 2 = 2p p(p − 1) · · · 1 = 2p p! .
Pour le produit des impairs, il est classique de multiplier et diviser par le produit des pairs, pour obtenir :
(2p − 1)(2p − 3) · · · 1 =
(2p)! (2p) × (2p − 1) × (2p − 2) × (2p − 3) × · · · × 2 × 1 = p · (2p) × (2p − 2) × · · · × 2 2 p!
En conclusion, pour tout entier naturel p , on a : I2p = I2p+1 =
(2p)! π , puis : 22p (p!)2 2
1 22p (p!)2 π = · (2p + 1) I2p 2 (2p + 1)!
269
Chapitre 7. Primitives et calculs d’intégrales 7.10 1. Pour tout réel x , on a F0 (x) = x , F1 (x) = Arctan(x) et : F2 (x) =
0
x
1 + t2 − t2 dt = (1 + t2 )2
x
0
1 dt + 1 + t2
= Arctan(x) +
x
−2t t × dt (1 + t2 )2 2
0
t 1 × 1 + t2 2
x 0
x 1 Arctan(x) + · 2 2(1 + x2 )
=
−
0
x
1 1 × dt 1 + t2 2
2. Pour tout réel x , on a :
Fn+1 (x) =
x
1 + t2 − t2 dx (1 + t2 )n+1
x
1 dt + (1 + t2 )n
0
=
0
x 0
−2nt t dt × (1 + t2 )n+1 2n
1 t = Fn (x) + × (1 + t2 )n 2n
x 0
−
x
0
2n − 1 x = Fn (x) + · 2n 2n(1 + x2 )n
1 1 dt × (1 + t2 )n 2n
3. En particulier, pour tout réel x , on a : x 3 x 3 + + Arctan(x). F3 (x) = 4(1 + x2 )2 8 1 + x2 8 7.11 1. Soit x ∈ ]0, π[ . Calculons
x
1 du . Pour cela, on fait le changement de vasin u
π/2
u , soit u = 2 Arctan t , et l’on utilise l’égalité : 2 u 2 tan 2 · ∀u ∈ ]0, π[ sin u = u 1 + tan2 2 La fonction ϕ : ]0, +∞[ −→ ]0, π[ est de classe C 1 . On a donc : t �−→ 2 Arctan t riable t = tan
x
π/2
1 du = sin u
tan(x/2)
1 + t2 2 dt = 2t 1 + t2
1
tan(x/2)
1
x · Ainsi, une primitive de f sur ]0, π[ est x �→ ln tan 2 On aurait pu avoir ce résultat directement si l’on avait remarqué que : x ′ 1 + tan2 1 2 = u (x) avec u : ]0, π[ −→ = ∀x ∈ ]0, π[ x sin x u(x) 2 tan x �−→ 2 2. Soit x ∈
π π
− , . Calculons 2 2 riable u = t + π/2 . On a donc :
0
270
x
1 dt = cos t
x+π/2 π/2
0
x
dt x = ln tan · t 2
IR x tan · 2
1 dt . Pour cela, on fait le changement de vacos t
1 u du = ln tan sin u 2
x+π/2 π/2
= ln tan
π x + 2 4
·
Solutions des exercices
π π Ainsi, une primitive de g sur − , 2 2
est donnée par :
x �→ ln tan
π x + 2 4
·
7.12 La fonction u : x �→ x3 est de classe C 1 sur IR et, pour tout réel x , on a u′ (x) = 3x2 . La 1 fonction t �→ étant continue, on a : 1 + t2
1
0
x2 dx = 1 + x6
1
0
1
u′ (x) 1 dx = Arctan x3 3 3 1 + u2 (x)
7.13 1. On peut remarquer que, pour tout t ∈ IR∗ :
1 t3 = 4 = t3 4 t(1 + t ) t (1 + t4 )
1 1 − t4 1 + t4
=
0
π · 12
.
∗ ∗ , à valeurs dans R+ Posons u : t �→ t4 . Il s’agit d’une fonction de classe C 1 sur R+ 1 1 étant continue sur IR∗+ , on a et u′ (t) = 4t3 pour tout t > 0 . La fonction s �→ − s 1+s pour tout x > 0 :
x
1/x
dt = t(1 + t4 )
=
x
1/x
1 1 − u(t) 1 + u(t)
x
1 ln(t4 ) − ln 1 + t4 4
1 = 4 =
u′ (t) 4
x 1 + x4
ln
x4 1 + x4
ln
1 4
4
− ln
1/x
1 x4
1+
1 x4
dt
1 1 + x4
=
1 x3 1 + = · x(1 + x4 ) 1 + x4 x
− ln
= ln x.
1 ∗ sur l’intervalle R+ . t(1 + t4 ) On a pour tout x > 0 , f (x) = G(x) − G(1/x) donc f est dérivable sur IR∗+ et :
2. Notons G une primitive de g : t �→
∀x ∈ IR∗+
1 1 + 2 x(1 + x4 ) x
f ′ (x) =
De plus, f (1) = 0 donc ∀x ∈ IR∗+ 7.14 1. Par linéarité : I +J =
0
π/2
1 (1 x
1 +
f (x) = ln(x) .
cos2 x + sin2 x dx =
2. En posant le changement de variable affine x = I=
π/2
sin2 x dx =
0
= Par conséquent, I = J =
π 4
·
1 ) x4
0
sin2 π/2 π/2
sin2 0
π/2
dx =
0
π 2
π · 2
− t , on obtient :
π − t (−1) dt 2
π −t 2
dt =
π/2
cos2 t dt = J.
0
271
Chapitre 7. Primitives et calculs d’intégrales 1 3. On a K = 4
π/2
sin2 (2x) dx . Le changement de variable linéaire x = t/2 donne :
0
K= Puisque :
on a :
π
sin2 t dt = π/2
π
sin2 t dt.
0
π/2
sin2 (t + π/2) dt =
0
√
1+x4 1+x2
3
π/2
cos2 t dt,
0
1 4
K=
7.15 Soit f : x �→ Arctan
1 8
sin x3 sin
π/2
sin2 (t) dt =
0
√
π · 16
1 − x2 . Cette fonction est correctement définie
et continue sur [−1, 1] et donc sur [−π/8, π/8] . Elle est de plus impaire donc : I=
π/8
f (x)dx =
−π/8
−π/8
f (−t)(−1)dt =
π/8
Ainsi, I = 0 .
−π/8
f (t)dt = −
π/8
π/8
−π/8
f (t)dt = −I.
7.16 La fonction à intégrer est paire et continue sur [−1, 1] , donc : I=
1
−1
|x|
1 + x2 dx = 2
1
x
0
1 + x2 dx.
La fonction u : x �→ x2 est de classe C 1 et pour tout x réel u′ (x) = 2x . Ainsi : 2
0
1
x
1 + x2 dx =
1
√ 4 2−2 3
1 1+sin x
·
1 + u(x)
0
On en déduit que I = 7.17 La fonction f : x �→ que :
1/2
u′ (x) dx =
2 3
1 + u(x)
3/2 1
.
0
est continue et f (π − x) = f (x) , pour tout x ∈ [0, π] . Il s’ensuit
π
f (x) dx =
0
π/2
f (x) dx +
0
=
π
f (x) dx
π/2
π/2
f (x) dx +
0
=2
0
π/2
π/2
0
f (π − t)(−1) dt
1 dx. 1 + sin x
La fonction t → � 2 Arctan t est de classe C 1 sur IR . En posant x = 2 Arctan t , on 2t a sin x = 1+t2 et :
0
π/2
1 dx = 1 + sin x
Par conséquent, on a
0
272
π
0
1
1 1+
2t 1+t2
2 dt = 1 + t2
sin x dx = π − 2. 1 + sin x
0
1
−1 1 dt = (1 + t)2 1+t
1 0
.
Solutions des exercices 7.18 La fonction à intégrer est continue sur [0, 1] . La fonction cosinus étant de classe C 1 sur IR , le changement de variable x = cos t donne :
1
0
1−x dx = 1+x
π/2
0
1 − cos t sin t dt. 1 + cos t
Par ailleurs, pour tout t ∈ [0, π/2] , on a 1 − cos t = 2 sin2 par positivité de la fonction tangente sur [0, π/4] , on a :
Par conséquent :
0
, 1 + cos t = 2 cos2
t 2
et donc,
t 1 − cos t t sin t = tan sin t = 2 sin2 = 1 − cos t. 1 + cos t 2 2
1
0
On peut aussi écrire :
t 2
1
1−x dx = 1+x
1−x dx = 1+x =
π/2
0
1 0 1 0
1 − cos t dt =
π − 1. 2
1−x √ dx 1 − x2
1 x √ −√ 2 1−x 1 − x2
= Arcsin(x) +
1 − x2
1
=
0
dx
π − 1. 2
7.19 1. L’application f est continue sur IR . La fonction t �→ 2 Arctan t est de classe C 1 et elle 2 1−tan( x 2) définit une bijection de IR sur ]−π, π[ . Ainsi, en utilisant le fait que cos x = 2 , 1+tan( x 2) on a pour tout x ∈ ]−π, π[ :
x
0
dx = 2 + cos x
0
tan( x 2)
2 2 dt = √ Arctan 3 + t2 3
t √ 3
tan( x2 )
.
0
Ainsi, une primitive de de f sur ]−π, π[ est la fonction : 2 F : x �→ √ Arctan 3
1 x √ tan 2 3
.
2. La fonction F est définie et dérivable sur IR \ {π + 2nπ | n ∈ ZZ} . De plus, pour tout π entier n , on a lim F = √ · π+2nπ − 3 On considère G l’unique primitive sur IR de f s’annulant en 0 , dont l’existence est assurée puisque f est continue. Comme F et G ont la même dérivée sur IR\{π+2nπ | n ∈ ZZ} , pour tout entier n , il existe une constante αn telle que l’on ait G(x) = F x − 2nπ + αn
pour tout x ∈ (2n − 1)π, (2n + 1)π .
On vérifie par récurrence et en utilisant la continuité de G en (2n + 1)π que αn =
2n √ π 3
lorsque n est un entier naturel, puis un entier relatif. En résumé : ∀n ∈ ZZ
∀x ∈ (2n − 1)π, (2n + 1)π
2n G(x) = F (x) + √ π. 3
273
Chapitre 8 : Équations différentielles linéaires I
Équations différentielles linéaires du premier ordre Structure de l’ensemble des solutions . . . . . . . . . Résolution . . . . . . . . . . . . . . . . . . . . . . . . Illustration en sciences physiques et industrielles . . II Équations différentielles linéaires du second ordre coefficients constants . . . . . . . . . . . . . . . . . . 1 Structure de l’ensemble des solutions . . . . . . . . . 2 Résolution de l’équation homogène . . . . . . . . . . 3 Solution particulière . . . . . . . . . . . . . . . . . . 4 Problème de Cauchy . . . . . . . . . . . . . . . . . . 5 Illustration en sciences physiques et industrielles . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3
. . . . . . . . à . . . . . . . . . . . . . . . .
276 . 277 . 278 . 283
. . . . .
285 285 286 287 290 290 292 295
Équations différentielles linéaires
8
Dans ce chapitre, I est un intervalle de IR d’intérieur non vide. Les fonctions considérées sont à valeurs dans IK , où IK désigne l’ensemble des nombres réels ou celui des nombres complexes.
I
Équations différentielles linéaires du premier ordre
Soit a et b deux fonctions continues de I dans IK . Quand on cherche les fonctions f dérivables sur I vérifiant : ∀x ∈ I
f ′ (x) + a(x) f (x) = b(x),
on dit que l’on résout l’équation différentielle linéaire du premier ordre que l’on note : y ′ + a(x) y = b(x). (E) Remarques • Lorsque a est la fonction nulle, le problème se ramène à la recherche des primitives de b . Nous allons voir comment, dans le cas général, ramener la résolution de l’équation (E) à une recherche de primitives. • Il arrive que l’on ait à résoudre des équations différentielles de la forme : α(x)y ′ + β(x)y = γ(x),
où les fonctions α , β et γ sont continues sur I . Dans ce cas, on se place sur un intervalle I ′ inclus dans I sur lequel la fonction α ne s’annule pas, et l’on se γ β et b = qui sont continues ramène à une équation du type (E), avec a = α α sur I ′ .
´ I Equations différentielles linéaires du premier ordre
1
Structure de l’ensemble des solutions
Définition 1 • On appelle solution sur I de l’équation différentielle y ′ + a(x) y = b(x) toute fonction f de I dans IK , dérivable, telle que : (E) ∀x ∈ I f ′ (x) + a(x) f (x) = b(x). • La fonction b est appelée second membre de l’équation différentielle. Si b est la fonction nulle, l’équation différentielle est dite homogène.
• On appelle équation homogène associée à (E), l’équation : y ′ + a(x) y = 0.
836
(E0 )
Proposition 1 L’ensemble S0 des solutions de l’équation homogène (E0 ) est stable par combinaison linéaire, c’est-à-dire qu’il vérifie : ∀(f1 , f2 ) ∈ S0 2 ∀(λ1 , λ2 ) ∈ IK2 λ1 f1 + λ2 f2 ∈ S0 . Remarque Nous verrons que cette proposition, avec l’appartenance de la fonction nulle à S0 , traduit le fait que S0 est un sous-espace vectoriel de l’espace vectoriel des fonctions dérivables sur I . Proposition 2 Si f1 est une solution particulière de l’équation (E) et si S0 désigne l’ensemble des solutions de l’équation (E0 ), alors l’ensemble des solutions de l’équation (E) est S = {f1 + g | g ∈ S0 } . Démonstration. • Si la fonction f est solution de (E) , alors la fonction f − f1 est solution de l’équation homogène (E0 ) . En effet : ∀x ∈ I
(f − f1 )′ (x) + a(x)(f − f1 )(x) = f ′ (x) + a(x)f (x) − f1′ (x) + a(x)f1 (x) = 0.
L’écriture f = f1 + (f − f1 ) nous assure alors que f ∈ {f1 + g | g ∈ S0 } . • Réciproquement, si f ∈ {f1 + g | g ∈ S0 }, alors il existe g ∈ S0 tel que f = f1 + g , et donc : ∀x ∈ I
Ainsi, la fonction f est solution de (E) . 854
f ′ (x) + a(x)f (x) = f1′ (x) + a(x)f1 (x) + g ′ (x) + a(x)g(x) = b(x)·
Remarques • Nous verrons (proposition 6 de la page 281) que l’ensemble S est non vide. La proposition 2 traduit alors le fait que S possède une structure de sous-espace affine de direction S0 . • L’ensemble {f1 + g | g ∈ S0 } est souvent noté f1 + S0 .
• Comme f1 + S0 = S , l’ensemble f1 + S0 ne dépend pas de la solution f1 choisie.
• D’après la proposition précédente, pour résoudre (E), il nous suffit de : ∗ résoudre l’équation homogène (E0 ), ∗ trouver une solution particulière.
Nous allons voir comment atteindre ces deux objectifs. 277
Chapitre 8. Équations différentielles linéaires
2
Résolution
Première étape : résolution de l’équation homogène La fonction nulle est, bien sûr, solution de l’équation homogène ; le résultat suivant montre que pour obtenir les solutions de l’équation homogène (E0 ), il suffit d’en connaître une solution non nulle. Il utilise la fonction exponentielle qui a été définie au chapitre 6. Rappelons que a est supposée continue sur l’intervalle I , donc admet une primitive sur cet intervalle. Proposition 3 Si A est une primitive de a sur I , alors les solutions de l’équation homogène (E0 ) sont les fonctions : I −→ IK avec λ ∈ IK. t �−→ λ e−A(t)
Démonstration page 292
Principe de démonstration. Soit f une fonction dérivable sur I . Il s’agit de prouver que f 910
est solution si, et seulement si, la fonction t �→ f (t) eA(t) est constante.
Remarque Nous verrons que la proposition précédente traduit le fait que l’ensemble des solutions de l’équation homogène (E0 ) est un IK –espace vectoriel de dimension 1 (une droite vectorielle). Ex. 1. Si a ∈ IK , alors l’ensemble des solutions de l’équation homogène y ′ = ay est : S0 = {t �→ λeat | λ ∈ IK}.
Exo 8.1
Proposition 4 Si f0 est une solution non nulle de l’équation(E0 ), alors elle ne s’annule pas sur I et l’on a : S0 = {λf0 | λ ∈ IK}.
Démonstration page 292
Point méthode Lorsqu’il y a une solution évidente non nulle de (E0 ), on a l’ensemble des solutions de (E0 ) sans avoir besoin de primitiver a.
Ex. 2. Résolvons l’équation homogène y ′ +
1 y = 0 sur IR∗+ . x
1 est une solution non nulle donc les solutions de l’équation x λ homogène sur IR∗+ sont les fonctions x �→ avec λ ∈ IK . x 2 Ex. 3. Résolvons l’équation homogène y ′ − y = 0 sur IR∗+ . x On remarque que la fonction x �→ x2 est une solution non nulle donc les solutions de l’équation homogène sur IR∗+ sont les fonctions x �→ λx2 avec λ ∈ IK. On remarque que la fonction x �→
278
´ I Equations différentielles linéaires du premier ordre 1 y = 0 sur IR . 1 + x2 1 est x �→ Arctan x ; donc les solutions sur IR Une primitive sur IR de la fonction x �→ 1 + x2 sont les fonctions x �→ λ exp (− Arctan x) avec λ ∈ IK. Ex. 4. Résolvons l’équation homogène y ′ +
Deuxième étape : recherche d’une solution particulière Maintenant que l’on dispose d’une méthode pour résoudre l’équation homogène (E0 ), il reste à trouver une solution particulière de l’équation initiale (E). Point méthode Si le second membre a une certaine forme, on peut chercher une solution particulière de la même forme. En particulier, lorsque l’on a une équation différentielle à coefficients constants et un second membre qui est le produit d’une fonction polynomiale et d’une fonction exponentielle c’est-à-dire de la forme x �→ P (x)eλx , on peut chercher une solution de même type que le second membre, c’est-à-dire de la forme x �→ Q(x)eλx avec Q une fonction polynomiale.
Ex. 5. Résolvons l’équation différentielle y ′ + y = x2 ex sur IR . Les solutions de l’équation homogène sont les fonctions x �→ λe−x avec λ ∈ IK . Cherchons une solution de la forme f : x �→ P (x)ex avec P une fonction polynomiale. On obtient que f est solution si, et seulement si, P ′ (x) + 2P (x) = x2 .
∀x ∈ IR
On cherche donc P de degré 2 et l’on trouve P : x �→ x2 /2 − x/2 + 1/4 par identification des coefficients. Ainsi, les solutions de l’équation sont les fonctions :
x �→ x2 /2 − x/2 + 1/4 ex + λe−x
avec
λ ∈ IK.
Ex. 6. Résolvons l’équation différentielle y ′ + y = cos x sur IR . Les solutions de l’équation homogène sont les fonctions x �→ λe−x avec λ ∈ IK . Comme : ∀x ∈ IR
cos x = Re eix ,
et que les coefficients de l’équation sont réels, on cherche une solution de l’équation y ′ + y = eix 1−i 1 = . Comme : sous la forme x �→ Ceix et l’on obtient C = 1+i 2 ∀x ∈ IR
Re
1 − i ix e 2
= Re
1 1−i 1 (cos x + i sin x) = cos x + sin x, 2 2 2
les solutions de l’équation sont les fonctions : x �→
1 1 cos x + sin x + λe−x 2 2
avec
λ ∈ IK.
On aurait pu chercher directement une solution particulière de la forme A cos +B sin avec (A, B) ∈ IR2 .
279
Chapitre 8. Équations différentielles linéaires Lorsque le second membre est une combinaison linéaire de seconds membres que l’on sait traiter, on peut utiliser le principe de superposition. Proposition 5 (Principe de superposition) Soit f1 une solution de l’équation y ′ + a(x)y = b1 (x) et f2 une solution de l’équation y ′ + a(x)y = b2 (x). Alors, pour tout (λ1 , λ2 ) ∈ IK2 , la fonction λ1 f1 + λ2 f2 est solution de l’équation y ′ + a(x)y = λ1 b1 (x) + λ2 b2 (x). Démonstration page 292
Point méthode Pour pouvoir utiliser le principe de superposition, on découpe le second membre b en somme de termes pour lesquels on peut trouver une solution particulière. Ex. 7. Résolvons sur IR∗+ l’équation différentielle xy ′ + y = 1 + (1 + x)ex . Comme x �→ 1/x est une solution non nulle évidente de l’équation homogène associée, les solutions de l’équation homogène sont les fonctions x �→ λ/x avec λ ∈ IK . Il est immédiat que la fonction constante 1 vérifie l’équation différentielle xy ′ + y = 1 . Cherchons donc, par le principe de superposition, une solution de xy ′ + y = (1 + x)ex . La forme du second membre pousse à envisager une solution sous la forme du produit d’une exponentielle par une certaine fonction. On arrive sans trop de mal à deviner x �→ ex . Donc les solutions sur IR∗+ sont les fonctions x �→ 1 + ex + λ/x , avec λ ∈ IK .
Remarques • L’équation de cet exemple n’est pas directement sous la forme y ′ + a(x)y = b(x), mais on s’y ramène facilement en divisant par x (c’est pour cela que l’on s’est placé sur un intervalle ne contenant pas 0 ). • Évidemment, dans la pratique, on n’aura pas toujours la chance de deviner aussi facilement des solutions. Point méthode Lorsque l’on ne trouve pas de solution évidente, on peut appliquer la méthode de la variation de la constante décrite ci-dessous. Méthode de la variation de la constante Si l’on considère y0 une solution non nulle de l’équation homogène (E0 ), alors les solutions de l’équation homogène (E0 ) sont les fonctions x �→ λ y0 (x) avec λ ∈ IK. La méthode de la variation de la constante consiste à chercher une solution de la forme y : x �→ λ(x) y0 (x) où λ est une fonction dérivable sur I . Pour tout x ∈ I , on a alors : y ′ (x) + a(x) y(x) = λ′ (x) y0 (x) + λ(x) y0′ (x) + a(x)λ(x) y0 (x) = λ′ (x) y0 (x) + λ(x) (y0′ (x) + a(x) y0 (x)) =0 car y0 ∈S0
′
= λ (x) y0 (x).
280
´ I Equations différentielles linéaires du premier ordre D’après la proposition 3 de la page 278, la solution y0 ne s’annule pas sur I . Ainsi, la fonction y est solution de (E) si, et seulement si, la fonction λ vérifie : ∀x ∈ I
λ′ (x) =
b(x) · y0 (x)
Ainsi, si la fonction λ est une primitive sur I de la fonction b/y0 , alors la fonction y : x �→ λ(x) y0 (x) est solution de (E). Une telle primitive existe d’après le théorème 4 de la page 257 car la fonction b/y0 est continue sur l’intervalle I comme quotient de deux fonctions continues dont le dénominateur ne s’annule pas. Remarque On parle de variation de la constante car la constante qui apparait dans les solutions de l’équation homogène a été remplacée par une fonction dérivable que l’on fait « varier ». On en déduit le résultat suivant. Proposition 6 L’équation (E) : y ′ +a(x) y = b(x) possède une (et même une infinité) de solutions. Démonstration page 292 1 x
x sur ]1, +∞[ . x−1 λ Les solutions de l’équation homogène sont les fonctions x �→ , λ ∈ IK . x λ(x) , où λ est une fonction dérivable Cherchons une solution particulière de la forme f1 : x �→ x sur ]1, +∞[ . Après calculs, on trouve que la fonction f1 est solution si, et seulement si, λ est (x + 1)(x − 1) + 1 1 x2 = =x+1+ · une primitive sur ]1, +∞[ de la fonction x �→ x−1 x−1 x−1 x ln(x − 1) Par conséquent, une solution particulière sur ]1, +∞[ est f1 : x �→ + 1 + · 2 x Ainsi, les solutions de l’équation sur ]1, +∞[ sont les fonctions :
Ex. 8. Résolvons l’équation différentielle y ′ + y =
x �→
ln(x − 1) λ x +1+ + 2 x x
avec
λ ∈ IK.
Point méthode Pour déterminer l’ensemble des solutions de (E), il faut donc : • déterminer l’ensemble des solutions de l’équation homogène associée ; pour cela, soit l’on trouve une solution « évidente », soit l’on primitive a ; • déterminer une solution particulière f1 ; pour cela, on peut :
∗ trouver une solution « évidente », en s’inspirant en particulier de la forme du second membre ; ∗ utiliser le principe de superposition ; ∗ utiliser la méthode de la variation de la constante. 281
Chapitre 8. Équations différentielles linéaires Problème de Cauchy La méthode de variation de la constante permet d’assurer l’existence de solutions de l’équation (E). Le résultat suivant affirme que la solution est unique si l’on impose une condition initiale. C’est la situation que l’on rencontre en général en sciences physiques et industrielles : une équation différentielle décrit l’évolution d’un système en fonction du temps et, souvent, la condition initiale en précise son état au temps t = 0 . Un problème de Cauchy est une équation différentielle associée à une condition initiale.
Exo 8.2
Théorème 7 (Théorème de Cauchy) Pour toute condition initiale (x0 , y0 ) ∈ I × IK , il existe une unique solution f de l’équation (E) : y ′ + a(x) y = b(x), telle que f (x0 ) = y0 . Démonstration page 292
Remarques • Les graphes de deux solutions d’une même équation différentielle linéaire d’ordre 1 sont donc disjoints ou confondus. • On retrouve que si f est solution d’une équation différentielle linéaire homogène d’ordre 1 , alors f s’annule si, et seulement si, elle est identiquement nulle. Ex. 9. Déterminons l’unique solution sur ]0, π[ de l’équation différentielle y ′ + s’annulant en π/2 .
cos x y = 1 sin x
λ , avec λ ∈ IK . sin x Pour trouver une solution particulière, on la cherche sous la forme :
Les solutions de l’équation homogène sont les fonctions x �→
f1 : x �→
λ(x) , sin x
où λ est une fonction dérivable sur ]0, π[ . On trouve que la fonction f1 est solution si, et seulement si, λ est une primitive sur ]0, π[ de la fonction sin . C − cos x Par conséquent, les solutions sur ]0, π[ de l’équation sont les fonctions x �→ sin x cos x · avec C ∈ IK . L’unique solution sur ]0, π[ s’annulant en π/2 est donc x �→ − sin x
Remarque L’utilisation d’un problème de Cauchy permet de démontrer des propriétés des solutions d’une équation différentielle. Ex. 10. Supposons I symétrique par rapport à 0 et les fonctions a et b continues sur I et impaires. Alors toute solution de l’équation différentielle (E) : y ′ + a(x) y = b(x) est paire. En effet, soit f une solution de (E) . Considérons g : x �→ f (−x) . Elle est dérivable sur I et : ∀x ∈ I
g ′ (x) = −f ′ (−x) = a(−x) f (−x) − b(−x) = −a(x) g(x) + b(x),
ce qui prouve que g est solution de (E) . De plus, g(0) = f (0) , donc f et g vérifient le même problème de Cauchy. Cela prouve qu’elles sont égales, donc que f est paire.
282
´ I Equations différentielles linéaires du premier ordre
3
Illustration en sciences physiques et industrielles
L’équation différentielle linéaire du premier ordre que l’on rencontre le plus fréquemment en sciences physiques et industrielles est l’équation (à coefficients constants) suivante : A(t) 1 y′ + y = · (∗) τ τ Elle régit l’évolution d’une grandeur y au cours du temps. La constante τ > 0 a la dimension d’un temps et représente le temps caractéristique d’évolution du phénomène qui est modélisé. Le second membre, qui peut être interprété comme l’action de l’extérieur sur le système (aussi appelé consigne en sciences physiques et industrielles), est généralement constant ou sinusoïdal. On parle de régime libre lorsque A = 0 et de régime forcé sinon. Cette équation apparaît dans de multiples situations. Échange thermique On note T la température (que l’on suppose homogène) d’un système placé au contact d’un dispositif dont la température est constante à T0 (thermostat). On admet qu’à chaque instant t , la variation de température du système est proportionnelle à la différence T − T0 . Ceci conduit à l’équation différentielle : dT = K(T − T0 ) avec K < 0. dt Cette équation différentielle est bien sous la forme (∗) avec τ = −1/K et A = −KT0 .
Charge/décharge d’un condensateur à travers une résistance Dans un circuit RC, la charge q du condensateur évolue selon l’équation suivante : q dq U= +R · C dt Celle-ci peut se mettre sous la forme (∗) avec τ = RC et A = U/R . Une équation similaire peut être obtenue si l’on cherche à modéliser l’établissement du courant dans un circuit comportant une bobine, une résistance et un générateur de tension.
Chute libre d’un corps On s’intéresse à la vitesse v (projetée sur un axe vertical) d’un corps de masse m en chute libre verticale dans un champ de pesanteur d’intensité g . On suppose que le corps est soumis à une force de frottement de l’air qui est proportionnelle à sa vitesse : f� = −α�v . L’équation qui régit l’évolution de v est alors : dv = −αv − mg. m dt Cette équation se ramène à nouveau à l’équation (∗) avec τ = m/α .
Réaction chimique On considère une réaction chimique transformant un réactif α en un produit β dont la vitesse dépend linéairement de la concentration de α . Alors la concentration du réactif α notée Cα vérifie une équation différentielle de la forme : dCα = −kCα . dt
283
Chapitre 8. Équations différentielles linéaires Cas d’un second membre de type « échelon » Lorsque A est une constante, alors les solutions sur IR+ de l’équation (∗) sont les fonctions t �→ A + λe−t/τ avec λ ∈ IR. Pour trouver la solution dans un cas particulier, il suffit donc de déterminer la constante λ à l’aide des conditions initiales du problème. On remarque que le comportement de la solution est toujours le même. • La grandeur tend vers la constante A lorsque t tend vers l’infini. Autrement dit, le système tend à rejoindre un état d’équilibre dans lequel la grandeur ne varie plus. • Cet état est atteint d’autant plus vite que le temps τ caractéristique d’évolution du système est petit. Cas d’un second membre de type sinusoïdal Lorsque A est de la forme t �→ A0 cos(ωt) avec (A0 , ω) ∈ IR × IR∗+ , on détermine une solution particulière en considérant la partie réelle d’une solution particulière de l’équation : A0 iωt 1 e . y′ + y = τ τ Les solutions sur IR+ de l’équation (∗) sont alors les fonctions : A0 cos(ωt) + ωτ sin(ωt) + λe−t/τ avec λ ∈ IR. 1 + ω2τ 2 A0 cos(ωt) + ωτ sin(ωt) peut aussi se voir sous La solution particulière t �→ 2 2 1+ω τ la forme d’un cosinus déphasé c’est-à-dire : t �→
A0 cos(ωt − ϕ) avec ϕ = Arctan(ωτ )· t �→ √ 1 + ω2τ 2 Pour trouver la solution dans un cas particulier, il suffit donc de déterminer la constante λ à l’aide des conditions initiales du problème. On remarque que le comportement de la solution est toujours le même. • La grandeur s’approche, lorsque t tend vers l’infini, d’un régime sinusoïdal de même fréquence que le second membre mais avec un déphasage d’autant plus petit que la constante ωτ est petite. C’est ce que l’on appelle le régime permanent. • Cet état est atteint d’autant plus vite que le temps caractéristique d’évolution du système, τ , est petit. La période pendant laquelle le régime permanent n’est pas encore « atteint » s’appelle le régime transitoire.
284
II Équations différentielles linéaires du second ordre à coefficients constants
II
Équations différentielles linéaires du second ordre à coefficients constants
Soit a et b deux éléments de IK et c une fonction continue de I dans IK. On considère l’équation différentielle linéaire du second ordre à coefficients constants : y ′′ + a y ′ + b y = c(x).
1
(E)
Structure de l’ensemble des solutions
Les démonstrations de cette partie sont similaires à celles données dans le cas des équations différentielles linéaires d’ordre 1 . Elles sont fondées sur le caractère linéaire de l’équation. Nous laissons donc le lecteur les adapter. Définition 2 • On appelle solution sur I de l’équation différentielle (E) toute fonction f deux fois dérivable de I dans IK telle que : ∀x ∈ I f ′′ (x) + a f ′ (x) + b f (x) = c(x). • La fonction c est appelée second membre de l’équation différentielle. Lorsque c est la fonction nulle, l’équation différentielle est dite homogène.
• On appelle équation homogène associée à (E) (ou équation sans second membre), l’équation : (E0 ) y ′′ + a y ′ + b y = 0. Proposition 8 L’ensemble S0 des solutions de l’équation homogène (E0 ) est stable par combinaison linéaire, c’est-à-dire qu’il vérifie : ∀(f1 , f2 ) ∈ S0 2 836
∀(λ1 , λ2 ) ∈ IK2
λ1 f1 + λ2 f2 ∈ S0 .
Remarque Nous verrons que cette proposition, avec l’appartenance de la fonction nulle à S0 , traduit le fait que S0 est un sous-espace vectoriel de l’espace vectoriel des fonctions deux fois dérivables de I dans IK . Proposition 9 Si f1 est une solution particulière de l’équation (E) et si S0 désigne l’ensemble des solutions de l’équation (E0 ), alors l’ensemble des solutions de l’équation (E) est S = {f1 + g | g ∈ S0 } .
854
Remarques • Nous verrons avec le théorème 14 de la page 290 que l’ensemble S est non vide. La proposition précédente traduit alors le fait que S possède une structure de sous-espace affine de direction S0 .
• Comme dans le cas des équations différentielles linéaires du premier ordre, résoudre une équation différentielle linéaire du second ordre revient donc à résoudre l’équation homogène associée et à trouver une solution particulière. 285
Chapitre 8. Équations différentielles linéaires
2
Résolution de l’équation homogène
Nous cherchons les solutions sur IR. Pour trouver les solutions sur I , il suffira d’en considérer les restrictions. Proposition 10 Soit r ∈ IK .
La fonction ϕr :
IR −→ IK vérifie l’équation homogène y ′′ + a y ′ + b y = 0 rx x �−→ e si, et seulement si, r2 + a r + b = 0 .
L’équation r2 + a r + b = 0 est appelée équation caractéristique de (E0 ). Démonstration page 292
Cas où IK = C Proposition 11 • Si l’équation caractéristique r2 + a r + b = 0 a deux racines distinctes r1 et r2 , alors les solutions de (E0 ) sont les fonctions : x �→ λ1 er1 x + λ2 er2 x
avec
(λ1 , λ2 ) ∈ C2 .
• Si l’équation caractéristique r2 + a r + b = 0 a une racine double r0 , alors les solutions de (E0 ) sont les fonctions : x �→ (λ1 + λ2 x)er0 x
avec
(λ1 , λ2 ) ∈ C2 .
Démonstration page 293 Étudier l’équation vérifiée par z : x �→ y(x)e−rx où r est une racine de l’équation caractéristique.
Principe de démonstration.
910
Remarque Dans les deux cas, l’ensemble des solutions de l’équation différentielle (E0 ) est constitué des combinaisons linéaires de deux solutions non proportionnelles. On verra que cela implique que (E0 ) est un C–espace vectoriel de dimension 2 . On dit que l’ensemble des solutions de l’équation homogène est un plan vectoriel. Cas où IK = IR Proposition 12 Supposons a et b réels. • Si l’équation caractéristique r2 + a r + b = 0 a deux racines réelles distinctes r1 et r2 , alors les solutions réelles de (E0 ) sont les fonctions : x �→ λ1 er1 x + λ2 er2 x
avec
x �→ (λ1 + λ2 x) er0 x
avec
(λ1 , λ2 ) ∈ IR2 .
• Si l’équation caractéristique r2 + a r + b = 0 a une racine double r0 (nécessairement réelle), alors les solutions réelles de (E0 ) sont les fonctions : (λ1 , λ2 ) ∈ IR2 .
• Si l’équation caractéristique r2 +a r+b = 0 a deux racines complexes conjuguées non réelles α ± iβ , alors les solutions réelles de (E0 ) sont les fonctions : x �→ λ1 eαx cos βx + λ2 eαx sin βx
286
avec
(λ1 , λ2 ) ∈ IR2 .
Démonstration page 294
´ II Equations différentielles linéaires du second ordre à coefficients constants Ex. 11. Résolvons les équations différentielles : 1. y ′′ + 4y ′ − 5y = 0 ; 2. y ′′ − 2y ′ + y = 0 ;
3. y ′′ + 2 y ′ + 2 y = 0 . . 1. L’équation caractéristique r 2 + 4r − 5 = 0 admet comme racines 1 et −5 donc les solutions à valeurs dans IK sont les fonctions : x �→ λ1 ex + λ2 e−5x
avec
(λ1 , λ2 ) ∈ IK2 .
2. L’équation caractéristique r 2 − 2r + 1 = 0 admet 1 comme racine double, donc les solutions à valeurs dans IK sont les fonctions : x �→ (λ1 + λ2 x)ex
avec
(λ1 , λ2 ) ∈ IK2 .
3. L’équation caractéristique r 2 + 2r + 2 = 0 admet comme racines −1 + i et −1 − i , donc les solutions complexes sont les fonctions : x �→ λ1 e−x+ix + λ2 e−x−ix
avec
(λ1 , λ2 ) ∈ C2
avec
(λ1 , λ2 ) ∈ IR2 .
et les solutions réelles sont les fonctions : x �→ (λ1 cos x + λ2 sin x)e−x
On remarque que les solutions complexes sont aussi les fonctions : x �→ (λ1 cos x + λ2 sin x)e−x
3
avec
(λ1 , λ2 ) ∈ C2 .
Solution particulière
Maintenant que l’on dispose d’une méthode pour résoudre l’équation homogène (E0 ), il reste à trouver une solution particulière de l’équation (E). Point méthode Si le second membre a une certaine forme, on peut chercher une solution particulière de la même forme. Ex. 12. Soit λ ∈ IK . Cherchons une solution sur IR de l’équation différentielle : y ′′ + a y ′ + b y = eλx de la forme f : x �→ Q(x)eλx . On a alors : ∀x ∈ IR
(E)
f ′′ (x) + a f ′ (x) + b f (x) = (λ2 + aλ + b) Q(x) + (2λ + a)Q′ (x) + Q′′ (x) eλx .
Ainsi, on va prendre Q : • de degré 0 si λ n’est pas racine de P : x �→ x2 + ax + b ;
• de degré 1 si λ est racine simple de P (c’est-à-dire si λ2 + aλ + b = 0 et 2λ + a �= 0 ) ; • de degré 2 si λ est racine double de P .
287
Chapitre 8. Équations différentielles linéaires Point méthode Soit λ ∈ IK . L’équation différentielle : y ′′ + a y ′ + b y = eλx possède une solution de la forme :
(E)
• x �→ Ceλx si λ n’est pas racine de l’équation r2 + a r + b = 0 ,
• x �→ Cxeλx si λ est racine simple de l’équation r2 + a r + b = 0 ,
• x �→ Cx2 eλx si λ est racine double de l’équation r2 + a r + b = 0 . Ex. 13. Résolvons les équations différentielles suivantes : 1. y ′′ − 4y ′ + 3y = ex ; 2. y ′′ − 2y ′ + y = ex .
1. Comme 1 et 3 sont racines simples de l’équation caractéristique, les solutions de l’équation homogène associée sont les fonctions x �→ λ1 ex + λ2 e3x avec (λ1 , λ2 ) ∈ IK2 .
Puisque 1 est racine simple de l’équation caractéristique, on cherche une solution sous la x forme f : x �→ Cx ex et on trouve que x �→ − ex est une solution particulière. Les 2 solutions sont donc les fonctions :
x
x �→ −
2
+ λ1
ex + λ2 e3x
avec
(λ1 , λ2 ) ∈ IK2 .
2. Comme 1 est racine double de l’équation caractéristique, les solutions de l’équation homogène associée sont les fonctions x �→ (λ1 + λ2 x) ex avec (λ1 , λ2 ) ∈ IK2 . On cherche une solution x2 x e est une solution particulière. sous la forme f : x �→ Cx2 ex et on trouve que x �→ 2 Les solutions sont donc les fonctions : x �→
1 2 x + λ1 + λ2 x 2
ex
avec
(λ1 , λ2 ) ∈ IK2 .
Plus généralement, si le second membre est le produit d’une fonction polynomiale et d’une fonction exponentielle, on peut chercher une solution particulière de la même forme. Ex. 14. Résolvons l’équation différentielle y ′′ − 4y ′ + 3y = (2x + 1) e−x .
On cherche une solution de la forme f : x �→ P (x) e−x avec P polynomiale. On obtient que f est solution si, et seulement si, ∀x ∈ IR P ′′ (x) − 6P ′ (x) + 8P (x) = 2x + 1 . On cherche alors P 5 x + de degré 1 et l’on trouve que x �→ e−x est solution. Les solutions sont donc les 4 16 fonctions : 5 x x �→ + e−x + λ1 ex + λ2 e3x avec (λ1 , λ2 ) ∈ IK2 . 4 16
Remarque Cette idée ainsi que le principe de superposition permettent de trouver une solution particulière lorsque le second membre est le produit d’une fonction polynomiale et d’une fonction cosinus ou sinus. 288
´ II Equations différentielles linéaires du second ordre à coefficients constants Proposition 13 (Principe de superposition) Soit f1 une solution de l’équation différentielle y ′′ + ay ′ + by = c1 (x) et f2 une solution de l’équation différentielle y ′′ + ay ′ + by = c2 (x), alors la fonction f1 + f2 est solution de l’équation y ′′ + ay ′ + by = c1 (x) + c2 (x). Ex. 15. Résolvons sur IR les équations différentielles suivantes : 1. y ′′ − 4 y ′ + 3 y = sh x . 2. y ′′ + y = sin3 x .
1. Une solution de y ′′ − 4 y ′ + 3 y = ex est x �→ −
x x e et une solution de y ′′ − 4 y ′ + 3 y = e−x 2
1 −x e (cf. point méthode de la page ci-contre). En utilisant le principe de superpo8 x 1 sition, on obtient la solution particulière x �→ − e−x − ex . Les solutions sont donc les 16 4 fonctions :
est x �→
x �→ −
1 −x x x e − e + λ1 ex + λ2 e3x 16 4
avec
(λ1 , λ2 ) ∈ IK2 .
2. Les solutions de l’équation homogène associée sont les fonctions : x �→ λ1 cos x + λ2 sin x
avec
(λ1 , λ2 ) ∈ IK2 .
On linéarise le second membre (voir l’exemple 7 de la page 168) : ∀x ∈ IR
3 1 sin3 x = − sin 3x + sin x 4 4
et l’on utilise le principe de superposition. On est ainsi amené à déterminer une solution f1 de y ′′ + y = sin 3x et une solution f2 de y ′′ + y = sin x . Comme la fonction x �→ sin 3x est combinaison linéaire des fonctions x �→ e3ix et x �→ e−3ix , et que ±3i n’est pas racine de l’équation caractéristique, on peut chercher f1 comme combinaison linéaire des fonctions x �→ e3ix et x �→ e−3ix , c’est-à-dire sous la forme x �→ a cos 3x + b sin 3x . On trouve : f1 : x �→ −
sin 3x · 8
En revanche, comme i et −i sont racines simples de l’équation caractéristique, on cherche la solution f2 de la forme : x �→ a x cos x + c x sin x,
1 ce qui donne f2 : x �→ − x cos x. Les solutions sont donc les fonctions : 2 x �→
sin 3x 3x + λ1 − 32 8
cos x + λ2 sin x
avec
(λ1 , λ2 ) ∈ IK2 .
289
Chapitre 8. Équations différentielles linéaires
4
Problème de Cauchy
Théorème 14 (Théorème de Cauchy) Pour toute condition initiale (x0 , y0 , y1 ) ∈ I × IK2 , il existe une unique solution f de l’équation (E) telle que f (x0 ) = y0 et f ′ (x0 ) = y1 . Démonstration (non exigible) page 294
5
Illustration en sciences physiques et industrielles
En sciences physiques et industrielles, on rencontre couramment des équations différentielles linéaires du second ordre à coefficients constants de la forme générale suivante : y ′′ + 2λy ′ + ω02 y = f (t). De manière générale : • le coefficient d’amortissement λ 0 modélise des phénomènes qui dissipent de l’énergie (frottements en mécanique, effet Joule en électricité) ; il a la dimension de l’inverse d’un temps ; • la constante ω0 > 0 est appelée pulsation propre ; sa dimension est aussi l’inverse d’un temps ; • le second membre f est une fonction qui représente l’action de l’extérieur sur le système (forçage). Voici une liste non exhaustive de situations où une telle équation intervient. Petites oscillations d’un pendule libre Un pendule pesant de longueur ℓ est placé dans un champ de pesanteur d’intensité g . On suppose que l’angle θ qu’il forme avec la verticale reste à chaque instant petit de sorte que l’approximation sin θ ≈ θ soit raisonnable. L’équation d’évolution de θ s’écrit : g d2 θ + θ = 0. dt2 ℓ Ici, il n’y a pas de frottements ( λ = 0 ) ni de forçage ( f = 0 ). On obtient le même type d’équation si l’on s’intéresse aux oscillations d’une masse reliée à un ressort.
Charge d’un condensateur avec une résistance et une inductance Si l’on considère un circuit RLC en série, alors l’équation d’évolution de la charge q du condensateur est : dq d2 q q +R +L 2· U= C dt dt Dans cet exemple, le coefficient d’amortissement vaut λ = R/2L et la pulsation propre √ vaut ω0 = 1/ LC .
290
´ II Equations différentielles linéaires du second ordre à coefficients constants Solutions de l’équation homogène : régime libre Le comportement des solutions de l’équation : y ′′ + 2λy ′ + ω02 y = 0 dépend du rapport entre les deux constantes de temps du système (1/λ et 1/ω0 ). On dit que le régime est : • pseudo-périodique si λ < ω0 . Dans ce cas, l’équation caractéristique possède deux racines non réelles distinctes et les solutions sont les fonctions : IR −→ IR x �−→ e−λx A cos( ω02 − λ2 x) + B sin( ω02 − λ2 x) avec (A, B) ∈ IR2 .
On observe donc des oscillations autour de la position d’équilibre y = 0 . Dans le cas où le terme d’amortissement est présent (λ > 0 ), l’amplitude de ces oscillations décroît de sorte que lim y(x) = 0 d’autant plus vite que λ est grand. La x→+∞ 2 quantité ω = ω0 − λ2 est appelée pseudo-pulsation.
• critique si λ = ω0 . Dans ce cas, l’équation caractéristique admet une racine réelle double. L’ensemble des solutions est : IR −→ IR avec (A, B) ∈ IR2 . x �−→ e−λx (A + Bx) • apériodique si λ > ω0 . Dans ce cas, l’ensemble des solutions est : 2 IR −→ IR √ 2 2 avec (A, B) ∈ IR √ 2 2 x �−→ e−λx Ae− λ −ω0 x + Be λ −ω0 x
Remarquons que dans tous les cas, on a
lim y(x) = 0 .
x→+∞
Figure 8.1 – Régimes pseudo-périodique, apériodique et critique
291
Chapitre 8. Équations différentielles linéaires
Démonstrations Proposition 3 Soit f une fonction dérivable sur I . On pose g : t �→ f (t)eA(t) . La fonction g est dérivable sur I et : ∀t ∈ I
g ′ (t) = f ′ (t) + a(t) f (t) eA(t) .
Comme la fonction t �→ eA(t) ne s’annule pas, on en déduit que f est solution si, et seulement si, g ′ est nulle sur I donc si, et seulement si, g est constante sur l’intervalle I . Proposition 4 Si f0 est une solution non nulle de l’équation homogène, alors il existe un scalaire non nul λ0 ∈ IK tel que : ∀t ∈ I
f0 (t) = λ0 e−A(t) ;
par conséquent, la fonction f0 ne s’annule pas sur I et l’ensemble des fonctions qui lui sont proportionnelles est aussi S0 c’est-à-dire S0 = {λf0 | λ ∈ IK}. Proposition 5
Pour tout x ∈ I , on a : f1′ (x) + a(x)f1 (x) = b1 (x)
et
f2′ (x) + a(x)f2 (x) = b2 (x).
Par conséquent, pour tout x ∈ I , on a : (λ1 f1 + λ2 f2 )′ (x) + a(x)(λ1 f1 + λ2 f2 )(x) = λ1 b1 (x) + λ2 b2 (x), ce qui prouve que λ1 f1 + λ2 f2 est solution de l’équation y ′ + a(x)y = λ1 b1 (x) + λ2 b2 (x) . Proposition 6 D’après ce qui précède, (E) possède au moins une solution f1 . Si l’on note f0 une solution non nulle de l’équation homogène associée dont l’existence est assurée par la proposition 4 de la page 278, alors d’après la proposition 2 de la page 277, l’ensemble des solution de (E) est {f1 + λ f0 | λ ∈ IK} . Théorème 7 Soit f1 une solution particulière de (E) et f0 une solution non nulle de l’équation homogène associée. Alors les solutions de (E) sont les fonctions de la forme f1 +λf0 avec λ ∈ IK . La condition f (x0 ) = y0 est donc équivalente à : λ f0 (x0 ) = y0 − f1 (x0 ). Comme la fonction f0 ne s’annule pas sur I (d’après la proposition 3 de la page 278), f0 (x0 ) �= 0 donc il y a une solution et une seule vérifiant f (x0 ) = y0 , la fonction : f1 + Proposition 10
y0 − f1 (x0 ) f0 . f0 (x0 )
Cette équivalence provient de la relation : ϕ′′r + a ϕ′r + b ϕr = (r 2 + a r + b) ϕr
et du fait que la fonction ϕr n’est pas la fonction nulle.
292
Démonstrations Proposition 11 •
L’équation caractéristique possède au moins une racine r ∈ C .
Soit f une fonction deux fois dérivable sur I . La fonction z définie sur I par : z :
I x
−→ �−→
C e−rx f (x)
est deux fois dérivable sur I et vérifie, pour tout x ∈ I : f (x) = z(x) erx ;
f ′ (x) = z ′ (x) + r z(x) erx ;
f ′′ (x) = z ′′ (x) + 2 r z ′ (x) + r 2 z(x) erx . Pour x ∈ I , on a donc :
f ′′ (x) + a f ′ (x) + b f (x) = z ′′ (x) + (2 r + a) z ′ (t) + (r 2 + a r + b)z(x) erx
= erx z ′′ (x) + (2 r + a) z ′ (x) .
(∗)
Par conséquent, la fonction f est solution de (E0 ) si, et seulement si, la fonction z ′ est solution d’une équation différentielle linéaire homogène du premier ordre : y ′ + (2 r + a)y = 0. •
(E0′ )
Nous avons deux cas suivant que le complexe 2r + a est nul ou pas, c’est-à-dire suivant que r est racine double ou racine simple de l’équation caractéristique. ∗
Si l’équation caractéristique r 2 + a r + b = 0 a deux racines distinctes r1 et r2 , alors en prenant r = r1 , les solutions de l’équation (E0′ ) sont les fonctions : IR x
−→ �−→
C λ e−(2r1 +a)x
avec
λ ∈ C.
Ainsi, la fonction f est solution de (E0 ) si, et seulement s’il existe des constantes λ1 et λ2 telles que : ∀x ∈ IR
z(x) = λ1 + λ2 e−(2r1 +a)x ,
c’est-à-dire si, et seulement s’il existe des constantes λ1 et λ2 telles que : ∀x ∈ IR
∗
f (x) = λ1 er1 x + λ2 e−(r1 +a)x .
En remarquant que r1 + r2 = −a , on obtient le résultat annoncé. Si l’équation caractéristique r 2 + a r + b = 0 a une racine double r0 , alors, en prenant r = r0 , on a 2a + r = 0 donc les solutions de l’équation (E0′ ) sont les fonctions : IR x
−→ �−→
C λ
avec
λ ∈ C.
Ainsi, la fonction f est solution de (E0 ) si, et seulement s’il existe des constantes λ1 et λ2 telles que : ∀x ∈ IR z(x) = λ1 + λ2 x, c’est-à-dire si, et seulement s’il existe des constantes λ1 et λ2 telles que : ∀x ∈ IR
f (x) = λ1 er0 x + λ2 xer0 x .
On obtient donc le résultat annoncé.
293
Chapitre 8. Équations différentielles linéaires Proposition 12 • Les deux premiers cas se traitent comme dans le cas complexe. •
Supposons que l’équation caractéristique r 2 + a r + b = 0 ait deux racines conjuguées α ± iβ avec β �= 0 . D’après la proposition 11 de la page 286, les fonctions : γα,β : x �→ eαx cos(βx) = et :
1 (α+iβ) x e + e(α−iβ) x 2
1 (α+iβ) x e − e(α−iβ) x 2i sont solutions de (E0 ) , et par conséquent il en est de même de toute fonction de la forme λ1 γα,β + λ2 σa,β avec (λ1 , λ2 ) ∈ IR2 , d’après la proposition 8 de la page 285. σa,β : x �→ eαx sin(βx) =
Réciproquement, si f est une solution réelle de (E0 ) , alors, d’après la proposition 11 de la page 286, on peut trouver deux complexes µ1 et µ2 tels que : ∀x ∈ IR
f (x) = µ1 e(α+iβ) x + µ2 e(α−iβ) x .
Comme f est réelle, elle est égale à sa partie réelle. Pour x ∈ IR , on a donc :
f (x) = Re f (x) = eα x Re µ1 cos(βx) − Im µ1 sin(βx) + Re µ2 cos(βx) + Im µ2 sin(βx) = (Re µ1 + Re µ2 ) eαx cos(βx) + (− Im µ1 + Im µ2 ) eαx sin(βx).
Théorème 14 On sait que les solutions de l’équation homogène (E0 ) sont combinaisons linéaires de deux solutions non proportionnelles u et v . • Si l’équation caractéristique a deux racines distinctes r1 et r2 , on peut choisir : u : x �→ er1 x
et
v : x �→ er2 x .
•
Si l’équation caractéristique a une racine double r , on peut choisir :
•
Si IK = IR et si l’équation caractéristique a deux racines non réelles α ± i β , on peut choisir :
u : x �→ erx u : x �→ eαx cos(β x)
et
et
v : x �→ x erx . v : x �→ eαx sin(β x).
On peut montrer qu’il existe une solution particulière f1 (voir l’exercice 8.16). La solution générale de (E) s’écrit donc : f : x �→ f1 (x) + λ1 u(x) + λ2 v(x)
avec
(λ1 , λ2 ) ∈ IK2 .
La fonction f vérifie f (x0 ) = y0 et f ′ (x0 ) = y1 si, et seulement si :
λ1 u (x0 ) + λ2 v (x0 ) = y0 − f1 (x0 ) λ1 u′ (x0 ) + λ2 v ′ (x0 ) = y1 − f1′ (x0 ).
Dans tous les cas, on vérifie que le déterminant de ce système (égal à u(x0 ) v ′ (x0 )−u′ (x0 ) v(x0 ) ) est non nul et donc que le système possède une unique solution (cf. page 123).
294
Exercices
S’entraîner et approfondir Équations différentielles linéaires du premier ordre 8.1 Résoudre les équations homogènes suivantes : 1. y ′ + (cos x) y = 0 sur IR ,
→278
2. (1 + x2 ) y ′ + x y = 0 sur IR . 8.2 Soit a et b des fonctions continues et T -périodiques sur IR . On considère l’équation différentielle (E) : y ′ + a(x)y = b(x) . 1. Montrer que si y est solution de l’équation différentielle (E) , alors la fonction :
→282
z :
IR x
−→ �−→
IK y(x + T )
est aussi solution. 2. Montrer qu’une solution y de l’équation différentielle est T -périodique si, et seulement si, y(0) = y(T ) . 8.3 Résoudre les équations différentielles suivantes sur des intervalles sur lesquels la fonction en facteur de y ′ ne s’annule pas : 1 1. (x ln x) y ′ − y = − (ln x + 1) , x 2. (1 + x)y ′ + y = 1 + ln(1 + x) , x−1 , 3. (1 − x)y ′ + y = x 1 4. y ′ + y = , 1 + ex 5. y ′ sin x − y cos x + 1 = 0 , 6. 2xy ′ + y = xn , où n est un entier naturel. ⋆ 8.4 Trouver toutes les applications f dérivables de IR dans C telles que : ∀(x, y) ∈ IR2
f (x + y) = f (x)f (y).
Équations différentielles linéaires du second ordre 8.5 Le mouvement d’une particule chargée dans un champ magnétique dirigé suivant l’axe Oz est régi par un système différentiel de la forme :
x′′ = ω y ′ y ′′ = −ω x′ z ′′ = 0
où ω ∈ IR∗+ est une constante dépendant de la masse et de la charge de la particule ainsi que du champ magnétique. En utilisant la fonction u = x′ + iy ′ , résoudre ce système différentiel. ⋆⋆ 8.6 Soit f une fonction de classe C 2 de IR dans IK (c’est-à-dire deux fois dérivable sur IR et dont la dérivée seconde est continue sur IR ). 1. Montrer qu’il existe une unique application g de classe C 2 sur IR telle que : ∀x ∈ IR
g(x) =
0
x
(x − t)g(t) dt + f (x).
(E)
2. Déterminer la fonction g dans le cas où f = cos .
295
Chapitre 8. Équations différentielles linéaires 8.7 Résoudre les équations suivantes : 1. y ′′ + 3y ′ + 2y = ex , 2. y ′′ + 3y ′ + 2y = e−x , 3. y ′′ + 2y ′ + y = 2e−x , 4. y ′′ + y ′ − 2y = 8 sin 2x ,
5. y ′′ − 2y ′ + 5y = −4e−x cos x + 7e−x sin x − 4ex sin 2x.
8.8 Résoudre les équations différentielles suivantes : 1. y ′′ + y ′ − 6y = 1 − 8x − 30x2 , 2. y ′′ + y ′ = 3 + 2x ,
3. y ′′ + 4y = 4 + 2x − 8x2 − 4x3 . ⋆ 8.9 Résoudre l’équation différentielle suivante sur tout intervalle ne contenant pas −1 : (1 + x)2 y ′′ + (1 + x)y ′ − 2 = 0.
(E)
(1 − x2 )y ′′ − xy ′ + y = 0.
(E)
⋆⋆ 8.10 On considère l’équation : Résoudre cette équation sur I = ]−1, 1[ en considérant la fonction z : t �→ y(sin t) . ⋆ 8.11 Soit (E) l’équation différentielle : xy ′′ + 2(x + 1)y ′ + (x + 2)y = 0. En considérant la fonction z : x �→ x y(x) , résoudre cette équation différentielle sur IR∗+ . ⋆ 8.12 Soit (E) l’équation différentielle : ax2 y ′′ + bxy ′ + cy = 0
avec
(a, b, c) ∈ IR∗ × IR2 .
1. Soit y une fonction deux fois dérivable sur I = IR∗+ . Montrer que y est solution de (E) sur I si, et seulement si, la fonction z : t �→ y(et ) est solution d’une équation du second ordre à coefficients constants que l’on donnera. 2. Quelle est la forme des solutions de (E) sur I = IR∗+ ? sur IR∗− ? 3. Résoudre sur IR∗+ et sur IR∗− l’équation :
x2 y ′′ − xy ′ + y = 0. ⋆ 8.13 Soit λ ∈ IR et f une fonction réelle dérivable sur IR vérifiant : ∀x ∈ IR
f ′ (x) = f (λ − x).
(∗)
1. Montrer que la fonction f est deux fois dérivable sur IR . 2. Déterminer l’ensemble des fonctions réelles vérifiant (∗) . ⋆⋆ 8.14 Soit f une fonction dérivable sur IR∗+ vérifiant : ∀x > 0
f ′ (x) = f
1 . x
1. Montrer que la fonction f est deux fois dérivable sur IR∗+ . 2. Déterminer l’ensemble des fonctions vérifiant (∗) (on pourra utiliser l’exercice 8.12).
296
(∗)
Exercices ⋆⋆ 8.15 Trouver toutes les applications f non nulles et deux fois dérivables sur IR telles que : ∀(x, y) ∈ IR2
f (x + y) + f (x − y) = 2f (x)f (y).
(∗)
Parmi ces applications, déterminer celles qui sont à valeurs réelles.
8.16 Soit a et b deux scalaires et c une fonction continue de I dans IK , considérons l’équation : y ′′ + a y ′ + b y = c(x)
(E)
et r une racine de l’équation caractéristique. 1. Soit f une fonction deux fois dérivable sur I et la fonction z définie sur I par : z :
I x
−→ �−→
C e−rx f (x).
Montrer que la fonction f est solution de l’équation (E) si, et seulement si, la fonction z ′ est solution d’une équation différentielle linéaire d’ordre 1. 2. En déduire que l’équation (E) admet des solutions.
297
Chapitre 8. Équations différentielles linéaires
Solutions des exercices 8.1 1. Une primitive sur IR de la fonction x �→ cos x est x �→ sin x ; donc les solutions sur IR sont les fonctions x �→ λ exp (− sin x) avec λ ∈ IK. x 2. Une primitive sur IR de la fonction x �→ est : 1 + x2 1 x �→ ln(1 + x2 ) = ln 1 + x2 ; 2 donc les solutions sur IR de l’équation homogène sont les fonctions : x �→ √
λ 1 + x2
avec
λ ∈ IK.
8.2 1. Soit y une solution de l’équation différentielle (E) . Alors la fonction z : x �→ y(x + T ) est dérivable sur IR et pour tout x ∈ IR : z ′ (x) + a(x)z(x) = y ′ (x + T ) + a(x)y(x + T )
= y ′ (x + T ) + a(x + T )y(x + T )
car a est T -périodique
= b(x + T )
car y est solution de (E)
= b(x)
car b est T -périodique.
La fonction z est donc solution de l’équation différentielle (E) . 2. Soit y une solution de l’équation différentielle (E) . La fonction y est T -périodique si, et seulement si, les fonctions y et z sont égales. D’après le théorème de Cauchy, les fonctions y et z sont égales si, et seulement si, elles coïncident en un point. Par suite, la fonction y est T -périodique si, et seulement si, y(0) = z(0) c’est-à-dire si, et seulement si, y(0) = y(T ) . 8.3 1. On se place sur l’intervalle I = ]0, 1[ ou sur I = ]1, +∞[ . Sur l’intervalle I , l’équation différentielle se réécrit : 1 ln x + 1 y=− 2 · y′ − x ln x x ln x Comme ln′ (x) 1 = , ∀x ∈ I x ln x ln(x) une solution de l’équation homogène est la fonction x �→ ln x . On cherche une solution de la forme x �→ λ(x) ln x avec λ une fonction dérivable sur I . ln x + 1 On est alors ramené à trouver une primitive sur I de la fonction x �→ − 2 2 · x ln x On remarque que : u′ (x) ln x + 1 = ∀x ∈ I u2 (x) x2 ln2 x où u est la fonction x �→ x ln x . ln x + 1 1 Par conséquent, une primitive sur I de la fonction x �→ − 2 2 est x �→ · x ln x x ln x avec λ ∈ IK. Les solutions sur I sont donc les fonctions I −→ IK 1 + λ ln x x �−→ x On aurait, bien sûr, pu remarquer que la fonction x �→ 1/x était une solution particulière.
298
Solutions des exercices 2. On se place sur l’intervalle I = ]−1, +∞[ . Sur l’intervalle I , l’équation différentielle se réécrit : 1 1 + ln(1 + x) 1 ln(1 + x) y′ + y= = + · 1+x 1+x 1+x 1+x 1 et la fonc1+x tion x �→ ln(1 + x) est une solution particulière. Les solutions sur I sont donc les fonctions : λ x �→ ln(1 + x) + avec λ ∈ IK. 1+x Une solution de l’équation homogène est la fonction x �→
3. On se place sur l’intervalle I = IR∗− , sur I = ]0, 1[ ou sur I = ]1, +∞[ . Sur l’intervalle I , l’équation différentielle se réécrit : y′ +
1 1 y=− · 1−x x
Une solution de l’équation homogène est la fonction x �→ x − 1 . On cherche une solution de la forme x �→ λ(x)(x − 1) avec λ une fonction dérivable sur I . On est alors ramené 1 à trouver une primitive sur I de la fonction x �→ · x(1 − x)
On écrit :
∀x ∈ I
1 1 1 = − · x(1 − x) x x−1
Par suite, une solution particulière sur I est donnée par :
x .
x �→ (x − 1) ln
Les solutions sur I sont donc les fonctions :
x−1
x + λ (x − 1) avec λ ∈ IK.
x �→ ln
x−1
4. Une solution de l’équation homogène est la fonction x �→ e−x . On cherche une solution de la forme x �→ λ(x)e−x avec λ une fonction dérivable sur I . On est alors ramené à ex · trouver une primitive sur I de la fonction x �→ 1 + ex On remarque que : ∀x ∈ I
u′ (x) ex = 1 + ex u(x)
où u est la fonction x �→ 1 + ex . Par conséquent, une primitive sur I de la foncex tion x �→ est donnée par x �→ ln (1 + ex ) . Les solutions sur IR sont donc les 1 + ex fonctions x �→ e−x ln(1 + ex ) + λe−x avec λ ∈ IK.
5. On se place sur un intervalle In = ]nπ, (n + 1)π[ avec n ∈ ZZ . Une solution de l’équation homogène est la fonction x �→ sin x . On remarque d’autre part que la fonction cos est une solution particulière de l’équation. Les solutions sur In sont donc les fonctions x �→ cos x + λ sin x avec λ ∈ IK.
299
Chapitre 8. Équations différentielles linéaires 6. On se place sur I = IR∗+ ou I = IR∗− . Une solution de l’équation homogène est donc la 1 fonction x �→ · |x| λ(x) avec λ une fonction En cherchant une solution particulière sous la forme x �→ |x| xn · Les solutions sur I sont donc les dérivable sur I , on obtient la solution x �→ 2n + 1 fonctions : λ xn avec λ ∈ IK. + x �→ 2n + 1 |x|
8.4 Raisonnons par analyse-synthèse. • Soit f une fonction dérivable sur IR vérifiant : ∀(x, y) ∈ IR2
f (x + y) = f (x)f (y).
(∗)
On a alors : f (0) = f (0)2 . Si f (0) = 0 , alors : ∀x ∈ IR
f (x) = f (x + 0) = f (x)f (0) = 0,
donc f est la fonction nulle. Sinon, f (0) = 1 . En fixant x et en dérivant par rapport à y , on obtient : ∀(x, y) ∈ IR2
f ′ (x + y) = f (x)f ′ (y).
En particulier : ∀x ∈ IR
f ′ (x) = f (x)f ′ (0),
donc f est solution de y ′ = f ′ (0)y . En posant λ = f ′ (0) , on a alors : ∀x ∈ IR
f (x) = f (0)eλx = eλx .
• Réciproquement, les fonctions x �→ eλx avec λ ∈ C vérifient (∗) .
Les solutions sont donc la fonction nulle et les fonctions de la forme x �→ eλx avec λ ∈ C . 8.5 Les solutions de l’équation z ′′ = 0 sont les fonctions affines. Soit x et y deux fonctions deux fois dérivables sur IR . Le couple (x, y) vérifie le système différentiel : ′′ x = ω y′ y ′′ = −ω x′
si, et seulement si, la fonction u = x′ + iy ′ est solution de l’équation u′ = −iωu dont les solutions sont les fonctions x �→ Ce−iωt avec C ∈ C , c’est-à-dire les fonctions t �→ (A + iB) (cos(ωt) + i sin(ωt)) avec (A, B) ∈ IR2 . Par suite, le couple (x, y) est solution si, et seulement s’il existe (A, B) ∈ IR2 tel que pour tout réel t , on ait : x′ (t) = A cos(ωt) − B sin(ωt)
300
et
y ′ (t) = B cos(ωt) + A sin(ωt).
Solutions des exercices Ainsi, le triplet (x, y, z) est solution si, et seulement s’il existe (A, B, C, D, E, F ) ∈ IR6 tel que pour tout réel t , on ait :
A B x(t) = sin(ωt) + cos(ωt) + C ω ω A
B
sin(ωt) − cos(ωt) + D y(t) = ω ω z(t) = E t + F.
8.6 1. Raisonnons par analyse-synthèse.
• Si une application g de classe C 2 sur IR convient, alors : g(x) = x
∀x ∈ IR
�
x
0
g(t) dt −
�
x
tg(t) dt + f (x), 0
donc, en dérivant la relation (ce qui est possible du fait de la régularité des fonctions f et g ), on a : ∀x ∈ IR
g ′ (x) =
�
0
x
g(t) dt + xg(x) − xg(x) + f ′ (x) =
�
x
g(t) dt + f ′ (x) 0
puis, en redérivant (ce qui est toujours possible du fait de la régularité des fonctions f et g ), on obtient : ∀x ∈ IR g ′′ (x) = g(x) + f ′′ (x).
Ainsi, g est solution de l’équation différentielle g ′′ − g = f ′′ . De plus, g(0) = f (0) et g ′ (0) = f ′ (0) . D’après le théorème de Cauchy, il existe une unique solution vérifiant ces hypothèses. Par suite, si une telle fonction g existe, alors elle est unique. • Soit g l’unique solution de l’équation différentielle g ′′ −g = f ′′ vérifiant les conditions initiales g(0) = f (0) et g ′ (0) = f ′ (0) . Alors les fonctions g et h : x �→
�
x
(x−t)g(t) dt+f (x) vérifient g ′′ = h′′ , g(0) = h(0)
0
et g ′ (0) = h′ (0) . Elles coïncident donc sur IR . Ainsi, il existe une unique fonction g de classe C 2 vérifiant (E) , il s’agit de l’unique solution de l’équation différentielle g ′′ − g = f ′′ vérifiant les conditions initiales g(0) = f (0) et g ′ (0) = f ′ (0) . 2. Étudions l’équation différentielle y ′′ − y = − cos x . Les solutions de l’équation homogène associée sont les fonctions : x �→ λ1 ex + λ2 e−x
avec
(λ1 , λ2 ) ∈ IK2 .
1 cos x . Par conséquent, les solutions de 2 ′′ l’équation différentielle y − y = − cos x sont les fonctions : 1 x �→ λ1 ex + λ2 e−x + cos x avec (λ1 , λ2 ) ∈ IK2 . 2 L’unique solution vérifiant les conditions initiales : Une solution particulière est la fonction x �→
g(0) = f (0) = 1 est donc la fonction g : x �→
et
g ′ (0) = f ′ (0) = 0
� 1 1� x 1 e + e−x + cos x = (ch x + cos x). 4 2 2 301
Chapitre 8. Équations différentielles linéaires 8.7 1. L’équation caractéristique est r 2 + 3r + 2 = 0 qui a deux racines −2 et −1 donc les solutions de l’équation homogène associée sont les fonctions x �→ λ1 e−2x + λ2 e−x avec (λ1 , λ2 ) ∈ IK2 . On cherche une solution particulière sous la forme x �→ Cex et l’on 1 trouve x �→ ex donc les solutions sont les fonctions : 6 x �→
1 x e + λ1 e−2x + λ2 e−x 6
avec
(λ1 , λ2 ) ∈ IK2 .
2. L’équation caractéristique est r 2 + 3r + 2 = 0 qui a deux racines −2 et −1 donc les solutions de l’équation homogène associée sont les fonctions x �→ λ1 e−2x + λ2 e−x avec (λ1 , λ2 ) ∈ IK2 . On cherche une solution particulière sous la forme x �→ Cxe−x et l’on trouve x �→ xe−x donc les solutions sont les fonctions : x �→ xe−x + λ1 e−2x + λ2 e−x
avec
(λ1 , λ2 ) ∈ IK2 .
3. L’équation caractéristique est r 2 + 2r + 1 = 0 qui une racine double −1 donc les solutions de l’équation homogène associée sont les fonctions x �→ λ1 e−x + λ2 xe−x avec (λ1 , λ2 ) ∈ IK2 . On cherche une solution particulière sous la forme x �→ Cx2 e−x et l’on trouve x �→ x2 e−x donc les solutions sont les fonctions : x �→ x2 e−x + λ1 e−x + λ2 xe−x
avec
(λ1 , λ2 ) ∈ IK2 .
4. L’équation caractéristique est r 2 + r − 2 = 0 dont les racines sont 1 et −2 donc les solutions de l’équation homogène associée sont les fonctions x �→ λ1 e−2x + λ2 e−x avec (λ1 , λ2 ) ∈ IK2 . On cherche une solution particulière de l’équation sous la 2 6 forme x �→ λ sin(2x) + µ cos(2x) et l’on trouve x �→ − sin 2x − cos 2x donc les 5 5 solutions sont les fonctions : x �→ λ1 ex + λ2 e−2x −
2 6 sin 2x − cos 2x 5 5
avec
(λ1 , λ2 ) ∈ IK2 .
5. L’équation caractéristique est r 2 − 2r + 5 = 0 dont les solutions sont 1 − 2i et 1 + 2i , par conséquent les solutions de l’équation homogène associée sont les fonctions x �→ (λ1 cos(2x) + λ2 sin(2x)) e−x avec (λ1 , λ2 ) ∈ IK2 . On cherche une solution particulière de l’équation différentielle :
y ′′ − 2y ′ + 5y = −4e−x cos x + 7e−x sin x sous la forme x �→ αe−x sin x + βe−x cos x et on trouve la fonction f1 : x �→ e−x sin x. On cherche une solution particulière de l’équation différentielle : y ′′ − 2y ′ + 5y = −4e(1+2i)x sous la forme x �→ P (x)e(1+2i)x et on trouve x �→ −ixe(1+2i)x . Ainsi, f2 : x �→ xex cos 2x est solution de y ′′ − 2y ′ + 5y = −4ex sin(2x) puis les solutions sont les fonctions : x �→ f1 (x) + f2 (x) + λ1 ex cos(2x) + λ2 ex sin(2x)
302
avec
(λ1 , λ2 ) ∈ IK2 .
Solutions des exercices 8.8 1. L’équation caractéristique est r 2 + r − 6 = 0 qui a deux racines 2 et −3 donc les solutions de l’équation homogène associée sont les fonctions x �→ λ1 e2x + λ2 e−3x avec (λ1 , λ2 ) ∈ IK2 . On cherche une solution particulière polynomiale et on trouve x �→ 2 + 3x + 5x2 donc les solutions sont les fonctions : x �→ 2 + 3x + 5x2 + λ1 e2x + λ2 e−3x
avec
(λ1 , λ2 ) ∈ IK2 .
2. L’équation caractéristique est r 2 + r = 0 qui a deux racines 0 et −1 donc les solutions de l’équation homogène associée sont les fonctions x �→ λ1 + λ2 e−x avec (λ1 , λ2 ) ∈ IK2 . On cherche une solution particulière polynomiale et l’on trouve x �→ x + x2 , donc les solutions sont les fonctions : x �→ x + x2 + λ1 + λ2 e−x
avec
(λ1 , λ2 ) ∈ IK2 .
3. L’équation caractéristique est r 2 + 4 = 0 qui a deux racines 2i et −2i donc les solutions de l’équation homogène associée sont les fonctions x �→ λ1 cos(2x) + λ2 sin(2x) avec (λ1 , λ2 ) ∈ IK2 . On cherche une solution particulière sous la forme d’une fonction polynomiale de degré 3 . On trouve la fonction x �→ 2 + 2x − 2x2 − x3 . Les solutions réelles sont donc les fonctions : x �→ 2 + 2x − 2x2 − x3 + λ1 cos(2x) + λ2 sin(2x)
avec
(λ1 , λ2 ) ∈ IK2 .
8.9 On se place sur un intervalle I ne contenant pas −1 . Une fonction y deux fois dérivable sur I est solution de l’équation différentielle (E) si, et seulement si, la fonction z = y ′ est solution sur I de l’équation différentielle : z′ +
2 1 z= · (1 + x) (1 + x)2
(E ′ ) 1 · 1+x constante est
Une solution de l’équation homogène associée à (E ′ ) est la fonction x �→ Une
solution particulière obtenue par variation de la ln |1 + x| · tion x �→ 2 1+x Les solutions de l’équation (E ′ ) sur I sont donc les fonctions : x �→
2 ln |1 + x| λ + 1+x 1+x
avec
la
fonc-
λ ∈ IK.
Par conséquent, les solutions de l’équation (E) sur I sont les fonctions : x �→ (ln |1 + x|)2 + λ1 ln |1 + x| + λ2
avec
(λ1 , λ2 ) ∈ IK2 .
8.10 Comme y est deux fois dérivable sur I , et par définition de z , il est clair que z est deux fois dérivable sur J = − π2 , π2 . La relation : ∀x ∈ I
nous donne alors :
∀x ∈ I et : ∀x ∈ I
y ′′ (x) =
y(x) = z (Arcsin x) .
y ′ (x) = √
1 z ′ (Arcsin x) 1 − x2
1 x z ′′ (Arcsin x) + z ′ (Arcsin x) . 1 − x2 (1 − x2 )3/2
303
Chapitre 8. Équations différentielles linéaires Ainsi, pour tout x ∈ I , on a : (1 − x2 )y ′′ (x) − xy ′ (x) + y(x) = z ′′ (Arcsin x) + −√
x z ′ (Arcsin x) (1 − x2 )1/2
x z ′ (Arcsin x) + z (Arcsin x) 1 − x2
= z ′′ (Arcsin x) + z (Arcsin x) .
Comme la fonction Arcsin établit une bijection de I dans J , la fonction y est solution de l’équation différentielle (E) sur I si, et seulement si, la fonction z est solution sur J de l’équation : z ′′ + z = 0, c’est-à-dire si, et seulement s’il existe des constantes A et B telles que : ∀t ∈ J
z(t) = A sin t + B cos t,
c’est-à-dire si, et seulement s’il existe des constantes A et B telles que : ∀x ∈ I
y(x) = A sin(Arcsin x) + B cos(Arcsin x) = Ax + B
8.11 Soit y une fonction deux fois dérivable sur I = IR∗+ .
1 − x2 .
On définit la fonction z sur I par z : x �→ xy(x) . On a alors :
z(x) · x La fonction z est deux fois dérivable sur I et l’on a : z ′ (x) z ′′ (x) z(x) z(x) z ′ (x) ∀x ∈ I y ′ (x) = et y ′′ (x) = − 2 −2 2 +2 3 · x x x x x Ainsi, la fonction y est solution de l’équation différentielle (E) sur I si, et seulement si, la fonction z est solution sur I de l’équation : ∀x ∈ I
y(x) =
z ′′ + 2z ′ + z = 0, donc si, et seulement s’il existe des constantes A et B telles que : ∀x ∈ I
z(x) = Axe−x + Be−x ,
∀x ∈ I
y(x) = Ae−x + B
c’est-à-dire si, et seulement s’il existe des constantes A et B telles que : e−x · x
8.12 1. Soit y une fonction deux fois dérivable sur I . On définit la fonction z , deux fois dérivable sur IR , par z : t �→ y(et ) . On a alors, pour tout x ∈ I , la relation y(x) = z (ln x) , puis : 1 ′ 1 1 z (ln x) et y ′′ (x) = 2 z ′′ (ln x) − 2 z ′ (ln x) . x x x Ainsi, la fonction y est solution de l’équation différentielle (E) sur I si, et seulement si, la fonction z est solution sur IR de l’équation du second ordre à coefficients constants : y ′ (x) =
az ′′ + (b − a)z ′ + cz = 0.
(E ′ )
2. On en déduit, suivant les racines de l’équation caractéristique de (E ′ ) , la forme des solutions de (E ′ ) sur IR et donc de (E) sur IR∗+ . • Si l’équation caractéristique admet deux racines réelles distinctes r1 et r2 , les solutions de (E) sur I sont les fonctions : x �→ λ1 xr1 + λ2 xr2
304
avec
(λ1 , λ2 ) ∈ IK2 .
Solutions des exercices • Si l’équation caractéristique admet une racine double r0 , les solutions de (E) sur I sont les fonctions : x �→ λ1 xr0 + λ2 xr0 ln x
(λ1 , λ2 ) ∈ IK2 .
avec
• Si l’équation admet deux racines complexes non réelles conjuguées α + iβ et α − iβ , alors les solutions de (E) sur I sont les fonctions : x �→ λ1 xα cos (β ln x) + λ2 xα sin (β ln x)
avec
(λ1 , λ2 ) ∈ IK2 .
Pour trouver les solutions sur IR∗− de (E) , on remarque que la fonction y est solution de l’équation différentielle (E) sur IR∗− si, et seulement si, la fonction z : x �→ y(−x) est solution sur IR∗+ de l’équation (E) . 3. On applique ce qui précède. Les solutions sur IR∗+ sont les fonctions : x �→ λ1 x + λ2 x ln x
avec
Les solutions sur IR∗− sont les fonctions :
x �→ λ1 x + λ2 x ln(−x)
(λ1 , λ2 ) ∈ IK2 .
avec
(λ1 , λ2 ) ∈ IK2 .
8.13 1. La fonction f étant dérivable sur IR , la fonction x �→ f (λ − x) l’est aussi. La relation (∗) implique alors que f est deux fois dérivable sur IR . Il est donc équivalent de chercher les fonctions deux fois dérivables sur IR vérifiant (∗) . 2. Raisonnons par analyse-synthèse : • Soit f une fonction deux fois dérivable sur IR vérifiant (∗) . Alors : f ′′ (x) = −f ′ (λ − x) = −f (x)
∀x ∈ IR
donc f est solution de l’équation y ′′ + y = 0 . Il existe donc des réels A et ϕ tels que : ∀x ∈ IR f (x) = A cos(x + ϕ). Si A �= 0 , alors la condition (∗) donne : soit : Par suite, on a :
− sin(x + ϕ) = cos(λ − x + ϕ)
∀x ∈ IR
∀x ∈ IR
∀x ∈ IR c’est-à-dire :
cos(x + ϕ + π/2) = cos(λ − x + ϕ).
x + ϕ + π/2 ≡ λ − x + ϕ [2π]
ou
x + ϕ + π/2 ≡ −(λ − x + ϕ) [2π]
∀x ∈ IR
2x ≡ λ − π/2 [2π]
ou
2ϕ ≡ −λ − π/2 [2π].
En prenant x tel que 2x �≡ λ − π/2 [2π] , on a donc : ϕ≡−
π λ − [π]. 2 4
Par suite, il existe un entier k tel que : ∀x ∈ IR
�
f (x) = A cos x −
�
λ π − + kπ . 2 4
305
Chapitre 8. Équations différentielles linéaires Si k est pair alors :
f (x) = A cos x −
∀x ∈ IR sinon :
π λ − 2 4
f (x) = −A cos x −
∀x ∈ IR
λ π − 2 4
Dans tous les cas, il existe un réel C telle que :
,
.
π λ − . 2 4 π λ avec C ∈ IR vérifient (∗) • Réciproquement, les fonctions x �→ C cos x − − 2 4 car : π π π π λ λ λ ∀x ∈ IR cos λ − x − − = cos x − − + = − sin x − − . 2 4 2 4 2 2 4 Les solutions sont donc les fonctions : π λ x �→ C cos x − − avec C ∈ IR. 2 4 f (x) = C cos x −
∀x ∈ IR
8.14 1. La fonction f étant dérivable sur IR∗+ , la fonction x �→ f (1/x) l’est aussi. La relation (∗) implique alors que f est deux fois dérivable sur IR∗+ . Il est donc équivalent de chercher les fonctions deux fois dérivables sur IR∗+ vérifiant (∗) . 2. Analyse. Soit f une fonction deux fois dérivable sur IR∗+ vérifiant (∗) . Alors : 1 f (x). x2 En raisonnant comme dans l’exercice 8.12, on se ramène à la résolution de l’équation différentielle à coefficients constants : ∀x ∈ IR∗+
f ′′ (x) = −
z ′′ − z ′ + z = 0,
dont les solutions sont les fonctions : z :
IR
−→
t
�−→
IK
et/2
λ1 cos
√ 3t 2
Ainsi, il existe (λ1 , λ2 ) ∈ IK2 tel que : ∀x ∈
+ λ2 sin
√ 3t 2
avec
(λ1 , λ2 ) ∈ IK2 .
√ √ √ 3 ln x 3 ln x + λ2 sin . f (x) = x λ1 cos 2 2
IR∗+
Synthèse. Soit (λ1 , λ2 ) ∈ IK2 . Posons : f : IR∗+
−→
x
�−→
Alors, pour tout x ∈ IR∗+ :
1 f x
IK √ √ √ 3 ln x 3 ln x x λ1 cos + λ2 sin . 2 2
√
306
3 ln x 2
√
3 ln x λ1 cos − λ2 sin 2 √ √ √ √ λ1 + 3λ2 3 ln x 3 ln x 1 λ2 − 3λ1 cos sin f ′ (x) = √ + . 2 2 2 2 x 1 = √ x
Solutions des exercices Ainsi, f (1) = λ1 et f ′ (1) =
λ1 +
√
3λ2
ce qui donne une condition nécessaire pour √ √ λ1 + 3λ2 , c’est-à-dire λ1 = 3λ2 . que f soit solution de l’équation (∗) : λ1 = 2 √ λ2 − 3λ1 ce Réciproquement, si cette condition est vérifiée, alors on a aussi −λ2 = 2 ′ ∗ 1 qui donne immédiatement f ( x ) = f (x) pour tout x ∈ IR+ . Ainsi, f est solution de l’équation (∗) si, et seulement si, λ1 et λ2 vérifient la √ relation λ1 = 3 λ2 . Les solutions de l’équation différentielle (E) sont donc les fonctions : IR∗+
−→
x
�−→
2
IK � � �√ �� �√ √ √ 3 ln x 3 ln x 3 cos + sin λ x 2 2
c’est-à-dire les fonctions :
IR∗+
−→
x
�−→
IK �√ � √ π 3 ln x − µ x cos 2 6
avec
λ ∈ IK
avec
µ ∈ IK.
8.15 Raisonnons par analyse synthèse. • Soit f une fonction non nulle deux fois dérivable sur IR vérifiant (∗) . On a alors : f (0) = f (0)2 . ∗ Si f (0) = 0 , alors :
∀x ∈ IR 2f (x) = 2f (0)f (x) = 0 donc f est la fonction nulle ce qui est exclu. ∗ Donc, f (0) = 1 . On en déduit que : f (y) + f (−y) = 2f (y)
∀y ∈ IR
c’est-à-dire que la fonction f est paire. ∗ En fixant y et en dérivant par rapport à x , on obtient : ∀(x, y) ∈ IR2
puis en redérivant, on a :
f ′ (x + y) + f ′ (x − y) = 2f ′ (x)f (y)
∀(x, y) ∈ IR2
f ′′ (x + y) + f ′′ (x − y) = 2f ′′ (x)f (y).
(1)
∀(x, y) ∈ IR2
f ′′ (x + y) + f ′′ (x − y) = 2f (x)f ′′ (y).
(2)
∗ En fixant x et en dérivant deux fois par rapport à y , on obtient : Des relations (1) et (2) , on obtient : ∀(x, y) ∈ IR2
f ′′ (x)f (y) = f (x)f ′′ (y).
En particulier, en prenant y = 0 , comme f (0) = 1 , on en déduit que : 2
′′
∀x ∈ IR
f ′′ (x) = f ′′ (0)f (x).
∗ Soit ω ∈ C tel que ω = f (0) . Alors, comme f ′ est impaire, f est l’unique solution du problème de Cauchy suivant :
′′ y − ω2y = 0
Par suite, on a f : x �→
y(0) = 1
y ′ (0) = 0.
eωx + e−ωx · 2
307
Chapitre 8. Équations différentielles linéaires • Réciproquement, pour tout ω ∈ C , la fonction x �→
eωx + e−ωx vérifie (∗) . 2
Les solutions sont donc les fonctions : x �→
eωx + e−ωx 2
avec
ω ∈ C.
Soit (A, B) ∈ IR2 . La fonction f : x �→ e(A+iB)x + e−(A+iB)x est à valeurs réelles si, et seulement si : ∀x ∈ IR
eAx sin(Bx) − e−Ax sin(Bx) = sin(Bx)2 sh(Ax) = 0.
Si B est nul, alors la fonction f est à valeurs réelles ; sinon, en considérant le réel obtient que la fonction f est à valeurs réelles si, et seulement si, A est nul. Les solutions réelles sont donc les fonctions : x �→ cos ωx
et
x �→ ch ωx
avec
π 2B
, on
ω ∈ IR.
8.16 1. La fonction z est deux fois dérivable sur I et vérifie, pour tout x ∈ I : f (x) = z(x) erx
f ′ (x) = z ′ (x) + r z(x) erx
f ′′ (x) = z ′′ (x) + 2 r z ′ (x) + r 2 z(x) erx . Pour x ∈ I , on a donc :
= 0 par hypothèse
f (x) + a f (x) + b f (x) = z (x) + (2 r + a) z (x) + (r 2 + a r + b)z(x) erx ′′
′
′′
′
= erx z ′′ (x) + (2 r + a) z ′ (x) .
Ainsi, la fonction f est solution de (E) si, et seulement si, la fonction z ′ est solution de l’équation différentielle : y ′ + (2r + a) y = c(x)e−rx . (E ′ ) 2. D’après l’étude des équations différentielles linéaires d’ordre 1 , l’équation (E ′ ) possède une solution g qui est dérivable sur I , donc continue sur I ; ce qui assure l’existence d’une primitive G sur I . La fonction x �→ G(x)erx est alors une solution de l’équation (E) .
308
Chapitre 9 : Nombres réels, suites numériques I
L’ensemble des nombres réels . . . . . . . . . . . . . . . Propriété de la borne supérieure . . . . . . . . . . . . . Caractérisation des intervalles de IR . . . . . . . . . . . Partie entière . . . . . . . . . . . . . . . . . . . . . . . . Approximation par des nombres décimaux . . . . . . . . Parties denses dans IR . . . . . . . . . . . . . . . . . . . Généralités sur les suites réelles . . . . . . . . . . . . . . 1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . 2 Monotonie . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Suites extraites . . . . . . . . . . . . . . . . . . . . . . . 4 À partir d’un certain rang . . . . . . . . . . . . . . . . . Limite d’une suite réelle . . . . . . . . . . . . . . . . . . 1 Suites convergentes . . . . . . . . . . . . . . . . . . . . . 2 Propriétés des suites convergentes . . . . . . . . . . . . 3 Suites tendant vers l’infini . . . . . . . . . . . . . . . . . 4 Limites et suites extraites . . . . . . . . . . . . . . . . . 5 Caractère asymptotique de la notion de limite . . . . . . Opérations sur les limites . . . . . . . . . . . . . . . . . 1 Produit d’une suite bornée par une suite tendant vers 0 2 Opérations sur les suites convergentes . . . . . . . . . . 3 Cas des limites infinies . . . . . . . . . . . . . . . . . . . 4 Inverse et quotient . . . . . . . . . . . . . . . . . . . . . 5 Passage à la limite dans les inégalités larges . . . . . . . 6 Existence de limite par encadrement . . . . . . . . . . . Résultats d’existence de limites . . . . . . . . . . . . . . 1 Limites des suites monotones . . . . . . . . . . . . . . . 2 Suites adjacentes . . . . . . . . . . . . . . . . . . . . . . 3 Théorème de Bolzano-Weierstrass . . . . . . . . . . . . Traduction séquentielle de certaines propriétés . . . . 1 Parties denses de IR . . . . . . . . . . . . . . . . . . . . 2 Caractérisation séquentielle de la borne supérieure . . . Suites complexes . . . . . . . . . . . . . . . . . . . . . . . 1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . 2 Suites convergentes . . . . . . . . . . . . . . . . . . . . . 3 Suites extraites . . . . . . . . . . . . . . . . . . . . . . . 4 Opérations sur les suites convergentes . . . . . . . . . . 5 En guise de conclusion . . . . . . . . . . . . . . . . . . . 1 2 3 4 5
II
III
IV
V
VI
VII
VIII Étude de suites, suites récurrentes . . . . . 1 Modes usuels de définition d’une suite . . . 2 Suites récurrentes particulières . . . . . . . 3 Suites récurrentes réelles un+1 = f (un ) . . Démonstrations . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
310 310 312 312 313 314 314 314 316 316 317 317 317 320 321 322 322 323 323 323 324 325 326 327 328 328 328 329 330 330 330 331 331 332 333 334 334
. 335 . . 335 . . 338 . . 341 . 345 . 357
Nombres réels, suites numériques
I
9
L’ensemble des nombres réels
Nous poursuivons ici l’étude des nombres réels entamée au chapitre 3.
1
Propriété de la borne supérieure
Borne supérieure, borne inférieure Définition 1 Soit A une partie de IR. • La borne supérieure de A est, s’il existe, le plus petit des majorants de A. Elle se note sup A. • La borne inférieure de A est, s’il existe, le plus grand des minorants de A. Elle se note inf A. Remarques • L’unicité de la borne supérieure, lorsque celle-ci existe, est une conséquence de l’unicité du plus petit élément d’un ensemble (cf. page 51). • De même, l’unicité de la borne inférieure, lorsque celle-ci existe, découle de l’unicité du plus grand élément d’un ensemble. Ex. 1. L’ensemble A = IR∗+ admet 0 comme borne inférieure. En effet, 0 est un minorant de A . Pour montrer que c’est le plus grand, raisonnons par l’absurde et supposons qu’il existe un minorant a de A strictement plus grand que 0 , c’est-à-dire a > 0 . On a alors a2 > 0 donc a2 ∈ A et par définition de a , on a alors a a2 , puis a 0 , d’où la contradiction. Remarque On utilise souvent le résultat suivant : si a est un réel tel que ∀ε > 0 |a| ε,
(∗)
alors a = 0 . La propriété (∗) signifie en effet que |a| est un minorant de IR∗+ , donc |a| inf IR∗+ = 0 . Comme |a| 0 , cela donne |a| = 0 , puis a = 0 .
I L’ensemble des nombres réels Propriétés immédiates Soit A une partie non vide de IR . • Si la partie A admet un plus grand élément, alors elle admet une borne supérieure et sup A = max A. De même si A admet un plus petit élément, alors inf A existe et inf A = min A. • Si inf A et sup A existent, alors inf A sup A. Attention Ne pas confondre les notions de plus grand élément et de borne supérieure : • si une partie possède un plus grand élément, alors d’après ce qui précède, ce plus grand élément est sa borne supérieure ; • en revanche, une partie peut admettre une borne supérieure sans avoir de plus grand élément, comme c’est le cas de l’intervalle[0, 1[ . Il en est de même pour les notions de borne inférieure et de plus petit élément. Propriétés de la borne supérieure et de la borne inférieure Nous admettons que l’ensemble IR des nombres réels possède la propriété de la borne supérieure et la propriété de la borne inférieure, c’est-à-dire : Théorème 1 Toute partie non vide et majorée de IR possède une borne supérieure. Théorème 2 Toute partie non vide et minorée de IR possède une borne inférieure.
Ex. 2. L’intervalle I = ]a, b[ admet b comme borne supérieure, et a comme borne inférieure, lorsque a et b sont réels et a < b . Ex. 3. L’ensemble X =
x ∈ IR+ : x2 2
est une partie de IR non vide et majorée (par
exemple par 2 ). Sa borne supérieure est un réel positif a qui vérifie a2 = 2 (cf. exercice 9.1 de √ la page 357). Cela prouve l’existence de 2 . Ex. 4. Montrons comment on peut déduire le théorème 2 du théorème 1. On se donne A une partie non vide et minorée de IR et l’on note E l’ensemble de ses minorants. Alors : • l’ensemble E est une partie non vide de IR ; • elle est majorée par n’importe quel élément de A (on rappelle que A est non vide) ; • le réel sup E est donc bien défini et plus grand que n’importe quel minorant de A ; • enfin, si a ∈ A , alors a majore E donc sup E a , ce qui justifie que sup E est un minorant de A . Le réel sup E est donc le plus grand des minorants de A .
Proposition 3 (Caractérisation de la borne supérieure) Soit A une partie de IR et a ∈ IR. Alors on a a = sup A si, et seulement si : ∀x ∈ A x a
et
∀b < a
∃x ∈ A b < x.
Démonstration. Le premier point signifie que a est un majorant de A , le second que c’est le plus petit.
311
Chapitre 9. Nombres réels, suites numériques Dans la proposition précédente, on peut remplacer le second point par : ∀ε > 0
∃x ∈ A a − ε < x.
Remarque Le dessin suivant illustre le fait que, quel que soit ε strictement positif, on peut trouver un élément de A compris entre sup A − ε et sup A. Attention, il peut exister des réels n’appartenant pas à A et compris entre a − ε et a.
a = sup A a−ε
A
x∈A
Caractérisation de la borne inférieure De même, a est la borne inférieure de A si, et seulement si : et
∀x ∈ A a x
2
∀ε > 0 ∃x ∈ A
x < a + ε.
Caractérisation des intervalles de IR
La propriété de la borne supérieure nous permet de démontrer la caractérisation suivante des intervalles de IR (ceux-ci ont été décrits à la page 3). Proposition 4 Les intervalles de IR sont les parties I de IR vérifiant : ∀x ∈ I
[x, y] ⊂ I.
∀y ∈ I
(⋆)
Démonstration page 345 Principe de démonstration. Il s’agit de justifier que si une partie I de IR vérifie la propriété (⋆) , alors I est un intervalle, c’est-à-dire qu’en notant a et b les extrémités inférieure et supérieure de I (avec la possibilité que a = −∞ et b = +∞ ), alors I est de la forme (a, b) , les parenthèses représentant un crochet, ouvert ou fermé.
3
Partie entière
Le résultat ci-dessous est connu sous le nom de propriété d’Archimède. Lemme 5 On a :
∀x ∈ IR∗+
Principe de démonstration.
que l’ensemble
nx | n ∈ IN
∀y ∈ IR
∃n ∈ IN
n x y.
Démonstration page 345 Raisonner par l’absurde en supposant qu’il existe x ∈ IR∗+ tel
soit majoré.
Ex. 5. Étant donné deux réels x et y avec x > 1 , il existe n ∈ IN tel que xn y .
En effet, comme x > 1 , on peut écrire x = 1 + h avec h > 0 . Pour n , entier naturel au moins égal à 2 , la formule du binôme donne : (1 + h)n = 1 + n h +
n n k=2
k
hk 1 + n h.
D’après la propriété d’Archimède, on peut trouver n tel que n h y − 1 ; on a alors xn y .
312
I L’ensemble des nombres réels Proposition 6 Étant donné x ∈ IR, il existe un unique entier relatif n tel que : n x < n + 1.
Cet unique entier relatif, appelé partie entière de x , est noté ⌊x⌋.
Démonstration page 345
Principe de démonstration.
Pour l’existence, on montre que n = max k ∈ ZZ : k x
vérifie la condition.
Notation On définit également la partie entière par excès de x, que l’on note ⌈x⌉ : c’est l’unique entier n vérifiant l’encadrement n − 1 < x n (cf. exercice 9.5). Pour éviter les risques de confusion, la partie entière ⌊x⌋ s’appelle parfois la partie entière par défaut de x. Remarques • Il vient de la définition que ⌊x⌋ est le plus grand entier relatif inférieur à x. En d’autres termes, si k ∈ ZZ vérifie k x, alors k ⌊x⌋.
Par ailleurs, si k ∈ ZZ vérifie x < k , alors ⌊x⌋ < k , c’est-à-dire ⌊x⌋ k − 1 .
• On dispose d’une autre caractérisation de la partie entière de x : c’est l’unique nombre entier n tel que x s’écrive x = n + y avec y ∈ [0, 1[ . Ex. 6. Pour tout x ∈ IR et p ∈ ZZ , on a ⌊x + p⌋ = ⌊x⌋ + p . En effet, de l’encadrement ⌊x⌋ x < ⌊x⌋ + 1 , on en déduit ⌊x⌋ + p x + p < ⌊x⌋ + p + 1 . Puisque ⌊x⌋ + p est un entier relatif, on a par définition de la partie entière : ⌊x + p⌋ = ⌊x⌋ + p.
4
Approximation par des nombres décimaux
Proposition 7 Étant donné x ∈ IR et n ∈ IN, le nombre décimal rn =
⌊10n x⌋ vérifie : 10n
1 · 10n Ce nombre décimal rn est appelé approximation décimale par défaut de x à la précision 10−n . rn x < rn +
Démonstration page 346
Remarque Avec les notations de la définition précédente, le nombre rn + 10−n est appelé approximation décimale par excès de x à la précision 10−n . Ex. 7. Voici un tableau donnant, pour quelques constantes usuelles, les valeurs décimales approchées à 10−3 près par défaut et par excès :
par défaut à 10−3 près −3
par excès à 10
près
1
√
1,000
1,414
1,001
1,415
2
√
3
π
e
ln(2)
1,732
3,141
2,718
0,693
1,733
3,142
2,719
0,694
313
Chapitre 9. Nombres réels, suites numériques
5
Parties denses dans IR
Proposition 8 Soit A une partie de IR. Les deux assertions suivantes sont équivalentes : (i) pour tout réel x et pour tout réel ε > 0 , on peut trouver au moins un élément de A dans l’intervalle [x − ε, x + ε] ;
(ii) entre deux réels distincts, il existe au moins un élément de A. On dit alors que A est dense dans IR.
Démonstration page 346
Remarque Le caractère dense d’une partie A de IR signifie qu’on peut approcher ou encadrer tout nombre réel par des éléments de A, de manière aussi précise que l’on veut. Théorème 9 Les ensembles D, I Q et IR \ Q sont denses dans IR.
Démonstration page 346 On commence par montrer la densité de D I dans IR , en utilisant l’approximation par des décimaux. On en déduit ensuite celle de Q . On montre celle de IR\Q √ √ / Q. en utilisant le fait que 2 ∈ IR \ Q et donc que si r ∈ Q , alors r + 2 ∈
Principe de démonstration.
Remarque Nous avons vu au chapitre 1 (cf. exemple 15 de la page 13) qu’il n’existe √ pas de rationnel x tel que x2 = 2 . Par ailleurs, le réel 2 est bien défini. On trouvera √ une démonstration de son existence à l’exercice 9.1 de la page 357. Par suite, 2 est bien un irrationnel. Remarque Les propriétés de densité des ensembles D, I Q et IR \ Q dans IR justifient donc le fait que : • entre deux réels distincts on peut toujours trouver, au choix, au moins un décimal, un rationnel ou un irrationnel ; • entre deux réels distincts on peut toujours trouver, au choix, une infinité de décimaux, de rationnels ou d’irrationnels (voir l’exercice 9.4 de la page 357) ; • étant donné un réel x, on peut toujours trouver, au choix, un décimal, un rationnel ou un irrationnel, aussi proche que l’on veut de x.
II 1
Généralités sur les suites réelles Définitions
Une suite à termes réels, ou suite réelle, est une famille de nombres réels indexée par IN, c’est-à-dire une application de IN dans IR. • Traditionnellement, si u est une suite, on utilise plutôt la notation indexée un à la place de u(n) pour désigner l’image par u de l’entier n. La suite u est alors notée (un )n∈IN . • Le terme un est appelé terme général de la suite (un )n∈IN .
• L’ensemble des suites réelles est noté IRIN . 314
II Généralités sur les suites réelles
Remarque Pour des raisons d’économie d’écriture, il arrive parfois d’utiliser la notation (un ) pour désigner la suite (un )n∈IN . Il faut alors bien comprendre l’importance des parenthèses qui indiquent qu’il s’agit d’une suite et non d’un terme général. Par extension, nous appellerons aussi suite réelle une famille de réels indexée par IN∗ , voire plus généralement par un intervalle d’entiers du type [[n0 , +∞[[. Une suite u indexée par [[n0 , +∞[[ sera notée (un )nn0 . Opérations sur les suites Étant donné deux suites réelles u et v ainsi qu’un réel λ, on note u + v (somme des suites u et v ), λ u (produit par le scalaire λ de la suite u ) et u v (produit des suites u et v ), les suites dont les termes généraux valent respectivement : un + vn ,
λ un ,
un vn .
Plus généralement, une combinaison linéaire de deux suites u et v est une suite de la forme (λ un + µ vn )n∈IN , pour un certain (λ, µ) ∈ IR2 . Définitions et opérations liées à la relation d’ordre On dit qu’une suite réelle (un )n∈IN est : • majorée si ∃M ∈ IR ∀n ∈ IN un M , • minorée si ∃m ∈ IR ∀n ∈ IN • bornée si ∃K ∈ IR ∀n ∈ IN
un m,
|un | K .
Remarques • Une suite (un )n∈IN est bornée si, et seulement si, la suite (|un |)n∈IN est majorée. • Une suite (un )n∈IN est bornée si, et seulement si, elle est majorée et minorée.
• Dans la définition d’une suite majorée, le « ∃M ∈ IR » peut-être remplacé, au choix, par « ∃M ∈ IR+ » ou « ∃M > 0 », sans changer le sens de la définition. En effet, si la propriété « ∀n ∈ IN un M » est vraie pour une valeur de M , alors elle est vraie pour toute valeur supérieure de M .
Propriétés immédiates On a les résultats suivants concernant les opérations sur les suites majorées, bornées, etc. (cf. proposition 10 de la page 79). • Si u et v sont des suites majorées, alors la suite u + v est majorée. • Si u et v sont des suites bornées, alors les suites u + v et uv sont bornées.
Définition 2 Une suite u est stationnaire si elle est constante à partir d’un certain rang, i.e. : ∃p ∈ IN ∀n p
un+1 = un .
315
Chapitre 9. Nombres réels, suites numériques
2
Monotonie
Une suite réelle (un )n∈IN étant une application de IN dans IR, sa croissance est définie par la propriété suivante : ∀(p, q) ∈ IN2
p q =⇒ up uq .
Voici une caractérisation plus simple de cette notion (ainsi que de la notion de stricte croissance). Proposition 10 Soit (un )n∈IN une suite. (i) La suite u est croissante si, et seulement si : ∀n ∈ IN un un+1 .
Exo 9.7
(ii) La suite u est strictement croissante si, et seulement si : ∀n ∈ IN un < un+1 .
Démonstration page 347
On adapte facilement la proposition précédente aux suites décroissantes. Remarques Soit u = (un )n∈IN une suite réelle. • Pour étudier la monotonie de u , on pourra étudier le signe de un+1 − un . un+1 à 1. • Lorsque u est à valeurs strictement positives, on peut aussi comparer un Ex. 8. La suite (un )n1 définie par un = 1/n est strictement décroissante. Ex. 9. Si a ∈ IR+ , la suite définie par un = an est monotone. Elle est en effet croissante si a 1 et décroissante si a 1 . Ex. 10. La suite de terme général (−1)n n’est pas monotone. Ex. 11. Pour α ∈ IR∗+ , la suite de terme général un =
effet, pour tout n ∈ IN , on a un > 0 (en particulier u0 =
α(α+1)···(α+n−1) est n! u n+α 1 ) et un+1 = · n+1 n
monotone. En
On en déduit que la suite est strictement décroissante si α < 1 , strictement croissante si α > 1 et constante (égale à 1 ) si α = 1 .
Remarques • L’opposée d’une suite croissante est une suite décroissante.
• Les suites constantes sont les seules suites qui soient croissantes et décroissantes.
• La somme de deux suites croissantes (respectivement le produit de deux suites croissantes positives) est une suite croissante.
3
Suites extraites
Définition 3 Une suite v = (vn )n∈IN est appelée suite extraite ou sous-suite d’une suite u = (un )n∈IN s’il existe une application ϕ : IN → IN strictement croissante telle que : ∀n ∈ IN vn = uϕ(n) . 316
III Limite d’une suite réelle
Ex. 12. La suite (un+1 )n∈IN est une suite extraite de la suite u = (un )n∈IN . Ex. 13. Les suites (u2n )n∈IN et (u2n+1 )n∈IN sont deux suites extraites de (un )n∈IN ; on les appelle respectivement sous-suite des termes d’indices pairs et sous-suite des termes d’indices impairs.
Ex. 14. La suite un+(−1)n
n∈IN
n’est pas en général une suite extraite de (un )n∈IN .
Remarque L’application ϕ de la définition précédente étant strictement croissante et à valeurs entières, pour tout n ∈ IN, on a ϕ(n + 1) ϕ(n) + 1 . Une récurrence immédiate donne alors : ∀n ∈ IN ϕ(n) n.
4 Exo 9.8
À partir d’un certain rang
La définition 2 de la page 315 a fait usage de la locution « à partir d’un certain rang » pour définir la notion de suite stationnaire. Cette locution est en fait utilisée dans de nombreuses situations : on dit qu’une suite (un )n∈IN vérifie une propriété à partir d’un certain rang s’il existe n0 ∈ IN tel que la suite (un )nn0 vérifie cette propriété. Ex. 15. Dire qu’une suite (un )n∈IN est positive à partir d’un certain rang signifie que : ∃n0 ∈ IN
∀n ∈ IN
n n0 =⇒ un 0.
Ex. 16. Dire qu’une suite (un )n∈IN est croissante à partir d’un certain rang signifie que : ∃n0 ∈ IN
∀n ∈ IN
n n0 =⇒ un un+1 .
Ex. 17. Étant donné deux suites (un )n∈IN et (vn )n∈IN , on dit que un vn à partir d’un certain rang pour signifier que : ∃n0 ∈ IN
III 1
∀n ∈ IN
n n0 =⇒ un vn .
Limite d’une suite réelle Suites convergentes
Définition 4 Étant donné une suite réelle (un )n∈IN ainsi que ℓ ∈ IR, on dit que la suite (un )n∈IN tend vers ℓ, ou encore converge vers ℓ, si : ∀ε > 0
∃n0 ∈ IN
∀n ∈ IN
n n0 =⇒ |un − ℓ| ε.
Remarque On dit aussi que la suite (un )n∈IN admet ℓ comme limite. Notation
On écrit un −→ ℓ pour dire que la suite (un )n∈IN tend vers ℓ . Lorsqu’il n→+∞
n’y a pas d’ambiguïté sur le fait que c’est la variable n qui tend vers +∞, on se permet d’utiliser la notation plus légère un → ℓ . 317
Chapitre 9. Nombres réels, suites numériques Remarque Il est important de bien comprendre la définition 4 de la page précédente, et en particulier la phrase formelle définissant la convergence d’une suite (un )n∈IN vers un réel ℓ . Décortiquons-la en partant de la fin. • L’assertion (|un − ℓ| ε) signifie : « un est à une distance de ℓ inférieure ou égale à ε », ou encore ℓ − ε un ℓ + ε . un
ℓ+ε
ℓ
ℓ−ε
• L’assertion (∀n ∈ IN n n0 =⇒ |un − ℓ| ε) signifie : « à partir du rang n0 , tous les termes de la suite u sont à une distance de ℓ inférieure à ε ». • L’assertion (∃n0 ∈ IN ∀n ∈ IN n n0 =⇒ |un − ℓ| ε) signifie : « il existe un rang à partir duquel tous les termes de la suite u sont à une distance de ℓ inférieure à ε », ou encore : « à partir d’un certain rang, tous les termes de la suite u sont à une distance de ℓ inférieure à ε ». • L’assertion complète (∀ε > 0 ∃n0 ∈ IN ∀n ∈ IN n n0 =⇒ |un − ℓ| ε) signifie donc : « pour tout réel ε > 0 , il existe un rang à partir duquel tous les termes de la suite sont à une distance de ℓ inférieure à ε ». Ex. 18. Montrons que la suite u = (1/n)n1 tend vers 0 . Soit ε > 0 . D’après la propriété d’Archimède (cf.lemme 5 de la page 312), on peut trouver un entier n0 > 0 tel que n0 ε 1 , c’est-à-dire tel que n10 ε . Fixons un tel n0 . Pour n n0 , on a alors : 1 1 ε. |un | = n n0 Ex. 19. Si |a| < 1 , la suite géométrique (an )n∈IN converge vers 0 . En effet :
• si a = 0 , c’est évident puisque la suite est nulle à partir du rang 1 ; 1 • si a �= 0 , on a |a| > 1 et, pour ε > 0 fixé, l’exemple 5 de la page 312 assure l’existence d’un entier n0 tel que
1 |a|
n0
1 et alors : ∀n n0 ε
|a|n |a|n0 ε .
Proposition 11 (Unicité de la limite) Si ℓ1 et ℓ2 sont deux réels tels que un → ℓ1 et un → ℓ2 , alors ℓ1 = ℓ2 .
Démonstration page 347 Raisonner par l’absurde en supposant ℓ1 �= ℓ2 .
Principe de démonstration.
2| En prenant ε = |ℓ1 −ℓ , on constate que un ne peut pas être à la fois à une distance de ℓ1 3 inférieure à ε et à une distance de ℓ2 inférieure à ε :
318
|un − ℓ1 | ε
ℓ1
|un − ℓ2 | ε
ℓ2
III Limite d’une suite réelle Étant donné une suite convergente u = (un )n∈IN , la proposition précédente permet de parler de la limite d’une suite u . Notation
La limite de la suite u est notée lim un , ou
lim un , ou encore lim u .
n→+∞
Définition 5 On dit qu’une suite réelle est convergente si elle admet une limite réelle. Dans le cas contraire, on dit qu’elle est divergente. Remarque Dire qu’une suite (un )n∈IN est convergente s’écrit donc : ∃ℓ ∈ IR ∀ε > 0 ∃n0 ∈ IN ∀n ∈ IN n n0 =⇒ un − ℓ ε. Ex. 20.
• Toute suite stationnaire est convergente, et sa limite est la valeur constante qu’elle prend à partir d’un certain rang. • En revanche, la réciproque est fausse. Une suite peut être convergente sans être stationnaire, 1 qui converge (vers 0 ) mais qui n’est pas comme par exemple la suite de terme général n stationnaire.
Proposition 12 Soit u une suite réelle et ℓ un réel. S’il existe une suite v convergeant vers 0 telle que |un − ℓ| vn à partir d’un certain rang, alors u converge vers ℓ .
Démonstration page 347
Point méthode Pour démontrer qu’une suite u converge vers un réel ℓ , on peut montrer que la suite (un − ℓ) converge vers 0 et donc essayer de majorer le réel positif |un − ℓ| par le terme général d’une suite qui tend vers 0 . Ex. 21. Montrons que la suite de terme général un = Pour n ∈ IN , on a n!+1 − 1 = 1 · n!
∀n ∈ IN∗ 1 −→ n n→+∞
tend vers 1 .
n!
Pour n ∈ IN∗ , on a 0 < n n! et il s’ensuit que :
Puisque
n!+1 n!
n! + 1
0
n!
− 1
1 · n
0 , on en déduit que la suite (un )n∈IN tend vers 1 .
Proposition 13
Si une suite u converge vers ℓ , alors la suite |u| = |un | n∈IN converge vers |ℓ|.
Démonstration. D’après l’inégalité triangulaire, on a |un |−|ℓ| |un −ℓ| pour tout n ∈ IN .
On conclut avec la proposition 12.
319
Chapitre 9. Nombres réels, suites numériques
2
Propriétés des suites convergentes
Proposition 14 Toute suite convergente est bornée. Démonstration page 347
Principe de démonstration. Utiliser la définition de la convergence avec, par exemple, ε = 1 . Ex. 22. La suite (n)n∈IN est divergente, car elle n’est pas bornée.
Ex. 23. La réciproque de la proposition précédente est fausse : par exemple la suite de terme général (−1)n est bornée mais divergente (cf. exemple 28 de la page 322).
Proposition 15 Soit u une suite convergeant vers ℓ ∈ IR. Si m est un réel vérifiant m < ℓ , alors la suite u est minorée par m à partir d’un certain rang. Démonstration page 347
Principe de démonstration. En prenant n suffisamment grand, on peut rendre les termes de la suite aussi proches de ℓ que l’on veut, et en particulier à une distance inférieure à ε = ℓ − m .
un m
ℓ ε
Ex. 24. Si u est une suite convergeant vers 0 , alors u2n |un | à partir d’un certain rang.
En effet, |u| tend vers 0 , donc |un | 1 à partir d’un certain rang. Comme pour tout réel x vérifiant |x| 1 , on a x2 |x| , la conclusion suit.
Remarque Par le même raisonnement, si u est une suite convergeant vers ℓ ∈ IR et m est un réel vérifiant m > ℓ , alors la suite u est majorée par m à partir d’un certain rang. Corollaire 16 Si u est une suite convergeant vers une limite ℓ > 0 , alors il existe un réel m > 0 tel que la suite u soit minorée par m à partir d’un certain rang. Démonstration.
Il suffit d’appliquer la proposition précédente avec m =
ℓ · 2
Corollaire 17 Si u est une suite convergeant vers une limite ℓ �= 0 , alors la suite |u| est minorée, à partir d’un certain rang, par un réel strictement positif. Démonstration. Il suffit d’appliquer le résultat précédent à la suite |u| qui converge vers |ℓ| > 0 .
Remarque Le résultat précédent assure que si une suite u converge vers une limite non nulle, alors, à partir d’un certain rang, elle ne s’annule plus et est du signe de sa limite. Cela permet alors, en notant n0 un tel rang, de considérer la suite u1n . nn0
320
III Limite d’une suite réelle
3
Suites tendant vers l’infini
Définition 6 On dit qu’une suite réelle (un )n∈IN • tend vers +∞ si : ∀A ∈ IR ∃n0 ∈ IN ∀n ∈ IN n n0 =⇒ un A ; • tend vers −∞ si : ∀A ∈ IR ∃n0 ∈ IN ∀n ∈ IN n n0 =⇒ un A.
De manière moins formelle, une suite (un )n∈IN tend vers +∞ si, en prenant n suffisamment grand, on peut rendre un aussi grand que l’on veut. Remarque Il est facile de voir, d’après la définition, que si une suite (un )n∈IN tend vers +∞, alors : • elle ne tend pas vers −∞ ;
• elle n’est pas bornée, donc elle est divergente. De même, une suite qui tend vers −∞ ne tend pas vers +∞ et n’est pas convergente. La propriété d’unicité de la limite, déjà énoncée pour des limites réelles, s’étend donc aux limites infinies. D’où la notation suivante : Notation Les notations déjà vues pour les suites convergentes s’utilisent également dans le cas des limites infinies : • cas +∞ : lim un = +∞, ou un → +∞ ; • cas −∞ : lim un = −∞, ou un → −∞.
Ex. 25. La suite de terme général un = n tend vers +∞ . En effet, pour tout réel A , on pose n0 = max(⌊A⌋ + 1, 0) ∈ IN , et l’on a : ∀n ∈ IN n n0 =⇒ n A .
Ex. 26. Si q > 1 , la suite un = q n tend vers +∞ . En effet, l’exemple 5 de la page 312 permet d’affirmer que pour A fixé, il existe un entier n0 tel que q n0 A . On a alors de façon évidente : ∀n n0
q n q n0 A.
Ex. 27. En s’inspirant de la démonstration de la proposition 14 de la page ci-contre, montrons que toute suite qui diverge vers +∞ est minorée. Soit u une suite qui diverge vers +∞ . D’après la définition 6, on peut trouver un rang n0 ∈ IN tel que ∀n n0 un 1 . Mais alors, il est clair que la suite u est minorée par le réel min{u0 , . . . , un0 −1 , 1} .
Attention Bien qu’elle ait une limite, une suite qui tend vers +∞ (ou vers −∞) n’est pas convergente. Pour insister sur ce fait, on préfère parfois dire qu’elle diverge vers +∞ (ou vers −∞). Remarques • Une suite u tend vers +∞ si, et seulement si, la suite −u tend vers −∞. • Si une suite (un )n∈IN tend vers +∞ ou vers −∞, alors la suite (|un |)n∈IN tend vers +∞, mais la réciproque de ce résultat est fausse, comme le prouve l’exemple de la suite u de terme général un = (−2)n . • Il est fréquent que l’on demande d’étudier la nature d’une suite. Ce qui est alors attendu c’est de déterminer si la suite est convergente ou divergente. Dans le cas où elle est divergente, on précise souvent si elle tend vers ±∞ ou pas. 321
Chapitre 9. Nombres réels, suites numériques
4
Limites et suites extraites
Proposition 18 Si u est une suite tendant vers une limite (finie ou infinie), alors toute suite extraite de u tend vers la même limite.
Démonstration page 347
Principe de démonstration.
Distinguer les cas, suivant que lim u ∈ IR , lim u = +∞ ou lim u = −∞ .
Penser à utiliser que, si ϕ : IN → IN est strictement croissante, alors on a ∀n ∈ IN
ϕ(n) n .
Point méthode Le résultat précédent implique que : • toute suite extraite d’une suite convergente est convergente ; ainsi, pour montrer qu’une suite est divergente, il suffit d’en exhiber une sous-suite divergente ; • pour montrer qu’une suite n’a pas de limite (finie ou infinie), il suffit d’en exhiber deux sous-suites tendant vers des limites différentes. Ex. 28. La suite définie par un = (−1)n n’admet pas de limite, car : • la sous-suite (u2n )n∈IN est constante égale à 1 , donc converge vers 1 ;
• la sous-suite (u2n+1 )n∈IN est constante égale à −1 , donc converge vers −1 .
Ex. 29. La suite définie par un = cos(nπ/4) diverge puisque la sous-suite (u4n )n∈IN a pour terme général (−1)n et donc est divergente.
Proposition 19 Si u est une suite telle que les deux sous-suites (u2n )n∈IN et (u2n+1 )n∈IN tendent vers une même limite (finie ou infinie), alors la suite u tend vers cette limite commune. Principe de démonstration.
Démonstration page 348 On se ramène à la définition, en distinguant les cas, suivant
que la limite est finie ou infinie.
5
Caractère asymptotique de la notion de limite
Rappelons (cf. page 317) que deux suites u et v sont égales à partir d’un certain rang si : ∃n0 ∈ IN ∀n ∈ IN n n0 =⇒ un = vn . Proposition 20 Soit u et v deux suites égales à partir d’un certain rang. Si l’une des deux tend vers une limite ℓ (finie ou infinie), alors l’autre tend aussi vers ℓ . Ce résultat, évident d’après les définitions, traduit ce que l’on appelle le caractère asymptotique de la notion de limite. Ainsi : • savoir si une suite converge ou non ne donne aucune information sur les valeurs de ses premiers termes ; • on peut modifier un nombre fini de termes d’une suite sans changer sa limite éventuelle ; c’est pourquoi, dans la suite de ce chapitre, la plupart des résultats énoncés s’appuieront sur des propriétés vraies à partir d’un certain rang ; c’était d’ailleurs déjà le cas de la proposition 12 de la page 319. 322
IV Opérations sur les limites
IV
Opérations sur les limites
Cette section regroupe des résultats permettant de prouver l’existence de la limite d’une suite et/ou de déterminer sa limite sans avoir besoin de revenir à la définition de la limite.
1
Produit d’une suite bornée par une suite tendant vers 0
Proposition 21 Le produit d’une suite bornée par une suite tendant vers 0 est une suite qui tend vers 0 .
Démonstration page 348 Commencer par exhiber un majorant M > 0 de |v| , puis ε · pour ε > 0 , utiliser la définition 4 de la page 317 avec M
Principe de démonstration.
2
Opérations sur les suites convergentes
Lemme 22 Si deux suites convergent vers 0 , alors leur somme converge aussi vers 0 . Principe de démonstration. rend |un | et |vn | inférieurs à
ε · 2
Démonstration page 348 On majore |un + vn | avec l’inégalité triangulaire, et on
Proposition 23 Soit u et v deux suites convergeant respectivement vers des réels ℓ1 et ℓ2 . Si λ et µ sont deux réels, alors les suites λ u + µ v et u v convergent respectivement vers λ ℓ1 + µ ℓ2 et ℓ1 ℓ2 . Démonstration page 349
Ex. 30. Si u est une suite convergente, alors un+1 − un → 0 .
En effet, notant ℓ la limite de u , la suite (un+1 )n∈IN est extraite de u , donc convergente, de limite ℓ . Il vient alors : un+1 − un −→ ℓ − ℓ = 0 . n→+∞
Attention La proposition précédente traite uniquement le cas de suites convergentes et ne donne aucun résultat sur la limite d’une somme de suites ayant une limite infinie. Remarques • Si u et u + v sont des suites convergentes, alors v = (u + v) − u est également convergente. • On en déduit que si u est une suite convergente et v une suite divergente, alors la suite u + v est divergente. Point méthode Si u et v sont des suites réelles : • lorsque deux des trois suites u , v , u + v convergent, alors la troisième converge ; Exo 9.11
• lorsque l’une des trois suites u , v et u + v converge et une autre diverge, alors la troisième diverge.
323
Chapitre 9. Nombres réels, suites numériques
3
Cas des limites infinies
Droite numérique achevée Afin d’unifier certains énoncés, il est pratique de travailler avec des éléments de IR. On prolonge partiellement à IR les opérations de IR, selon les tables suivantes : +
−∞
y ∈ IR
−∞
−∞
−∞
x ∈ IR
−∞
x+y
+∞
+∞
+∞
+∞
×
−∞
y ∈ IR∗−
−∞
+∞
+∞
+∞
xy
+∞
x∈
IR∗−
0
y ∈ IR∗+
+∞
−∞
−∞
0
xy
−∞
0
0
0
0
xy
+∞
+∞
+∞
x ∈ IR∗+
−∞
xy
+∞
−∞
−∞
0
où les cases vides correspondent à des cas où l’opération n’est pas définie. Lemme 24 Soit u une suite tendant vers +∞. 1. Si v est une suite minorée, alors la suite u + v tend vers +∞. 2. Si v est une suite minorée à partir d’un certain rang par un nombre strictement positif, alors la suite u v tend vers +∞. Démonstration page 349
Proposition 25 Soit u et v deux suites réelles admettant des limites ℓ1 et ℓ2 dans IR. • Si ℓ1 + ℓ2 est défini dans IR, alors on a lim(u + v) = ℓ1 + ℓ2 . • Si ℓ1 ℓ2 est défini dans IR, alors on a lim(u v) = ℓ1 ℓ2 .
Ex. 31. La suite de terme général
Démonstration page 349
1 − 1 n2 tend vers −∞ . n
1 − 1 −→ −1 et n2 −→ +∞ . On peut donc appliquer la proposition 25. n→∞ n→∞ n 1 2 Ex. 32. La suite de terme général n + − n2 tend vers 2 . n La proposition 25 ne peut pas s’appliquer directement. On remarque cependant que :
En effet
Exo 9.12
n+
1 n
2
− n2 = 2 +
1 n2
−→ 2 + 0 = 2.
n→+∞
Attention Les résultats précédents ne disent rien : • de la somme de deux suites qui tendent respectivement vers +∞ et −∞ ; • du produit d’une suite tendant vers +∞ et d’une suite convergeant vers 0 . En fait, dans ces situations, il se peut qu’il y ait une limite, finie ou infinie, mais il se peut aussi qu’il n’y en ait pas. On parle alors de forme indéterminée. 324
IV Opérations sur les limites
4
Inverse et quotient
Proposition 26 Soit u une suite convergeant vers une limite ℓ = � 0 . Alors à partir d’un certain 1 1 rang n0 tous les un sont non nuls, et la suite converge vers · un nn0 ℓ
Démonstration page 350
|un − ℓ| 1 1 , que l’on Pour la convergence, on écrit − =
Principe de démonstration.
un majore en majorant le numérateur et en minorant le dénominateur.
ℓ
|ℓ| |un |
Proposition 27 Soit u une suite divergeant vers +∞. Alors à partir d’un certain rang n0 tous 1 les un sont strictement positifs, et la suite converge vers 0 . un nn0
Démonstration page 350
Proposition 28 Soit u une suite convergeant vers 0 dont tous les termes sont strictement positifs 1 à partir d’un certain rang n0 . Alors la suite tend vers +∞. un nn0
Démonstration page 350
Remarque Étant donné une suite u , en appliquant les résultats précédents à la suite −u , on obtient : • si u diverge vers −∞, alors à partir d’un rang n0 tous les un sont strictement négatifs, et la suite u1n converge vers 0 ; nn0
• si u converge vers 0 et si tous les termes un sont strictement négatifs à partir d’un certain rang n0 , alors la suite u1n tend vers −∞. nn0
Attention • L’inverse d’une suite à termes non nuls convergeant vers 0 peut très bien ne tendre ni vers +∞ ni vers −∞, comme le prouve l’exemple de la suite de terme général
(−1)n n
.
• En revanche, si lim un = 0 et si ∀n ∈ IN un �= 0 , alors |u| est une suite à termes 1 strictement positifs qui converge vers 0 , et donc lim |u| = +∞. Proposition 29 Soit u une suite convergeant vers une limite ℓ �= 0 . Soit v une suite convergeant vers une limite ℓ′ . Alors à partir d’un certain rang n0 tous les un sont non nuls, ℓ′ vn et la suite converge vers · un nn0 ℓ Démonstration. Pour tout entier n assez grand, on a et produit de suites convergentes.
vn un
= vn × u1n · On conclut par inverse
325
Chapitre 9. Nombres réels, suites numériques 2n2 − sin n · cos n − 3n2 Le terme général apparaît comme le quotient de deux quantités qui divergent, donc on ne peut pas conclure directement. Cependant, pour n ∈ IN∗ , on a : 2 − sin2n un = cos n n · −3 n2
Ex. 33. Étudions la convergence de la suite de terme général un =
Comme produits d’une suite bornée et d’une suite tendant vers 0 , on a : sin n 1 = sin n × 2 n2 n On en déduit que 2 −
5
−→ 0
n→+∞
et
cos n 1 = cos n × 2 n2 n
−→ 0.
n→+∞
sin n cos n 2 −→ 2 et − 3 −→ −3 , et enfin que un −→ − · n→+∞ n→+∞ n2 n→+∞ n2 3
Passage à la limite dans les inégalités larges
Proposition 30 Soit u une suite positive à partir d’un certain rang. Si u admet une limite ℓ ∈ IR, alors on a ℓ 0 .
Démonstration page 350
Corollaire 31 (Passage à la limite dans une inégalité large) Soit u et v deux suites convergentes telles que un vn à partir d’un certain rang. Alors on a lim u lim v . Démonstration.
Il suffit d’appliquer la proposition précédente à la suite w = v − u .
Ex. 34. Si u est convergente et à valeurs dans un intervalle I d’extrémités a et b , alors lim un est dans l’intervalle fermé d’extrémités a et b . Il suffit, en effet, d’appliquer le corollaire 31 à u et aux deux suites constantes égales respectivement à a et à b .
Attention On ne peut pas affiner le résultat précédent en utilisant des inégalités strictes. Par exemple, la suite de terme général n1 est à termes strictement positifs, convergente, mais sa limite n’est pas strictement positive. Point méthode Si u est une suite convergente dont on souhaite montrer que sa limite est strictement positive, alors on peut chercher un réel m > 0 tel que un m à partir d’un certain rang.
Ex. 35. Si u est une suite croissante convergente dont au moins un terme est strictement positif, alors sa limite est strictement positive. En effet, si n0 ∈ IN est tel que un0 > 0 , par croissance on a : ∀n n0
un un0 .
En passant à la limite (cf. corollaire 31), on obtient alors lim u un0 > 0 .
326
IV Opérations sur les limites
6
Existence de limite par encadrement
Théorème 32 (Théorème d’encadrement) Soit u et w deux suites convergeant vers une limite commune ℓ . Si v est une suite vérifiant l’encadrement un vn wn à partir d’un certain rang, alors v converge et sa limite vaut ℓ .
Démonstration page 351
Principe de démonstration.
Écrire v = u + (v − u) et montrer que v − u tend vers 0 .
Remarque Il faut bien comprendre la différence de nature qu’il y a entre le théorème 32 et le corollaire 31 de la page ci-contre : • lors d’un passage à la limite dans une inégalité (corollaire 31), toutes les suites intervenant sont déjà supposées convergentes ; • dans une convergence par encadrement (théorème 32), la suite que l’on encadre n’est pas supposée convergente, et c’est dans la conclusion du théorème qu’on obtient sa convergence.
Ex. 36. Déterminons la nature de la suite de terme général un =
n k=1
√
n et le cas +k
n4
échéant, déterminons sa limite. Cherchons à encadrer un . Puisque un s’exprime comme une somme, le plus naturel est d’encadrer à n fixé chaque terme de la somme. Soit n ∈ IN∗ . On a :
n 1 n n n √ √ √ = · 4 4 4 n +n n +k n +1 n En sommant ces n encadrements, on obtient : ∀k ∈ [[1, n]]
√
n4
√
n2 un 1. n4 + n
Comme : √
1 n2 = n4 + n 1+
−→ 1,
1 n→+∞ n3
le théorème d’encadrement assure que la suite (un )n∈IN∗ converge vers 1 .
La proposition suivante est la version « limites infinies » du théorème 32 qui s’obtient immédiatement en revenant aux définitions. Proposition 33 Soit u et v deux suites vérifiant un vn à partir d’un certain rang. 1. Si lim u = +∞, alors lim v = +∞. 2. Si lim v = −∞, alors lim u = −∞. 327
Chapitre 9. Nombres réels, suites numériques
V
Résultats d’existence de limites
1
Limites des suites monotones
Théorème 34 (Théorème de la limite monotone) Soit u une suite croissante. 1. Si elle est majorée, alors elle converge vers ℓ = sup {un | n ∈ IN} .
2. Si elle n’est pas majorée, alors elle diverge vers +∞.
Démonstration page 351 Pour le premier point, se ramener à la définition de la convergence, et utiliser la caractérisation de la borne supérieure.
Principe de démonstration.
Remarques • Toute suite croissante admet donc une limite (finie ou égale à +∞).
• Lorsque l’on a majoré une suite croissante, on a non seulement montré sa convergence, mais aussi trouvé un majorant de sa limite, puisque celle-ci est le plus petit de ses majorants. • Si l’on sait qu’une suite croissante (un )n∈IN converge vers ℓ , alors on peut affirmer que ∀n ∈ IN un ℓ . C’est une conséquence immédiate du fait que ℓ = sup un n ∈ IN .
En appliquant le théorème de la limite monotone à la suite −u , on obtient le résultat suivant concernant les suites décroissantes : Corollaire 35 Soit u une suite décroissante. 1. Si elle est minorée, elle converge vers ℓ = inf {un | n ∈ IN} .
2. Si elle n’est pas minorée, elle tend vers −∞. Ex. 37. La suite u de terme général
n
k=1
1−
1 2k
est convergente. En effet :
• pour tout n ∈ IN∗ , on a 0 un , car il s’agit d’un produit de n termes positifs ;
1 1 un , car un 0 et 1 − 2n+1 1. • pour n ∈ IN∗ , on a un+1 = un 1 − 2n+1 Ainsi, u est une suite décroissante et minorée, donc convergente par le théorème de la limite monotone.
2
Suites adjacentes
Définition 7 On dit que deux suites sont adjacentes si l’une est croissante, l’autre décroissante, et si leur différence tend vers 0 . Théorème 36 (Théorème des suites adjacentes) Si deux suites sont adjacentes, alors elles convergent vers une limite commune. Principe de démonstration.
Démonstration page 351
En supposant u croissante et v décroissante, commencer par prouver que ∀n ∈ IN
328
un vn .
V Résultats d’existence de limites Remarque D’après la démonstration du théorème précédent, si u et v sont deux suites adjacentes, u étant croissante et v décroissante, alors on a : ∀n ∈ IN un vn .
De plus, si ℓ désigne la limite commune des deux suites, on a : ∀n ∈ IN
et plus généralement
un ℓ vn ,
∀(n, p) ∈ IN2
un ℓ vp .
Ex. 38. Les deux suites définies sur IN∗ par : un =
n 1 p=0
p!
vn = un +
et
1 n!
sont adjacentes, et donc convergentes. En effet : • la suite u est évidemment croissante ; • un calcul simple donne, pour n ∈ IN∗ : vn+1 − vn =
1−n 0, (n + 1)!
donc la suite v est décroissante ; 1 , donc la suite v − u tend vers 0 . • pour n ∈ IN∗ on a vn − un = n! Il en résulte que les suites u et v sont adjacentes, donc convergentes.
Remarque On verra (cf. proposition 9 de la page 617) que leur limite commune est le nombre e = exp(1).
3
Théorème de Bolzano-Weierstrass
Théorème 37 Toute suite bornée possède au moins une sous-suite convergente. Démonstration page 351
Principe de démonstration. • Procéder par dichotomie en construisant par récurrence une suite de segments In = [an , bn ] 0 · telle que pour tout n ∈ IN la suite u ait une infinité de termes dans In et bn − an = b02−a n
an
In
ou
In+1
bn
• Montrer que les suites (an )n∈IN et (bn )n∈IN sont adjacentes. Ensuite, notant λ la limite commune, construire ϕ : IN → IN strictement croissante telle que uϕ(n) −→ λ . n→+∞
329
Chapitre 9. Nombres réels, suites numériques Remarque Le résultat précédent ne donne aucune méthode pratique pour expliciter une telle sous-suite ou sa limite. Ex. 39. D’après le théorème de Bolzano-Weierstrass, la suite de terme général sin(n) possède au moins une sous-suite convergente.
VI 1
Traduction séquentielle de certaines propriétés Parties denses de IR
La notion de partie dense a été définie à la proposition 8 de la page 314. Proposition 38 Une partie de A de IR est dense dans IR si, et seulement si, pour tout réel x, on peut trouver une suite d’éléments de A qui converge vers x. Démonstration page 352
On a vu que les ensembles D, I Q et IR\Q sont denses dans IR. D’après la proposition 38 cela signifie que, pour tout réel x, on peut trouver : • une suite de nombres rationnels qui converge vers x ; • une suite de nombre décimaux qui converge vers x ;
• une suite de nombres irrationnels qui converge vers x.
Remarque Étant donné un réel x, on peut construire de manière explicite une suite de nombres décimaux qui converge vers x. En effet, si u est la suite définie par : un =
⌊10n x⌋ 10n près par défaut de x), on a alors pour
(la valeur décimale approchée à 10−n tout n ∈ IN : 0 10n x − ⌊10n x⌋ < 1, donc, en divisant par le réel strictement positif 10n : 0 x − un
0 ∃n0 ∈ IN
∀n ∈ IN
n n0 =⇒ |un − λ| ε.
La convergence d’une suite complexe s’écrit donc comme celle d’une suite réelle, en remplaçant les valeurs absolues par des modules. Proposition 42 (Unicité de la limite) Si la suite u = (un )n∈IN converge vers λ et vers λ′ , alors λ = λ′ . Démonstration.
L’inégalité triangulaire permet, pour tout n , d’écrire :
0 λ − λ′ |λ − un | + un − λ′ .
Par passage à la limite (sur des suites à termes réels), on déduit alors 0 |λ − λ′ | 0 , et donc λ = λ′ .
Définition 9 Soit u = (un )n∈IN une suite complexe. • Lorsqu’il existe un complexe λ vers lequel la suite u converge, on dit que u est une suite convergente. Ce complexe (unique) s’appelle alors la limite de u et se note lim u ou lim un . • Une suite qui n’est pas convergente est dite divergente. Remarque Vu l’absence de relation d’ordre sur C, on ne définit pas, pour les suites complexes, de notion de limite infinie. Ex. 41. La suite définie par un = 1 n
géométrique
√
2
n∈IN
(1+i)n 2n
converge vers 0 , car |un | =
tend vers 0 , du fait que −1
1 , la suite géométrique (q n )n∈IN diverge car elle n’est pas bornée, étant donné que lim |q|n = +∞ .
Proposition 46
Si u est une suite convergeant vers λ, alors la suite des conjugués u converge vers λ . Démonstration.
3
Évident car |un − λ| = |un − λ| .
Suites extraites
La notion de suite extraite est la même que pour les suites réelles : une suite v = (vn )n∈IN est appelée suite extraite, ou sous-suite, d’une suite u = (un )n∈IN s’il existe une application ϕ, strictement croissante de IN dans IN, vérifiant : ∀n ∈ IN vn = uϕ(n) . Proposition 47 Si v est extraite d’une suite u convergeant vers λ, alors v converge vers λ. Démonstration page 353
Remarque Comme pour les suites à termes réels, on utilise surtout le résultat précédent pour démontrer qu’une suite à termes complexes n’est pas convergente en exhibant deux sous-suites convergeant vers des limites différentes. π Ex. 45. La suite donnée par un = exp n i ne converge pas. Pour le montrer, considérons
2 les suites extraites (u4n )n∈IN et (u4n+1 )n∈IN : • la sous-suite (u4n )n∈IN est constante égale à 1 donc converge vers 1 ;
• la sous-suite (u4n+1 )n∈IN est constante égale à i donc converge vers i . Puisque les suites extraites (u4n )n∈IN et (u4n+1 )n∈IN n’ont pas la même limite, la suite est divergente.
333
Chapitre 9. Nombres réels, suites numériques Théorème 48 (Théorème de Bolzano-Weierstrass) Toute suite bornée u possède au moins une sous-suite convergente. Démonstration page 353
Principe de démonstration. Appliquer successivement le théorème de Bolzano-Weierstrass
réel (cf. théorème 37 de la page 329) à la suite Re un
n∈IN
, puis à la suite Im uϕ(n)
est une fonction strictement croissante de IN vers IN telle que Re uϕ(n)
4
n∈IN
n∈IN
, où ϕ
soit convergente.
Opérations sur les suites convergentes
Proposition 49 Soit u et v deux suites convergentes de CIN et k une constante complexe. 1. La suite u + v converge vers lim u + lim v . 2. La suite u v converge vers lim u × lim v .
3. La suite k u converge vers k × lim u .
Démonstration page 354
Ex. 46. Si q �= 1 est un nombre complexe de module 1 , la suite géométrique u = (q n )n∈IN est
divergente. Raisonnons par l’absurde et supposons que la suite converge vers ℓ . • Comme pour n ∈ IN , on a |un | = 1 , on trouve |ℓ| = lim |un | = 1 .
• Un passage à la limite dans la relation un+1 = q un donne ℓ = q ℓ , c’est-à-dire ℓ(1 − q) = 0 , donc ℓ = 0 , car q �= 1 . D’où la contradiction.
Proposition 50 Soit u une suite convergeant vers une limite ℓ = � 0 . Alors à partir d’un certain 1 1 rang n0 tous les un sont non nuls, et la suite converge vers · un nn0 ℓ Principe de démonstration.
5
Démonstration page 354 1 Pour le second point, exprimer à l’aide de un et |un |2 . un
En guise de conclusion
Pour résumer, on peut garder à l’esprit qu’une bonne partie des notions et propriétés valables sur les suites réelles se généralisent aux suites complexes, sauf celles qui font intervenir la relation d’ordre sur IR. Ainsi, à propos d’une suite complexe, on n’utilisera surtout pas : • la notion de suite monotone ; • la notion de suite majorée et/ou minorée ;
• la notion de suite divergeant vers +∞ ou −∞ ; • le théorème d’encadrement ; • les suites adjacentes. 334
VIII Étude de suites, suites récurrentes
VIII 1
Étude de suites, suites récurrentes
Modes usuels de définition d’une suite
Dans la pratique, on rencontre plusieurs manières de définir des suites. Suites définies explicitement On peut définir une suite à l’aide d’une expression dépendant d’une variable entière. C’est le cas de la plupart des exemples que nous avons traités jusqu’à présent. √ √ Ex. 47. Considérons la suite u = n + 1 − n n∈IN .
Une transformation d’écriture va nous donner les premières propriétés de u . Utilisant la quantité conjuguée, on a : 1 ∀n ∈ IN un = √ √ · n+1+ n √ √ étant croissante et positive, u est décroissante, positive. Puisque n −→ +∞ , La fonction n→+∞
par opérations sur les limites, il vient que un −→ 0 . n→+∞
Suites définies implicitement De manière informelle, on dit qu’une suite u est définie de manière implicite si, pour tout n ∈ IN, le réel un est l’unique solution d’une équation dépendant de n. Ex. 48.
Montrons pour tout n ∈ IN∗ , qu’il existe un unique réel un ∈ [0, 1] tel que xn + x − 1 = 0 . Pour cela, fixons n ∈ IN∗ et introduisons la fonction fn : [0, 1] −→ IR x �−→ xn + x − 1. La fonction fn est dérivable sur l’intervalle [0, 1] et : x ∀x ∈ [0, 1]
fn′ (x) = nxn−1 + 1 > 0.
0
1 1
fn −1
Par suite, fn réalise une bijection de [0, 1] sur [−1, 1] . Comme 0 ∈ [−1, 1] , cela démontre l’existence et l’unicité d’une solution à l’équation fn (x) = 0 .
Remarque On dispose rarement d’une expression explicite pour une suite définie implicitement sous la forme fn (un ) = 0 . L’étude d’une telle suite passera souvent par la comparaison des fonctions fn et fn+1 . Ex. 49. Poursuivons l’étude de la suite (un )n∈IN∗ . Soit n ∈ IN∗ . Pour x ∈ [0, 1] on a xn+1 xn , donc : ∀x ∈ [0, 1]
fn+1 (x) fn (x).
En particulier : fn+1 (un ) fn (un ) = 0.
335
Chapitre 9. Nombres réels, suites numériques Puisque fn+1 (un ) 0 = fn+1 (un+1 ) , la stricte croissance de fn+1 implique un un+1 . On en conclut que la suite (un )n∈IN∗ est croissante. Cette suite est par définition à valeurs dans [0, 1] ; elle est en particulier majorée. Il vient alors du théorème de la limite monotone qu’elle est convergente.
Remarque Il arrive parfois, lorsque l’on a montré a priori la convergence d’une suite, que l’on puisse ensuite calculer explicitement cette limite. Ex. 50. Dans le cas précédent, le fait d’avoir établi la convergence de la suite u va nous permettre de calculer sa limite. Notons ℓ cette limite. Puisque 0 un 1 pour tout n ∈ IN∗ , il vient par passage à la limite dans les inégalités larges que 0 ℓ 1 . Comme u est croissante, on a un ℓ et par croissance sur IR+ de la fonction x �→ xn , il vient : ∀n ∈ IN∗
n 0 un n ℓ ,
c’est-à-dire au vu de la définition de la suite u : ∀n ∈ IN∗
0 1 − un ℓn .
(∗)
Montrons que ℓ = 1 en raisonnant par l’absurde. Supposons 0 ℓ < 1 . On a alors ℓn −→ 0 . n→+∞
Par encadrement, il vient de la relation (∗) que 1 − un
−→
n→+∞
0 , donc ℓ = 1 , ce qui est
contradictoire. On en conclut que ℓ = 1 , donc un −→ 1 . n→+∞
Suites définies par récurrence Souvent on cherche à définir une suite u par récurrence, en explicitant chaque terme en fonction du précédent, ou plus généralement des précédents. Cela n’est pas toujours possible comme le montre le deuxième exemple ci-dessous. Ex. 51. On peut définir par récurrence la suite u = (n!)n∈IN en posant :
u0 = 1 ∀n ∈ IN
un+1 = (n + 1) un .
Ex. 52. Il n’existe pas de suite u vérifiant : u0 =
3 2
et
∀n ∈ IN
En effet, pour une telle suite on aurait u0 =
un+1 =
1 · un − 1
3 1 , u1 = 2 , u2 = 1 et u3 = · · · 2 0
On admet le théorème suivant qui permet de montrer l’existence d’une telle suite. 336
VIII Étude de suites, suites récurrentes Théorème 51 (Définition d’une suite par récurrence) Soit E un ensemble et une application f : E → E .
Pour tout a ∈ E , il existe une unique suite u ∈ E IN telle que : u0 = a ∀n ∈ IN un+1 = f (un ). Une telle suite est dite définie par récurrence.
Point méthode Pour définir une suite par récurrence à partir d’une application f , on cherche une partie E du domaine de définition de f qui soit stable par f et contienne le premier terme. Extension On peut étendre le résultat du théorème 51 à des cas plus généraux. • Si (fn )n∈IN est une suite d’applications de E dans E , alors pour tout a ∈ E , il existe une unique suite u telle que u0 = a et un+1 = fn (un ) pour tout n ∈ IN. • Si pour tout n ∈ IN, on dispose d’une fonction fn : E n+1 → E , alors pour tout a ∈ E , il existe une unique suite u telle que u0 = a et un+1 = fn (u0 , . . . , un ) pour tout n ∈ IN. Ex. 53. Considérons une suite u = (un )n∈IN vérifiant
u0 ∈ [1, +∞[
n + un · n+1 La suite u est bien définie, car u0 ∈ [1, +∞[ et pour tout n ∈ IN∗ , l’application fn : x �→ ∀n ∈ IN∗
un+1 =
n+x n+1
est définie sur [1, +∞[ et à valeurs dans [1, +∞[ . Pour x ∈ [1, +∞[ et n ∈ IN∗ , on a : fn (x) − x =
n(1 − x) n+x −x= 0 n+1 n+1
Par conséquent, la suite u est décroissante, à valeurs dans [1, +∞[ . Puisque u est une suite décroissante, minorée, elle est convergente par le théorème de limite monotone. Notons ℓ sa limite. On a : • d’une part, par extraction, un+1 −→ ℓ ; n→+∞
• d’autre part, par opérations sur les limites : 1 + unn n + un = n+1 1 + n1 car u est convergente, donc bornée, donc
un n
−→ 1,
n→+∞
−→ 0 .
n→+∞
La suite u converge donc vers 1 .
337
Chapitre 9. Nombres réels, suites numériques
2
Suites récurrentes particulières
Il est rare que l’on puisse expliciter le terme général d’une suite définie par récurrence. Il existe cependant quelques cas particuliers importants. Suites arithmétiques Soit r ∈ C et (un )n∈IN une suite vérifiant : ∀n ∈ IN un+1 = un + r. Une telle suite est dite suite arithmétique de raison r . • On vérifie facilement par récurrence : ∀n ∈ IN
un = u0 + n r .
• L’expression ci-dessus montre que (un )n∈IN converge si, et seulement si, r = 0 .
Suites géométriques Soit q ∈ C et (un )n∈IN une suite vérifiant : ∀n ∈ IN un+1 = q un . Une telle suite est dite suite géométrique de raison q . • On vérifie facilement par récurrence : ∀n ∈ IN
un = u0 q n .
• Les exemples 44 de la page 333 et 46 de la page 334 montrent que la suite converge si, et seulement si : ∗ u0 = 0 (et la limite est nulle) ; ∗ ou |q| < 1 (et la limite est nulle) ou q = 1 (et la limite vaut u0 ). Remarque Lorsque |q| > 1 et u0 �= 0 , alors |un | −→ +∞. n→+∞
Suites arithmético-géométriques Soit (a, b) ∈ C2 avec a �= 1 , ainsi que (un )n∈IN une suite vérifiant : ∀n ∈ IN un+1 = aun + b.
(∗)
Une telle suite est dite suite arithmético-géométrique. • Commençons par chercher les suites constantes vérifiant (∗). La suite constante b égale à ℓ vérifie (∗) si, et seulement si, ℓ = aℓ + b i.e. si, et seulement si, ℓ = 1−a . • Si la suite u vérifie (∗) et ℓ est l’unique complexe vérifiant ℓ = aℓ + b , alors, pour tout n ∈ IN : un+1 − ℓ = a un + b − a ℓ + b = a un − ℓ . En d’autres termes, la suite un − ℓ n∈IN est géométrique de raison a.
• On en déduit alors le terme général :
∀n ∈ IN un = an
u0 −
• En particulier, la suite converge vers ℓ =
b 1−a
b 1−a
+
b · 1−a
si |a| < 1 ou si u0 = ℓ .
Point méthode Pour étudier une suite arithmético-géométrique, on commence par chercher l’unique scalaire ℓ vérifiant ℓ = a ℓ + b , puis on étudie la suite de terme général un − ℓ , qui est une suite géométrique. 338
VIII Étude de suites, suites récurrentes Récurrence linéaire homogène d’ordre 2 Dans la suite de cette section, IK = IR ou IK = C. Une suite récurrente linéaire homogène d’ordre 2 à coefficients constants est une suite, réelle ou complexe, vérifiant une relation de récurrence de la forme : ∀n ∈ IN
un+2 = a un+1 + b un ,
(⋆)
où a et b sont des constantes (réelles ou complexes), avec b �= 0 .
Ex. 54. Soit r ∈ IK non nul. La suite géométrique u = (rn )n∈IN vérifie ( ⋆ ) si, et seulement si, r2 − ar − b = 0 . En effet, pour tout n ∈ IN :
un+2 − aun+1 − bun = r n r 2 − ar − b .
Ainsi, u vérifie ( ⋆ ) si, et seulement si, l’on a r n r 2 − ar − b = 0 pour tout n ∈ IN , c’est-à-
dire r 2 − ar − b = 0 , car r n �= 0 pour au moins un n ∈ IN (en fait tous, puisque r �= 0 ).
Proposition 52 Soit (λ, µ) ∈ IK2 et u = (un )n∈IN et v = (vn )n∈IN deux suites vérifiant la relation (⋆). La suite de terme général λun + µvn vérifie alors la relation (⋆ ). Démonstration page 354
En d’autres termes, l’ensemble des suites vérifiant (⋆ ) est stable par combinaison linéaire. Proposition 53 Si u et v sont deux suites vérifiant (⋆ ) telles que u0 = v0 et u1 = v1 , alors u = v .
Démonstration page 355
Principe de démonstration. Par récurrence double. L’équation suivante est appelée équation caractéristique de la relation (⋆ ) : x2 − a x − b = 0. Remarques • L’hypothèse b �= 0 assure que 0 n’est pas solution de (Ec ).
(Ec )
• L’exemple 54 montre que la suite géométrique de terme général rn vérifie (⋆ ) si, et seulement si, r est solution de (Ec ).
Proposition 54 (Cas complexe) On distingue deux cas. • Si l’équation caractéristique possède deux solutions distinctes r1 et r2 , alors les suites complexes vérifiant la relation (⋆ ) sont les suites de terme général : λ1 r1n + λ2 r2n
avec (λ1 , λ2 ) ∈ C2 .
• Sinon, l’équation caractéristique possède une solution double r ; les suites complexes vérifiant la relation (⋆ ) sont alors les suites de terme général : λ1 rn + λ2 n rn
avec (λ1 , λ2 ) ∈ C2 .
Démonstration page 355 Vérifier que les suites proposées conviennent. Ensuite, pour montrer qu’il n’y en a pas d’autres, penser à utiliser le fait qu’une suite vérifiant ( ⋆ ) est caractérisée par ses deux premiers termes (cf. proposition 53).
Principe de démonstration.
339
Chapitre 9. Nombres réels, suites numériques Dans le cas où a et b sont des nombres réels, il est légitime de ne pas chercher toutes les suites complexes vérifiant (⋆ ), mais de rechercher seulement les suites réelles. C’est l’objet de la proposition suivante. Proposition 55 (Cas réel) On suppose ici que a et b sont réels. On distingue trois cas, suivant le nombre de solutions réelles de l’équation caractéristique. 1. Si l’équation caractéristique possède deux solutions réelles distinctes r1 et r2 , alors les suites réelles vérifiant la relation (⋆ ) sont les suites de terme général : λ1 r1n + λ2 r2n
avec (λ1 , λ2 ) ∈ IR2 .
2. Si l’équation caractéristique possède une solution double r , alors les suites réelles vérifiant la relation (⋆ ) sont les suites de terme général : avec (λ1 , λ2 ) ∈ IR2 .
λ1 rn + λ2 n rn
3. Si l’équation caractéristique ne possède pas de solution dans IR, alors, en notant r = ρ eiθ l’une de ses deux solutions complexes conjuguées, les suites réelles vérifiant la relation (⋆ ) sont les suites de terme général : ρn λ1 cos(nθ) + λ2 sin(nθ) avec (λ1 , λ2 ) ∈ IR2 .
Démonstration page 356
Principe de démonstration.
Dans chacun des cas, les suites réelles vérifiant la relation ( ⋆ ) sont à chercher parmi les suites complexes vérifiant cette relation (que l’on connaît grâce à la proposition 54).
Ex. 55. Considérons la suite u définie par u0 = 0 et u1 = 1 , ainsi que la relation de récurrence : un+2 = un+1 + un .
∀n ∈ IN
L’équation caractéristique r 2 − r − 1 = 0 a pour solutions (distinctes) : √ 1+ 5 2
et
√ 1− 5 · 2
Il existe donc (λ1 , λ2 ) ∈ IR2 tel que : ∀n ∈ IN
un = λ1
u0 = 0 u1 = 1
∀n ∈ IN
un =
La résolution du système
√ n √ n 1+ 5 1− 5 + λ2 · 2 2
nous donne λ1 =
√
√ √ n √ √ n 5 1+ 5 5 1− 5 − . 5 2 5 2
Cette suite est connue sous le nom de suite de Fibonacci.
340
√ 5 5 et λ2 = − · Par suite : 5 5
VIII Étude de suites, suites récurrentes Ex. 56. Soit θ ∈ ]0, π[ et la suite u définie par u0 = 0 , u1 = 1 et : ∀n ∈ IN
un+2 = 2 cos θun+1 − un .
L’équation caractéristique r 2 − 2r cos θ + 1 = 0 a pour discriminant −4 sin2 θ < 0 donc admet deux solutions complexes conjuguées distinctes eiθ et e−iθ . Il existe donc (λ1 , λ2 ) ∈ IR2 tel que : ∀n ∈ IN un = λ1 cos(nθ) + λ2 sin(nθ). La résolution du système
u0 = 0 u1 = 1
nous donne λ1 = 0 et λ2 =
∀n ∈ IN
3
un =
1 · Par suite : sin θ
sin(nθ) · sin θ
Suites récurrentes réelles un+1 = f (un)
Dans tout ce qui suit, I est un intervalle d’intérieur non vide de IR. Une suite réelle (un )n∈IN est dite récurrente d’ordre 1 (associée à f ) si elle vérifie une relation de récurrence de la forme : un+1 = f (un ), où f est une fonction réelle d’une variable réelle. Nous avons vu qu’étant donnée f : I → IR et a ∈ I , il n’existe pas nécessairement de suite (un )n∈IN vérifiant u0 = a et un+1 = f (un ) pour tout n ∈ IN (voir page 336). Cela étant, nous disposons de la proposition suivante, qui se déduit immédiatement du théorème 51 de la page 337. Proposition 56 Soit f : I → IR une fonction, et J ⊂ I un intervalle stable par f , c’est-à-dire vérifiant : ∀x ∈ J f (x) ∈ J. Si a ∈ J , alors il existe une unique suite (un )n∈IN vérifiant : u0 = a
et
∀n ∈ IN un+1 = f (un ).
Point méthode Pour démontrer l’existence et l’unicité d’une suite récurrente d’ordre 1 , il convient de trouver un intervalle stable par f contenant le premier terme de la suite. Ex. 57. Justifions l’existence et l’unicité d’une suite (un )n∈IN vérifiant : u0 = 2
et
∀n ∈ IN
un+1 = ln(1 + un ).
D’après le point méthode, il suffit de trouver un intervalle contenant 2 et stable par la fonction f : x �→ ln(1 + x) . On constate que l’ensemble IR+ convient ; en effet : • on a 2 ∈ IR+ ; • pour tout x ∈ IR+ , on a 1 + x 1 , donc ln(1 + x) 0 ; donc f est à valeurs dans IR+ .
341
Chapitre 9. Nombres réels, suites numériques Remarques • Si u est une suite vérifiant une relation un+1 = f (un ), on a alors pour tout n ∈ IN : un = (f ◦ · · · ◦ f )(u0 ). n fois
• Les suites (u2n )n∈IN et (u2n+1 )n∈IN sont encore des suites récurrentes d’ordre 1 , mais associées à la fonction f ◦ f .
• En revanche, une suite extraite quelconque d’une suite récurrente d’ordre 1 n’est pas en général une suite récurrente d’ordre 1 . Cas où la fonction f est croissante Soit f : I → I une fonction croissante et u une suite vérifiant u0 ∈ I ∀n ∈ IN un+1 = f (un ). Deux cas se présentent. • Si u1 u0 , alors la croissance de f permet de montrer par récurrence : ∀n ∈ IN
un+1 un .
La suite u est donc croissante.
• Si u1 u0 , un raisonnement analogue montre que la suite u est décroissante. En particulier, si u0 = u1 , la suite est à la fois croissante et décroissante, donc constante. Remarque Si f est en plus strictement croissante et si u0 �= u1 , alors la suite u est strictement monotone. Ex. 58. Reprenons la suite (un )n∈IN définie par u0 = 2 et un+1 = ln(1+un ) pour tout n ∈ IN . Puisque la fonction f : x �→ ln(1 + x) est croissante sur IR+ , la suite est monotone. Comme u1 = ln 2 < 2 = u0 , on peut conclure à la décroissance de la suite u .
Remarque Lorsque la fonction f est décroissante, on peut établir la monotonie des suites extraites (u2n )n∈IN et (u2n+1 )n∈IN . Ex. 59. Soit f : I → I une fonction décroissante et a ∈ I . On considère la suite (un )n∈IN définie par : u0 = a et ∀n ∈ IN un+1 = f (un ). Montrons que les deux sous-suites (u2n )n∈IN et (u2n+1 )n∈IN sont monotones, de sens de monotonie opposés. Comme il a été remarqué page 342, les suites (u2n )n∈IN et (u2n+1 )n∈IN sont des suites récurrentes d’ordre 1 associées à la fonction g = f ◦ f . Puisque f : I → I est décroissante, la fonction g est croissante. D’après l’étude faite page 342, toute suite récurrente d’ordre 1 associée à g est monotone. Il en découle que les suites (u2n )n∈IN et (u2n+1 )n∈IN sont monotones. On a enfin ∀n ∈ IN u2n+1 = f (u2n ) donc comme f décroît, les suites sont de sens de monotonie opposés.
342
VIII Étude de suites, suites récurrentes Étude du signe de f (x) − x Considérons une suite récurrente u d’ordre 1 , associée à une fonction f : I → I . Pour étudier la monotonie éventuelle de u , on peut étudier le signe de g : x �→ f (x) − x. Si g est positive sur une partie J ⊂ I , stable par f et contenant u0 , alors on montre directement que un+1 un pour tout n ∈ IN, i.e. la suite u est croissante. On adapte naturellement lorsque g est à valeurs négatives, pour montrer que u est décroissante. Ex. 60. Considérons une suite u vérifiant u0 ∈ IR et : ∀n ∈ IN un+1 = un sin2 (un ) .
Pour tout x ∈ IR , posons f (x) = x sin2 (x) et g(x) = f (x) − x = −x cos2 (x) . Distinguons deux cas. • Cas u0 ∈ IR+ . Il est clair que IR+ est stable par f . Par ailleurs, g(x) 0 pour tout x ∈ IR+ . Par suite, u est positive et décroissante donc convergente. • Cas u0 ∈ IR− . De même IR− est stable par f et g(x) 0 pour tout x ∈ IR− ; la suite u est négative et croissante donc convergente.
Construction graphique Disposant du graphe de la fonction f ainsi que du premier terme u0 reporté sur l’axe des abscisses, c’est-à-dire le point de coordonnées (u0 , 0), il est possible de construire graphiquement les différents termes de la suite (un )n∈IN . Pour construire par exemple le point (u1 , 0), on peut procéder ainsi : • on construit le point (u0 , u1 ) = u0 , f (u0 ) , comme intersection de la droite d’équation x = u0 avec la courbe de f ; • on construit le point (u1 , u1 ), comme intersection de la droite d’équation y = u1 avec la première bissectrice ; • le point (u1 , 0) s’obtient alors comme intersection de la droite d’équation x = u1 avec l’axe des abscisses. En réitérant le processus, on peut construire le point (u2 , 0), etc. Ex. 61. Si l’on met en œuvre ce qui précède dans le cas de la suite définie par : 1 10 on obtient la construction suivante : u0 =
et
∀n ∈ IN
un+1 =
un ,
y=x y=
1
0
√
u0
u1
u2
√
x
u3 u4 1
Une telle construction est souvent utile car elle permet de prédire le comportement de la suite (en particulier, ses propriétés de monotonie et de convergence). Évidemment, un dessin n’étant pas une preuve, il reste alors à prouver ce que l’on a observé. 343
Chapitre 9. Nombres réels, suites numériques
378
Convergence des suites récurrentes La proposition suivante donne des informations sur la limite finie éventuelle d’une suite récurrente d’ordre 1 . Il sera démontré au chapitre 10. Proposition 57 Soit f : I → I une fonction et u une suite vérifiant
u0 ∈ I ∀n ∈ IN
un+1 = f (un ).
Si u est convergente vers ℓ ∈ I et si f est continue en ℓ , alors ℓ est un point fixe de f , c’est-à-dire f (ℓ) = ℓ . Remarque Si l’on a étudié le signe de g : x �→ f (x)−x, on a déterminé en particulier les points fixes de f . Ex. 62. Reprenons à nouveau la suite u définie par u0 = 2 et ∀n ∈ IN un+1 = ln(1 + un ) (voir les exemples 57 et 58). Nous savons que u est strictement décroissante, à valeurs dans I = IR+ , donc minorée. Par le théorème de limite monotone, elle est convergente ; notons ℓ sa limite. Puisque I est un intervalle fermé, ℓ ∈ I et comme f : x �→ ln(1 + x) définie sur I est continue, la limite ℓ est un point fixe de f . Il reste à déterminer les points fixes de f . Pour cela étudions g : x �→ f (x)−x . Par les théorèmes généraux, la fonction g est dérivable sur I et : x · ∀x ∈ I g ′ (x) = − 1+x On en déduit le tableau de variations de g : x
0
g (x)
0 0
′
+∞ −
g Il vient du tableau que l’unique zéro de g , donc l’unique point fixe de f , est 0 . En conclusion, on a un −→ 0 . n→+∞
Remarque Si I n’est pas un intervalle fermé, la suite (un )n∈IN peut converger sans que sa limite soit dans I . 1 · un La fonction f est bien définie et I est stable
Ex. 63. Soit a > 0 et u la suite vérifiant u0 = a et : ∀n ∈ IN un+1 = un + Posons I = IR∗+ et f :
I −→ IR x �−→ x + 1/x. par f . Puisque a ∈ I , la suite u est définie, à valeurs dans I . Pour tout x ∈ I , on a f (x) − x = x1 > 0 . Il s’ensuit que u est strictement croissante et que f n’a pas de point fixe. D’après le théorème de limite monotone, u admet une limite ℓ finie ou +∞ . Si u converge vers ℓ , par croissance de la suite u , on a l’inégalité ℓ u0 > 0 qui montre que ℓ ∈ I ; par continuité de f , ℓ est un point fixe de f : absurde. En conclusion, u diverge vers +∞ .
344
Démonstrations
Démonstrations Proposition 4
Tout intervalle I vérifie évidemment la propriété : ∀x ∈ I
[x, y] ⊂ I.
∀y ∈ I
(⋆)
Montrons la réciproque. Donnons-nous une partie I de IR vérifiant la propriété ( ⋆ ). Si I est vide, alors c’est, par définition, un intervalle. Supposons donc I non vide et définissons a et b de la manière suivante : a=
inf I −∞
si I est minoré sinon
b=
et
sup I +∞
si I est majoré sinon.
Montrons les résultats résumés dans le tableau ci-dessous :
• •
b∈I
b ∈ IR \ I
b = +∞
a∈I
I = [a, b]
I = [a, b[
I = [a, +∞[
a ∈ IR \ I
I = ]a, b]
I = ]a, b[
I = ]a, +∞[
a = −∞
I = ]−∞, b]
I = ]−∞, b[
I = ]−∞, +∞[
Par définition de a et b , on obtient facilement que, dans chaque cas, l’ensemble I est inclus dans l’intervalle indiqué. Pour conclure, il suffit de montrer l’inclusion ]a, b[ ⊂ I puisqu’alors on aura : I = ]a, b[ ,
I = ]a, b] ,
I = [a, b[
ou
I = [a, b] ,
en fonction de l’appartenance de a et b à I . Soit z ∈ ]a, b[ . Montrons que z ∈ I . Le réel z n’est pas un majorant de I , car : ∗ si b = +∞ , alors I n’est tout simplement pas majoré ; ∗ si b ∈ IR , alors, comme b est la borne supérieure de I (et donc le plus petit de ses majorants), l’inégalité z < b assure que z ne majore pas I . On peut donc trouver y ∈ I tel que z < y . De même, on montre que z n’est pas un minorant de I , donc on peut trouver x ∈ I tel que x < z . On a ainsi z ∈ [x, y] . Or, d’après la propriété (⋆) , comme x ∈ I et y ∈ I , on a [x, y] ⊂ I . On en déduit que z ∈ I . Lemme 5
Raisonnons par l’absurde en supposant pouvoir trouver (x, y) ∈ IR∗+ × IR tel que : ∀n ∈ IN
n x < y.
L’ensemble A = {nx | n ∈ IN} est alors une partie non vide et majorée de IR , qui possède donc une borne supérieure, que l’on note a . On a alors : ∀n ∈ IN
n x a.
(⋆)
Pour n ∈ IN , la propriété (⋆) appliquée avec n + 1 nous donne (n + 1)x a , autrement dit nx a − x . Il en résulte que a − x est un majorant de A . Comme a − x < a , ceci contredit le fait que a est le plus petit des majorants de A . D’où le résultat. Proposition 6 • Unicité. Soit n1 et n2 deux entiers relatifs vérifiant : n1 x < n1 + 1
et
n2 x < n2 + 1.
x − 1 < n1 x
et
x − 1 < n2 x,
On a alors :
345
Chapitre 9. Nombres réels, suites numériques ou encore : et − x −n2 < 1 − x. x − 1 < n1 x En sommant ces deux encadrements, on obtient : −1 < n1 − n2 < 1.
•
Comme n1 et n2 sont des entiers, cela donne n1 − n2 = 0 , c’est-à-dire n1 = n2 . Existence. Notons A = {k ∈ ZZ : k x} .
∗
∗
Montrons que A est une partie non vide et majorée dans ZZ . Supposons d’abord x positif. Alors 0 ∈ A , donc A n’est pas vide. D’après la propriété d’Archimède (cf.lemme 5 de la page 312), il existe un entier n tel que n × 1 x (car 1 > 0 ). Il s’ensuit que n est un majorant de A . Si x est négatif, en appliquant le cas ci-dessus à |x| , il existe un entier n tel que |x| n . Pour un tel entier, on a −n x , ce qui montre que A est non vide. Il est immédiat que 0 est un majorant de A . Par propriété de la relation d’ordre sur ZZ , la partie A , qui est non vide et majorée, a un plus grand élément (voir page 5). Notons n = max A . On a n x (car n ∈ A ) et, comme n + 1 > n , on a n + 1 ∈ / A , i.e. x < n + 1 . Autrement dit, n vérifie la condition souhaitée.
Proposition 7
Par définition de la partie entière, on a : ⌊10n x⌋ 10n x < ⌊10n x⌋ + 1.
Il suffit alors de diviser cet encadrement par le réel strictement positif 10n : ⌊10n x⌋ 1 ⌊10n x⌋ x < + n· 10n 10n 10 Proposition 8 (i) ⇒ (ii) . Supposons que (i) soit vraie, et montrons (ii) . Soit a et b deux réels distincts. Quitte à échanger a et b , on peut supposer a < b . Il est clair qu’en appliquant la propriété (i) avec : b−a b−a 2
2
b−a a+b et ε = , a 2 2 a+b b 2 on obtient qu’il existe au moins un élément de A dans l’intervalle [a, b] . (ii) ⇒ (i) . Supposons que (ii) soit vraie, et montrons (i) . Soit x ∈ IR et ε > 0 . En appliquant la propriété (ii) avec a = x − ε et b = x + ε , on peut affirmer qu’il existe au moins un élément de A dans l’intervalle [x − ε, x + ε] . x=
Théorème 9 • Densité de D I dans IR . Soit x ∈ IR et ε > 0 . Montrons qu’il existe au moins un nombre décimal dans l’intervalle [x − ε, x + ε] . Pour cela, donnons-nous n ∈ IN tel que 10n
• •
1 ε
(un tel entier n existe d’après l’exemple 5 de
la page 312). Considérons rn l’approximation décimale par défaut de x à la précision 10−n . On a alors |rn − x| 10−n ε , et donc rn ∈ [x − ε, x + ε] . D’où le résultat. I dans IR et du fait Densité de Q dans IR . Elle découle immédiatement de la densité de D I . que Q contient D Densité de IR \ Q dans IR . Soit deux réels x et y tels que x < y . Comme Q est dense √ √ dans IR , on peut trouver un nombre rationnel r appartenant à l’intervalle [x − 2, y − 2] . √ √ √ Le nombre r + 2 est alors irrationnel, sinon on aurait 2 = (r + 2) − r ∈ Q , et il appartient à [x, y] .
346
Démonstrations Proposition 10 Nous traitons le cas croissant. Le cas strictement croissant se démontre en remplaçant les inégalités larges par des inégalités strictes. • (i) ⇒ (ii) . Soit n ∈ IN . Puisque u est croissante et n n + 1 , on a un un+1 . •
(ii) ⇒ (i) . Soit (un )n∈IN une suite telle que : ∀n ∈ IN un un+1 . Soit p ∈ IN . On montre par récurrence immédiate sur q p la propriété Hq : « up uq ». Cela montre que l’application n �→ un est croissante sur IN .
Soit (un )n∈IN une suite tendant vers ℓ1 et vers ℓ2 . Montrons que ℓ1 = ℓ2 . |ℓ1 − ℓ2 | > 0. Raisonnons par l’absurde en supposant que ℓ1 �= ℓ2 ; posons ε = 3 D’après la définition 4 de la page 317, on peut trouver deux rangs n1 et n2 tels que :
Proposition 11
∀n n1
et
|un − ℓ1 | ε
∀n n2
Posons alors n = max{n1 , n2 } . D’après ce qui précède, on a :
|un − ℓ2 | ε.
|ℓ1 − ℓ2 | = (ℓ1 − un ) + (un − ℓ2 ) |ℓ1 − un | + |un − ℓ2 | 2ε.
Avec la définition de ε , il en résulte que :
2 |ℓ1 − ℓ2 |, 3 ce qui, comme |ℓ1 − ℓ2 | > 0 , mène à une contradiction. |ℓ1 − ℓ2 |
Proposition 12 Notons n1 ∈ IN un rang tel que ∀n n1 |un − ℓ| vn . Soit ε > 0 . Comme la suite v tend vers 0 , on peut trouver un rang n2 ∈ IN tel que : ∀n ∈ IN
n n2 =⇒ |vn | ε.
Notons alors n0 = max(n1 , n2 ) . Pour n ∈ IN tel que n n0 , on a |un − ℓ| vn ε , ce qui montre que un → ℓ .
Proposition 14 Soit u une suite convergeant vers un réel ℓ . La définition de la convergence, appliquée par exemple avec ε = 1 , nous permet de fixer un rang n0 ∈ IN tel que : ∀n ∈ IN
n n0 =⇒ ℓ − 1 un ℓ + 1.
On constate alors que la suite u est majorée par le réel M = max{u0 , . . . , un0 −1 , ℓ + 1} et minorée par le réel m = min{u0 , . . . , un0 −1 , ℓ − 1} . Ainsi u est bornée.
Proposition 15 Soit (un )n∈IN une suite qui converge vers ℓ > m . Il s’agit de montrer qu’il existe un rang n0 ∈ IN tel que ∀n ∈ IN n n0 =⇒ un m . Comme ℓ−m > 0 , on peut appliquer la définition de la convergence de u vers ℓ avec ε = ℓ−m . On trouve alors un rang n0 ∈ IN tel que : ∀n n0
|un − ℓ| ℓ − m.
Pour n n0 , on a alors m − ℓ un − ℓ ℓ − m , ce qui donne en particulier un m . Proposition 18 •
Soit u une suite telle que lim u = ℓ et v = uϕ(n)
n∈IN
une sous-suite de u .
Supposons ℓ ∈ IR , et montrons que v converge vers ℓ , ce qui s’écrit : ∀ε > 0
∃n0 ∈ IN
∀n n0
|vn − ℓ| ε.
Soit ε > 0 . Comme u converge vers ℓ , on peut trouver un rang n0 ∈ IN tel que : ∀n n0
|un − ℓ| ε.
Pour n n0 , on a ϕ(n) n n0 (cf. remarque de la page 317), et donc : |vn − ℓ| = |uϕ(n) − ℓ| ε.
D’où la convergence de la suite v vers ℓ .
347
Chapitre 9. Nombres réels, suites numériques •
Supposons ℓ = +∞ et montrons que v diverge vers +∞ , ce qui s’écrit : ∀A ∈ IR
∃n0 ∈ IN
n n0 =⇒ vn A.
∀n ∈ IN
Soit A ∈ IR . Comme u diverge vers +∞ , on peut trouver un rang n0 ∈ IN tel que : ∀n n0
un A.
Pour n n0 , on a ϕ(n) n n0 (cf. remarque de la page 317), et donc : vn = uϕ(n) A. •
Cela montre la divergence de la suite v vers +∞ . Le cas ℓ = −∞ se traite en appliquant le résultat précédent à la suite −u .
Proposition 19
Supposons que les deux sous-suites
u2n
n∈IN
et
u2n+1
n∈IN
tendent vers une
même limite ℓ , et montrons que u tend également vers ℓ . • Supposons ℓ ∈ IR . Soit ε > 0 . Par convergence vers ℓ des deux sous-suites considérées, on peut trouver deux rangs n1 et n2 tels que : ∀p n1
|u2p − ℓ| ε
et
∀p n2
|u2p+1 − ℓ| ε.
(⋆)
En posant n0 = max(2n1 , 2n2 + 1) , alors tout entier n n0 est : ∗ soit pair de la forme n = 2p avec p n1 ; ∗ soit impair de la forme n = 2p + 1 avec p n2 ; dans chaque cas, d’après (⋆) , on a |un − ℓ| ε . Cela prouve la convergence de u vers ℓ . •
Supposons ℓ = +∞ . Soit A ∈ IR . Comme u2n on peut trouver deux rangs n1 et n2 tels que : ∀p n1
u2p A
et
et u2n+1
n∈IN
∀p n2
n∈IN
divergent vers +∞ ,
u2p+1 A.
Comme dans le cas précédent, en posant n0 = max(2n1 , 2n2 + 1) , on a : ∀n n0
•
un A,
ce qui prouve la divergence de u vers +∞ . Le cas ℓ = −∞ se traite en appliquant le résultat précédent à la suite −u .
Proposition 21 Étant donné une suite u bornée et une suite v tendant vers 0 , prouvons que u v tend vers 0 . Nous souhaitons donc montrer que : ∀ε > 0
∃n0 ∈ IN
∀n n0
|un vn | ε.
Soit ε > 0 . La suite u étant bornée, on peut trouver un réel M > 0 tel que : ∀n ∈ IN Étant donné que la suite v tend vers 0 et que un rang n0 tel que :
|un | M. ε M
est un réel strictement positif, on peut trouver
ε · M Pour tout n n0 , on a alors |un vn | ε , ce qui montre que la suite u v converge vers 0 . ∀n n0
Lemme 22
|vn |
Soit u et v deux suites qui convergent vers 0 . Montrons que u+v converge vers 0 , i.e. : ∀ε > 0
∃n0 ∈ IN
∀n ∈ IN
n n0 =⇒ |un + vn | ε.
Soit ε > 0 . Comme ε2 > 0 et comme les suites u et v tendent vers 0 , on peut trouver deux rangs n1 ∈ IN et n2 ∈ IN tels que : ε ε et ∀n ∈ IN n n2 =⇒ |vn | · ∀n ∈ IN n n1 =⇒ |un | 2 2
348
Démonstrations En posant n0 = max(n1 , n2 ) , et en utilisant l’inégalité triangulaire, on a, pour n n0 : ε ε |un + vn | |un | + |vn | + = ε, 2 2 d’où le résultat. Proposition 23 • Montrer que la suite λ u + µ v tend vers λ ℓ1 + µ ℓ2 revient à montrer que la suite de terme général (λ un + µ vn ) − (λ ℓ1 + µ ℓ2 ) tend vers 0 . Pour n ∈ IN , on a : (λ un + µ vn ) − (λ ℓ1 + µ ℓ2 ) = λ (un − ℓ1 ) + µ (vn − ℓ2 ).
•
Les suites (un − ℓ1 )n∈IN et (vn − ℓ2 )n∈IN tendent vers 0 , donc, d’après la proposition 21 de la page 323 (où λ et µ sont vues comme des suites constantes donc bornées), les suites de termes généraux λ (un − ℓ1 ) et µ (vn − ℓ2 ) tendent aussi vers 0 . Le lemme 22 de la page 323 permet alors de conclure. Pour n ∈ IN , on peut écrire : un vn − ℓ1 ℓ2 = un (vn − ℓ2 ) + ℓ2 (un − ℓ1 ).
(⋆)
La suite u est bornée car convergente, et la suite de terme général vn − ℓ2 tend vers 0 , donc, d’après la proposition 21 de la page 323, on a un (vn − ℓ2 ) → 0 . ∗ De même, on a ℓ2 (un − ℓ1 ) → 0 . Le lemme 22 de la page 323 permet alors d’affirmer que :
∗
un (vn − ℓ2 ) + ℓ2 (un − ℓ1 ) → 0 ;
autrement dit, d’après la relation (⋆) , on a un vn → ℓ1 ℓ2 .
Lemme 24 1. Soit A ∈ IR . Comme v est minorée, on peut trouver m ∈ IR tel que ∀n ∈ IN vn m . La suite u tendant vers +∞ , on peut trouver un rang n0 tel que ∀n n0 un A − m . Pour n ∈ IN tel que n n0 , on a alors un + vn A . Cela prouve que un + vn → +∞ . 2. Soit A ∈ IR+ . Comme v est minorée à partir d’un certain rang par un nombre strictement positif, on peut trouver un réel m > 0 et un rang n1 ∈ IN tels que : ∀n n1
vn m.
∀n n2
un
La suite u tendant vers +∞ , on peut trouver un rang n2 ∈ IN tel que : A · m
Pour n ∈ IN tel que n max(n1 , n2 ) , on a alors : vn m 0
et
un
A 0, m
et donc un vn A . Cela prouve que un vn → +∞ .
Proposition 25 • Si ℓ1 et ℓ2 sont réels, alors les résultats découlent de la proposition 23 de la page 323. • Pour la somme. ∗ Si ℓ1 = +∞ et ℓ2 �= −∞ , alors soit v est convergente donc bornée, soit elle tend vers +∞ et alors elle est minorée (cf. exemple 27 de la page 321). Dans les deux cas, on a la somme d’une suite tendant vers +∞ et d’une suite minorée, somme qui tend donc vers +∞ , c’est-à-dire vers ℓ1 + ℓ2 (d’après le lemme 24 de la page 324). ∗ Le cas ℓ1 = −∞ et ℓ2 �= +∞ s’obtient alors en appliquant ce qui précède aux suites −u et −v . On obtient en effet que la suite −(u + v) diverge vers +∞ , et donc que u + v diverge vers −∞ , c’est-à-dire vers ℓ1 + ℓ2 .
349
Chapitre 9. Nombres réels, suites numériques •
Pour le produit. ∗ Si ℓ1 = +∞ alors pour ℓ2 ∈ IR∗+ , la suite v est minorée à partir d’un certain rang par un réel strictement positif (d’après le corollaire 16 de la page 320) et pour ℓ2 = +∞ la définition nous dit que v est minorée à partir d’un certain rang par 1 (par exemple). Dans les deux cas, le lemme 24 de la page 324 permet d’affirmer que lim(u v) = +∞ . ∗ Les autres cas s’obtiennent de la même manière.
Proposition 26 Soit u une suite convergeant vers une limite ℓ �= 0 . D’après le corollaire 17 de la page 320, on peut trouver un entier n0 et un réel m > 0 tels que :
La suite
1 un
∀n n0
|un | m.
est alors bien définie, et pour n n0 on peut écrire :
nn0
1 |un − ℓ| 1 − = un
ℓ
|ℓ| |un |
Par opération sur les limites finies, la suite
1 |un − ℓ|. |ℓ|m
1 |un − ℓ| |ℓ|m
On en déduit (cf. proposition 12 de la page 319) que
1 un
converge vers 0 .
n∈IN
converge vers
nn0
1 · ℓ
Proposition 27 • Comme u diverge vers +∞ , on peut trouver n0 ∈ IN tel que ∀n n0
un 1 . Donc, à 1 partir du rang n0 , tous les termes de la suite sont strictement positifs. La suite un nn 0
•
est donc bien définie. Soit ε > 0 . Comme u diverge vers +∞ , on peut trouver n1 n0 tel que : ∀n n1 Pour n n1 , on a alors 0 suite
1 un
Proposition 28
un
1 · ε
converge vers 0 .
nn0
1 1 ε , ce qui donne ε . Cela montre que la un un
Montrons que la suite 1/u diverge vers +∞ , autrement dit : ∀A ∈ IR∗+ 1 A
Soit A > 0 . Comme le réel un entier n1 ∈ IN tel que :
∃n2 ∈ IN
∀n n2
1 A. un
est strictement positif et que u converge vers 0 , on peut trouver ∀n n1
|un |
1 · A
Posons n2 = max(n0 , n1 ) . Pour n n2 on a alors 0 < un D’où la divergence de
1 un
nn0
1 A
, ce qui donne
1 un
A.
vers +∞ .
Proposition 30 Si ℓ = lim u était strictement négatif, la suite serait strictement négative à partir d’un certain rang (c’est immédiat par définition si ℓ = −∞ et cela découle du corollaire 16 de la page 320 si ℓ ∈ IR ). C’est contradictoire avec l’hypothèse de positivité à partir d’un certain rang.
350
Démonstrations Théorème 32 • •
D’après les hypothèses on a, à partir d’un certain rang : 0 vn − un wn − un .
Puisque lim(w −u) = 0 , la proposition 12 de la page 319 permet d’affirmer que la suite v −u converge vers 0 . Comme v = u + (v − u) , on en déduit, par opérations sur les limites, que v converge et que lim v = lim u .
Théorème 34 1. Supposons la suite u majorée. Alors l’ensemble {un | n ∈ IN} est non vide et majoré. Il possède donc une borne supérieure ℓ . Montrons que u converge vers ℓ , c’est-à-dire : ∀ε > 0
2.
∃n0 ∈ IN
∀n n0
ℓ − ε un ℓ + ε.
Soit ε > 0 . D’après la caractérisation de la borne supérieure (cf. proposition 3 de la page 311), on peut trouver n0 ∈ IN tel que ℓ − ε < un0 ℓ . Comme u est croissante et majorée par ℓ , on a alors : ∀n n0 ℓ − ε un0 un ℓ ℓ + ε, ce qui termine la démonstration. Supposons u non majorée et montrons qu’elle tend vers +∞ . Soit M un réel quelconque. Il ne majore pas la suite u , donc on peut trouver un entier n0 tel que M un0 . Par croissance de la suite u , on a alors : ce qui prouve que lim u = +∞ .
∀n n0
M un0 un ,
Théorème 36 Soit u et v des suites adjacentes. Supposons u croissante et v décroissante. Comme u est croissante et v décroissante, la suite u − v est croissante. Comme de plus elle tend vers 0 , elle est à valeurs négatives, ce qui donne : • •
∀n ∈ IN
un vn .
On en déduit que la suite u est majorée par v0 puisque ∀n ∈ IN un vn v0 . Comme u est croissante, le théorème de limite monotone assure alors qu’elle converge.
Enfin, l’écriture v = u + (v − u) permet de prouver que v converge et nous donne : lim v = lim u + lim(v − u) .
D’où le résultat. Théorème 37
=0
Si I = [a, b] est un segment, on notera ℓ(I) = b − a sa longueur.
Toujours si I = [a, b] est un segment, notant c = a+b le milieu de I , on pose g(I) = [a, c] 2 (« la moitié gauche de I ») et d(I) = [c, d] (« la moitié droite de I »).
a
Il est clair que : • g(I) ⊂ I et d(I) ⊂ I ;
•
I
g(I)
c
d(I)
b
on a ℓ g(I) = ℓ d(I) = ℓ(I)/2 . En effet :
ℓ g(I) = c − a =
De même pour ℓ d(I) .
ℓ(I) b−a a+b −a = = · 2 2 2
351
Chapitre 9. Nombres réels, suites numériques Soit u une suite bornée. Désignons par m un minorant de la suite, et par M un majorant. • Construisons par récurrence une suite de segments In = [an , bn ] tels que, pour tout n , le segment In contienne une infinité de termes de la suite (c’est-à-dire plus précisément, que l’ensemble {k ∈ IN : uk ∈ In } soit infini) et In+1 = g(In ) ou In+1 = d(In ) . ∗ Pour cela on commence par poser I0 = [m, M ] . Le segment I0 vérifie bien la propriété souhaitée, car il contient tous les termes de la suite. ∗ Pour n ∈ IN , supposons construit un segment In = [an , bn ] contenant une infinité de termes de la suite. Posons alors : In+1 =
•
g(In ) d(In )
si g(In ) contient une infinité de termes de u ; sinon.
Puisque In = g(In ) ∪ d(In ) et In contient une infinité de termes de u , au moins l’un des segments g(In ) ou d(In ) contient une infinité de termes de u . Il s’ensuit que In+1 contient une infinité de termes de u . Remarquons que l’on a In+1 ⊂ In pour tout n ∈ IN , car In+1 = g(In ) ou In+1 = d(In ) . Notons In = [an , bn ] et montrons que les suites (an )n∈IN et (bn )n∈IN sont adjacentes. ∗ Soit n ∈ IN . Puisque In+1 ⊂ In , on a an an+1 et bn+1 bn . La suite a est donc croissante et la suite b décroissante. ∗ Soit n ∈ IN . Puisque ℓ g(In ) = ℓ d(In ) = ℓ(In )/2 , on a ℓ(In+1 ) = ℓ(In )/2 . Par une récurrence immédiate, pour n ∈ IN , on a ℓ(In ) = ℓ(I0 )/2n , c’est-à-dire : ∀n ∈ IN
•
bn − a n =
b0 − a 0 2n
−→ 0.
n→+∞
Cela prouve que les suites (an )n∈IN et (bn )n∈IN sont adjacentes. Notons λ la limite commune. Construisons par récurrence une application ϕ : IN → IN strictement croissante telle que : ∀n ∈ IN
∗ ∗
uϕ(n) ∈ In .
On pose ϕ(0) = 0 . On a évidemment uϕ(0) ∈ I0 . Pour n ∈ IN , supposons avoir défini ϕ(0), ϕ(1), . . . , ϕ(n − 1) vérifiant : ϕ(0) < ϕ(1) < · · · < ϕ(n − 1)
et
∀p ∈ [[0, n − 1]]
uϕ(p) ∈ Ip .
Comme l’ensemble {k ∈ IN : uk ∈ In } est infini, il n’est pas majoré et donc contient des éléments strictement supérieurs à ϕ(n − 1) . Choisissons l’un de ces éléments comme valeur de ϕ(n) . On a alors : ϕ(0) < ϕ(1) < · · · < ϕ(n − 1) < ϕ(n)
et
∀p ∈ [[0, n]]
uϕ(p) ∈ Ip .
On a ainsi défini une application ϕ strictement croissante de IN dans IN vérifiant : ∀n ∈ IN
uϕ(n) ∈ In .
Ainsi, par définition de la suite (In )n∈IN , on a : ∀n ∈ IN
an uϕ(n) bn .
Comme les suites (an )n∈IN et (bn )n∈IN ont même limite λ , on obtient uϕ(n) −→ λ par n→+∞
encadrement. Proposition 38 • Supposons que pour tout x ∈ IR on puisse trouver une suite d’éléments de A qui converge vers x , et montrons que A est dense dans IR . Pour cela, donnons-nous x ∈ IR et ε > 0 , et montrons qu’il existe au moins un élément de A tel que |x − a| ε . Par hypothèse, on peut considérer (un )n∈IN une suite d’éléments de A qui converge vers x . Alors, à partir d’un certain rang n0 , on a |un − x| ε . L’élément un0 ∈ A convient.
352
Démonstrations •
Réciproquement, supposons que A soit dense dans IR . Donnons-nous x ∈ IR , et montrons qu’il existe une suite d’éléments de A qui converge vers x . Pour tout n ∈ IN∗ , la densité de A dans IR nous assure qu’on peut trouver au moins un 1 élément a de A vérifiant |a − x| , ce qui nous permet de choisir un tel élément et de n l’appeler un . On construit ainsi une suite (un )n1 d’éléments de A qui vérifie : ∀n ∈ IN∗
|un − x|
1 · n
Donc la suite u converge vers x . Proposition 39 (i) ⇒ (ii) Supposons que s majore A et qu’il existe une suite (un )n∈IN d’éléments de A qui converge vers s . Montrons que s = sup A . Pour cela, utilisons la caractérisation donnée à la proposition 3 de la page 311 : donnons-nous ε > 0 et montrons qu’il existe a ∈ A vérifiant s − ε < a . Par convergence de la suite u vers s , on a, pour n assez grand, |un − s| 2ε · On a alors s − ε < s − 2ε un , ce qui, comme un ∈ A , montre le résultat. (ii) ⇒ (i) Réciproquement, supposons que s = sup A . Alors s est un majorant de A . Montrons qu’il existe une suite d’éléments de A qui converge vers s . Pour tout n ∈ IN∗ , le fait que s = sup A nous permet de trouver au moins un élément a 1 de A vérifiant s − a s , et donc d’en choisir un, que l’on note un . n On construit ainsi une suite (un )n1 d’éléments de A telle que, pour tout n ∈ IN∗ , 1 1 on a s − un s , ce qui donne |un − s| · n n La suite (un )n1 converge donc vers s par théorème d’encadrement.
Proposition 43 • L’implication (i) ⇒ (ii) est une conséquence des inégalités : 0 |Re un − Re λ| |un − λ|
et
0 |Im un − Imλ| |un − λ|
et du théorème de convergence par encadrement (théorème 32 de la page 327). •
L’implication (ii) ⇒ (i) est une conséquence de l’inégalité :
|un − λ| |Re un − Re λ| + |Im un − Im λ| .
En effet, si l’on suppose (ii) , alors l’inégalité précédente donne, par théorème d’encadrement, que |un − λ| → 0 , ce qui permet d’affirmer que un → λ . Proposition 47
Soit u une suite tendant vers λ et v = uϕ(n)
n∈IN
une sous-suite de u .
La suite réelle |v − λ| = uϕ(n) − λ n∈IN est une suite extraite de la suite (|un − λ|)n∈IN qui
est à valeurs réelles et converge vers 0 ; elle converge donc vers 0 .
Donc la suite uϕ(n)
n∈IN
est convergente et sa limite est égale à λ .
Théorème 48 Soit u une suite complexe bornée. La suite Re u est bornée, donc on peut trouver une fonction ϕ : IN → IN strictement croissante et telle que la suite Re uϕ(n) n∈IN soit convergente.
La suite v = Im uϕ(n)
n∈IN
est bornée et l’on peut donc trouver une fonction ψ : IN → IN
strictement croissante et telle que la suite vψ(n)
n∈IN
soit convergente.
353
Chapitre 9. Nombres réels, suites numériques
La suite Im uϕ◦ψ(n)
n∈IN
est alors convergente par construction, et la suite Re uϕ◦ψ(n)
est convergente comme suite extraite de la suite convergente Re uϕ(n)
Donc, d’après la proposition 43 de la page 332, la suite uϕ◦ψ(n)
. n∈IN
n∈IN
est convergente.
n∈IN
Enfin, ϕ ◦ ψ est une fonction strictement croissante de IN dans IN (comme composée de deux fonctions strictement croissantes), ce qui conclut. Attention
La suite extraite de uϕ(n)
s’écrit bien uϕ◦ψ(n)
et non uψ◦ϕ(n) .
Proposition 49 Soit u et v deux suites convergeant respectivement vers λ et µ . 1. Les suites réelles Re u , Im u , Re v et Im v convergent respectivement vers : Re λ, Im λ, Re µ et Im µ.
Par conséquent, les suites Re(u + v) et Im(u + v) convergent respectivement vers : Re λ + Re µ = Re(λ + µ) 2.
Im λ + Im µ = Im(λ + µ).
et
Donc la suite u + v converge vers Re(λ + µ) + i Im(λ + µ) , c’est-à-dire λ + µ . Pour tout n ∈ IN , on peut écrire :
0 |un vn − λ µ| = un (vn − µ) + µ(un − λ)
|un | |vn − µ| + |µ| |un − λ| .
De cet encadrement, on déduit lim un vn − λ µ = 0 , et donc : 3.
lim(un vn ) = λ µ.
C’est un cas particulier du point précédent, en voyant k comme la suite constante égale à k .
Proposition 50 • On applique à la suite (|un |)n∈IN le résultat correspondant sur les suites réelles. •
Pour n n0 , on peut écrire ∗ ∗
un 1 = · un |un |2
Comme u converge vers λ , la suite u = (un )n∈IN converge vers λ . De même, la suite réelle de terme général |un | converge vers |λ| (limite non nulle) et les 1 résultats sur les suites à termes réels permettent de dire que la suite de terme général |un |2 1 converge vers · |λ|2
Par produit de suites convergentes, on en déduit que la suite de terme général converge vers
λ 1 = · |λ|2 λ
Proposition 52 C’est une simple vérification. En notant wn = λun + µvn , on a, pour tout n ∈ IN :
wn+2 = λ un+2 + µ vn+2 = λ a un+1 + b un + µ a vn+1 + b vn
1 un = un |un |2
= a λ un+1 + µ vn+1 + b λ un + µ vn = a wn+1 + b wn .
354
Démonstrations Proposition 53 Soit pour n ∈ IN la propriété Hn : « un = vn ». • Initialisation. On a par hypothèse H0 et H1 . • Soit n 2 un entier tel que Hn−1 et Hn−2 soient vraies. On a alors : un = a un−1 + bun−2
(définition)
= a vn−1 + bvn−2 = vn
(Hn−1 et Hn−2 , puis définition)
Cela démontre Hn pour tout n ∈ IN par récurrence double. Proposition 54
Rappelons la définition d’une récurrence linéaire d’ordre 2 à coefficients constants : ∀n ∈ IN
un+2 = a un+1 + b un ,
(⋆)
et son équation caractéristique :
x2 − a x − b = 0. •
(Ec )
Cas où (Ec ) a deux solutions distinctes r1 et r2 . ∗ ∗
Soit (λ1 , λ2 ) ∈ C2 . D’après l’exemple 54, les suites v = (r1n )n∈IN et w = (r2n )n∈IN vérifient toutes les deux ( ⋆ ), donc, d’après la proposition 52, la combinaison linéaire λ1 v + λ2 w , c’est-à-dire la suite de terme général λ1 r1n + λ2 r2n vérifie ( ⋆ ). Soit u une suite vérifiant ( ⋆ ). Le point précédent et la proposition 53 donnent que u et λ1 v + λ2 w sont égales si, et seulement si :
u0 = u1 =
λ1 + λ2 λ1 r 1 + λ2 r 2 .
1 Ce système a une unique solution (λ1 , λ2 ) car son déterminant r1
•
1 = r2 − r1 est r2
non nul. Cela prouve qu’il existe (un unique) (λ1 , λ2 ) ∈ C2 tel que un = λ1 r1n + λ2 r2n , pour tout n ∈ IN . Cas où (Ec ) a une solution double r . ∗
Dans ce cas, x2 − ax − b = (x − r)2 pour tout x ∈ C , donc a = 2r et b = −r2 . Posons alors v = (r n )n∈IN et w = (nr n )n∈IN . Comme on l’a déjà vu, la suite v vérifie ( ⋆ ). De plus pour n ∈ IN , on a : wn+2 − awn+1 − bwn = (n + 2)r n+2 − 2r(n + 1)r n+1 + r 2 nr n
= r n+2 (n + 2) − 2(n + 1) + n = 0. ∗ ∗
La suite w vérifie également ( ⋆ ). D’après la proposition 52 de la page 339, pour tout (λ1 , λ2 ) , la suite λ1 v + λ2 w de terme général λ1 r n + λ2 nr n vérifie ( ⋆ ). Soit une suite u vérifiant ( ⋆ ) et (λ1 , λ2 ) ∈ C2 . Les suites u et λ1 v + λ2 w coïncident si, et seulement si : u0 = λ1 u1 = r λ1 + λ2 .
Ce système a une unique solution, car r �= 0 , ce qui prouve qu’il existe (λ1 , λ2 ) ∈ C2 tel que un = r n λ1 + λ2 n , pour tout n ∈ IN .
Cela achève la démonstration.
Remarque L’examen de la démonstration montre que pour toute suite u vérifiant ( ⋆ ), il existe (λ1 , λ2 ) ∈ C2 unique tel que u = λ1 v + λ2 w , où v et w sont définies plus haut.
355
Chapitre 9. Nombres réels, suites numériques Proposition 55 • Les deux premiers cas se traitent comme dans le cas complexe, en remplaçant à chaque fois C par IR dans les démonstrations. • Cas 3 . ∗ Les suites de la forme annoncée conviennent. En effet, pour n ∈ IN , on a :
einθ + e−inθ einθ − e−inθ + λ2 2 2i λ1 − iλ2 n λ1 + iλ2 n = r , r + 2 2
ρn λ1 cos(nθ) + λ2 sin(nθ) = ρn λ1
∗
qui d’après la proposition 54 de la page 339 vérifie la relation ( ⋆ ). Réciproquement montrons, pour tout (ω0 , ω1 ) ∈ IR2 , qu’il existe une suite de la forme souhaitée dont les deux premiers termes valent respectivement ω0 et ω1 . Pour une suite de la forme un = ρn λ1 cos(nθ) + λ2 sin(nθ) , on a : u0 = λ1
On a donc :
u0 = ω0 u1 = ω1
⇐⇒
et
u1 = ρλ1 cos θ + ρλ2 sin θ.
λ1 (ρ cos θ) λ1
+
(ρ sin θ) λ2
= =
ω0 ω1 .
Comme ρ sin θ est non nul (car r = ρeiθ n’est pas réel), ce dernier système est de Cramer et donc possède une (unique) solution.
356
Exercices
S’entraîner et approfondir Propriété de la borne supérieure 9.1 (Existence d’au moins un irrationnel) Le but de l’exercice est d’utiliser la propriété de la borne supérieure pour montrer qu’il existe un nombre réel dont le carré vaut 2. D’après l’exemple 15 de la page 13, on sait alors qu’un tel nombre est irrationnel.
Soit X = x ∈ IR x 0
et
x2 2 .
1. Montrer que X possède une borne supérieure, notée a dans la suite, et que a ∈ [0, 2] .
On pose Y = x ∈ IR 0 x 2
et
x2 2
∀x ∈ [0, 2]
et g l’application définie par :
g(x) = x +
2 − x2 · 4
2. (a) Montrer que si x ∈ X vérifie x2 < 2 , alors g(x) ∈ X et g(x) > x . (b) Montrer que si x ∈ Y vérifie x2 > 2 , alors g(x) ∈ Y et g(x) < x . 3. Montrer que a2 = 2 .
9.2 Soit A et B deux parties non vides et majorées de IR . On définit l’ensemble A + B par : A + B = {x + y | x ∈ A, y ∈ B} .
Montrer que l’ensemble A + B est majoré et que sup(A + B) = sup A + sup B. 9.3 Soit X un ensemble. Pour f ∈ IRX , on pose (lorsque cela existe) : sup f = sup f (X) = sup{f (x) | x ∈ X}.
1. Pour f ∈ IRX et g ∈ IRX telles que sup f et sup g existent, établir : sup(f + g) sup f + sup g.
2. Justifier qu’en général, on n’a pas : sup(f + g) = sup f + sup g . 9.4 Montrer qu’étant donné deux réels distincts x et y , il existe, compris entre x et y : • une infinité de décimaux ; • une infinité de rationnels ; • une infinité d’irrationnels. 9.5 1. Montrer que : ∀x ∈ IR
⌈x⌉ = −⌊−x⌋ .
2. Montrer que : ∀x ∈ IR \ ZZ
⌈x⌉ = ⌊x⌋ + 1 .
9.6 Quelques propriétés de la fonction partie entière 1. Montrer que la fonction x �→ ⌊x⌋ est croissante sur IR .
2. Étant donné deux réels x et y , a-t-on toujours ⌊x + y⌋ = ⌊x⌋ + ⌊y⌋ ? 3. Pour x ∈ IR , exprimer ⌊2x⌋ en fonction de ⌊x⌋ .
357
Chapitre 9. Nombres réels, suites numériques
Généralités sur les suites 9.7 Soit f : IR → IR et (un )n∈IN la suite définie par ∀n ∈ IN
→316
un = f (n) .
1. Montrer que si f est monotone, alors (un )n∈IN l’est également, et a même sens de monotonie que f .
2. Une fonction de IR dans IR qui vérifie ∀x ∈ IR croissante ?
f (x) f (x + 1) est-elle nécessairement
9.8 Montrer que si une suite est bornée à partir d’un certain rang, alors elle est bornée. →317
9.9 Est-ce que le produit de deux suites réelles minorées est encore une suite minorée ? 9.10 Soit (un )n∈IN une suite réelle. Parmi les suites ci-dessous, trouver celles qui sont extraites d’une autre : (u3n )n∈IN , (u6n )n∈IN , (u2n )n∈IN , (u3×2n )n∈IN (u3×2n+1 )n∈IN ,
(u2n )n∈IN ,
(u2n+1 )n∈IN .
Convergence 9.11 1. Trouver deux suites divergentes dont la somme est une suite convergente. →323 2. Trouver deux suites divergentes dont le produit est une suite convergente. 9.12 Dans chacun des →324 1. lim u = +∞ , 2. lim u = +∞ , 3. lim u = +∞ , 4. lim u = +∞ ,
cas suivants, lim v = −∞ lim v = −∞ lim v = 0 et lim v = 0 et
déterminer des suites u et v vérifiant la propriété souhaitée : et u + v converge ; et u + v diverge ; u v converge ; u v diverge.
9.13 Étudier les limites des suites définies par : 1. un =
sin(n2 ) ; n
3. un =
2. un =
a n − bn ( a > 0 et b > 0 ) ; a n + bn
4. un =
5n3
n3 + 5n + cos n +
1 n2
;
2n + (−1)n · 5n + (−1)n+1
9.14 Soit (an )n∈IN et (bn )n∈IN deux suites réelles qui convergent respectivement vers ℓ et ℓ′ . On considère les suites de termes généraux : un = min(an , bn )
et
vn = max(an , bn ).
Montrer que ces deux suites convergent respectivement vers : min(ℓ, ℓ′ )
358
max(ℓ, ℓ′ ).
⌊10n x⌋ 1 et vn = un + n · 10n 10 et (vn )n∈IN sont adjacentes, de limite x .
9.15 Soit x ∈ IR . Pour n ∈ IN , on pose un = Montrer que les suites (un )n∈IN
et
Exercices 9.16 On considère deux suites positives (un )n∈IN et (vn )n∈IN vérifiant v0 u0 et : √ un + vn ∀n ∈ IN un+1 = un vn et vn+1 = · 2 Montrer que ces deux suites convergent vers une limite commune. ⋆ 9.17 On considère deux suites u et v qui divergent vers +∞ , avec de plus : lim(un+1 − un ) = 0. On se propose de montrer que l’ensemble {up − vm | (p, m) ∈ IN2 } est dense dans IR .
On fixe ε > 0 , et on considère un rang n0 à partir duquel |un+1 − un | ε . 1. Montrer que pour tout réel x tel que x un0 , il existe un terme up de la suite tel que |up − x| ε .
2. En utilisant le fait que la suite (vn )n∈IN diverge vers +∞ , montrer que pour tout réel x , il existe (p, m) ∈ IN2 tels que |(up − vm ) − x| ε et conclure.
9.18 Montrer que la suite de terme général un =
5n2 + sin n est divergente. 3(n + 2)2 cos nπ 5
9.19 Soit u une suite telle qu’il existe une suite (αp )p∈IN tendant vers 0 vérifiant : p · ∀(n, p) ∈ IN2 |un | αp + n+1 Montrer que la suite (un )n∈IN tend vers 0 . ⋆ 9.20 Théorème de Cesàro Soit (un )n∈IN une suite réelle. On définit la suite (vn )n∈IN∗ par : vn =
u1 + u2 + · · · + un · n
1. On suppose dans cette question que la suite (un )n∈IN converge vers 0. On souhaite montrer que la suite (vn )n∈IN∗ converge aussi vers 0. Soit ε > 0 . (a) Montrer qu’il existe un rang n0 tel que pour tout n n0 :
un0 + un0 +1 + · · · + un ε · n
2
Dans la suite, n0 désigne un tel rang. (b) Montrer qu’il existe un rang n1 tel que pour tout n n1 :
u1 + u2 + · · · + un0 −1 ε · n
2
Dans la suite, n1 désigne un tel rang. (c) En déduire alors le résultat annoncé.
2. En déduire que, plus généralement, si la suite (un )n∈IN est convergente, alors la suite (vn )n∈IN∗ l’est aussi et a même limite que (un )n∈IN . Montrer que la réciproque est fausse.
359
Chapitre 9. Nombres réels, suites numériques
Suites récurrentes
un+1 = u2n+1 un
9.21 Étudier les suites u vérifiant u0 > 0 , u1 > 0 et : ∀n ∈ IN
9.22 Méthode de Héron Soit α et a deux réels strictement positifs et (xn )n∈IN la suite vérifiant : x0 = a
et
∀n ∈ IN
xn+1 =
α 1 xn + 2 xn
1. Étudier la suite (xn )n∈IN . 2. Montrer que pour tout n 1 , on a 0 xn+1 −
√
α
13
.
·
√ (xn − α)2 √ · 2 α
En déduire l’encadrement : ∀n ∈ IN∗
0 xn −
√
√ α2 α
√ 2n−1 x1 − α √ · 2 α
⋆ 9.23 Soit (an )n∈IN une suite réelle bornée vérifiant : ∀n ∈ IN∗
1. Montrer que la suite an+1 + 23 an
n∈IN
an+1 13 an + 32 an−1 .
est convergente. On note λ sa limite.
2. Soit ε > 0 . Pour n ∈ IN , on pose un = an −
3 5
λ.
Montrer qu’il existe n0 ∈ IN tel que l’on ait |un+1 | 32 |un | + ε pour tout n n0 .
3. Étudier la convergence de la suite (an )n∈IN .
9.24 Étudier la suite u définie par u0 = −1/2 et ∀n ∈ IN
un+1 =
√
1 + un .
Suites complexes 9.25 Étant donné θ ∈ IR , pour tout n ∈ IN , on pose un =
n cos kθ k=0
2k
·
Montrer que la suite (un )n∈IN est convergente et en déterminer la limite. 9.26 Soit h : C \ {−2}
−→
C
et
1 z+2 1. Montrer que D est stable par h . 2. On considère une suite (un )n∈IN telle que u0 ∈ D et : ∀n ∈ IN z
�−→
(a) Quelles sont les limites possibles pour la suite u ? (b) Si ℓ est une limite possible, déterminer un réel 0 λ < 1 : ∀n ∈ IN (c) Conclusion ?
360
D = z ∈ C : |z| 1 .
un+1 − ℓ λun − ℓ.
un+1 = h(un ) .
Solutions des exercices
Solutions des exercices 9.1 1. L’ensemble X est une partie de IR : • non vide, car elle contient 1 ; / X. • majorée, par exemple par 2 , car, pour x > 2 , on a x2 > 4 , donc x ∈
Donc X admet une borne supérieure. Puisque 2 majore X , on a par définition de la borne supérieure a 2 . 2. On observe d’abord que la fonction g est strictement croissante, à valeurs dans [ 21 , 32 ] . (a) Soit x ∈ X tel que x2 < 2 . • Il est clair qu’alors g(x) > x .
• Ensuite, g(g(x)) > g(x) par stricte croissance de la fonction g donc
2−g(x)2 2
>0
puis g(x)2 < 2 . (b) On raisonne de même lorsque x ∈ Y vérifie x2 > 2 , les calculs étant similaires. 3. Nous avons vu que a ∈ [0, 2] .
Par ailleurs, tout y ∈ Y est un majorant de X . En effet, si z > y , alors z 2 > y 2 2 , car les termes sont positifs, ce qui montre que z ∈ / X.
• Supposons a2 < 2 . Dans ces conditions, a ∈ X et d’après la question 2a, on a g(a) ∈ X et a < g(a) . Cela contredit le fait que a soit un majorant de X . • Supposons a2 > 2 . Dans ces conditions, a ∈ Y et d’après la question 2b, on a g(a) ∈ Y et g(a) < a . Comme g(a) est élément de Y , c’est un majorant de X , contredisant le fait que a soit le plus petit majorant de X .
Puisque a2 < 2 et a2 > 2 ne peuvent pas être réalisée, on en déduit a2 = 2 .
9.2 Comme la partie A (resp. B ) est non vide et majorée, elle possède une borne supérieure que nous notons α (resp. β ) . • Comme A et B sont non vides, il en est de même pour A + B . De plus, étant donné z ∈ A + B , on peut trouver x ∈ A et y ∈ B tels que z = x + y , ce qui assure que z α + β . La partie A + B est donc majorée par α + β . La partie A+B , étant non vide et majorée par α+β , possède donc une borne supérieure vérifiant : sup(A + B) α + β. • Montrons que α + β est la borne supérieure de A + B . Comme on a déjà obtenu que c’est un majorant, il reste à montrer que : ∀ε > 0
∃z ∈ A + B
α + β − ε < z.
Soit ε > 0 . Par caractérisation de la borne supérieure, ∗ on peut trouver x ∈ A tel que α − ∗ on peut trouver y ∈ B tel que β −
ε 2 ε 2
0 et b > 0 , l’élément un est bien défini pour tout n ∈ IN ; on est dans l’un des trois cas suivants : • si a = b , alors la suite considérée est la suite nulle ; ( a )n − 1 , on obtient lim un = −1 ; • si b > a , alors, en écrivant un = ab n (b) + 1
9.13 1. Pour tout entier n ∈ IN∗ , on a un = sin(n2 ) ×
• si a > b , alors, en écrivant un =
1 − ( ab )n
1 + ( ab )n
, on obtient lim un = 1 .
3. Pour tout n ∈ IN∗ , on a 5n3 + cos n1 + n12 �= 0 ; cela assure que la suite (un )n∈IN∗ est bien définie. 1 + n52 1 , d’où lim un = · Pour n ∈ IN∗ , on a un = n 1 5 5 + cos + n3 n5 4. Pour tout n ∈ IN , on a 5n + (−1)n+1 �= 0 ; cela assure que la suite (un )n∈IN est bien définie. n 2 + (−1) 2 ∗ n Pour n ∈ IN , on a un = , d’où lim un = · (−1)n+1 5 5+ n 9.14 On a, pour tout n ∈ IN :
an + bn − |an − bn | an + bn + |an − bn | et vn = · 2 2 On peut donc conclure, par opérations sur les limites, que les suites u et v tendent respecℓ + ℓ′ + |ℓ − ℓ′ | ℓ + ℓ′ − |ℓ − ℓ′ | et , c’est-à-dire vers min(ℓ, ℓ′ ) et max(ℓ, ℓ′ ) tivement vers 2 2 respectivement. un =
9.15 Pour n ∈ IN , notons pn = ⌊10n x⌋ . Par définition de la partie entière, on a alors : pn 10n x < pn + 1,
ce qui donne, d’une part : un x < vn , et d’autre part : 10 pn 10n+1 x < 10 pn + 10. • Comme pn+1 = ⌊10n+1 x⌋ , c’est le plus grand entier inférieur ou égal à 10n+1 x . On en déduit que 10 pn pn+1 , ce qui donne un un+1 . La suite u est donc croissante. • De même 1 + pn+1 est le plus petit entier strictement supérieur à 10n+1 x . On en déduit que 1 + pn+1 10 pn + 10 , puis que vn+1 vn . La suite v est donc décroissante. • Comme vn − un = 10−n , la suite v − u converge vers 0 . Les suites u et v sont donc adjacentes, et convergent vers l’unique réel ℓ vérifiant : ∀n ∈ IN un ℓ vn .
Comme x vérifie cette propriété, on a ℓ = x .
364
Solutions des exercices 9.16 • Pour n 1 , on a 2(vn − un ) =
√
un−1 −
√
vn−1
2
0 , ce qui prouve que vn un .
• Les suites (un )n1 et (vn )n1 sont respectivement croissante et décroissante. En effet, pour n ∈ IN∗ , on a : un + vn un − vn − vn = 0 2 2 √ 2 √ √ √ √ un+1 − un = un vn − un = un vn − un 0. vn+1 − vn =
• Comme la suite (un )n1 est croissante et majorée (par v1 ), elle converge vers un réel ℓ . De même, la suite (vn )n1 étant décroissante et minorée (par u1 ), elle converge vers un réel ℓ′ . un + vn ℓ + ℓ′ , on a alors ℓ′ = , ce qui • En passant à la limite dans la relation vn+1 = 2 2 donne finalement ℓ = ℓ′ . 9.17 1. Soit p = min{k ∈ IN : k > n0 et uk > x} (l’ensemble considéré est une partie non vide de IN , car la suite u diverge vers +∞ ). On a alors up > x , et, comme p − 1 n0 , on a |up − up−1 | ε. Montrons que up−1 x , ce qui nous donnera l’encadrement up−1 x < up , et donc |up − x| ε . Distinguons deux cas : • si p = n0 + 1 , alors p − 1 = n0 , et donc, par hypothèse sur x , on a up−1 x ; • si p > n0 + 1 , alors p − 1 > n0 . Or, par définition de p , l’entier p − 1 n’appartient pas à l’ensemble considéré ci-dessus, et donc nécessairement up−1 x. 2. Soit x un réel quelconque. Comme (vn ) diverge vers +∞ , il existe m ∈ IN tel que : x + vm un0 .
Il suffit alors d’utiliser le résultat de la question précédente avec x ˜ = x + vm . 9.18 Tout d’abord on vérifie que la suite est bien définie, ce qui est le cas car : nπ �= 0. ∀n ∈ IN cos 5 En effet, pour x ∈ IR , on a :
xπ π 5 xπ = 0 ⇐⇒ ≡ [π] ⇐⇒ x ≡ [5], 5 5 2 2 ce qui n’est vérifié par aucun nombre entier. Une manière efficace d’obtenir la divergence de (un )n∈IN est de remarquer que : 5 ; • la sous-suite (u10n )n∈IN tend vers 3 5 • la sous-suite (u10n+5 )n∈IN tend vers − . 3 cos
√ 9.19 En prenant p = ⌊ n + 1⌋ , dans la relation de l’énoncé, on obtient : √ ⌊ n + 1⌋ 1 α⌊√n+1⌋ + √ · (∗) ∀n ∈ IN |un | α⌊√n+1⌋ + n+1 n+1 √ Comme lim ⌊ n + 1⌋ = +∞ , on montre facilement que lim α⌊√n+1⌋ = 0 (ce n’est pas n→+∞
n→+∞
une sous-suite de (αn ) ; il faut revenir à la définition). D’autre part,
lim
n→+∞
√1 n+1
= 0.
On déduit de la majoration (∗) que (un ) tend vers 0 .
365
Chapitre 9. Nombres réels, suites numériques 9.20 1. (a) Comme la suite u tend vers 0 , on peut considérer un rang n0 ∈ IN tel que : ε n n0 =⇒ |un | · 2 On a alors, pour n n0 :
un0 + un0 +1 + · · · + un |un0 | + |un0 +1 | + · · · + |un | n − n0 + 1 ε ε × · n
n
2
n
2
(b) L’existence du rang n1 vérifiant la condition souhaitée provient simplement de la limite suivante (l’entier n0 ayant été fixé) : u1 + u2 + · · · + un0 −1 n
−→ 0.
n→+∞
(c) Pour n max(n0 , n1 ) , on a :
u1 + u2 + · · · + un0 −1 un0 + un0 +1 + · · · + un ε ε + + = ε.
|vn |
n
2
n
2
D’après la définition de la convergence d’une suite, cela montre que vn → 0 . 2. • Il suffit d’appliquer la résultat précédent à la suite de terme général un − ℓ (où ℓ est la limite de la suite). En effet, en écrivant : (u1 − ℓ) + (u2 − ℓ) + · · · + (un − ℓ) , n on obtient que vn − ℓ → 0 , c’est-à-dire vn → ℓ . • La réciproque est fausse : si un = (−1)n , alors la suite (un ) est divergente, alors que la suite (vn ) converge vers 0 . vn − ℓ =
9.21 Remarquons qu’une telle suite est à valeurs strictement positives, ce qui se démontre par récurrence. • Pour n ∈ IN , posons vn = ln un . Il vient de la définition de la suite u : vn+2 =
∀n ∈ IN
2 vn vn+1 + · 3 3
La suite (vn )n∈IN est donc une suite récurrente linéaire homogène d’ordre 2 à coefficients constants, d’équation caractéristique r 2 − 23 r − 31 = 0 , dont les solutions sont 1 et − 31 ·
Il existe donc (α, β) ∈ IR2 tel que :
1 n
vn = α + β −
∀n ∈ IN Les réels α et β vérifient :
v0 v1
3
.
=α+β = α − β3 ·
On en déduit β = 34 (v0 − v1 ) et α = 41 (v0 + 3v1 ) .
• Ainsi, pour tout n ∈ IN : vn =
3 1 v0 + 3v1 + (v0 − v1 ) − 4 4 3
n
−→
n→+∞
v0 + 3v1 · 4
Par continuité de la fonction exponentielle, sachant que un = exp(vn ) pour tout n ∈ IN , on en déduit : 1 v0 + 3v1 un −→ exp = u0 u31 4 . n→+∞ 4
366
Solutions des exercices 9.22 1. Posons f : IR∗+
IR∗+ α 1 x+ · x �−→ 2 x • La fonction f est bien définie et laisse stable IR∗+ . Il s’ensuit que la suite (xn )n∈IN est bien définie. √ La fonction f est dérivable sur IR∗+ et : x 0 α +∞ 1 α f ′ (x) − 0 + 1− 2 ∀x ∈ IR∗+ f ′ (x) = 2 x +∞ +∞ On constate que f est à valeurs √ f dans I = [ α, +∞[ et que cet intervalle √ α est stable par f . Donc (xn )n∈IN est à valeurs dans I à partir du rang 1 . • Soit n ∈ IN∗ . On a : 1 α α − x2n xn + − xn = 0, xn+1 − xn = 2 xn 2xn √ car pour n 1 , on a xn ∈ [ α, +∞[ . √ • Par conséquent, (xn )n∈IN est une suite décroissante à partir du rang 1 , minorée par α , donc, d’après le théorème de limite monotone, elle est convergente. Notons ℓ sa limite. √ √ Par décroissance de la suite (xn )n∈IN∗ et la minoration par α , on a ℓ α , ce qui implique que ℓ est dans le domaine de définition de f . Par continuité de f , on a donc f (ℓ) = ℓ , ce √ qui donne ℓ = α . √ En conclusion, la suite (xn )n∈IN converge vers α . √ 2. Nous avons remarqué à la question précédente que xn α à partir du rang 1 . Soit n 1 . On a : √ √ √ 1 α x2 − 2xn α + α xn+1 − α = xn + − α= n 2 xn 2xn √ 2 √ 2 (xn − α) (xn − α) √ (xn α > 0). = 2xn 2 α −→
On en déduit alors par récurrence : ∀n ∈ IN
∗
0 xn −
√
√ α2 α
√ 2n−1 x1 − α √ · 2 α
Remarque L’encadrement ci-dessus montre que si x1 est choisi suffisamment près √ √ √ de α (plus précisément α x1 2 α ), alors la suite (xn )n∈IN converge très ra√ pidement vers α , puisqu’alors : ∀n ∈ IN∗ 9.23 1. Soit n ∈ IN∗ . On a : an+1 +
2 an 3
0 xn −
√
n−1 √ 1 2 α2 α · 2
1 2 2 2 an + an−1 + an = an + an−1 . 3 3 3 3
Il s’ensuit que la suite an+1 + 32 an
n∈IN
est décroissante. Puisqu’elle est minorée (car la
suite (an )n∈IN est bornée), elle est convergente d’après le théorème de la limite monotone. 2. Pour n ∈ IN , posons un = an − 35 λ . Pour n ∈ IN , on a : un+1 +
2 3 2 2 3 un = an+1 − λ + an − λ = an+1 + an − λ −→ 0. n→+∞ 3 5 3 5 3
367
Chapitre 9. Nombres réels, suites numériques Soit ε > 0 . Par définition de la limite, il existe un entier n0 tel que : 2 ∀n n0 un+1 − un ε. 3 Fixons un tel entier n0 . D’après l’inégalité triangulaire, pour n n0 , on a donc : 2 2 2 |un+1 | = un+1 − un + un |un | + ε. 3 3 3 3. Conservons les notations de la question précédente.
Posons la suite arithmético-géométrique αn αn0 = |un0 |
et
nn0
∀n n0
définie par : αn+1 =
2 αn + ε. 3
Par récurrence, on a |un | αn pour tout n n0 . Par ailleurs l’équation ℓ = pour solution ℓ = 3ε . On en déduit : ∀n n0 Puisque 0 2/3 < 1 , on a
αn = 3ε +
2 n−n0 3
n−n0 2 3
αn0 − 3ε
2 ℓ 3
+ε a
αn0 − 3ε .
−→ 0 . Par conséquent, il existe, par
n→+∞
définition de la limite, un entier n1 , que l’on peut supposer supérieur à n0 , tel que pour tout n n1 on ait : n−n0 2 αn0 − 3ε ε. 3 Ainsi, pour tout n n1 , on a : |un | αn 4ε. On en conclut que un −→ 0 et que la suite (an )n∈IN converge vers n→+∞
9.24 La suite est bien définie, car l’application : √ f : x �→ 1 + x est définie sur I = [−1, +∞[ et l’intervalle I est stable car f (I) ⊂ IR+ ⊂ I . Notons que f est croissante, ce qui implique que u est monotone.
3 5
λ.
y=x
y y=
√ 1+x
Puisque u1 = 1/2 −1/2 = u0 , la suite est croissante. O + + + + x u0 u1 u2 u3 Comme le laisse voir la représentation graphique ci-contre, la suite semble être convergente. Montrons cela. • Déterminons les points fixes de f . Puisque f est à valeurs positives, elle n’admet pas de point fixe dans l’intervalle [−1, 0[ . Pour x ∈ IR+ , on a, du fait que les deux termes sont positifs : f (x) = x ⇐⇒ 1 + x = x2 . √
√
Les solutions sur IR de l’équation x2 − x − 1 = 0 sont ϕ = 1+2 5 et ψ = 1−2 5 · Il existe ainsi une unique solution dans IR+ , à savoir ϕ . • Là encore comme le suggère le dessin, montrons que l’intervalle J = [−1, ϕ] est stable par f . Cela est une conséquence immédiate du fait que f est croissante, car, pour x ∈ J : −1 0 = f (−1) f (x) f (ϕ) = ϕ.
368
Solutions des exercices • La stabilité de l’intervalle J garantit que la suite u est à valeurs dans J donc majorée. • La suite u est croissante, majorée. Elle est donc convergente et comme l’intervalle J est fermé, sa limite ℓ est dans J . Enfin, puisque f est continue et ℓ ∈ J , nécessairement ℓ est un point fixe de f . Par suite : un −→ ϕ . n→+∞
9.25 Comme
eiθ 2
�= 1 , on a : ∀n ∈ IN
un = Re
n eikθ k=0
2k
= Re
1− 1
ei(n+1)θ 2n+1 iθ − e2
·
ei(n+1)θ tend vers 0 , comme produit d’une suite bornée par une 2n+1 suite tendant vers 0 . On obtient alors :
La suite de terme général
lim
n→+∞
1− 1
ei(n+1)θ 2n+1 iθ − e2
On en déduit que u converge et que lim u = Re lim u =
=
1 1−
eiθ 2
1 1−
eiθ 2
· . En simplifiant, on a :
4 − 2 cos θ · 5 − 4 cos θ
9.26 1. Soit z ∈ C , tel que |z| 1 . Alors par l’inégalité triangulaire :
|z + 2| |2| − |z| 2 − |z| 2 − 1 = 1.
On en conclut que |h(z)| 1 . 2. (a) Supposons que u converge vers ℓ . Comme |un | 1 pour tout n ∈ IN , par passage à la limite dans les inégalités larges, on obtient |ℓ| 1 . Par opérations sur les limites, il vient de : ∀n ∈ IN
un+1 =
1 un + 2
1 , c’est-à-dire ℓ2 + 2ℓ − 1 = 0. Les racines de cette équation du second que ℓ = ℓ+2 degré sont : √ √ r0 = 2 − 1 et r1 = − 2 − 1. Seule r0 vérifie |ri | 1 . On conclut que la seule limite possible est r0 . 1 , on a : (b) Soit n ∈ IN . Comme r0 = 2+r 0
un+1 − r0 =
1 1 r0 − un = r0 un+1 r0 − un . − = 2 + un 2 + r0 (un + 2)(r0 + 2)
En passant au module, sachant que |un+1 | 1 puisque la suite est à valeurs dans D , il vient : |un+1 − r0 | |r0 | |un − r0 |. (⋆) Le réel λ = r0 convient donc, car 0 r0 < 1 . (c) De la relation (⋆) , on déduit par récurrence : ∀n ∈ IN
|un − r0 | r0n |u0 − r0 |.
Puisque 0 r0 < 1 , on a r0n −→ 0 , donc un −→ r0 . n→+∞
n→+∞
369
Chapitre 10 : Limites et continuité I
L’aspect ponctuel : limites, continuité . . . . . . . . . . Au voisinage . . . . . . . . . . . . . . . . . . . . . . . . Définitions - Premières propriétés . . . . . . . . . . . . . Utilisation des suites . . . . . . . . . . . . . . . . . . . . Limites et continuité à droite, à gauche . . . . . . . . . Prolongement par continuité . . . . . . . . . . . . . . . Opérations sur les limites . . . . . . . . . . . . . . . . . Propriétés liées à l’ordre . . . . . . . . . . . . . . . . . . Démontrer l’existence ou la non-existence de limites . . Limite monotone . . . . . . . . . . . . . . . . . . . . . . II L’aspect global : fonctions continues sur un intervalle 1 L’ensemble C (I, IR) . . . . . . . . . . . . . . . . . . . . 2 Théorème des valeurs intermédiaires . . . . . . . . . . . 3 Fonctions définies sur un segment . . . . . . . . . . . . . 4 Théorème de la bijection . . . . . . . . . . . . . . . . . . 5 Continuité uniforme, théorème de Heine . . . . . . . . . III Extension aux fonctions à valeurs complexes . . . . . . 1 Limites, continuité . . . . . . . . . . . . . . . . . . . . . 2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Adaptation des théorèmes de continuité . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3 4 5 6 7 8 9
. . . . . . . . . . . . . . . . .
372 372 373 377 380 382 383 385 386 388 389 389 391 394 395 396 397 397 398 399 400 408
Limites et continuité
10
Dans ce chapitre, nous allons étendre aux fonctions la notion de limite vue pour les suites. Cette notion a déjà été abordée dans le secondaire et nous l’avons utilisée dans les chapitres 6 et 8. Nous allons ici la formaliser rigoureusement. Tout au long de ce chapitre, I est un intervalle de IR d’intérieur non vide (cf. page 4) et a est : • soit un réel intérieur à I ;
• soit l’une des extrémités de I et dans ce cas : a est réel (et il appartient alors ou non à I ) ou a = ±∞. Sauf dans la partie III, toutes les fonctions considérées sont à valeurs réelles.
I
L’aspect ponctuel : limites, continuité
1
Au voisinage
Considérons une propriété P susceptible d’être vérifiée ou non par une fonction. Par exemple, la propriété P peut être « f est croissante », ou encore « f est à valeurs strictement positives ». Définition 1 Soit f : I → IR une fonction et J un intervalle d’intérieur non vide inclus dans I . On dit que f vérifie P sur J si la restriction f|J vérifie la propriété P . Définition 2 Soit f : I → IR une fonction et a vérifiant les hypothèses de la présente page.
• Si a ∈ IR, on dit que f vérifie la propriété P au voisinage de a s’il existe un réel r > 0 tel que f vérifie P sur I ∩ [a − r, a + r].
• Si +∞ est l’extrémité supérieure de I , on dit que f vérifie la propriété P au voisinage de +∞ s’il existe un réel M tel que f vérifie P sur I ∩ [M, +∞[ .
• Si −∞ est l’extrémité inférieure de I , on dit que f vérifie la propriété P au voisinage de −∞ s’il existe un réel M tel que f vérifie P sur I ∩ ]−∞, M ].
I L’aspect ponctuel : limites, continuité Remarques • La locution « au voisinage de a » joue pour les fonctions un rôle analogue à celui de la locution « à partir d’un certain rang » pour les suites. • Soit f : I → IR une fonction. Si f vérifie la propriété P1 au voisinage de a et vérifie la propriété P2 au voisinage de a alors f vérifie « P1 et P2 » au voisinage de a. Justifions cela pour a ∈ IR. Il existe r1 > 0 tel que f vérifie la propriété P1 sur I ∩ [a − r1 , a + r1 ] et il existe de même r2 > 0 tel que f vérifie la propriété P2 sur I ∩ [a − r2 , a + r2 ]. Par conséquent, f vérifie « P1 et P2 » sur I ∩ [a − r, a + r], où r = min{r1 , r2 } . La démonstration est semblable pour a = +∞ et a = −∞.
Ex. 1. Soit f la fonction définie sur IR par f (t) = t2 . • La fonction f est bornée au voisinage de tout point a de IR . • La fonction f est croissante au voisinage de +∞ , mais elle ne l’est pas sur IR . • La fonction f n’est pas bornée au voisinage de +∞ .
2
Définitions - Premières propriétés
Nous nous intéressons d’abord aux limites finies. Pour une suite (an )n∈IN et ℓ ∈ IR, nous avons vu au chapitre 9 que an −→ ℓ signifie : pour tout ε > 0 , l’inégan→+∞
lité |an − ℓ| ε est vérifiée à partir d’un certain rang. Pour définir f (x) −→ ℓ , on x→a
est conduit à remplacer « à partir d’un certain rang » par « au voisinage de . . . ». Limites finies
Définition 3 Soit f : I → IR une fonction et ℓ ∈ IR. • Supposons I non majoré.
On dit que f (x) tend vers ℓ lorsque x tend vers +∞ si : ∀ε > 0 ∃M ∈ IR ∀x ∈ I x M =⇒ f (x) − ℓ ε .
• Supposons I non minoré.
On dit que f (x) tend vers ℓ lorsque x tend vers −∞ si : ∀ε > 0 ∃M ∈ IR ∀x ∈ I x M =⇒ f (x) − ℓ ε .
Définition 4 Soit f : I → IR une fonction, ℓ ∈ IR et a un réel qui appartient à I ou est une extrémité de I . On dit que f (x) tend vers ℓ lorsque x tend vers a si : ∀ε > 0 ∃η > 0 ∀x ∈ I |x − a| η =⇒ f (x) − ℓ ε . 373
Chapitre 10. Limites et continuité Remarques • Dans tous les cas de figure, on peut traduire la propriété « f (x) tend vers ℓ lorsque x tend vers a » par : « pour tout ε > 0 , l’inégalité Pε : f − ℓ ε est vérifiée au voisinage de a ». y
y
2η 2ε
ℓ+
O
2ε
ℓ+
+
a
x
+
O
x
M
Limite en +∞ Limite en a ∈ IR • Par extension, il arrive, lorsque a est un point intérieur à I , que l’on cherche la limite d’une fonction définie seulement sur I \ {a} (voir par exemple la définition de la dérivabilité page 422). Nous étudierons ce cas de figure d’une fonction définie sur un « intervalle épointé » à la page 382. Notation La propriété : « f (x) tend vers ℓ lorsque x tend vers a » se note f (x) −→ ℓ . x→a
Elle se dit aussi « f tend vers ℓ en a » ou « f a pour limite ℓ en a ». Si un tel réel ℓ existe, on dit que f a une limite finie en a. Ex. 2. Pour tout n ∈ IN∗ , on a xn −→ 0 . x→0
En effet, pour tout ε > 0 et x réel vérifiant |x| min{ε, 1} , on a les inégalités : |xn | |x| ε. Ex. 3. Pour tout n ∈ IN∗ , on a de même
1 −→ 0 . xn x→+∞
Remarques Soit f : I → IR une fonction. • On a f (x) −→ 0 si, et seulement si, f (x) −→ 0 .
x→a x→a • Soit ℓ un réel. Alors f (x) −→ ℓ si, et seulement si, f (x) − ℓ −→ 0 . x→a
x→a
En particulier, si f (x) −→ ℓ , alors pour tout réel λ, on a f (x) + λ −→ ℓ + λ. x→a
x→a
De même, toujours si f (x) −→ ℓ , alors on a −f (x) −→ −ℓ . x→a
x→a
Proposition 1 Soit f : I → IR une fonction. Si f a une limite finie en a, alors f est bornée au voisinage de a. Démonstration. Notons ℓ ∈ IR la limite. En prenant ε = 1 dans la définition de la limite, on obtient l’inégalité |f (x) − ℓ| 1 au voisinage de a .
Puisque |f (x)| f (x) − ℓ + |ℓ| , l’inégalité |f (x)| 1 + |ℓ| est vérifiée au voisinage de a , ce qui démontre que f est bornée au voisinage de a .
374
I L’aspect ponctuel : limites, continuité Limites infinies Définition 5 Soit f : I → IR une fonction et a une extrémité de I .
• Lorsque a ∈ IR, on dit que f (x) tend vers +∞ lorsque x tend vers a si : ∀A ∈ IR ∃η > 0 ∀x ∈ I |x − a| η =⇒ f (x) A .
• Lorsque a = +∞, on dit que f (x) tend vers +∞ lorsque x tend vers +∞ si : ∀A ∈ IR ∃B ∈ IR ∀x ∈ I x B =⇒ f (x) A .
• Lorsque a = −∞, on dit que f (x) tend vers +∞ lorsque x tend vers −∞ si : ∀A ∈ IR ∃B ∈ IR ∀x ∈ I x B =⇒ f (x) A .
Remarques • On peut traduire « f (x) tend vers +∞ lorsque x tend vers a » par : « pour tout A ∈ IR, l’inégalité PA : f A est vérifiée au voisinage de a ».
• Dans la définition de « f (x) tend vers +∞ lorsque x tend vers a », on peut remplacer « ∀A ∈ IR » par « ∀A ∈ IR∗+ » car si l’inégalité PA est réalisée au voisinage de a pour un réel A > 0 elle l’est a fortiori pour tout A 0 .
Définition 6 Soit f : I → IR et a une extrémité de I . On dit que f (x) tend vers −∞ lorsque x tend vers a si −f (x) −→ +∞. x→a
Remarque La propriété : « f (x) −→ −∞ » se traduit facilement avec des quantix→a
ficateurs. Il faut distinguer selon que a ∈ IR, a = +∞ ou a = −∞. On obtient : • lorsque a ∈ IR : ∀A ∈ IR ∃η > 0 ∀x ∈ I |x − a| η =⇒ f (x) A ; • lorsque a = +∞ :
∀A ∈ IR
∃B ∈ IR
∀x ∈ I
x B =⇒ f (x) A ;
∃B ∈ IR
∀x ∈ I
x B =⇒ f (x) A .
• lorsque a = −∞ : ∀A ∈ IR
Notation La propriété : « f (x) tend vers +∞ lorsque x tend vers a » est notée f (x) −→ +∞. x→a
Elle se dit aussi « f tend vers +∞ en a » ou « f a pour limite +∞ en a ». De même pour « f (x) tend vers −∞ lorsque x tend vers a ».
375
Chapitre 10. Limites et continuité
Ex. 4. Pour tout n ∈ IN∗ , on a xn −→ +∞ . En effet, pour tout réel A , on a, pour tout x x→+∞
réel vérifiant x max{|A|, 1} , les inégalités : xn x |A| A. Ex. 5. Pour tout n ∈ IN∗ , on a de même
1 −→ +∞ . x2n x→0
Remarque Si f a pour limite +∞ (resp. −∞) en a, alors elle n’est pas majorée (resp. minorée) au voisinage de a. Unicité de la limite Théorème 2 (Unicité de la limite) Soit f : I → IR une fonction, a ∈ IR qui appartient à I ou est une extrémité de I , 2
ainsi que (ℓ1 , ℓ2 ) ∈ IR .
Si f (x) −→ ℓ1 et f (x) −→ ℓ2 , alors ℓ1 = ℓ2 . x→a
x→a
L’élément ℓ1 = ℓ2 de IR est appelé la limite de f en a . Démonstration page 400 Raisonner par l’absurde. Dans le cas où ℓ1 et ℓ2 sont réels, choisir en fonction de ℓ1 et ℓ2 un ε ad hoc.
Principe de démonstration.
Notation Lorsque f admet une limite en a, on désigne celle-ci par lim f (x) ou lim f . x→a
a
Remarque On ne peut utiliser l’écriture lim f qu’après avoir justifié l’existence de a
la limite ou, éventuellement, supposé son existence pour aboutir à une contradiction. Continuité en a Considérons le cas particulier où a appartient à I . Proposition 3 Soit f : I → IR une fonction et a ∈ I . Si f admet une limite ℓ ∈ IR en a, alors ℓ ∈ IR et ℓ = f (a). On dit alors que f est continue en a . Dans le cas contraire, on dit que f est discontinue en a.
Principe de démonstration.
Démonstration page 400 On montre que ℓ ∈ IR , puis que : ∀ε > 0 f (a) − ℓ ε .
Remarque La continuité n’est donc qu’un cas particulier (très important) de limite. Ex. 6. Une fonction constante est continue en tout point.
Ex. 7. L’application identité de IR est continue en tout point. Dans la définition, il suffit de prendre η = ε . Ex. 8. La fonction valeur absolue
IR x
−→ �−→
IR |x|
est continue en tout point. En effet,
soit a ∈ IR ; pour tout x ∈ IR , l’inégalité triangulaire donne |x| − |a| |x − a| , et l’on conclut comme dans l’exemple 7.
376
I L’aspect ponctuel : limites, continuité est continue en 0 . IR+ −→ √ IR x x �−→ √ √ √ √ En effet, pour x 0 et ε > 0 , on a | x − 0| = x et l’inégalité x ε équivaut à x ε2 . 2 Il suffit donc de prendre η = ε dans la définition. Ex. 9. La fonction racine carrée
Une méthode importante pour montrer que f tend vers le réel ℓ en a Proposition 4 Soit f : I → IR une fonction et ℓ un réel. S’il existe une fonction g : I → IR telle que : f − ℓ g et g(x) −→ 0, x→a
Exo 10.1
alors f (x) −→ ℓ . x→a
Démonstration page 400
Ex. 10. Soit a > 0 . Pour tout x 0 , on a : √ √ |x − a| |x − a| √ √ · | x − a| = √ x+ a a De
|x−a| √ −→ a x→a
0 , on déduit
√
x −→
x→a
√
a : la fonction racine est continue en a pour a > 0
(l’exemple 9 montre qu’elle est continue en 0 ).
3
Utilisation des suites
Bon nombre de propriétés des limites de fonctions peuvent être obtenues à partir des propriétés des limites de suites vues au chapitre 9. Théorème 5 (Composition des limites : cas des suites) Soit f : I → IR une fonction et ℓ ∈ IR tels que f (x) −→ ℓ . Alors, pour toute x→a
suite (xn )n∈IN à valeurs dans I et tendant vers a, on a f (xn ) −→ ℓ . n→+∞
Démonstration page 400
Point méthode
Exo 10.2
• Le théorème 5 est particulièrement utile pour démontrer qu’une fonction n’admet pas de limite finie en un point. Il joue un rôle analogue aux suites extraites (cf.proposition 18 de la page 322). Il suffit en effet, pour démontrer qu’une fonction n’a pas de limite en un point a, d’exhiber deux suites (xn )n∈IN et (yn )n∈IN ayant toutes les deux pour limite a et telles que lim f (xn ) et lim f (yn ) n→+∞ n→+∞ existent et soient différentes. • Pour démontrer qu’une fonction n’est pas continue en a, il suffit d’exhiber une suite (xn )n∈IN convergeant vers a et telle que f (xn ) n∈IN ne converge pas vers f (a).
377
Chapitre 10. Limites et continuité Ex. 11. La fonction sinus n’a pas de limite en +∞ . 1 En effet
lim 2nπ = +∞ et
n→+∞
lim
n→+∞
2n +
lim sin (2nπ) = 0
n→+∞
2
et
π = +∞ , alors que lim sin
n→+∞
2n +
1 π = 1. 2
Application aux suites récurrentes Théorème 6 (Suite récurrente et point fixe) Soit f : I → I une fonction et (un )n∈IN une suite vérifiant u0 ∈ I et, pour tout entier naturel n, la relation un+1 = f (un ) . Si : • la suite (un )n∈IN est convergente, • sa limite ℓ appartient à I , • la fonction f est continue en ℓ , alors ℓ est un point fixe de f , i.e. f (ℓ) = ℓ . Principe de démonstration.
Démonstration page 401 Passer à la limite dans la relation un+1 = f (un ) .
Remarques • En général, on applique le théorème précédent avec une fonction f continue en tout point de I . • Ce théorème ne donne qu’une condition nécessaire pour qu’un réel ℓ ∈ I soit la limite. • Une suite récurrente peut converger vers ℓ , sans que ℓ soit dans I . Considérons par exemple la suite géométrique u = (1/2n )n∈IN . En posant I = ]0, 1], elle ; sa limite est nulle vérifie u0 = 1 ∈ I et un+1 = f (un ) avec f : I −→ I x �−→ x/2 et n’appartient pas à I . • Si I est un intervalle fermé et que la suite converge vers ℓ , alors ℓ appartient nécessairement à I . Le cas I = IR est évident. Si I = ]−∞, a], I = [a, b] ou I = [a, +∞[ , cela s’obtient par passage à la limite dans les inégalités. Caractérisation séquentielle Le théorème suivant complète le théorème de composition des limites dans le cas des suites, en en donnant une réciproque. Théorème 7 (Caractérisation séquentielle) Soit f : I → IR une fonction et ℓ ∈ IR. Les assertions suivantes sont équivalentes : (i) la fonction f a pour limite ℓ en a ;
(ii) pour toute suite (xn )n∈IN à valeurs dans I de limite a, la suite f (xn ) n∈IN a pour limite ℓ . Principe de démonstration.
Seul (ii) ⇒ (i) reste à montrer.
Démonstration page 401
On raisonne par l’absurde, en construisant une suite (xn )n∈IN telle que xn
que f (xn )
378
n∈IN
n’ait pas ℓ pour limite.
−→
n→+∞
a et telle
I L’aspect ponctuel : limites, continuité Caractère local de la limite Remarque Soit f : I → IR une fonction, J un intervalle de I . Si a est un point de J ou une extrémité de J et si lim f = ℓ , alors lim f|J = ℓ . En particulier, si f est a
a
continue en a ∈ J , alors f|J est continue en a. Cela résulte clairement de la définition de la limite. La proposition suivante est une sorte de réciproque.
Proposition 8 (Caractère « local » de la limite) Soit f : I → IR une fonction et a vérifiant les hypothèses de la page 372. • Si a ∈ IR et r ∈ IR∗+ , on a alors :
lim f = ℓ ⇐⇒ lim f|I∩[a−r,a+r] = ℓ. a
a
• Si a = +∞ et M ∈ IR, on a alors :
lim f = ℓ ⇐⇒ lim f|I∩[M,+∞[ = ℓ.
+∞
+∞
• Si a = −∞ et M ∈ IR, on a alors :
lim f = ℓ ⇐⇒ lim f|I∩]−∞,M ] = ℓ.
−∞
Principe de démonstration.
−∞
Démonstration page 401
Par caractérisation séquentielle.
Corollaire 9 (Caractère « local » de la continuité) Soit f : I → IR une fonction, ainsi que a ∈ I et r ∈ IR∗+ . La fonction f est continue en a si, et seulement si, la restriction f|I∩[a−r,a+r] est continue en a. Point méthode • Pour étudier la limite d’une fonction f : I → IR en a ∈ IR, on peut se restreindre à un intervalle I ∩ [a − r, a + r] avec r > 0 .
• Pour étudier la limite d’une fonction f : I → IR en +∞, on peut se restreindre à un intervalle I ∩ [M, +∞[ avec M ∈ IR.
• Pour étudier la limite d’une fonction f : I → IR en −∞, on peut se restreindre à un intervalle I ∩ ]−∞, M ] avec M ∈ IR. Ex. 12. y
O
x
La fonction f : x �→ ⌊x⌋ est définie sur IR et admet une limite en tout point de IR \ ZZ . En effet, pour a ∈ IR \ ZZ , il existe un réel r > 0 tel que [a − r, a + r] ⊂ IR \ ZZ (il suffit de prendre 0 < r < min{a − ⌊a⌋, ⌊a⌋ − a + 1} ). La fonction f|[a−r,a+r] étant constante, elle admet une limite en a .
379
Chapitre 10. Limites et continuité L’aspect local de la limite permet d’affiner la proposition 4 de la page 377. Point méthode Afin d’établir qu’une fonction f : I → IR admet une limite finie ℓ en a, on peut chercher à exhiber une fonction g telle que : • l’inégalité f (x) − ℓ g (x) soit vérifiée au voisinage de a ; • g(x) −→ 0 .
Exo 10.3
x→a
4
Limites et continuité à droite, à gauche
Continuité à droite, à gauche Définition 7 Soit f : I → IR une fonction et a soit un point intérieur à I .
• La fonction f est continue à droite en a si f|I∩[a,+∞[ est continue en a.
• La fonction f est continue à gauche en a si f|I∩]−∞,a] est continue en a.
Ex. 13. La fonction x �→ ⌊x⌋ est continue à droite en tout point de IR , mais elle n’est continue à gauche qu’aux points de IR \ ZZ . Ex. 14. La fonction x �→ ⌈x⌉ (cf. page 4) est continue à gauche en tout point de IR , mais elle n’est continue à droite qu’aux points de IR \ ZZ .
Proposition 10 Soit f : I → IR une fonction et a un point intérieur à I . Alors la fonction f est continue en a si, et seulement si, elle est continue à droite et à gauche en a. Démonstration page 401
Remarques • Lorsque a est l’extrémité inférieure de I , on peut définir de la même façon la continuité à droite en a, mais cela n’a pas beaucoup d’intérêt car cela revient à la notion de continuité en a. De même pour la continuité à gauche lorsque a est l’extrémité supérieure de I . • En revanche, on ne peut pas définir la continuité à droite lorsque a est l’extrémité supérieure de I , ni la continuité à gauche lorsque a est l’extrémité inférieure de I , car cela reviendrait à considérer la restriction de f à {a} . Point méthode Pour démontrer que f : I → IR est continue en un point a intérieur à I , on peut établir que f est continue à gauche et à droite en a. Cette méthode n’est utile que si f est définie par des expressions différentes à droite et à gauche de a.
380
I L’aspect ponctuel : limites, continuité Ex. 15. Soit f : IR → IR l’application définie par f (x) = sin x si x 0 et f (x) = sh x sinon. Montrons que f est continue en 0 . Comme sin(0) = 0 = sh(0) , la fonction f vérifie : ∀x 0
f (x) = sin x
et
∀x 0
f (x) = sh x.
Ainsi, la restriction de f à [0, +∞[ est l’application x �→ sin x . Par conséquent f|[0,+∞[ est conti-
nue. De même, la restriction de f à ]−∞, 0] est l’application x �→ sh x . Par conséquent f|]−∞,0] est continue. Le résultat s’ensuit.
Limite à droite, à gauche Ex. 16. La fonction f : x �→ ⌊x⌋ n’est pas continue en 0 puisqu’elle n’est pas continue à gauche en 0 . Pourtant, pour x ∈ [−1, 0[ on a f (x) = −1 , qui tend donc vers −1 . Il semble donc raisonnable de dire que f admet −1 pour limite à gauche en 0 (et 0 pour limite à droite en 0 ). Cela motive la définition suivante.
Définition 8 • Soit f : I → IR une fonction et a ∈ I un point autre que l’extrémité supérieure de I . La limite à droite de f en a , notée x→a lim f (x) ou lim+ f (x), est la x→a
x>a
limite de f|I∩]a,+∞[ en a, lorsque cette dernière est définie. • Soit f : I → IR une fonction et a ∈ I un point autre que l’extrémité inférieure de I . La limite à gauche de f en a , notée x→a lim f (x) ou lim f (x), est la Exo 10.4
x→a−
xa
Démonstration page 402
Remarque On a un résultat identique concernant la continuité à gauche. 381
Chapitre 10. Limites et continuité
Attention Soit f : I → IR une fonction et a un point intérieur à I . Noter • que si f est continue à droite et à gauche en a, alors f est continue en a ;
• que dans les notions de limite à droite et limite à gauche en a, la valeur de f (a) n’intervient pas, alors que si f est continue en a, la limite de f est nécessairement égale à f (a) ;
• que f peut donc avoir une limite à droite et à gauche en a, sans admettre de limite en a (c’est-à-dire sans être continue en a), même si ces deux limites sont égales. Ex. 19. La fonction f indicatrice du singleton {1} définie par : f (1) = 1
et
∀x ∈ IR \ {1}
f (x) = 0
admet 0 pour limite à gauche et à droite en 1 , mais n’est pas continue en 1 puisque ces limites ne sont pas égales à f (1) .
5
Prolongement par continuité
Limites d’une fonction définie sur un intervalle épointé Jusqu’à présent, nous n’avons considéré que des fonctions définies sur un intervalle. Cependant, dans de nombreuses circonstances, on est amené à considérer des fonctions définies non pas sur un intervalle, mais sur un intervalle privé d’un point intérieur a. Il est naturel de vouloir étudier l’existence et la valeur de la limite de f en a. Cela conduit aux définitions suivantes. Définition 9 Soit a un point intérieur à I et f : I \ {a} → IR. • On dit que f (x) tend vers ℓ ∈ IR lorsque x tend vers a si : ∀ε > 0 ∃η > 0 ∀x ∈ I \ {a} |x − a| η =⇒ f (x) − ℓ ε . • On dit que f (x)tend vers +∞ lorsque x tend vers a si : ∀M ∈ IR ∃η > 0 ∀x ∈ I \ {a} |x − a| η =⇒ f (x) M .
• On dit que f (x) tend vers −∞ lorsque x tend vers a si : ∀M ∈ IR ∃η > 0 ∀x ∈ I \ {a} |x − a| η =⇒ f (x) M .
Le lecteur vérifiera que toutes les propriétés des limites vues jusqu’à présent dans ce chapitre s’étendent aux fonctions définies sur un intervalle épointé. Remarques • Soit a un point intérieur à I et f : I \ {a} → IR une fonction.
S’il existe ℓ ∈ IR tel que f (x) tende vers ℓ lorsque x tend vers a, alors ℓ est unique : ℓ est la limite de f en a. On note ℓ = lim f (x). x→a
La fonction f a une limite en a si, et seulement si, elle a une limite à droite et une limite à gauche en a qui coïncident. • Si f : I → IR est une fonction et a ∈ I , on définit la limite épointée de f en a par : x→a lim f (x) = lim f|I\{a} (x). x�=a
382
x→a
I L’aspect ponctuel : limites, continuité Par exemple, la fonction f indicatrice sur IR du singleton {1} n’a pas de limite en 1 , mais x→1 lim f (x) = 0 . x�=1
On remarque que lorsque a est une borne de I , cette notion coïncide avec celle de limite à droite ou de limite à gauche. • Si f : I → IR a une limite en a ∈ I , elle a une limite épointée en a qui vaut f (a). Prolongement
Exo 10.6
Théorème 12 Soit a ∈ I et f : I \ {a} → IR une fonction. Il existe une fonction f : I → IR continue en a prolongeant f sur I si, et seulement si, f admet une limite finie en a. Dans ce cas, un tel prolongement est unique et f(a) = lim f . a
On l’appelle le prolongement par continuité de f en a .
Démonstration page 402
Ex. 20. La fonction f : IR∗ En effet,
IR admet un prolongement par continuité en 0. sin x x �−→ x −→ sin′ (0) = cos(0) = 1 . −→
sin x x x→0
Le prolongement par continuité de f en 0 est défini sur IR par f(x) =
6
sin x x
1
si si
x �= 0 x = 0.
Opérations sur les limites
Opérations algébriques Les résultats de calcul algébrique de limites vus pour les suites peuvent être étendus aux fonctions. On les démontre par caractérisation séquentielle en utilisant les résultats correspondant pour les suites. Proposition 13 Soit f : I → IR et g : I → IR deux fonctions. Si lim f = 0 et si g est bornée au voisinage de a, alors lim (f g) = 0 . a
a
Démonstration page 402
Nous renvoyons au paragraphe IV.3 page 324 du chapitre 9 pour l’extension partielle des opérations algébriques à IR. Proposition 14 (Calcul algébrique de limites) Soit f : I → IR et g : I → IR deux fonctions ayant respectivement les limites ℓ et ℓ′ dans IR en a. 1. Si ℓ + ℓ′ est défini dans IR, alors f + g a une limite en a, égale à ℓ + ℓ′ . 2. Soit λ ∈ IR. Si λ ℓ est défini dans IR, alors λ f a une limite en a, égale à λ ℓ . 3. Si ℓ ℓ′ est défini dans IR, alors f g admet une limite en a, égale à ℓ ℓ′ .
Démonstration page 402
383
Chapitre 10. Limites et continuité Corollaire 15 Soit f et g deux fonctions réelles définies sur I et continues en a, ainsi que λ ∈ IR. Alors les fonctions f + g , λ f et f g sont continues en a. Ex. 21. Toute fonction polynomiale (réelle) définie sur IR est continue en a pour tout a ∈ IR . Attention Exo 10.7
On n’a pas toujours lim (f + g) = lim f + lim g . a
a
a
Pour écrire une telle égalité, on doit avoir établi : 1. l’existence de lim f et lim g ; a
a
2. que la somme a un sens dans IR.
Ex. 22. Si l’on prend f : x �→ x et g : x �→ sin x − x , alors f (x)
−→
x→+∞
+∞
et g(x) −→ −∞ , mais la fonction f + g = sin n’a pas de limite en +∞ . x→+∞
Théorème 16 (Limite de l’inverse) Soit f : I → IR∗ une fonction et ℓ ∈ IR∗ . Si f (x) −→ ℓ , alors x→a
1 1 −→ · f (x) x→a ℓ Démonstration page 403
Remarque Si l’on ne suppose pas que f est à valeurs dans IR∗ mais seulement que f (x) −→ ℓ �= 0 , alors la proposition 23 de la page suivante nous dit que f x→a
ne s’annule pas au voisinage de a, et le théorème précédent peut s’appliquer en considérant une restriction de f . Corollaire 17 Si f : I → IR∗ est continue en a ∈ I , alors la fonction
1 est continue en a. f
Corollaire 18 Si f : I → IR et g : I → IR∗ sont deux fonctions continues en a ∈ I , alors la fonction f /g est continue en a. Ex. 23. Toute fonction rationnelle (réelle) définie sur un intervalle I est continue en tout a ∈ I . Proposition 19 (Limite de l’inverse) Si f : I → IR∗ tend vers +∞ ou vers −∞ en a, alors lim a
1 = 0. f Démonstration page 403
Proposition 20 (Limite de l’inverse) Si f : I → IR est une fonction à valeurs strictement positives (respectivement à 1 valeurs strictement négatives) et si f tend vers 0 en a, alors lim = +∞ (respeca f 1 tivement lim = −∞). a f Démonstration page 403
384
I L’aspect ponctuel : limites, continuité Composition Théorème 21 (Composition des limites) Soit I et J deux intervalles de IR et f : I → J . On suppose lim f = b ∈ IR. a
Alors b appartient à J ou est une extrémité de J ; de plus, si g : J → IR est telle que lim g = ℓ ∈ IR, alors lim (g ◦ f ) = ℓ . a
b
Démonstration page 403
Exo 10.8
Corollaire 22 (Composition des fonctions continues) Soit I et J deux intervalles non vides de IR, f : I → IR et g : J → IR deux fonctions telles que f (I) ⊂ J . Si f est continue en a ∈ I et si g est continue en b = f (a), alors g ◦ f est une fonction continue en a. Ex. 24. Si f est continue en a , alors |f | est continue en a . Si de plus f est à valeurs strictement positives, alors ln f est continue en a .
7
Propriétés liées à l’ordre
Ici encore, les propriétés liant les limites et la relation d’ordre sur IR vues sur les suites ont leurs analogues pour les fonctions. Limite et signe Proposition 23 (Limite et signe) Soit f : I → IR une fonction. Si f admet une limite, finie ou infinie, ℓ strictement positive (resp. strictement négative) en a, alors f est strictement positive (resp. strictement négative) au voisinage de a. Démonstration page 403
Passage à la limite dans les inégalités larges Proposition 24 (Passage à la limite dans les inégalités larges) Soit f, g : I → IR. Si f g au voisinage de a et si f et g admettent des limites, finies ou infinies, en a, alors : lim f lim g. a
a
Démonstration.
Par caractérisation séquentielle de la limite, à l’aide de la propriété correspondante sur les suites.
Limite par encadrement Proposition 25 (Limite par encadrement) Soit f , g et h trois fonctions définies sur I . Si : • l’inégalité f (x) g(x) h(x) est vérifiée au voisinage de a ;
• les fonctions f et h ont la même limite finie ℓ en a,
alors g admet une limite en a et lim g = ℓ . a
Démonstration. Soit (xn )n∈IN une suite à valeurs dans I , de limite a . Les suites f (xn ) n∈IN
et
h(xn )
n∈IN
convergent, par composition, vers ℓ . On a f (xn ) g(xn ) h(xn ) , pour n
385
Chapitre 10. Limites et continuité assez grand. On sait qu’alors la suite caractérisation séquentielle de la limite.
g(xn )
n∈IN
converge aussi vers ℓ et l’on conclut par
Proposition 26 (Limite par minoration) Soit f et g deux fonctions définies sur I telles que f g au voisinage de a. Si lim f = +∞, alors lim g = +∞. a
a
Démonstration.
Par caractérisation séquentielle de la limite, à l’aide de la propriété correspondante sur les suites.
Proposition 27 (Limite par majoration) Soit f et g deux fonctions définies sur I telles que f g au voisinage de a. Si lim g = −∞, alors lim f = −∞. a
Démonstration.
a
On considère −f et −g et l’on applique la proposition 26.
Remarque On notera la différence de nature entre les propositions 25, 26 et 27, qui donnent l’existence d’une limite et la proposition 24 qui suppose que l’on sache déjà que les différentes fonctions ont une limite.
8
Démontrer l’existence ou la non-existence de limites
Nous venons de voir divers énoncés concernant l’existence et le calcul de limites. On peut les regrouper en trois catégories : • les définitions, l’utilisation de suites ; • les résultats opératoires (somme, produit, inverse, composée, etc.) ; • les résultats liés à l’ordre (limite par encadrement, etc.). Pour un problème donné, plusieurs stratégies peuvent être pertinentes. Remarques préliminaires • Les démonstrations fondées sur la définition sont le dernier recours auquel il faut penser ; elles s’utilisent principalement pour des questions de nature théorique. • L’utilisation de suites est souvent incontournable pour démontrer la non existence de limite. Cas d’application des théorèmes Lorsque la fonction f est donnée explicitement par une formule, on peut commencer par essayer d’utiliser les résultats opératoires. Ex. 25. Étude de la limite en 0 de f : x �→
√ ex + 2+x · 1+cos2 x
On peut rédiger ainsi. • Comme cos x −→ 1 , on a donc 1 + cos2 x −→ 2 �= 0 . x→0 x→0 √ √ √ √ x • De plus e −→ 1 et 2 + x −→ 2 entraînent ex + 2 + x −→ 1 + 2 . x→0 x→0 x→0 √ √ 1+ 2 ex + 2 + x −→ · Par quotient, on en déduit 1 + cos2 x x→0 2
386
I L’aspect ponctuel : limites, continuité Cas des « formes indéterminées » Dans l’exemple précédent, une utilisation correcte des théorèmes généraux a permis facilement de conclure mais il est des cas où l’écriture sous forme de somme, produit, quotient de fonctions ne permet pas de conclure. On est alors face à ce que l’on appelle couramment une « forme indéterminée ». Ex. 26. • Si P est une fonction polynomiale, alors l’étude directe de sa limite en +∞ nous donne une somme de termes tendant vers ±∞ , ce qui empêche le plus souvent d’utiliser les théorèmes généraux. • Si F : x �→
P (x) Q(x)
est une fonction rationnelle, alors l’étude directe de sa limite en +∞ nous
donne un quotient de termes tendant le plus souvent vers ±∞ , ce qui empêche d’utiliser les théorèmes généraux.
Exo 10.9
Point méthode Lorsque l’on est confronté à une telle situation de « forme indéterminée », on peut chercher à transformer l’expression de f (x), pour obtenir une forme permettant d’utiliser les « théorèmes généraux » (sommes, produits, quotients, composées, etc.) Ex. 27. Soit P : x �→
n
k=0
ak xk une fonction polynomiale sur IR , avec n 1 et an �= 0 .
Pour tout réel x �= 0 , on a : P (x) = x
n
an +
n−1
ak x
k=0
k−n
= xn Q(x).
Pour tout k ∈ [[0, n − 1]] , on a xk−n −→ 0 et donc : Q(x) −→ an . x→+∞
x→+∞
On peut alors appliquer la proposition 14 de la page 383 et dire que : • si an > 0 , alors lim P (x) = +∞ ; x→+∞
• si an < 0 , alors Exo 10.10
lim P (x) = −∞ .
x→+∞
On exprime souvent le résultat précédent en disant qu’en +∞ , une fonction polynomiale a même limite que son terme de plus haut degré.
Remarque Il reste des cas où l’on n’arrive pas, comme précédemment, à s’en sortir avec une chaîne de calculs. Nous verrons au chapitre 14 d’autres techniques bien plus efficaces et permettant le plus souvent de conclure. Cas particulier des fonctions puissances
Exo 10.11
Point méthode Pour étudier la limite éventuelle en a d’une fonction ϕ : x �→ f (x)g(x) , où g n’est pas constante, on se ramène systématiquement à l’écriture ϕ(x) = exp u(x) , avec u(x) = g(x) ln f (x) , et l’on commence par étudier la limite éventuelle de u en a. 387
Chapitre 10. Limites et continuité Utilisation d’une majoration ou d’une minoration Quand les résultats opératoires ne permettent pas de s’en sortir, ou dans des exercices plus théoriques où la fonction f n’est pas totalement explicitée, on doit alors penser aux méthodes suivantes : • pour prouver que f tend vers un réel ℓ en a, essayer d’obtenir une majoration f (x) − ℓ g(x), où g est une fonction qui tend vers 0 en a ; • pour prouver que f tend vers +∞ en a, essayer d’obtenir une minoration f (x) g(x), où g est une fonction qui tend vers +∞ en a ;
Exo 10.12
• pour prouver que f tend vers −∞ en a, essayer d’obtenir une majoration f (x) g(x), où g est une fonction qui tend vers −∞ en a. Pour pouvoir appliquer les méthode précédentes, il faut évidemment avoir une idée de ce que peut être la limite de f .
9
Limite monotone
Théorème 28 (Théorème de la limite monotone) 2
Soit f une fonction monotone définie sur I = ]a, b[ , avec (a, b) ∈ IR et a < b. Alors lim f (x) et lim f (x) existent dans IR. x→a
x→b
Principe de démonstration.
Démonstration page 403 Analogue à celle du théorème correspondant pour les suites.
Corollaire 29 Soit f une fonction monotone définie sur un intervalle I et x un point intérieur à I . Alors : • la fonction f a une limite finie à droite et une limite finie à gauche en x ; • on a, de plus, lim− f (t) f (x) lim+ f (t) si f est croissante t→x
t→x
Exo 10.13
et lim+ f (t) f (x) lim f (t) si f est décroissante. t→x−
t→x
Démonstration page 404 Pour obtenir l’existence de la limite à droite, appliquer le théorème de la limite monotone à f|]x,c[ , où c est un élément de I tel que c > x .
Principe de démonstration.
Remarque Si f croissante et c ∈ ]a, b[ , alors, pour tout (x, y) ∈ I 2 vérifiant x < c < y , on a les inégalités : f (x) lim− f (t) f (c) lim+ f (t) f (y) . t→c
t→c
Le lecteur adaptera cela au cas des fonctions décroissantes sur un intervalle. Point méthode Le théorème de la limite monotone est d’une très grande utilité. D’un point de vue théorique, il fournit l’existence d’une limite, sans qu’on la connaisse a priori. D’un point de vue pratique, à partir du moment où l’on est assuré de l’existence d’une limite, on peut parfois la calculer explicitement, par exemple à l’aide de suites ou de relations vérifiées par f . Ex. 28. C’est ainsi que l’on a procédé pour démontrer que lim ln x = +∞ au chapitre 6. x→+∞
388
II L’aspect global : fonctions continues sur un intervalle
II
L’aspect global : fonctions continues sur un intervalle
De manière informelle, une propriété sera dite « globale » si elle fait intervenir la totalité du domaine de définition.
1
L’ensemble C (I, IR)
Définition 10 Une fonction f : I → IR est continue sur I si elle est continue en tout point de I . Notation On désigne par C (I, IR) l’ensemble des fonctions réelles définies et continues sur I . Remarques • On note parfois C (I) pour C (I, IR).
• On évitera de parler de « fonction discontinue sur I ». Cette locution est en effet ambiguë. On parlera soit d’une fonction non continue (pour indiquer qu’il existe au moins un point de discontinuité), soit d’une fonction discontinue en tout point. • On s’autorise parfois la notation C (X, IR) lorsque X n’est pas un intervalle, pour désigner l’ensemble des fonctions continues sur X . Le plus souvent, X sera une réunion d’intervalles d’intérieur non vide. Par exemple : ∗ la fonction x �→ 1/x est un élément de C (IR∗ , IR), ∗ la fonction tangente est un élément de C IR \ π2 + πZZ , IR .
• Il est clair que si f ∈ C (I, IR) et si J ⊂ I est un intervalle d’intérieur non vide, alors f|J ∈ C (J, IR). Opérations sur les fonctions continues Les résultats qui suivent ne sont que des reformulations globales des résultats déjà établis pour la limite et la continuité ponctuelle. Proposition 30 2
Soit (f, g) ∈ C (I, IR) et λ ∈ IR. Alors :
• les fonctions f + g et λ f sont continues sur I ; • le produit f g est continu sur I .
Démonstration. 836
689
Il suffit d’appliquer en tout a ∈ I le corollaire 15 de la page 384.
Remarques Comme l’ensemble C (I, IR) contient les fonctions constantes 0 et 1 : • le premier résultat de cette proposition signifie que c’est un sous-espace vectoriel de F (I, IR) , +, · ; • les deux résultats impliquent que c’est un sous-anneau de F (I, IR) , +, × . Ex. 29. Comme la fonction exp est continue, les fonctions ch et sh sont continues sur IR .
389
Chapitre 10. Limites et continuité Proposition 31 Soit f ∈ C (I, IR) une fonction qui ne s’annule pas. Alors la fonction 1/f est continue. Démonstration.
C’est une conséquence de la proposition 19 de la page 384.
Ex. 30. Une fonction rationnelle est continue sur tout intervalle sur lequel elle est définie. Ex. 31. La fonction tan est continue sur tout intervalle inclus dans IR \
Ex. 32. La fonction th est continue sur IR .
π 2
+ πZZ .
Proposition 32 Soit I et J deux intervalles d’intérieur non vide, f ∈ C (I, IR) et g ∈ C (J, IR) telles que f (I) ⊂ J . Alors g ◦ f est continue sur I . Démonstration.
C’est une conséquence immédiate du corollaire 22 de la page 385.
Proposition 33 Soit I et J deux intervalles d’intérieur non vide, avec J ⊂ I . Alors pour tout f ∈ C (I, IR) , la fonction f|J est continue. Démonstration.
Pour tout a ∈ J , la fonction f étant continue en a , sa restriction à J est également continue en a .
Fonction lipschitzienne Définition 11 Soit f : I → IR une fonction.
Exo 10.17
• Soit K un réel positif. On dit que f est K -lipschitzienne lorsque : ∀(x, y) ∈ I 2 f (y) − f (x) K |y − x| .
• On dit que f est lipschitzienne lorsqu’il existe un réel K 0 tel que f soit K -lipschitzienne. Théorème 34 Toute fonction lipschitzienne sur un intervalle I est continue sur I . Démonstration page 404
Ex. 33. À l’aide de l’inégalité triangulaire, on vérifie que la fonction valeur absolue x �→ |x| définie sur IR est 1 -lipschitzienne.
Comme le montre l’exemple suivant, il y a des fonctions continues qui ne sont pas lipschitziennes. Ex. 34. Nous avons démontré que la fonction f : x �→
√
x définie sur IR+ est continue sur IR+ (cf. exemples 9 de la page 377 et 10 de la page 377). Montrons que f n’est pas lipschitzienne.
390
II L’aspect global : fonctions continues sur un intervalle √ Raisonnons par l’absurde. Supposons que f : x �→ x soit K -lipschitzienne, pour un K ∈ IR+ . On peut évidemment supposer K > 0 . On a alors, pour tout x > 0 : √ et donc, toujours pour tout x > 0 :
√ √ x = x − 0 K x,
1 · K2 Cette dernière inégalité ne peut pas être vérifiée pour tout x > 0 : il y a des réels positifs 1 strictement inférieurs à K12 , par exemple 2K 2· x
Fonctions de référence Il est nécessaire dans la pratique de disposer de fonctions dont on sait qu’elles sont continues. On dresse ici la liste des fonctions de référence. Certaines justifications seront données plus loin. Ex. 35. Les fonctions usuelles suivantes sont continues sur leur ensemble de définition : • la fonction valeur absolue ; • les fonctions polynomiales (réelles) ; les fonctions rationnelles (réelles) continues sur tout intervalle sur lequel le dénominateur ne s’annule pas ; √ • les fonctions x �→ xα , α ∈ IR+ \ IN et x �→ n x , continues sur IR+ ; • la fonction ln et exp ; les fonctions hyperboliques ch , sh et th ; • les fonctions trigonométriques sin et cos , ce résultat est admis ; la fonction tan , continue sur IR \ π2 + kπ | k ∈ ZZ car quotient de fonctions continues ; les fonctions Arcsin , Arccos et Arctan , comme fonctions réciproques de bijections continues définies sur des intervalles.
Point méthode Le plus souvent, pour justifier qu’une fonction est continue, on invoque les propositions 30, 32 et/ou 31, qui concernent les opérations sur les fonctions continues. En effet, les fonctions que l’on rencontre dans la pratique sont souvent obtenues en itérant opérations algébriques et compositions à partir des fonctions de référence précédentes, qui sont continues. Pour décrire un tel raisonnement, on utilise parfois la locution « à l’aide des théorèmes généraux ». Ex. 36. Considérons f : x �→
·
sin ln |x| + 1
3 + exp x21+1 Puisque les fonctions valeur absolue, sin , exp, ln et les fonctions rationnelles sont continues sur leur domaine de définition, f est continue à l’aide des théorèmes généraux sur son domaine de définition (qui est IR∗ ).
2
Théorème des valeurs intermédiaires
Intuitivement, une fonction définie sur un intervalle est continue si son graphe peut être tracé sans lever le stylo. On pourrait déduire de cette propriété que « lorsque l’on passe de part et d’autre d’une droite horizontale, il y a un moment où l’on va se trouver sur cette droite ». C’est ce qu’énonce en substance le théorème des valeurs intermédiaires. 391
Chapitre 10. Limites et continuité Théorème 35 (Théorème des valeurs intermédiaires) Soit f une fonction continue sur un intervalle I , à valeurs réelles, et (a, b) ∈ I 2 . Alors toutes les valeurs entre f (a) et f (b) sont atteintes par f . Démonstration page 404
Principe de démonstration. Pour montrer que f prend la valeur y , on procède par dichotomie pour construire deux suites (αn )n∈IN et (βn )n∈IN adjacentes, telles que f (αn ) y f (βn ) , pour tout n ∈ IN . y
O
α0 = α1
α2
+
+
+
+
β3 β1 = β2
+ β0
x
Méthode de dichotomie pour le théorème des valeurs intermédiaires
Exo 10.18
Point méthode Pour démontrer qu’une fonction continue sur un intervalle I prend la valeur y , il suffit donc de montrer qu’il existe (a, b) ∈ I 2 tel que f (a) y et f (b) y . Ex. 37. Soit (p, q) ∈ (IR∗+ )2 et f : [0, 1] → IR une application continue.
Montrons qu’il existe c ∈ [0, 1] tel que p f (0) + q f (1) = (p + q)f (c) . On veut démontrer que f prend la valeur y =
On a f (0) − y =
q(f (0)−f (1)) p+q
et f (1) − y =
pf (0)+q f (1) · p+q
p(f (1)−f (0)) · p+q
Ces deux réels ont des signes opposés, donc y est entre f (0) et f (1) . D’où le résultat.
Corollaire 36 (Cas d’une fonction strictement monotone) Soit f une fonction continue et strictement monotone sur un intervalle I , à valeurs réelles, et (a, b) ∈ I 2 . Alors, pour tout réel y entre f (a) et f (b), il existe un unique réel x entre a et b tel que f (x) = y . Démonstration.
L’existence de x résulte du théorème 35 et l’unicité du fait qu’une fonction strictement monotone est injective.
Exo 10.19
Corollaire 37 L’image d’un intervalle par une fonction réelle continue est un intervalle. Démonstration page 405
Principe de démonstration.
Appliquer le théorème des valeurs intermédiaires pour démontrer que pour tout couple (α, β) ∈ f (I)2 tel que α β , on a [α, β] ⊂ f (I) .
Remarque En fait, il résulte de la caractérisation des intervalles (cf.proposition 4 de la page 312) que le corollaire 37 est équivalent au théorème 35. 392
II L’aspect global : fonctions continues sur un intervalle Ex. 38. Soit f : I → IR une fonction continue telle que |f | soit constante. Alors f est constante. En effet : • si |f | = 0 , alors f = 0 donc est constante ; • sinon, |f | est une constante a > 0 et si f n’était pas constante sur l’intervalle I , elle prendrait seulement les deux valeurs opposées distinctes, −a et a , ce qui est impossible car alors f (I) devrait contenir [−a, a] .
Exo 10.20
Attention Les intervalles I et f (I) ne sont pas nécessairement de même nature, c’est-à-dire que l’image d’un intervalle ouvert est certes un intervalle, mais pas nécessairement ouvert ; de même, l’image d’un intervalle fermé n’est pas nécessairement un intervalle fermé, etc. Le théorème des valeurs intermédiaires est souvent utilisé sous la forme particulière suivante. Proposition 38 Soit f ∈ C I, IR et (a, b) ∈ I 2 . Si f (a) f (b) 0 , alors il existe c entre a et b tel que f (c) = 0 . Point méthode
Exo 10.21
• Étant donné une équation « f (x) = 0 », un problème fréquent est de déterminer l’existence de solutions de l’équation. Le théorème des valeurs intermédiaires permet d’établir l’existence d’une telle solution, lorsque f est continue. • Pour étudier une équation « f (x) = g(x) », on a souvent intérêt à se ramener au cas précédent, en posant h = f − g . Ex. 39. Montrons que l’équation exp(−x) = x2 a au moins une solution réelle. Posons h : x �→ exp(−x) − x2 , définie sur IR . D’après les théorèmes généraux, elle est définie et continue sur l’intervalle IR . On a h(0) = 1 > 0 et h(1) = e−1 − 1 < 0 . D’après le théorème des valeurs intermédiaires, h s’annule sur ]0, 1[ .
Ex. 40. Soit (a, b) ∈ IR2 , avec a < b et f : [a, b] → [a, b] , continue. Montrons qu’il existe c ∈ [a, b] tel que f (c) = c . Pour cela, considérons h : x �→ f (x) − x , définie sur [a, b] . D’après les théorèmes généraux, elle est continue sur [a, b] . De plus h(a) = f (a)−a 0 et h(b) = f (b)−b 0 car f ([a, b]) ⊂ [a, b] . Il existe donc c ∈ [a, b] tel que h(c) = 0 , c’est-à-dire f (c) = c .
Ex. 41. Soit I un intervalle d’extrémités a et b , f ∈ C I, IR , ℓ et ℓ′ dans IR , tels que ℓ < 0
et ℓ′ > 0 . On suppose f (x) −→ ℓ et f (x) −→ ℓ′ . Alors, il existe c ∈ I tel que f (c) = 0 . x→a
x→b
En effet, on a lim f < 0 , donc la fonction f est strictement négative au voisinage de a a
(cf.proposition 23 de la page 385). Il existe donc x ∈ I tel que f (x) < 0 . De même, en considérant lim f , on montre qu’il existe y ∈ I tel que f (y) > 0 . b
La proposition 38 permet de conclure.
393
Chapitre 10. Limites et continuité Corollaire 39 Exo Soit f ∈ C I, IR . Si f ne s’annule pas sur l’intervalle I , alors f a un signe (strict) 10.22 constant. Démonstration.
Ce n’est que la contraposée de la proposition 38 de la page précédente.
Attention Les résultats du théorème 35 et des corollaires 37, 38, 39 peuvent tomber en défaut si f est définie sur autre chose qu’un intervalle. Ex. 42. Soit f la fonction définie sur X = [−1, 0[ ∪ ]0, 1] par f (x) = x1 ·
La fonction f est continue en tout point de X . On a f (X) = ]−∞, −1] ∪ [1, +∞[ . Ainsi f prend des valeurs positives et négatives sur X , mais ne s’annule pas.
3
Fonctions définies sur un segment
Théorème 40 (Théorème des bornes atteintes) Soit f : [a, b] → IR une fonction continue, avec a < b . Alors f est bornée et atteint Exo 10.23 ses bornes.
Démonstration (non exigible) page 405
Traduction Le résultat du théorème signifie que f possède un minimum et un maximum sur [a, b]. Corollaire 41 (Image d’un segment par une fonction continue) L’image d’un segment par une fonction continue est un segment. Démonstration page 405
Ex. 43. Soit f une fonction continue sur un segment et à valeurs strictement positives. Étant continue sur un segment, f atteint un minimum en un point c qui vaut f (c) > 0 . Il s’ensuit que f est minorée par la constante strictement positive f (c) .
Attention
Ce résultat ne subsiste pas si f est définie sur un intervalle quelconque.
Ex. 44. La fonction f : x �→
, continue sur IR∗+ est à valeurs strictement positives. est vérifiée au voisinage de +∞ : il Soit m > 0 . Puisque f (x) −→ 0 , l’inégalité f (x) m 2 1 x
x→+∞
existe donc x > 0 tel que f (x) < m . Donc f n’est minorée par aucune constante strictement positive.
Point méthode • Une manière simple de montrer qu’une fonction réelle est bornée (sans étudier ses variations), est de vérifier qu’elle est définie sur un segment et y est continue. • Une manière simple de montrer que la borne supérieure d’une fonction est atteinte, est de vérifier que la fonction est définie sur un segment et y est continue.
394
II L’aspect global : fonctions continues sur un intervalle Ex. 45. Si f : IR → IR est une fonction continue ayant une limite finie en −∞ et en +∞ ,
alors f est bornée sur IR . En effet, la fonction f possède une limite finie en −∞ et en +∞ , donc elle est bornée au voisinage de −∞ et de +∞ . Il existe donc M1 0 et A < 0 tels que |f (x)| M1 , pour tout x A ; de même, il existe M2 0 et B > 0 tels que |f (x)| M2 , pour x B . Enfin, f est continue sur [A, B] donc est bornée sur [A, B] par une constante M3 . On a donc : ∀x ∈ IR
4
|f (x)| max{M1 , M2 , M3 }.
Théorème de la bijection
Il est clair qu’une fonction f strictement monotone sur un intervalle y est injective. Si f est continue, la réciproque est vraie. Théorème 42 Soit f ∈ C (I, IR). Les propositions suivantes sont équivalentes : (i) la fonction f est injective ;
(ii) la fonction f est strictement monotone. Démonstration (non exigible) page 405
Attention La fonction définie sur IR∗ par f (x) = x1 est injective, continue et n’est pas monotone. Mais elle n’est pas définie sur un intervalle ! Théorème 43 (Théorème de la bijection) Soit f : I → IR une fonction continue strictement monotone. Alors :
1. la fonction f définit une bijection de I sur l’intervalle J = f (I) ;
Exo 10.24
2. l’application réciproque f −1 est continue. Démonstration (non exigible) page 406
Remarque Si f est continue et strictement monotone sur I , il résulte de la démonstration du théorème de la limite monotone (cf. page 388) que les extrémités de f (I) sont les limites de f aux extrémités de I . Attention Pour le théorème de la bijection, l’hypothèse que f soit définie sur un intervalle est cruciale, comme le montre l’exemple suivant. x si x ∈ ]0, 1[ Ex. 46. Soit f la fonction définie sur X = ]0, 1[ ∪ [2, 3[ par : f (x) = x−1
y
y = f −1 (x) y = f (x)
O
|
|
|
1
2
3
L’application réciproque f
x −1
si x ∈ [2, 3[.
D’après le caractère local de la continuité, f est continue en tout point de X . En distinguant les cas x < y < 1 , 2 x < y et x < 2 y , on vérifie facilement que si (x, y) ∈ X 2 , avec x < y , alors f (x) < f (y) . La fonction f est donc strictement croissante. Il est clair que f (X) = ]0, 2[ . Ainsi, f une bijection continue strictement croissante de X sur ]0, 2[ .
est définie sur ]0, 2[ . Mais f −1 ]0, 2[ = ]0, 1[ ∪ [2, 3[ n’est pas un
intervalle. Donc f −1 n’est pas continue.
395
Chapitre 10. Limites et continuité Applications aux fonctions usuelles • Nous avons vu au chapitre 6 que la fonction ln définit une bijection strictement croissante de IR∗+ dans IR. Elle est de plus continue. D’après le théorème de la bijection, la fonction exponentielle, qui est la bijection réciproque de la fonction logarithme népérien, est continue sur IR. • De par les théorèmes généraux, les fonctions x �→ xα = exp(α ln x), avec α ∈ IR, sont continues sur IR∗+ . De même, les fonctions ch, sh et th sont continues sur IR. • La restriction de la fonction tan à − π2 , π2 définit une bijection continue stric tement croissante de − π2 , π2 sur IR. Par conséquent, la fonction Arctan est continue sur IR. On justifie de même que les fonctions Arcsin et Arccos sont continues sur [−1, 1]. • Soit n ∈ IN∗ un entier impair. La fonction fn : x �→ xn définie sur IR est continue, strictement croissante. De plus lim fn = −∞ et lim fn = +∞. Elle définit donc −∞
+∞
une bijection de IR sur IR. √ Son application réciproque, notée n est définie sur IR, continue et strictement croissante. • Soit n ∈ IN∗ un entier pair. La fonction fn : x �→ xn définie sur IR+ est continue, strictement croissante. De plus f (0) = 0 et lim fn = +∞. Elle définit donc une +∞
bijection de IR+ sur IR+ . √ Son application réciproque, notée n est définie sur IR+ , continue et strictement croissante.
5
Continuité uniforme, théorème de Heine
Soit f : I → IR. Rappelons que la continuité de f sur I signifie que : ∀x ∈ I ∀ε > 0 ∃η > 0 ∀y ∈ I |x − y| η =⇒ f (x) − f (y) ε.
Il résulte de cette définition que η dépend de ε, mais aussi de x. Pour un certain nombre de problèmes, il est utile d’avoir η ne dépendant que de ε, c’est-à-dire indépendant de x. En d’autres termes, on veut un « contrôle uniforme » de η par ε. Cela conduit à la définition suivante. Définition 12 Soit f ∈ F (I, IR) . On dit que f est uniformément continue si : ∀ε > 0 ∃η > 0 ∀(x, y) ∈ I 2 |x − y| η =⇒ f (x) − f (y) ε . Remarque Il est clair que si f ∈ F (I, IR) est uniformément continue, alors elle est continue.
Proposition 44 Soit f ∈ C (I, IR). Si f est lipschitzienne, alors elle est uniformément continue.
Démonstration page 406
Remarque Soit f : I → IR une fonction. On a les implications : f est f est uniformément f est =⇒ =⇒ lipschitzienne continue continue 396
III Extension aux fonctions à valeurs complexes Ex. 47. Soit f : [0, +∞[ −→ x
�−→
IR x2 .
• Soit a ∈ IR∗+ . Pour tout (x, y) ∈ [0, a]2 , on a :
2 y − x2 = |x + y| |x − y| 2a |y − x|.
La fonction f|[0,a] est lipschitzienne, donc uniformément continue.
• Soit η > 0 . Pour x ∈ IR+ et y = x + η , on a :
|f (y) − f (x)| = |(x + η)2 − x2 | = 2xη + η 2 > 1, pour x assez grand, car 2xη + η 2
−→ +∞ . On vient de démontrer la négation de la
x→+∞
continuité uniforme (avec « ε = 1 »). La fonction f n’est pas uniformément continue.
Exo 10.25
Théorème 45 (Théorème de Heine) Toute fonction continue définie sur un segment est uniformément continue. Démonstration (non exigible) page 406
III
Extension aux fonctions à valeurs complexes
On peut facilement étendre la notion de limite finie aux fonctions à valeurs complexes de la variable réelle. En revanche, puisque l’on ne dispose pas de relation d’ordre « pertinente » sur C qui prolongerait celle sur IR, on ne peut pas donner un sens à « une limite +∞ » pour les fonctions à valeurs complexes.
1
Limites, continuité
Définition 13 Soit f : I → C une fonction, a ∈ IR qui appartient à I ou est une extrémité de I , et ℓ ∈ C. On dit que f (x) tend vers ℓ lorsque x tend vers a si la fonction réelle x �→ f (x) − ℓ a pour limite 0 en a.
Traduction Ainsi, f (x) tend vers ℓ lorsque x tend vers a si, pour tout ε > 0 , l’inégalité f − ℓ ε est vérifiée au voisinage de a. La définition de la limite d’une fonction complexe s’écrit donc comme celle d’une fonction réelle, en remplaçant simplement la valeur absolue par le module. Proposition 46 (Unicité de la limite) Soit f : I → C une fonction et (ℓ, ℓ′ ) ∈ C2 . Si f (x) − ℓ −→ 0 et f (x) − ℓ′ −→ 0 , alors ℓ = ℓ′ . x→a
x→a
Le nombre complexe ℓ = ℓ′ est la limite de f en a . Ex. 48. Si f (x) −→ ℓ , alors f (x) −→ |ℓ| . En effet, x→a
x→a
Démonstration page 407
f (x) − ℓ f (x) − ℓ −→ 0 . x→a
397
Chapitre 10. Limites et continuité Proposition 47 Soit f : I → C une fonction et a ∈ I . Si f admet une limite ℓ ∈ C en a, alors ℓ = f (a). On dit alors que f est continue en a . Démonstration. La démonstration est la même que dans le cas réel, en remplaçant la valeur absolue par le module. Définition 14 Soit f : I → C une fonction. On dit que f est continue si elle est continue en tout point a de I . Notation
2
On note C (I, C) l’ensemble des fonctions continues de I dans C.
Propriétés
La caractérisation séquentielle (cf. page 378) et les propriétés sur les limites finies d’une somme et d’un produit (cf. page 383) sont encore valables pour les fonctions à valeurs complexes. Il suffit de remplacer les valeurs absolues par des modules dans les démonstrations. Proposition 48 Soit f : I → C une fonction. Si f a pour limite ℓ en a, alors f a pour limite ℓ en a. Démonstration. Il suffit d’appliquer la définition et d’utiliser le fait que pour tout x ∈ I , on a f (x) − ℓ = f (x) − ℓ = |f (x) − ℓ| .
Théorème 49 Soit f : I → C une fonction. Les assertions suivantes sont équivalentes : (i) la fonction f a une limite en a ;
(ii) les fonctions Re (f ) et Im (f ) admettent des limites finies en a. Dans ce cas, on a : lim f = lim Re (f ) + i lim Im (f ) . a
a
a
Démonstration page 407
Corollaire 50 Soit f : I → C∗ une fonction. Si f a une limite non nulle ℓ en a, alors 1/f a pour limite 1/ℓ en a. Principe de démonstration.
Démonstration page 407 Préciser les parties réelles et imaginaires de 1/f .
Corollaire 51 Soit f : I → C une fonction complexe de la variable réelle. Les assertions suivantes sont équivalentes : (i) f est continue ; (ii) les fonctions Re (f ) et Im (f ) sont continues. 398
III Extension aux fonctions à valeurs complexes Ex. 49. 1. Lorsque f est une fonction continue, les fonctions f et |f | sont continues. 2. Les fonctions polynomiales complexes de la variable réelle sont continues sur IR . 3. Toute fonction rationnelle de la variable réelle à coefficients complexes est continue sur IR\P , où P est l’ensemble des racines réelles de son dénominateur. Par exemple la fonc1 est continue sur IR . tion t �→ t−i 4. La fonction t �→ eit est continue sur IR .
Proposition 52 (Composition des limites) Soit I et J deux intervalles de IR et f : I → J . On suppose lim f = b ∈ IR. a
Alors b appartient à J ou est une extrémité de J ; de plus, si g : J → C est telle que lim g = ℓ ∈ C, alors lim (g ◦ f ) = ℓ . b
a
Démonstration. Comme dans le cas de deux fonctions à valeurs réelles, elle se fait par caractérisation séquentielle. Exo 10.26
Attention Bien noter la dissymétrie entre f et g . La fonction f est impérativement à valeurs réelles, alors que g est à valeurs complexes. Point méthode • L’écriture f = Re f + i Im f permet, avec le théorème 49 de la page précédente, d’établir facilement des propriétés sur les limites et la continuité de fonctions de la variable réelle à valeurs complexes. • Il ne faut cependant pas perdre de vue que les propriétés algébriques, de compositions, etc. peuvent être utilisées et qu’elles sont souvent souples et efficaces.
Exo 10.27
3
Adaptation des théorèmes de continuité
• Le théorème des valeurs intermédiaires, de même que ses corollaires, n’a naturellement plus de sens dans le cas des fonctions complexes. • La notion de bornes atteintes n’a pas de sens non plus pour des fonctions complexes. Le théorème 40 de la page 394 s’adapte néanmoins : Corollaire 53 Toute fonction complexe continue sur un segment est bornée. Démonstration page 407
• La définition des fonctions lipschitziennes et la continuité uniforme s’étendent sans problème aux cas des fonctions à valeurs complexes, en remplaçant la valeur absolue par le module. • Le théorème de Heine reste valable, ainsi que sa démonstration qui utilise le théorème de Bolzano-Weierstrass dans sa version complexe (théorème 48 de la page 334). 399
Chapitre 10. Limites et continuité
Démonstrations Théorème 2 Raisonnons par l’absurde et supposons donc ℓ1 �= ℓ2 . La démonstration est fondée sur le fait que si f vérifie la propriété P1 au voisinage de a et vérifie la propriété P2 au voisinage de a , alors elle vérifie « P1 et P2 » au voisinage de a et donc en particulier sur un intervalle non vide (cf. remarque page 373). Distinguons trois cas. •
Supposons ℓ1 et ℓ2 réels. Dans ces conditions, |ℓ2 − ℓ1 | > 0 . Par définition, les inégali-
1| 1| et f (x) − ℓ2 |ℓ2 −ℓ sont toutes deux vérifiées au voisinage tés f (x) − ℓ1 |ℓ2 −ℓ 3 3 de a , donc sur un intervalle non vide J . Pour tout x ∈ J , on a :
|ℓ2 − ℓ1 | = (ℓ2 − f (x)) + (f (x) − ℓ1 ) f (x) − ℓ2 + f (x) − ℓ1
•
•
On obtient l’inégalité |ℓ2 − ℓ1 |
2 3
|ℓ2 − ℓ1 | , ce qui impossible.
2 |ℓ2 − ℓ1 |. 3
Supposons l’une des valeurs finie, l’autre infinie, par exemple ℓ1 ∈ IR et ℓ2 = ±∞ . Comme f a pour limite finie ℓ1 en a , il résulte de la proposition 1 de la page 374 que f est bornée au voisinage de a . Mais alors, il est impossible qu’elle tende vers ℓ2 , car sinon, d’après la remarque de la page 376, elle ne serait pas bornée au voisinage de a . Supposons ℓ1 et ℓ2 toutes deux infinies, par exemple ℓ1 = −∞ et ℓ2 = +∞ . Les inégalités f (x) −1 et f (x) 1 sont toutes deux vérifiées au voisinage de a . C’est impossible.
On a donc ℓ1 = ℓ2 . Proposition 3 •
•
Supposons ℓ = +∞ . En prenant A = f (a) + 1 dans la définition de la limite, on montre que l’inégalité f (x) f (a) + 1 est vérifiée au voisinage de a . Comme f est définie en a , on a en particulier f (a) f (a) + 1 : c’est impossible. Le cas ℓ = −∞ se traite de la même manière. On a donc ℓ ∈ IR . Pour tout ε > 0 , l’inégalité |f − ℓ| ε est vérifiée au voisinage de a . Comme f est définie en a , on a en particulier f (a) − ℓ ε . Si f (a) �= ℓ , on a, en choisissant ε =
|f (a)−ℓ| 2
est absurde. Ainsi, f (a) = ℓ .
> 0 , l’inégalité f (a) − ℓ
|f (a)−ℓ| 2
, ce qui
Proposition 4 Il faut distinguer selon que a = −∞ , a = +∞ ou a est réel. Nous ne traiterons que le cas a = +∞ , les autres démonstrations étant similaires. Soit ε > 0 . Puisque g(x) −→ 0 , il existe un réel M , tel que pour tout x ∈ I , on ait x→+∞
l’implication : x M =⇒ g(x) ε. A fortiori, pour tout x ∈ I vérifiant x M , on a :
f (x) − ℓ g (x) ε.
La conclusion en découle.
Théorème 5 Il y a a priori neuf cas à traiter, suivant que a et ℓ sont réels ou égaux à ±∞ , mais les démonstrations dans chacun des cas sont très similaires. Nous ne traiterons qu’un cas. Supposons f (x) −→ ℓ , avec a et ℓ finis. Soit ε un réel strictement positif. x→a
L’hypothèse f (x) −−−→ ℓ se traduit par l’existence d’un η > 0 tel que pour tout x ∈ I x→a
vérifiant |x − a| η , nous ayons f (x) − ℓ ε . Fixons un tel η .
400
Démonstrations L’hypothèse sur la suite (xn )n∈IN donne l’existence d’un entier naturel n0 tel que pour tout entier n n0 nous ayons |xn − a| η . Par conséquent, pour tout entier n n0 , nous avons f (xn ) − ℓ ε . Ainsi, par définition f (xn ) −→ ℓ .
Théorème 6 Supposons que la suite (un )n∈IN converge vers ℓ ∈ I . Alors, par extraction, lim un+1 = ℓ , mais on a également, par continuité de f en ℓ : n→+∞
un+1 = f (un ) −→ f (ℓ) . n→+∞
Par conséquent, par unicité de la limite, ℓ = f (ℓ) . Théorème 7 Seul le sens (ii) ⇒ (i) est à traiter (cf.théorème 5 de la page 377). Il faut encore a priori traiter neuf cas. Les démonstrations dans chacun des cas sont relativement semblables. Nous traitons le cas où a = +∞ et ℓ est fini. Supposons que l’assertion (ii) soit vraie et que ℓ ne soit pas limite de f en +∞ . Cela signifie qu’il existe un réel ε > 0 tel que : ∀M ∈ IR
∃x ∈ I ∩ [M, +∞[
f (x) − ℓ > ε.
On peut donc, pour tout entier naturel n , choisir un réel xn ∈ I tel que xn n et f (xn ) − ℓ > ε . Il est clair que lim xn = +∞ , et donc, d’après l’hypothèse (ii) , on n→+∞
a
lim f (xn ) = ℓ . En passant à la limite dans l’inégalité f (xn ) − ℓ > ε , on obtient 0 ε ,
n→+∞
ce qui est absurde. Proposition 8 •
Notons J = [a − r, a + r] , avec r un réel strictement positif. Il s’agit de démontrer que si lim f|I∩J = ℓ , alors f a une limite en a et lim f = ℓ , puisque nous avons remarqué que a
a
l’autre implication est évidente. Soit (xn )n∈IN une suite à valeurs dans I qui converge vers a . Par définition de la limite d’une suite, il existe un rang n0 tel que, pour tout n n0 , on ait |xn −a| r . Puisque lim f|J = ℓ a
et que la suite (xn )n∈IN est à valeurs dans I ∩ J à partir d’un certain rang, on a, par composition des limites, lim f (xn ) = ℓ . On conclut alors par caractérisation séquentielle. n→+∞
•
Les cas +∞ et −∞ se traitent de manière similaire.
Proposition 10 • •
Si f est continue en a , alors il est évident qu’elle est continue à droite et à gauche en a . Supposons que f soit continue à droite et à gauche en a . Soit ε > 0 . Puisque f est continue à droite, il existe ηd > 0 tel que : ∀x ∈ I ∩ [a, +∞[ Il existe de même ηg > 0 tel que : ∀x ∈ I ∩ ]−∞, a]
x − a ηd ⇒ f (x) − f (a) ε .
x − a ηg ⇒ f (x) − f (a) ε .
Par conséquent, en posant η = min{ηg , ηd } , on a η > 0 et : ∀x ∈ I
x − a η ⇒ f (x) − f (a) ε .
La conclusion est alors immédiate.
401
Chapitre 10. Limites et continuité Proposition 11 • Si f est continue en a , elle a pour limite f (a) en a et a fortiori la restriction à ]a, +∞[ a pour limite f (a) en a , c’est-à-dire x→a lim f (x) = f (a) . x>a
•
Supposons x→a lim f (x) = f (a) . Soit ε > 0 . Par définition de la limite à droite, il existe η > 0 x>a
tel que :
∀x ∈ I ∩ ]a, +∞[ Puisque f (a) − f (a) = 0 , on a :
∀x ∈ I ∩ [a, +∞[
|x − a| η =⇒ f (x) − f (a) ε .
|x − a| η =⇒ f (x) − f (a) ε ,
ce qui est la définition de la continuité à droite.
Théorème 12 • Si un tel prolongement f existe, on a par continuité de f et caractère local de la limite : f|I\{a} (x) −→ f(a). x→a
Par ailleurs, pour tout x ∈ I \ {a} , on a f|I\{a} (x) = f (x) . Ainsi : f (x) −→ f(a). x→a
Donc f a une limite finie en a . •
Supposons que f possède une limite finie en a , que nous notons ℓ . Soit f le prolongement
de f à I définie par f(a) = ℓ . Soit ε > 0 . Par définition, il existe η > 0 tel que, pour
tout x ∈ I \ {a} , on ait f (x) − ℓ ε . Fixons un tel η . Par conséquent, f(x) − ℓ ε pour tout x ∈ I \ {a} vérifiant |x − a| η . Puisque f(a) = ℓ , il vient que : ∀x ∈ I
Donc f est continue en a .
|x − a| η =⇒ f(x) − f(a) ε .
Proposition 13 On utilise la caractérisation séquentielle de la limite et la proposition 21 de la page 323. Plus précisément, soit (xn )n∈IN une suite à valeurs dans I , de limite a . Puisque g est bornée au voisinage de a , la suite g(xn ) n∈IN est bornée. Par composition des limites, la
suite f (xn )
n∈IN
converge vers 0 . Ainsi :
(f g)(xn ) = f (xn )g(xn ) −→ 0. n→+∞
Le théorème de caractérisation séquentielle permet alors de conclure. Proposition 14
Soit (xn )n∈IN une suite à valeurs dans I telle que xn −→ a . n→+∞
Par composition des limites, f (xn ) −→ ℓ et g(xn ) −→ ℓ′ . n→+∞
n→+∞
D’après les opérations sur les limites des suites, si ℓ + ℓ′ est définie dans IR , alors f (xn ) + g(xn ) −→ ℓ + ℓ′ . n→+∞
Ainsi, par caractérisation séquentielle, f (x) + g(x) −→ ℓ + ℓ′ . x→a
Les cas du produit λ f et du produit f g se traitent de la même manière.
402
Démonstrations Théorème 16
Soit (xn )n∈IN une suite à valeurs dans I telle que xn −→ a . Par composition n→+∞
∗
des limites, f (xn ) −→ ℓ . Puisque f est à valeurs dans IR , la suite n→+∞
1 f (xn )
D’après les opérations sur les limites des suites, sachant que ℓ �= 0 , on a
est définie. n∈IN
1 f (xn )
−→
n→+∞
1 · ℓ
On
conclut par caractérisation séquentielle de la limite. Proposition 19
Soit (xn )n∈IN une suite à valeurs dans I telle que xn −→ a . Par composition n→+∞
des limites, f (xn )
∗
±∞ . Puisque f est à valeurs dans IR , la suite
−→
n→+∞
définie. D’après les opérations sur les limites des suites, on a
1 f (xn )
1 f (xn )
est
n∈IN
−→ 0 . On conclut par
n→+∞
caractérisation séquentielle de la limite. Proposition 20
Soit (xn )n∈IN une suite à valeurs dans I telle que xn −→ a . Par composition n→+∞
des limites, f (xn ) −→ 0 . Si f est à valeurs dans IR∗+ , la suite (f (xn ))n∈IN est à valeurs n→+∞
strictement positives. D’après les opérations sur les limites des suites, on a
1 −→ f (xn ) n→+∞
+∞ .
On conclut par caractérisation séquentielle de la limite. Le deuxième cas s’en déduit en utilisant −f . Théorème 21 Soit (xn )n∈IN une suite à valeurs dans I , de limite a . Par composition des limites dans le cas des suites, on a lim f (xn ) = b , du fait que lim f = b . Le même théorème assure, n→+∞
en vertu de l’hypothèse lim g = ℓ , que b
a
lim g f (xn ) = ℓ . Le théorème de caractérisation
n→+∞
séquentielle permet de conclure.
Proposition 23 Nous ne traiterons que le cas où ℓ est strictement positive, le cas ℓ < 0 s’y ramenant par passage à l’opposé. Cas a fini. Supposons que f ne soit pas strictement positive au voisinage de a . En particulier, pour tout entier n ∈ IN∗ , il existe au moins un réel xn ∈ I ∩ a− n1 , a+ n1 tel que f (xn ) 0 . Par passage à la limite dans les inégalités pour les suites (cf.corollaire 31 de la page 326), on a ℓ = lim f (xn ) 0 , ce qui est faux. n→+∞
Cas a = +∞ . On raisonne de même en introduisant une suite (xn )n∈IN telle que, pour tout entier n , on ait xn ∈ I ∩ [n, +∞[ . Le cas a = −∞ est similaire. Théorème 28 On peut supposer sans perte de généralité que f est croissante. Nous faisons la démonstration concernant la limite en b , celle de la limite en a étant similaire. Notons J = f I . Cas J majoré. Posons L = sup J . Soit ε un réel strictement positif. Par définition de la borne supérieure, il existe β ∈ I tel que L − ε f (β) (sinon, L − ε serait un majorant de f ). D’après la croissance de f et la définition de la borne supérieure, pour tout x ∈ I , avec β x < b , on a : L − ε f (β) f (x) L. Par définition de la limite, lim f (x) = L . x→b
Cas J non majoré. Soit M un réel. Il existe β ∈ I tel que f (β) M . Ainsi, pour tout x ∈ I , tel que β x < b , on a : M f (β) f (x) .
Toujours par définition, lim f (x) = +∞ . x→b
403
Chapitre 10. Limites et continuité Corollaire 29 Supposons f croissante. Comme x est intérieur à I , il existe c ∈ I tel que c > x . Alors ]x, c[ ⊂ I et, pour tout t ∈ ]x, c[ : f (x) f (t) = f|]x,c[ (t).
La fonction f|]x,c[ qui est croissante et minorée par f (x) sur l’intervalle ouvert ]x, c[ possède, d’après le théorème 28 de la page 388, une limite finie en x . Donc f a une limite finie à droite en x . Par passage à la limite dans l’inégalité, cette limite est supérieure à f (x) . On obtient de même le résultat pour la limite à gauche en considérant la restriction de f à ]d, x[ , où d ∈ I et d < x . Si f est décroissante, toutes les inégalités changent de sens. Théorème 34 Soit f une fonction K -lipschitzienne sur I et a ∈ I . Pour tout x ∈ I , on a : f (x) − f (a) K |x − a| .
On conclut en remarquant que lim K|x − a| = 0 , ce qui implique lim f (x) = f (a) . x→a
x→a
Théorème 35 Soit y entre f (a) et f (b) . On veut montrer qu’il existe c entre a et b tel que f (c) = y . On peut supposer, sans perte de généralité, a b . On a f (a) y f (b) ou f (b) y f (a) . Quitte à considérer −f et montrer qu’elle prend la valeur −y , on peut supposer f (a) y f (b) . On construit deux suites adjacentes (αn )n∈IN et (βn )n∈IN d’éléments de I . On procède par récurrence. On pose (α0 , β0 ) = (a, b) . Par hypothèse on a f (α0 ) y et f (β0 ) y . Ensuite, n , on pose : pour tout entier naturel n , en notant cn = αn +β 2 (αn+1 , βn+1 ) =
(cn , βn ) (αn , cn )
si f (cn ) y sinon.
de x Les suites sont bien définies et à valeurs dans I , car pour (x, y) ∈ I 2 , le milieu x+y 2 et y est encore un élément de I . On vérifie alors, par une récurrence immédiate que, pour tout entier n on a : f (αn ) y et f (βn ) y. (∗) De plus, toujours pour tout entier n : βn+1 − αn+1 = Par conséquent, βn − αn =
1 2n
= =
βn − cn cn − αn
(β0 − α0 ) et donc
βn −αn 2 βn −αn 2
si f (cn ) y, sinon.
lim (βn − αn ) = 0 .
n→+∞
Comme β0 − α0 = b − a 0 , on a également βn − αn 0 pour tout n ∈ IN . De la définition des suites (αn )n∈IN et (βn )n∈IN , on déduit alors : αn+1 − αn =
βn −αn 2
0
0
si f (cn ) y, sinon ;
ce qui montre que (αn )n∈IN est croissante. On montre de même que (βn )n∈IN est décroissante. Il s’ensuit que les suites (αn )n∈IN et (βn )n∈IN sont adjacentes. On note c leur limite commune. Alors c ∈ [a, b] , car pour tout n ∈ IN , a αn βn b . La fonction f étant continue en c , on obtient, en passant à la limite dans les inégalités (∗) : f (c) y et donc f (c) = y .
404
et
f (c) y
Démonstrations 2
Corollaire 37 Soit (α, β) ∈ f I , avec α β . Par définition, il existe (a, b) ∈ I 2 tel que f (a) = α et f (b) = β . D’après le théorème des valeurs intermédiaires, on a [α, β] ⊂ f (I) . On conclut, à l’aide de la caractérisation des intervalles (cf.proposition 4 de la page 312), que f (I) est un intervalle. Théorème 40 •
Supposons que f ne soit pas majorée. Alors, il existe une suite (xn )n∈IN à valeurs dans [a, b] telle que
lim f (xn ) = +∞ . En effet f [a, b] n’est pas majoré, et donc, pour tout entier
n→+∞
naturel n , il existe xn ∈ [a, b] tel que f (xn ) n . D’après le théorème de Bolzano-Weierstraß (voir page 329), il existe une suite extraite conver-
gente xϕ(n)
n∈IN
; on note x sa limite. Par extraction, nous avons
Par ailleurs, par continuité de f en x , nous obtenons l’égalité
lim f xϕ(n) = +∞ .
n→+∞
lim f xϕ(n) = f (x) , ce
n→+∞
qui est contradictoire. Par conséquent f est majorée. De même, f est minorée. •
Notons M = sup f (x) . Supposons que M ne soit pas une valeur atteinte par f . Consix∈[a,b]
dérons alors la fonction g : t �→
1 M −f (t)
, qui est définie et continue sur [a, b] . Par définition
de la borne supérieure, pour tout α > 0 , il existe t ∈ [a, b] tel que M − α1 f (t) et donc g(t) α . La fonction g continue sur un segment n’est pas majorée, ce qui est contradictoire avec le premier point. Donc f atteint la valeur M. On montre de même qu’elle atteint la valeur m . Corollaire 41 Soit f : [a, b] → IR une fonction continue, avec a < b . D’après le théorème 40 de la page 394, elle possède un minimum m et un maximum M . D’après le théorème des valeurs intermédiaires, f ([a, b]) est un intervalle, clairement inclus dans [m, M ] . Comme m et M appartiennent à f ([a, b]) , on a f ([a, b]) = [m, M ] . Théorème 42
On a remarqué que l’implication (ii) ⇒ (i) est vraie.
Démontrons l’implication (i) ⇒ (ii) . Soit f une fonction continue et injective sur I . Considérons deux éléments a et b de I , tels que a < b . Quitte à remplacer f par −f , on peut supposer f (a) < f (b) . Montrons qu’alors f est strictement croissante. Soit (x, y) ∈ I 2 , x < y . Considérons la fonction : g : [0, 1] t
−→ �−→
IR f (1 − t)b + ty − f (1 − t)a + tx .
On a pour tout t ∈ [0, 1] , min{b, y} (1 − t)b + ty max{b, y} . Comme b et y sont dans I , on en déduit (1 − t)b + ty ∈ I . On montre de même que (1 − t)a + tx ∈ I . Ainsi, la fonction g est bien définie sur [0, 1] . De plus, elle est continue, d’après les théorèmes généraux. Montrons que g ne s’annule pas sur [0, 1] . Supposons qu’il existe t ∈ [0, 1] tel que g(t) = 0 . Comme f est injective, on en déduit (1 − t)b + ty = (1 − t)a + tx , i.e. (1 − t)(b − a) = t(x − y) . Par hypothèse, on a (1 − t)(b − a) 0 et t(x − y) 0 . L’égalité n’est donc possible que si (1 − t)(b − a) = 0 et t(x − y) = 0 . Mais cela nécessite t = 1 et t = 0 . C’est impossible. Par conséquent, g ne s’annule pas sur [0, 1] . D’après le théorème des valeurs intermédiaires, g étant continue, elle garde un signe strict constant. Puisque g(0) = f (b) − f (a) > 0 , on a aussi g(1) = f (y) − f (x) > 0 , donc f (x) < f (y) : la fonction f est strictement croissante.
405
Chapitre 10. Limites et continuité Théorème 43 1.
L’application f est injective, donc induit une bijection de I sur J = f (I) . De plus, J est un intervalle d’après le théorème des valeurs intermédiaires.
2.
On a f −1 (J) = I et I est un intervalle. De plus, f −1 est monotone, de même monotonie que f . La continuité de f −1 résulte alors du lemme suivant, réciproque partielle du théorème des valeurs intermédiaires.
Lemme Soit g : I → IR une fonction monotone. Si g (I) est un intervalle, alors g est continue sur I . Démonstration. On démontre que si g n’est pas continue, alors g(I) n’est pas un intervalle. On peut, quitte à passer à l’opposé, supposer que g est croissante. Supposons donc que g ne soit pas continue en x ∈ I et notons g(x−) et g(x+ ) les limites à gauche et à droite de g en x . On a alors g(x− ) �= g(x) ou g(x+ ) �= g(x) .
g(t) g(x+ ) g(x)
x
t
I
Pour fixer les idées, supposons g(x+ ) �= g(x) , c’est-à-dire ici g(x+ ) > g(x) . Alors, aucune valeur de ]g(x), g(x+ )[ n’appartient à g(I) . En effet, pour tout t ∈ I , si t x , alors g(t) g(x) et si t > x , alors g(t) g(x+ ) . Considérons un réel t > x , ce qui est possible car g possède une limite à droite en x , donc x n’est pas le plus grand élément de I . Alors, g(x) et g(t) sont dans l’image, mais [g(x), g(t)] �⊂ g(I) . Ainsi g(I) n’est pas un intervalle. Proposition 44 Soit f une fonction K -lipschitzienne. On peut supposer K > 0 . Soit ε > 0 . En ε , on a pour tout (x, y) ∈ I 2 vérifiant |x − y| η : posant η = K
f (y) − f (x) K |y − x| K η = ε.
Théorème 45 Soit f : [a, b] → IR une fonction continue, avec a < b . On démontre le résultat par l’absurde. Soit donc ε > 0 tel que, pour tout η > 0 , il existe (x, y) ∈ [a, b]2 tel que |x − y| η et f (y) − f (x) > ε . En particulier, pour tout n ∈ IN∗ , il existe (xn , yn ) ∈ [a, b]2 tel
que |xn − yn |
1 n
et f (yn ) − f (xn ) > ε .
D’après le théorème de Bolzano-Weierstraß, il existe une application ϕ : IN → IN strictement croissante telle que la suite (xϕ(n) )n∈IN converge. Notons ℓ = lim xϕ(n) . n→+∞
Puisque |yn − xn |
1 n
, on a
lim (yn − xn ) = 0 et donc, par extraction,
n→+∞
lim yϕ(n) = ℓ .
n→+∞ Par continuité de f en ℓ , en passant à la limite dans l’inégalité f (yϕ(n) ) − f (xϕ(n) ) > ε , on
obtient 0 ε , ce qui est absurde.
406
Démonstrations Proposition 46
On a, pour tout x ∈ I :
0 ℓ − ℓ′ = ℓ − f (x) + f (x) − ℓ′ f (x) − ℓ + f (x) − ℓ′ .
Par passage à la limite dans les inégalités, du fait que f (x) − ℓ −→ 0 et f (x) − ℓ′ −→ 0 , on en déduit |ℓ − ℓ′ | 0 , et donc ℓ = ℓ′ .
x→a
x→a
Théorème 49 • Si lim f = ℓ , alors lim f = ℓ . D’après les propriétés des limites d’une somme et d’un produit, a
a
on a lim Re (f ) = lim a
•
a
f +f 2
=
ℓ+ℓ 2
et lim Im (f ) = lim a
a
f −f 2i
=
ℓ−ℓ · 2i
De même, si Re (f ) et Im (f ) ont une limite en a , alors :
lim f = lim Re (f ) + i Im (f ) = lim Re (f ) + i lim Re (f ) . a
Corollaire 50
On a
1 f
=
a
Re f |f |2
−i
Im f |f |2
a
a
2
2
. La limite de |f | en a est |ℓ| �= 0 . De par les théorèmes
généraux sur les fonctions réelles, les fonctions réelles Re f1 et Im en a . On obtient : Im ℓ 1 1 Re ℓ −i 2 = · −→ f (x) x→a |ℓ|2 |ℓ| ℓ Corollaire 53
1 f
ont des limites finies
Soit f : [a, b] → C continue.
Les fonctions réelles |Re f | et |Im f | sont continues sur le segment [a, b] . Elles sont respective√ ment majorées par des fonctions constantes A et B . Alors |f | est majorée par A2 + B 2 .
407
Chapitre 10. Limites et continuité
S’entraîner et approfondir Limites et continuité ponctuelle 10.1 Montrer que lim
x→0
→377
√
x
1 √ x
= 1.
10.2 Montrer que la fonction 1Q indicatrice de Q , définie sur IR , n’admet de limite en aucun →377 point. On utilisera les densités de Q et de IR \ Q dans IR (cf. page 314). 10.3 Montrer que →380
10.4 Soit f : →381
IR x
√
x2 + 1 − x
−→ �−→
−→ 0 .
x→+∞
et n un entier relatif.
IR x − ⌊x⌋
Déterminer, si elles existent, les limites x→n lim f (x) et x→n lim f (x) . x>n
10.5 La fonction f définie sur IR par f (x) = →381
x 0 sinon
est-elle continue en 0 ?
1 10.6 Démontrer que la fonction f définie sur IR∗ par f (x) = exp − 2 x →383 par continuité en 0 .
admet un prolongement
10.7 Soit f, g : I → IR . →384 1. Démontrer que si deux des trois termes lim(f + g) , lim f et lim g sont définis et sont a
a
a
réels, alors le troisième est défini et l’on a lim(f + g) = lim f + lim g . a
a
a
2. Démontrer que si deux des trois termes lim(f + g) , lim f et lim g sont définis a
a
a
et au moins un de ces deux termes est réel, alors le troisième est défini et l’on a lim(f + g) = lim f + lim g . a
a
a
10.8 Soit f : I → IR et g : I → IR deux fonctions continues en a ∈ I . →385 Démontrer que les fonctions sup{f, g} et inf{f, g} sont continues en a . On rappelle que les fonctions sup{f, g} et inf{f, g} sont définies sur I par :
sup{f, g} : x �→ max f (x), g(x) 10.9 Déterminer la limite de x �→ →387
10.11 Calculer lim (1 + x)1/x . x→0
→387
408
et
inf{f, g} : x �→ min f (x), g(x) .
√ x2 + 2x − x en +∞ .
10.10 Déterminer les limites de x �→ →387
3x2 + x − 1 −x3 + x2 + 5 et x �→ 3 en +∞ . 3 2 5x − x + 2 x − 2x + 1
Exercices 2x
dt √ · t + t x √ Pour chercher la limite de f en +∞ , on peut remarquer que t + t est « proche » de t lorsque t tend vers +∞ . Ce qui suit met en forme cette idée.
10.12 On pose pour tout x ∈ [1, +∞[ , f (x) = →388
1. Que vaut, pour x > 0 , l’intégrale
2x x
dt ? t
2. Démontrer que pour tout t ∈ [1, +∞[ , on a : 0
3. En déduire une majoration de ln 2 − f (x) .
1 1 1 √ 3/2 · − t t t+ t
4. Quelle est la limite de f (x) lorsque x tend vers +∞ ?
10.13 Soit f : IR∗+ → IR croissante, telle que g : x �→ →388
est continue.
f (x) soit décroissante. Démontrer que f x
10.14 Déterminer les limites de :
x−1 x+1
1.
x �→ x
2.
x �→
tan(5x) en 0 ; sin(2x)
3.
x �→
e3x + 2x + 7 en +∞ . ex + e−x
−1
en +∞ ;
10.15 Déterminer les fonctions périodiques ayant une limite en +∞ . ⋆ 10.16 Soit f : I → IR une fonction. Démontrer l’équivalence entre les assertions : (i) pour toute suite (xn )n∈IN à valeurs dans I , de limite a , la suite
une limite finie ou infinie ; (ii) la fonction f admet une limite, finie ou infinie, en a .
f (xn )
n∈IN
admet
Continuité globale 10.17 Soit f : →390
IR x
−→ �−→
IR x2 .
• Démontrer que la restriction de f à [0, 1] est lipschitzienne.
• Démontrer que f n’est pas lipschitzienne.
10.18 Soit (a1 , . . . , an ) ∈ [0, 1]n . Démontrer qu’il existe a ∈ [0, 1] tel que →392
1 n
n
k=1
|ak − a| = 21 ·
10.19 Soit f : I → IR une fonction continue telle que f (I) ⊂ Q . Démontrer que f est constante. →392
10.20 1. Donner un exemple de fonction f : ]−1, +1[ → IR telle que f ]−1, 1[ = [−1, 1] . →393
2. Donner un exemple de fonction continue f : [0, +∞[ → IR , telle que f [0, +∞[ = [0, 1[ .
409
Chapitre 10. Limites et continuité 10.21 Montrer que toute fonction polynomiale réelle f de degré impair admet au moins un zéro →393 sur IR . 10.22 Soit f : IR → IR une fonction continue telle qu’il existe a ∈ IR vérifiant (f ◦ f )(a) = a . →394 Montrer qu’il existe c ∈ IR tel que f (c) = c . 10.23 Montrer qu’une fonction continue sur IR et périodique est bornée et atteint ses bornes. →394
10.24 Démontrer que la fonction f : IR → IR définie par f (x) = x3 + x + 1 , est une bijection de IR →395 sur IR . 10.25 Soit f : →397
[0, +∞[ x
−→ �−→
IR √
x.
1. Démontrer que pour tout a ∈ IR∗+ , la fonction f|[0,a] est uniformément continue.
2. Démontrer que f est uniformément continue. 3. La fonction réciproque d’une bijection uniformément continue d’un intervalle I sur un intervalle J est-elle uniformément continue ? 10.26 Soit f : I → C une fonction à valeurs complexes. Démontrer que si f admet une limite →399 en a , alors exp ◦f admet une limite en a . 10.27 Déterminer, pour α réel et n entier naturel, →399
lim
x→+∞
eiα x − 1 e−iα x − 1
n
.
10.28 Soit f une fonction réelle définie sur IR , continue en 0 et telle que : Démontrer que f est constante.
∀x ∈ IR
f (2x) = f (x) .
10.29 Soit f : IR → IR une fonction continue, vérifiant : On pose α = f (1)
∀(x, y) ∈ IR2
f (x + y) = f (x) + f (y) .
1. Calculer f (x) en fonction de x et α , successivement pour x ∈ IN , x ∈ ZZ et x ∈ Q . 2. Déterminer f . 10.30 1. Justifier qu’il existe une unique fonction réelle définie sur IR qui soit 1 -périodique et telle que : 1 1 f (x) = |x| ∀x ∈ − , 2 2 2. Démontrer que f est continue.
10.31 Soit f : [0, 1] −→ IR , continue, telle que f (0) = f (1) et n ∈ IN∗ . 1 1 tel que f α + = f (α) . Montrer qu’il existe α ∈ 0, 1 − n n
410
Exercices 10.32 Montrer qu’il n’existe pas d’application f continue de IR dans IR telle que tout réel ait exactement deux antécédents par f . 10.33 Soit f et g deux applications continues de [0, 1] dans [0, 1] telles que f ◦ g = g ◦ f .
1. Soit E = {x ∈ [0, 1] : f (x) = x} . Montrer que E n’est pas vide, qu’il possède un minimum a et un maximum b . 2. Montrer que, pour tout x ∈ E , g(x) ∈ E . En déduire qu’il existe c ∈ [0, 1] tel que f (c) = g(c) .
⋆ 10.34 Soit f : IR → IR une fonction continue telle que lim f = lim f = +∞ . Démontrer que f est minorée et que sa borne inférieure est atteinte.
−∞
+∞
⋆ 10.35 Déterminer les fonctions continues f : [0, 1] → [0, 1] vérifiant f ◦ f = f . On commencera par déterminer f|f ([0,1]) . 10.36 Montrer qu’il n’existe pas d’application f : IR → IR continue, telle que f ◦ f = − IdIR . ⋆ 10.37 Soit f et g deux fonctions réelles continues, définies sur [0, 1] . On pose, pour tout x réel :
ϕ (x) = sup f (t) + xg(t) . t∈[0,1]
Démontrer que ϕ est lipschitzienne.
10.38 Pour tout λ ∈ IR+ , on pose Pλ (x) = x3 + λx − 1 .
1. Montrer que, pour tout λ ∈ IR+ , la fonction Pλ a une unique racine réelle, notée u(λ) . 2. Montrer que l’application u : [0, +∞[ λ 3. Calculer sa limite en +∞ .
−→ �−→
IR u(λ)
est monotone et continue.
⋆ 10.39 Démontrer qu’une fonction réelle, définie sur IR , continue et périodique, est uniformément continue.
411
Chapitre 10. Limites et continuité
Solutions des exercices 10.1 On s’intéresse à la limite en √ 1 par f (x) = x √ . x
0
de la fonction
f
définie sur l’intervalle
IR∗+
Soit x un réel strictement positif. On essaie de majorer f (x) − 1 . Par définition de la partie entière d’un réel, on a : 1 √ − √1 1. x x √ En multipliant par x , on obtient :
1 − √x √1 √x. x
La proposition 4 permet alors de conclure, puisqu’on a montré que la page 377).
√
x −→ 0 (exemple 9 de x→0
10.2 La démonstration repose sur la densité de Q dans IR et la densité de IR \ Q dans IR . Soit x un réel. On sait qu’il existe deux suites (xn )n∈IN et (yn )n∈IN convergeant vers x , la première à valeurs dans Q , la seconde à valeurs dans IR \ Q (voir page 314). Puisque 1Q (xn ) = 1 pour tout n ∈ IN , on a lim 1Q (xn ) = 1 . n→+∞
De même,
lim 1Q (yn ) = 0 et donc 1Q n’est pas continue en x . On montre de même que 1Q
n→+∞
n’a pas de limite en +∞ et −∞ , en considérant des suites ayant pour limites ±∞ à valeurs dans Q ou IR \ Q . 10.3 On a pour tout réel x > 0 :
√
√ 1 + x2 − x 1 + x2 + x 1 √ √ +1−x = = > 0. x + 1 + x2 x + 1 + x2 Ainsi, toujours pour tout x > 0 : 1 1 √ , x2 + 1 − x = 2 x x+ 1+x 1 −→ 0 . et l’on conclut à l’aide du fait que x x→+∞
x2
10.4 Puisque f|]n−1,n[ est la fonction x �→ x − n + 1 et f|]n,n+1[ la fonction x �→ x − n , on a : lim f (x) = 1
et
x→n xn
10.5 La fonction est évidemment continue à gauche en 0 , car f|]−∞,0] est nulle. De plus, on a lim f (x) = 0 , par composition des limites (cf.théorème 21 de la page 385), et f (0) = 0 ; x→0+
ainsi f est continue à droite en 0 , et donc continue en 0 .
10.6 On a lim − x12 x→0
= −∞ et donc lim exp − x12 x→0
= 0 par le théorème de composition des
limites. Donc f admet un prolongement par continuité en 0 . Si on note f ce prolongement, 1 exp − 2 si x �= 0 x on a f(x) = 0 si x = 0.
412
Solutions des exercices 10.7 1. C’est immédiat si lim f et lim g existent et sont réelles. Si lim f et lim(f + g) existent a
a
a
a
et sont réelles, alors, du fait que g = (f + g) − f , la limite de g est définie en a . De même, si lim g et lim(f + g) existent et sont réelles. a
a
2. C’est encore immédiat si lim f et lim g existent et l’une de ces limites est réelle. Là a
a
encore, si lim f et lim(f + g) existent et que et l’une de ces limites est réelle, on peut a
a
remarquer que l’égalité g = (f + g) − f permet de conclure. 10.8 Rappelons que, pour tout (x, y) ∈ IR2 , on a max{x, y} =
x + y + |x − y| 2
et
min{x, y} =
x + y − |x − y| 2
On en déduit que : f + g + |f − g| f + g − |f − g| et inf{f, g} = · 2 2 Les fonctions f + g et |f − g| sont continues en a (la seconde comme composée de fonctions continues) donc il en est de même de sup{f, g} et inf{f, g} . sup{f, g} =
10.9 Puisque x tend vers +∞ , on peut supposer que x > 0 . On multiplie et divise par la quantité conjuguée : 2x 2 x2 + 2x − x = √ = , x2 + 2x + x 1 + x2 + 1 d’où
lim
x→+∞
10.10 • Le quotient
x2 + 2x − x = 1. −x3 +x2 +5 5x3 −x2 +2
est défini pour x assez grand, car le dénominateur tend vers +∞
quand x tend vers +∞ et on a, en mettant en facteur x3 : −1 + x1 + x53 −x3 + x2 + 5 = 3 2 5x − x + 2 5 − x1 + x23
1 −x3 + x2 + 5 =− · x→+∞ 5x3 − x2 + 2 5 • En procédant de même, on obtient : 1 1 1 3 + x + x2 3x2 + x − 1 = · , 2 3 x − 2x + 1 x 1 − x2 + x13 d’où
d’où
lim
3x2 + x − 1 = 0. x→+∞ x3 − 2x + 1 lim
10.11 La fonction x → � ln(1 + x) est définie sur ]−1, +∞[ contenant 0 . De la dérivabilité de fonction ln en 1 , il vient que : lim
x→0
ln (1 + x) = ln′ (1) = 1. x
Il s’ensuit, par continuité de la fonction exponentielle : (1 + x)1/x = exp
1 ln (1 + x) −→ e1 = e. x→0 x
413
Chapitre 10. Limites et continuité 10.12 1. On a, pour x > 0 :
2x x
√
2x 2x dt = ln t x = ln t x 1√ t+ t
dt = t3/2
1 t
= ln 2.
. De plus : √ 1 t t 1 1 0 − √ = √ 2 = 3/2 · t t t t+ t t t+ t
2. Pour tout t 1 , on a t +
t t et donc
√
3. Soit x 1 . Puisque x 2x , on a : 0
2x
x
Puisque :
0
1 1 √ − t t+ t
x
on en déduit que :
2x
dt − t
2x
dt
2x x
dt √ = t+ t
x
x
0 ln 2 − f (x) 4. Puisque
√1 −→ x x→+∞
2x
−2 √ t
2x
=
x
1 1 − √ t t+ t
√ 2− 2 √ · x
dt,
√ 2− 2 √ · x
0 , on a f (x) −→ ln 2 . x→+∞
10.13 Pour x ∈ IR∗+ , on note f (x+ ) et f (x− ) les limites à droite et à gauche de f en x et de même pour g . Ces limites existent, d’après le théorème de la limite monotone. Comme f est croissante, on a, pour tout x ∈ IR∗+ : f (x− ) f (x) f (x+ ).
Puisque g est décroissante, on a : g(x+ ) g(x) g(x− ), c’est-à-dire
f (x) f (x− ) f (x+ ) · x x x
Comme x > 0 , on en déduit f (x+ ) f (x) f (x− ) . On obtient f (x− ) = f (x+ ) = f (x) donc f est continue en x . Ceci étant vrai pour tout x > 0 , on en déduit que f est continue.
10.14 1. Pour x > 1 , on a x
x−1 x+1
−1 = x
1 1− x 1 1+ x
− 1 . La parenthèse tend vers 0 : on a
une « forme indéterminée ». On multiplie par l’expression conjuguée : x
1 1− x 1 1+ x
f (x) =
1 1− x 1 1+ x
−1
+1
=
En appliquant les théorèmes généraux, on trouve : x
−2 1 1+ x 1 1− x 1 1+ x
+1 x−1 x+1
tan(5x) 5x 2x tan(5x) 5 tan 5x = d’où lim = · x→0 sin 2x sin 2x 5x 2x sin(2x) 2
2.
e3x e2x e3x + 2x + 7 > x = , x −x −x e +e e +e 1 + e−2x e3x + 2x + 7 = +∞. d’où lim x→+∞ ex + e−x
3. Pour x > 0 , on a :
414
·
−1
−→ −1 .
x→+∞
Solutions des exercices 10.15 Soit f : IR → IR une fonction T -périodique ayant une limite ℓ en +∞ . Pour tout x ∈ IR , la suite (x + nT )n∈IN tend vers +∞ donc lim f (x + nT ) = ℓ . Par ailleurs la suite a
f (x + nT )
n→+∞
est constante, égale à f (x) , et par conséquent on
n∈IN
lim f (x + nT ) = f (x) . Par unicité de la limite, on a f (x) = ℓ (et donc ℓ ∈ IR ). Comme
n→+∞
ceci est vrai pour tout x , la fonction f est constante. Réciproquement, si f est constante, égale à c , alors elle est T -périodique, pour tout T > 0 , et a pour limite c en +∞ . 10.16 Seule l’implication (i) ⇒ (ii) est à démontrer. D’après la caractérisation séquentielle de la limite, il suffit de montrer qu’il existe ℓ ∈ IR tel que toute suite (xn )n∈IN à valeurs dans I ,
de limite a , la suite f (xn )
n∈IN
admet ℓ comme limite.
Considérons deux suites (xn )n∈IN et (yn )n∈IN à valeurs dans I de limite a . D’après l’hypo thèse (i) , les suites f (xn ) n∈IN et f (yn ) n∈IN ont chacune une limite, notées ℓ et ℓ′ . On
veut montrer que ℓ = ℓ′ . On définit la suite (zn )n∈IN par : ∀n ∈ IN z2n = xn et z2n+1 = yn . On sait qu’alors la suite (zn )n∈IN a pour limite a . D’après (i) , la suite (f (zn ))n∈IN a une limite ℓ′′ . Par extraction, on a : ℓ′′ = lim f (z2n ) = lim f (xn ) = ℓ. n→+∞
n→+∞
On a de même ℓ′′ = ℓ′ et donc ℓ′ = ℓ . Ainsi, pour toute suite (yn )n∈IN de limite a , la suite f (yn ) n∈IN a pour limite ℓ .
10.17 • Pour tout (x, y) ∈ [0, 1]2 , on a f (y) − f (x) = |x + y| |x − y| 2 |y − x| , donc f|[0,1] est 2 -lipschitzienne.
• Pour tout x ∈
IR∗+ ,
f (2x) − f (x) = 3 x. on a : 2x − x
Si f était lipschitzienne, l’ensemble
|f (y)−f (x)| |y−x|
qui n’est pas possible au vu de la relation (∗) . 10.18 Soit f la fonction définie sur [0, 1] par f (x) = D’autre part, on a : f (0) =
n 1 ak n
et
f (1) =
k=1
1 n
(∗)
| (x, y) ∈ IR2+ , x �= y
n
k=1
n n 1 1 (1 − ak ) = 1 − ak . n n k=1
(resp. f (1)
). Dans tous les cas,
1 2
serait borné, ce
|ak − x| . Cette fonction est continue.
On a donc f (0) + f (1) = 1 . On en déduit que si f (0) 1 2
k=1
1 2
(resp. f (0)
1 2
), alors f (1)
1 2
est entre f (0) et f (1) donc, d’après le théorème des
valeurs intermédiaires, il existe a ∈ [0, 1] tel que f (a) = 12 · 10.19 Si f n’est pas constante, f (I) est un intervalle contenant au moins deux points. Un tel intervalle contient au moins un élément de IR \ Q , ce qui contredit le fait que f (I) ⊂ Q . 10.20 1. La fonction f : x �→ sin(π x) convient. x 2. La fonction f : x �→ x+1 convient.
415
Chapitre 10. Limites et continuité 10.21 Soit f : x �→
2n−1 k=0
ak xk , où (a0 , . . . , a2n−1 ) ∈ IR2n et a2n−1 �= 0 . Quitte à considérer −f ,
on peut supposer a2n−1 > 0 . On a pour tout x �= 0 :
2n−2 ak f (x) = a + , 2n−1 2n−1 x x2n−1−k k=0
et par conséquent :
f (x) −→ a2n−1 . x2n−1 x→±∞ Il s’ensuit, en multipliant par x2n−1 , que lim f = +∞ et lim f = −∞ . Ainsi f prend des +∞
−∞
valeurs positives et des valeurs négatives. D’après le théorème des valeurs intermédiaires, elle s’annule. 10.22 On raisonne par l’absurde : on suppose que, pour tout x ∈ IR , f (x) �= x . La fonction h : x �→ f (x) − x ne s’annule pas sur IR . Comme elle est continue, elle garde un signe constant. • Si h est strictement positive, on a, pour tout x ∈ IR , f (x) > x et donc : (f ◦ f )(a) = f (f (a)) > f (a) > a,
ce qui contredit l’hypothèse. • Si h est strictement négative, on obtient de même (f ◦ f )(a) < a et encore une contradiction. 10.23 Soit T > 0 une période de f . Comme f est continue sur [0, T ] , il existe (m, M ) ∈ IR2 tel que f ([0, T ]) = [m, M ] . On a f (IR) = f ([0, T ]) = [m, M ] , car f est T -périodique. Donc f est bornée. Comme les bornes m et M sont atteintes par f sur [0, T ] , f atteint ses bornes. 10.24 La fonction f est polynomiale, donc continue sur l’intervalle IR . Il est facile d’établir que lim f = −∞ et lim f = +∞ . On a donc d’après le théorème des valeurs intermé−∞
+∞
diaires, f (IR) = IR . La fonction f est la somme d’une constante et des fonctions x �→ x et x �→ x3 , toutes les deux strictement croissantes. Elle est donc strictement croissante. D’après le théorème de la bijection, f est une bijection de IR sur IR . 10.25 1. La fonction f|[0,a] est continue sur le segment [0, a] , elle donc uniformément continue d’après le théorème de Heine. 1 1 . Par conséquent, 2. Soit ε > 0 . Puisque lim √1x = 0 , il existe a > 0 tel que 2√ a x→+∞
pour tout x a et y a , on a : √ |y − x| y − √x = √|y − x| √ √ |y − x|. x+ y 2 a
Par ailleurs, il existe η1 > 0 tel que, pour tout (x, y) ∈ [0, a]2 , si |y − x| η1 , √ √ alors y − x ε2 · En posant η = min{η1 , 2ε } , on obtient, pour tout (x, y) vérifiant |y − x| η : √ √ • y − x ε2 ε si (x, y) appartient à [0, a]2 ou à [a, +∞[2 ; √ √ • y − x |f (x) − f (a)| + |f (y) − f (a)| 2 2ε ε , si x a y .
La conclusion est immédiate. 3. La fonction réciproque d’une bijection uniformément continue n’est pas nécessairement uniformément continue, puisque f −1 , définie sur IR+ par f −1 (x) = x2 n’est pas uniformément continue, d’après l’exemple 47 de la page 397.
416
Solutions des exercices 10.26 On ne peut en aucun cas invoquer directement la composition des limites, car nous ne disposons de la notion de limite que pour les suites et pour les fonctions définies sur une partie non vide de IR , et non pour les fonctions définies sur une partie de C . En revanche, on peut écrire, pour tout t ∈ I :
(exp ◦f )(t) = eRe(f (t)) cos Im(f (t)) + i eRe(f (t)) sin Im(f (t)) . L’existence de la limite est alors une conséquence des théorèmes généraux. 10.27 Pour tout x > 1 , on a : eiα − 1/x eiα x − 1 = , e−iα x − 1 e−iα − 1/x Par ailleurs eiα − 1/x −→ eiα et e−iα − 1/x −→ e−iα . Ainsi : x→+∞
x→+∞
iα
e x−1 −→ e2iα e−iα x − 1 x→+∞
et
eiα x − 1 e−iα x − 1
n
−→ e2inα .
x→+∞
10.28 Pour montrer que f est constante, montrons que, pour tout x ∈ IR , on a f (x) = f (0) . Soit x ∈ IR . On a f (y) = f
Puisque
x −→ 2n n→+∞
y 2
pour tout y ∈ IR . Par récurrence, on démontre que : ∀n ∈ IN
x 2n
= f (0).
f (x) = f
.
0 , par composition des limites et unicité de la limite, il vient que : f (x) = lim f n→+∞
x 2n
10.29 1. En considérant x = y = 0 , on obtient f (0) = 2f (0) , c’est-à-dire f (0) = 0 . Pour tout x réel, on vérifie, par récurrence sur IN , que f (n x) = n f (x) . En particulier f (n) = α n , lorsque n ∈ IN . Puisque f (n) + f (−n) = f (0) = 0 , on obtient que f (n) = α n , pour tout n ∈ ZZ . Pour tout (p, q) ∈ ZZ × IN∗ , on a : f et donc f
p q
q
p q
= qf
p q
et
f
q
p q
= f (p) = α p,
= α pq · Ceci montre que f (x) = αx , pour tout x ∈ Q .
2. Soit x ∈ IR . Par densité de Q dans IR , il existe une suite (xn )n∈IN de rationnels convergeant vers x . D’après ce qui précède : f (xn ) = αxn −→ αx, n→+∞
mais par continuité de f en x : f (xn ) −→ f (x). n→+∞
Par unicité de la limite, on a donc f (x) = αx . Il est par ailleurs facile de vérifier que, pour tout réel α , f : x �→ αx est une fonction continue vérifiant, pour tout (x, y) ∈ IR2 , la relation f (x + y) = f (x) + f (y) .
417
Chapitre 10. Limites et continuité
10.30 1. Unicité. Il suffit de remarquer que pour tout x ∈ IR , on a x − x +
périodicité, pour tout x ∈ IR , on a donc f (x) = x − x + 12 .
Existence. Il suffit de poser :
1 2
∈ − 21 ,
1 2
. Par
1 . 2 La périodicité est facile à établir en remarquant que ⌊a + 1⌋ = ⌊a⌋ + 1 , pour tout réel a . D’autre part, pour tout x ∈ [− 12 , 21 [ , on a x + 12 = 0 donc f (x) = |x| . ∀x ∈ IR
f (x) = x − x +
2. La fonction partie entière est continue en a si a ∈ / ZZ , et seulement continue à droite / ZZ et continue en a si a ∈ ZZ , donc par composition f est continue en a si a + 12 ∈ à droite en a si a +
1 2
∈ / ZZ . Il suffit donc de vérifier la continuité de f à gauche en
un tel point et, comme f est 1 périodique, de la vérifier en − 21 · On a f − 12 =
pour x ∈
]− 32 , − 12 [ ,
f (x) = |x + 1| et donc
lim
x→(− 1 2)
−
f (x) =
1 2
10.31 Si n = 1 , α = 0 convient. On suppose désormais n 2 .
Considérons la fonction g : x �→ f x + valle [0, 1 −
1 ]. n
On a
k n−1
g
k=0
n
=
1 n
n−1 k+1
f
k=0
n
1
= f −2 .
1 2
et
− x . Elle est définie et continue sur l’inter-
−f
k n
= f (1) − f (0) = 0,
car la somme est télescopique. Les termes g nk , pour 0 k n − 1 , ne peuvent pas être tous strictement négatifs ou tous strictement positifs, sinon la somme ne serait pas nulle. Il existe donc k et ℓ dans [[0, n − 1]] tels que g nk 0 et g nℓ 0 . La fonction g , continue sur l’intervalle [0, 1 − n1 ] , qui prend des valeurs positives et négatives s’annule, d’après le théorème des valeurs intermédiaires. 1 1 tel que g(α) = 0 , c’est-à-dire tel que f α + = f (α) . Il existe donc α ∈ 0, 1 − n n
10.32 Supposons qu’une telle application existe. Notons a < b les deux antécédents de 0 . Sur ]a, b[ , la fonction f ne s’annule pas, donc elle garde un signe constant, puisqu’elle est continue. Quitte à considérer −f , on peut supposer que f est positive sur ]a, b[ . On note M = max f = f (c) , avec c ∈ ]a, b[ . Si y ∈ ]0, M [ , il existe, d’après le théorème [a,b]
des valeurs intermédiaires x1 ∈ ]a, c[ et x2 ∈ ]c, b[ tels que f (x1 ) = f (x2 ) = y . Sur ]−∞, a] et [b, +∞[ , f ne peut pas prendre la valeur y (car sinon cette valeur serait prise au moins trois fois) et comme f (a) = f (b) = 0 < y , elle ne peut pas prendre de valeur supérieure à y (sinon par le théorème des valeurs intermédiaires elle prendrait la valeur y sur ]−∞, a] ou [b, +∞[ ). On en déduit qu’un réel z > M n’a pas d’antécédent par f , ce qui est contradictoire. 10.33 1. L’ensemble E n’est pas vide, d’après l’exemple 40 de la page 393. L’ensemble E étant borné, il possède une borne inférieure a et une borne supérieure b . Montrons que a appartient à E . On sait qu’il existe une suite (an ) d’éléments de E qui converge vers a . Par continuité de f , on a f (a) = lim f (an ) = lim an = a, n→+∞
n→+∞
car les an appartiennent à E . On a donc f (a) = a , donc a ∈ E et a = min E . On démontre de même que b = max E .
418
Solutions des exercices 2. Soit x ∈ E . On a f (x) = x et donc f (g(x)) = g(f (x)) = g(x) , donc g(x) ∈ E . En particulier, g(a) et g(b) appartiennent à E . Soit h définie sur [0, 1] par h(x) = f (x) − g(x) . La fonction h est continue. On a : h(a) = f (a) − g(a) = a − g(a) 0, car g(a) ∈ E et a = min E et de même :
h(b) = f (b) − g(b) = b − g(b) 0,
car g(b) ∈ E et b = max E . D’après le théorème des valeurs intermédiaires, la fonction h s’annule. 10.34 L’hypothèse sur les limites de f donne l’existence d’un réel a > 0 tel que pour tout x vérifiant |x| a on ait f (x) f (0) . La restriction de f au segment [−a, a] est continue. Elle a donc un minimum m atteint en un point x0 ∈ [−a, a] et l’on a m f (0) . Pour tout x ∈ / [−a, a] , on a f (x) f (0) m . Par conséquent, pour tout x ∈ IR , f (x) m et f admet un minimum, atteint en x0 .
10.35 Soit f une solution. Alors f [0, 1] est un segment [a, b] ⊂ [0, 1] . Puisque f ◦ f = f , on a, pour tout y ∈ [a, b] : f (y) = (f ◦ f )(x) = f (x) = y, où x est un antécédent de y . Ainsi f|[a,b] est l’identité de [a, b] . De plus, si a > 0 , alors f|[0,a]
est une application continue de [0, a] dans [a, b] prenant en a la valeur a . De même, si b < 1 , alors f|[b,1] est une application continue de [b, 1] dans [a, b] prenant en b la valeur b . Réciproquement, soit [a, b] ⊂ [0, 1] . On se donne f1 : [0, a] → [a, b] une fonction quelconque telle que f1 (a) = a et, si 0 < a , continue et f2 : [b, 1] → [a, b] une fonction quelconque telle que f2 (b) = b et, si b < 1 , continue. Il est alors aisé de vérifier que la fonction définie sur [0, 1] par f1 (x) si 0 x < a ; x si a x b ; f (x) = f2 (x) si b < x 1, est continue et qu’elle est une solution du problème. 10.36 Supposons qu’une telle application existe. Alors f est injective. En effet si (x, y) ∈ IR2 et f (x) = f (y) , on a (f ◦ f )(x) = (f ◦ f )(y) et donc x = y . D’après le théorème 42 de la page 395, comme f est continue, elle est strictement monotone. La composée de deux fonctions monotones, de même monotonie, est croissante. Ainsi − IdIR serait croissante, ce qui est faux. 10.37 La fonction |g| est continue sur le segment [0, 1] . Elle est bornée et admet un maximum. On pose M = max g(t) . t∈[0,1]
Soit (x, y) ∈ IR2 . On a alors, pour tout t ∈ [0, 1] :
f (t) + yg(t) = f (t) + xg(t) + (y − x)g(t)
f (t) + xg(t) + |y − x| |g(t)| ϕ(x) + M |y − x|.
(déf. d’une borne supérieure)
419
Chapitre 10. Limites et continuité Toujours par définition de la borne supérieure, on en déduit que : ϕ(y) ϕ(x) + M |y − x|.
En échangeant les rôles de x et y , on obtient ϕ(x) ϕ(y) + M |x − y| et donc :
ϕ(y) − ϕ(x) M |y − x|.
10.38 1. La fonction Pλ est une fonction polynomiale de degré impair donc elle s’annule sur IR . Pour tout λ 0 , la fonction Pλ est continue sur IR et strictement croissante sur IR , car somme des fonctions x → λx − 1 , croissante, et x → x3 strictement croissante. Donc elle s’annule une seule fois, en u(λ) . 2. On note que u(λ) > 0 , car Pλ (0) = −1 < 0 et u(λ) 1 , car Pλ (1) = λ 0 . L’égalité Pλ (u(λ)) = 0 équivaut à
1 − u(λ)2 = λ. u(λ) Considérons la fonction f : ]0, 1] → IR+ , définie par f (x) =
1 x
− x2 .
La fonction f est continue et strictement décroissante, donc elle réalise une bijection de ]0, 1] sur [f (1), lim f [ = [0, +∞[ . Pour tout λ ∈ IR+ , u(λ) ∈ ]0, 1] et f (u(λ)) = λ . 0
Ainsi u(λ) = f −1 (λ) . La fonction u , c’est-à-dire f −1 , est continue et strictement décroissante comme fonction réciproque d’une fonction continue strictement décroissante. 3. La fonction u = f −1 réalise une bijection décroissante de IR+ sur ]0, 1] . On a donc
lim u(λ) = 0 .
λ→+∞
10.39 Soit f : IR → IR une fonction continue, périodique de période T > 0 . Soit ε > 0 . La restriction de f|[0,2T ] est évidemment continue et donc, d’après le théorème de Heine (cf.théorème 45 de la page 397), elle est uniformément continue. Il existe donc η > 0 tel que : ∀(x, y) ∈ [0, 2T ]2 |x − y| η ⇒ f (y) − f (x) ε.
Fixons un tel η , que l’on peut de plus supposer inférieur à T . Soit (x, y) ∈ IR2 , avec 0 y − x η . Posons k = ′
et y = y − kT ∈ [y − x, y − x + T [ . Puisque :
x T
. On a alors x′ = x − kT ∈ [0, T [
0 y − x = y ′ − x′ η T,
les deux points x′ et y ′ sont dans [0, 2T ] et vérifient |y ′ − x′ | η . Par conséquent, en utilisant la périodicité de f , on obtient :
f (y) − f (y) = f (y − kT ) − f (y − kT ) = f (y ′ ) − f (x′ ) ε
Il s’ensuit que la fonction f est uniformément continue sur IR .
420
Chapitre 11 : Dérivation I
Dérivée . . . . . . . . . . . . . . . . . . . . . . . . . . Définitions, interprétations . . . . . . . . . . . . . . Calcul de dérivées . . . . . . . . . . . . . . . . . . . Dérivées à droite et à gauche . . . . . . . . . . . . . II Théorèmes de Rolle et des accroissements finis . . 1 Extrema . . . . . . . . . . . . . . . . . . . . . . . . . 2 Théorème de Rolle et égalité des accroissements finis 3 Dérivée et fonctions monotones . . . . . . . . . . . . 4 Variations et extrema . . . . . . . . . . . . . . . . . 5 Inégalité des accroissements finis . . . . . . . . . . . 6 Application aux suites un+1 = f (un ) . . . . . . . . . 7 Théorème de la limite de la dérivée . . . . . . . . . . III Fonctions de classe C k . . . . . . . . . . . . . . . . . 1 Fonctions de classe C 1 . . . . . . . . . . . . . . . . . 2 Fonctions de classe C n . . . . . . . . . . . . . . . . . 3 Opérations sur les fonctions de classe C n . . . . . . IV Extension aux fonctions à valeurs complexes . . . . 1 Ce qui ne change pas : l’aspect opératoire . . . . . . 2 Ce qui change : les accroissements finis . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
422 . 422 . 424 . 428 428 . 428 . 430 . 431 . 433 . 433 . 435 . 436 437 . 437 . 438 . 440 444 . 444 . 446 448 454
Dérivation
11
Dans tout le chapitre, I désigne un intervalle de IR d’intérieur non vide et a est un élément de I .
I
Dérivée
1
Définitions, interprétations
Nombre dérivé Définition 1 Soit f : I → IR une fonction. On dit que f est dérivable en a si son taux d’accroissement en a : τa (f ) :
I \ {a} −→ IR f (x) − f (a) x �−→ x−a
admet une limite finie en a. Cette limite, lorsqu’elle existe, est le nombre dérivé de f en a . Il est noté f ′ (a) ou D(f )(a).
Ex. 1. Une fonction constante f sur I est dérivable en tout point de I et f ′ (a) = 0 . Ex. 2. Lorsque n ∈ IN , la fonction : f :
IR x
−→ �−→
IR xn
est dérivable en tout point de IR . • Si n = 0 , d’après le point précédent, f ′ (a) = 0 .
• Si n 1 , on a f ′ (a) = nan−1 . Cela a été démontré au chapitre 3, page 81.
I Dérivée Ex. 3. Lorsque n ∈ ZZ∗− et I = IR∗+ ou I = IR∗− , la fonction : f :
I x
−→ �−→
IR xn
est dérivable en tout point de I et f ′ (a) = nan−1 . Cela a également été démontré au chapitre 3 page 84. √ f (x) − f (0) 1 = √ −→ +∞ . Ex. 4. La fonction f : x �→ x n’est pas dérivable en 0 , car x−0 x x→0
Remarques • On trouve parfois, notamment en physique, la notation dérivé de f en a.
df dx (a)
pour le nombre
• Un simple changement d’écriture montre, en s’appuyant sur la composition des limites, que f est dérivable en a si, et seulement si, la fonction h �→ a une limite finie en 0 et l’on a alors : f (a + h) − f (a) · f ′ (a) = lim h→0 h
f (a+h)−f (a) h
• Soit J un intervalle d’intérieur non vide inclus dans I , avec a ∈ J . Si f est dérivable en a, alors f|J est dérivable en a et l’on a (f|J )′ (a) = f ′ (a).
• La notion de dérivabilité, étant définie à l’aide d’une limite, est une notion locale. Plus précisément, s’il existe r > 0 tel que f|I∩[a−r,a+r] soit dérivable en a, alors f ′ est dérivable en a et f ′ (a) = f|I∩[a−r,a+r] (a).
Interprétation graphique Rappelons que : • lorsque la fonction f est dérivable en a, sa courbe admet au point d’abscisse a une tangente qui a pour équation : y = f (a) + f ′ (a) x − a ;
f (x) − f (a) admet une limite infinie en a, alors x−a la courbe admet une tangente verticale en a. Une autre formulation de la dérivabilité • lorsque le taux d’accroissement
Proposition 1 Soit f : I → IR une fonction. La fonction f est dérivable en a si, et seulement s’il existe un réel ℓ et une fonction α : I → IR tels que : ∀x ∈ I
f (x) = f (a) + ℓ (x − a) + (x − a) α (x)
et
lim α(x) = 0.
x→a
Dans ces conditions, f (a) = ℓ . ′
Démonstration page 448
Remarque En notant Ia = {x − a | x ∈ I} , on peut réécrire le résultat de cette dernière proposition sous la forme suivante : la fonction f est dérivable en a si, et seulement s’il existe un réel ℓ et une fonction β : Ia → IR tels que : ∀h ∈ Ia
f (a + h) = f (a) + ℓ h + h β (h)
et
lim β (h) = 0.
h→0
423
Chapitre 11. Dérivation Dérivabilité et continuité Proposition 2 (Continuité et dérivation) Soit f : I → IR une fonction. Si f est dérivable en a, alors f est continue en a. Démonstration.
Avec les notations de la proposition précédente, on a lim (x − a) α(x) = 0 x→a
et lim ℓ (x − a) = 0 . La conclusion en découle. x→a
Attention La réciproque de la proposition précédente est fausse. Par exemple, la √ fonction f : x �→ x est continue en 0 et nous avons vu qu’elle n’est pas dérivable en 0 (cf. exemple 4 de la page précédente). Fonction dérivée Définition 2 Soit f : I → IR une fonction. On dit que f est dérivable si elle est dérivable en tout point x de I . On note alors f ′ ou D(f ) l’application qui à x ∈ I associe le nombre dérivé de f en x. On l’appelle l’application dérivée de f , ou plus simplement la dérivée de f . Notation
On note D (I, IR) l’ensemble des fonctions réelles dérivables sur I .
Remarques • On trouve parfois la notation df dx pour désigner la fonction dérivée. • Comme pour les fonctions continues (cf. remarque de la page 389), on s’autorise parfois à parler de fonctions dérivables même dans le cas où elles sont définies sur une réunion d’intervalles d’intérieur non vide. Par exemple : ∗ la fonction x �→ 1/x est un élément de D (IR∗ , IR), ∗ la fonction tangente est un élément de D IR \ π2 + πZZ , IR . • La notation prime (i.e. ′ ) ne s’applique qu’aux fonctions. Écrire (x2 + 1)′ = 2x est donc un abus à proscrire. En revanche, on pourra parfois, notamment en physique, d 2 x + 1 = 2x. écrire des égalités du type dx
2
Calcul de dérivées
Théorème 3 (Opérations algébriques) Soit f et g deux fonctions définies sur I et dérivables en a. • Soit λ et µ deux réels. La fonction λf + µg est dérivable en a et : ′
(λf + µg) (a) = λf ′ (a) + µg ′ (a).
(linéarité)
• Le produit f g est dérivable en a et :
(f g)′ (a) = f ′ (a) g(a) + f (a) g ′ (a).
Principe de démonstration.
Démonstration page 448 Pour le produit, utiliser l’astuce classique de calcul suivante :
f (x) − f (a) g(x) + f (a) g(x) − g(a) (f g)(x) − (f g)(a) = · x−a x−a
424
I Dérivée En appliquant ce théorème en tout point de I , on obtient le corollaire suivant. Corollaire 4 2
Soit (f, g) ∈ D (I, IR) et (λ, µ) ∈ IR2 .
Alors λf + µg et f g sont dérivables sur I et l’on a : (λf + µg)′ = λf ′ + µg ′
836
et
(f g)′ = f ′ g + f g ′ .
Remarque • L’ensemble D (I, IR) contenant la fonction nulle, la première égalité du corollaire traduit le fait que D (I, IR) est un sous-espace vectoriel de F (I, IR) , +, · ; de plus, f �→ f ′ est une application linéaire de D (I, IR) dans F (I, IR) . • L’ensemble D (I, IR) contenant la fonction constante égale à 1 , la dérivabilité d’un produit de fonctions dérivables permet de montrer que D (I, IR) , +, × est un sous-anneau de F (I, IR) , +, × . Corollaire 5 Les fonctions polynomiales réelles sont dérivables sur IR. La dérivée d’une fonction polynomiale est elle-même une fonction polynomiale. Théorème 6 (Composition) Soit I et J deux intervalles d’intérieur non vide, ainsi que f : I → IR et g : J → IR deux fonctions, avec f (I) ⊂ J . Si la fonction f est dérivable en a, et si la fonction g est dérivable en b = f (a), alors g ◦ f est dérivable en a et : (g ◦ f )′ (a) = g ′ (b) f ′ (a) = g ′ f (a) f ′ (a).
Démonstration page 448 Écrire g (y) − g (b) = g ′ (b) (y − b) + (y − b) α (y) en y = f (x) . Diviser par x − a et considérer la limite lorsque x tend vers a .
Principe de démonstration.
Exo 11.1
Corollaire 7 Soit f ∈ D (I, IR) et g ∈ D (J, IR) , où I et J sont des intervalles d’intérieur non vide, avec f (I) ⊂ J . Alors g ◦ f est dérivable et : ′ (g ◦ f ) = g ′ ◦ f × f ′ . Ex. 5. Une fonction f , impaire et dérivable, possède une dérivée paire. En effet, considérons la fonction g : x �→ f (−x) , dérivable par composition et de dérivée g ′ : x �→ −f ′ (−x) . Par imparité de f , on a l’égalité de fonctions f = −g . En dérivant, on obtient f ′ = −g ′ , c’est-à-dire f ′ (x) = f ′ (−x) pour tout x . Ainsi f ′ est paire. Ex. 6. Soit α ∈ ]0, +∞[ et f la fonction définie sur ]0, +∞[ par f (x) = xα = exp(α ln x) . Cette fonction est dérivable sur ]0, +∞[ car x �→ ln x est dérivable sur ]0, +∞[ et la fonction exponentielle est dérivable sur IR ; de plus, pour tout x > 0 , on a : 1 1 exp(α ln x) = α xα = αxα−1 . x x Ex. 7. Soit f : I → ]0, +∞[ une fonction dérivable à valeurs strictement positives. Alors la fonction f α , définie par f α = exp(α ln f ) , est dérivable sur I et l’on a (f α )′ = αf α−1 × f ′ . f ′ (x) = α
425
Chapitre 11. Dérivation Corollaire 8 Soit f : I → IR une fonction dérivable en a.
′
• Pour n ∈ IN∗ , la fonction f n est dérivable en a et (f n ) (a) = n f ′ (a) f n−1 (a).
• Pour n ∈ ZZ∗− , si f (a) �= 0 , alors la fonction f n est dérivable en a et : ′
(f n ) (a) = n f ′ (a) f n−1 (a). ′ f ′ (a) 1 · • En particulier : (a) = − 2 f f (a)
Démonstration page 449
Principe de démonstration. Utiliser le théorème précédent et la dérivation des fonctions puissances entières (cf. page 422).
Remarque Lorsque n = 0 , l’égalité (f n )′ (a) = n f ′ (a) f n−1 (a) est encore vérifiée dans le cas où f (a) �= 0 , mais elle n’a pas de sens si f (a) = 0 . Corollaire 9 Soit f ∈ D (I, IR).
• Pour n ∈ IN∗ , la fonction f n est dérivable et (f n )′ = n f ′ f n−1 .
• Pour n ∈ ZZ∗− , si f ne s’annule pas sur I , alors la fonction f n est dérivable et : (f n )′ = n f ′ f n−1 .
Corollaire 10 Soit f ∈ D I, IR ne s’annulant pas. Alors 1/f est dérivable et : ′ f′ 1 =− 2· f f Remarque Si f : I → IR et g : I → IR sont deux fonctions dérivables et si g ne s’annule pas, alors la fonction f /g est dérivable, en tant que produit de deux fonctions dérivables et : ′ ′ g f ′g − f g′ 1 f ′ = f × + f× − 2 = · g g g g2 Ex. 8. La fonction tan est dérivable sur tout intervalle non trivial inclus dans IR \ ( π2 + πZZ) . En dérivant le quotient tan′ =
1 sin , puis le produit sin × , on obtient : cos cos
sin′ × cos − sin × cos′ cos2
ou, en d’autres termes : tan′ =
et
tan′ = cos ×
1 sin , + sin × cos cos2
1 = 1 + tan2 . cos2
Corollaire 11 Toute fonction rationnelle f : I → IR est dérivable. La dérivée d’une fonction rationnelle est elle-même une fonction rationnelle. 426
I Dérivée Fonctions réciproques Théorème 12 Soit f : I → J une bijection continue sur I , dérivable en a. Alors, en posant b = f (a), la fonction f −1 est dérivable en b si, et seulement si, f ′ (a) �= 0 , et dans ce cas : −1 ′ 1 1 · = ′ −1 (b) = ′ f f (f (b)) f (a)
Démonstration page 449
Principe de démonstration.
f f −1 (y) − f f −1 (b) f −1 (y) − f −1 (b) Remarquer que · est l’inverse de f −1 (y) − f −1 (b) y−b
Exo 11.2
Corollaire 13 Soit f : I → J une bijection dérivable. Alors, f −1 est dérivable si, et seulement si, f ′ ne s’annule pas et dans ce cas : −1 ′ 1 · = ′ f f ◦ f −1 Le théorème de dérivation des fonctions réciproques permet d’établir des résultats concernant la dérivation des fonctions usuelles. Ils ont déjà été évoqués au chapitre 6. Ex. 9. Puisque la dérivée sur IR∗+ de la fonction logarithme f : x �→ ln(x) est f ′ : x �→ x1 , qui
est à valeurs strictement positives, la fonction f −1 = exp est dérivable sur IR et on a :
′
f −1
ce qui s’écrit exp′ = exp .
Ex. 10. Puisque la dérivée sur − π2 ,
=
π 2
1 = f ′ ◦ f −1
1 1
= f −1 ,
f −1
de la fonction tan est la fonction t �→ 1+tan2 t , qui est
à valeurs strictement positives, la fonction Arctan est dérivable sur IR et Arctan′ : x �→
1 · x2 +1
Ex. 11. Puisque, pour tout t ∈ − π2 , π2 , on a sin′ (t) = cos(t) > 0 , la fonction Arcsin est dérivable sur ]−1, 1[ et sur cet intervalle : Arcsin′ (x) =
1 · cos (Arcsin x)
On peut simplifier le dénominateur pour x ∈ ]−1, 1[ . En effet, on a y = Arcsin(x) ∈ − π2 , Donc cos y 0 et ainsi cos y =
1 − sin y , ce qui implique : 2
∀x ∈ ]−1, 1[
Arcsin′ (x) = √
π 2
.
1 · 1 − x2
Notons que sin π2 = 1 et que sin′ π2 = cos π2 = 0 . Par conséquent, Arcsin n’est pas dérivable en 1 . Il en est de même, par exemple par imparité, pour −1 .
427
Chapitre 11. Dérivation
3
Dérivées à droite et à gauche
Définition 3 Soit f : I → IR une fonction.
• Si a n’est pas l’extrémité supérieure de I , on dit que f est dérivable à droite en a si la restriction f|I∩[a,+∞[ est dérivable en a. Par définition, le nombre ′ dérivé à droite de f en a est f|I∩[a,+∞[ (a). Il est noté fd′ (a).
• On définit de même la dérivabilité à gauche et le nombre dérivé à gauche, en un point a qui n’est pas l’extrémité inférieure de I . Il est noté fg′ (a).
Remarques • Si a est l’extrémité supérieure de I , l’intersection I ∩ [a, +∞[ est réduite au singleton {a} , donc la question de la dérivabilité à droite de f en a ne se pose pas. Ainsi, la fonction f est dérivable en a si, et seulement si, elle est dérivable à gauche en a. • Si f est dérivable à droite en a, alors f est continue à droite en a. Pour le démontrer, il suffit d’appliquer la proposition 2 de la page 424 à f|I∩[a,+∞[ .
Si la fonction f est dérivable en un point a intérieur à I , alors elle est dérivable à droite et à gauche en a. La proposition suivante établit la réciproque. Proposition 14 Soit f : I → IR une fonction et a un point de l’intérieur de I . La fonction f est dérivable en a si, et seulement si, elle est dérivable à gauche et à droite en a, avec fg′ (a) = fd′ (a), et alors f ′ (a) = fg′ (a) = fd′ (a).
Démonstration page 449
Attention Contrairement à ce qui se passe pour la continuité, la dérivabilité à gauche et à droite n’est pas suffisante pour garantir la dérivabilité. Ex. 12. La fonction f : x �→ |x| est dérivable à gauche et à droite en 0 , mais n’est pas dérivable
en 0 . En effet, la restriction de f à ]−∞, 0] est x �→ −x , dérivable en 0 , de dérivée −1 , donc fg′ (0) = −1 . De même fd′ (0) = 1 . Ainsi, f n’est pas dérivable en 0 .
II
Théorèmes de Rolle et des accroissements finis
1
Extrema
Nous avons vu au chapitre 3 ce que signifie pour une fonction réelle d’admettre un maximum, un minimum et un extremum. Complétons ces notions. Définition 4 • On dit que f : I → IR admet un maximum local en a , s’il existe un réel η > 0 tel que la fonction f|I∩[a−η,a+η] admette un maximum en a, i.e. : ∀x ∈ I ∩ [a − η, a + η] f (x) f (a). • On définit de même la notion de minimum local.
• On dit que f admet un extremum local en a , si f admet en a un maximum ou un minimum local. 428
II Théorèmes de Rolle et des accroissements finis Remarques • On trouve également la locution « maximum relatif » à la place de « maximum local ». • Évidemment, la fonction f admet un maximum local en a si, et seulement si, −f admet un minimum local en a. • On utilise parfois la locution « maximum global » à la place de maximum. De même pour « minimum global » et « extremum global ». • Un extremum global est évidemment un extremum local. Théorème 15 Soit f : I → IR une fonction. Si :
• a est un point intérieur à I , • la fonction f est dérivable en a, • la fonction f admet un extremum local en a,
alors f ′ (a) = 0 .
Démonstration page 449
Principe de démonstration. y
A
Remarquer que si f a un maximum local en a , alors les pentes des cordes (AM ) sont positives si M est à gauche de A et négatives si M est à droite de A . Faire ensuite tendre x vers a par valeurs inférieures, pour obtenir f ′ (a) 0 .
M
O
a
x
Attention • Bien noter que le théorème précédent ne s’applique pas aux extrémités de I . Par exemple, la fonction f : [0, 1] → IR définie par f (x) = x est dérivable et sa dérivée vaut f ′ : x �→ 1 . La fonction f admet un minimum en 0 et un maximum en 1 . Pourtant, f ′ (0) et f ′ (1) ne sont pas nuls. • Le théorème précédent fournit une condition nécessaire d’existence d’un extremum local en un point intérieur, mais celle-ci n’est pas suffisante. On peut en effet avoir f ′ (a) = 0 sans que f admette un extremum local en a. C’est le cas, par exemple, de la fonction f : x �→ x3 définie sur IR. Sa dérivée s’annule en 0 , mais f n’atteint ni un maximum local, ni un minimum local en 0 . Définition 5 Soit f : I → IR une fonction. Un point critique est un point de I en lequel f est dérivable avec une dérivée nulle. Remarque Le théorème 15 peut se reformuler comme suit : pour qu’une fonction dérivable f : I → IR admette un extremum local en un point intérieur a ∈ I , il est nécessaire que a soit un point critique. 429
Chapitre 11. Dérivation
2 Exo 11.8
Théorème de Rolle et égalité des accroissements finis
Théorème 16 (Théorème de Rolle) Soit a et b deux réels, avec a < b , et f : [a, b] → IR une fonction continue sur [a, b], dérivable sur ]a, b[ , telle que f (a) = f (b). Alors il existe c ∈ ]a, b[ tel que f ′ (c) = 0 . Démonstration. Puisque f est continue sur le segment [a, b] , elle admet, d’après le théorème des bornes atteintes, un maximum et un minimum sur [a, b] . • S’ils sont tous les deux atteints en a ou b , la fonction f est constante car f (a) = f (b) . a+b Dans ce cas, on a donc f ′ = 0 et la conclusion s’ensuit en prenant par exemple c = · 2 • Sinon le maximum ou le minimum est atteint en un point de ]a, b[ . Le théorème 15 de la page précédente permet alors de conclure.
Interprétation géométrique y Considérons le graphe d’une fonction réelle continue sur un segment [a, b], dérivable sur l’intérieur. Si le graphe comporte deux points distincts de même ordonnée, alors il existe au moins une tangente au graphe qui soit parallèle + + + x à l’axe des abscisses. a c O b Interprétation cinématique Considérons un marcheur qui se promène le long d’une route rectiligne et qui revient à son point de départ. En supposant que la position du marcheur soit une fonction dérivable du temps, hypothèse physiquement raisonnable, le théorème de Rolle affirme qu’il existe au moins un moment où la vitesse instantanée du marcheur est nulle. Attention Bien noter que le théorème de Rolle fournit l’existence d’un c tel que f ′ (c) = 0 , mais en aucun cas l’unicité. Par exemple, sur [0, 2π], la fonction sinus vérifie sin(0) = sin(2π). Sa fonction dérivée sin′ = cos s’annule deux fois, en π2 et 3π 2 · Théorème 17 (Théorème des accroissements finis) Soit a et b deux réels, avec a < b , et f : [a, b] → IR une fonction continue sur [a, b], dérivable sur ]a, b[ . Il existe alors c ∈ ]a, b[ tel que : f (b) − f (a) = f ′ (c). b−a
Démonstration page 450
Principe de démonstration. La corde [AB] n’étant pas « verticale », elle correspond au graphe d’une fonction affine. Appliquer le théorème de Rolle à la fonction h définie sur [a, b] , par h(x) = f (x) − g(x) , où g(x) est l’ordonnée du point d’abscisse x situé sur la
y h(x)
B
A O
430
a
b
x
b a corde [AB] , avec A f (a) et B f (b) .
II Théorèmes de Rolle et des accroissements finis Interprétation géométrique Le théorème des accroissements finis signifie qu’il existe (au moins) une tangente au graphe d’une fonction continue sur le segment [a, b], dérivable sur ]a, b[ a qui soit parallèle à la corde [AB], où A f (a) b et B f (b) .
Interprétation cinématique Considérons une randonneuse qui marche cinq kilomètres en une heure le long d’un sentier rectiligne. En supposant que sa position est une fonction dérivable du temps, il existe un moment où sa vitesse instantanée est de 5 km/h.
3
y B
A O
+
+
a
x
b
Dérivée et fonctions monotones
Fonctions dérivables monotones sur un intervalle
Exo 11.9
Théorème 18 (Fonctions dérivables croissantes) Soit f : I → IR une fonction continue sur I et dérivable sur l’intérieur de I . Alors f est croissante si, et seulement si, pour tout point x intérieur à I , on a f ′ (x) 0 . Principe de démonstration.
Démonstration page 450 Appliquer le théorème des accroissements finis à f entre x
et y , avec x < y .
Remarque Le théorème précédent présente des hypothèses très générales. Dans la pratique, on utilisera souvent le théorème sous la forme plus simplifiée suivante : Soit f : I → IR une fonction dérivable. Alors f est croissante si, et seulement si, f ′ est positive. Il ne faudrait pas croire que cette version simplifiée suffise à traiter tous les exemples. Penser par exemple à la fonction racine carrée seulement dérivable sur ]0, +∞[ et pourtant croissante sur [0, +∞[ . Attention • Une fonction continue peut très bien être croissante sans être (partout) dérivable. Un exemple est suggéré par la figure ci-contre.
y
O
x
• Le résultat du théorème précédent est faux si l’on ne se place pas sur un intervalle. Par exemple, considérons la fonction f définie sur IR∗ par f (x) = −1/x.
Pour tout x ∈ IR∗ , on a f ′ (x) = 1/x2 > 0 et pourtant f n’est pas croissante, puisque f (−1) > f (1). 431
Chapitre 11. Dérivation Ex. 13. Étudions la fonction f : x �→
√ x − ln (1 + x) .
La fonction f est définie et continue sur IR+ . Elle est dérivable sur IR∗+ et l’on a : √ 2 1− x 1 1 √ · = f ′ : x �→ √ − 1+x 2 x 2(1 + x) x
x
0
f (x)
||
′
1 +
0
+∞ + +∞
f 0
L’étude du signe de f ′ est facile ; on en déduit le tableau de variations de f .
Corollaire 19 Soit f : I → IR une fonction continue sur I et dérivable sur l’intérieur de I . Alors f est décroissante si, et seulement si, f ′ est négative.
Corollaire 20 (Fonctions constantes sur un intervalle) Soit f : I → IR une fonction continue sur I et dérivable sur l’intérieur de I avec une dérivée nulle. Alors f est constante. Démonstration.
Supposons f ′ = 0 . En particulier f ′ 0 , donc le théorème 18 de la page précédente implique que f est croissante. De la même façon, f est décroissante. Ainsi f est constante.
Attention Insistons sur le fait que dans le corollaire précédent, il est crucial que le domaine de définition soit un intervalle. Par exemple, la fonction f définie sur IR∗ par : −1 si x < 0 f (x) = 1 si x > 0 est dérivable, de dérivée nulle, sans être constante.
Fonctions dérivables strictement monotones sur un intervalle On dispose d’une caractérisation des fonctions dérivables strictement croissantes. Théorème 21 Soit f : I → IR une fonction continue sur I et dérivable sur l’intérieur de I . Alors f est strictement croissante si, et seulement si : • la fonction f ′ est positive sur l’intérieur de I ,
• il n’existe aucun couple (a, b) ∈ I 2 vérifiant a < b , tel que la restriction (f ′ )|]a,b[ soit la fonction nulle.
Démonstration page 450 Remarquer qu’une fonction croissante est non strictement croissante si, et seulement s’il existe (a, b) ∈ I 2 tel que a < b et f (a) = f (b) et que dans ce cas, f|[a,b] est constante.
Principe de démonstration.
Remarque On obtient le même théorème pour caractériser les fonctions strictement décroissantes puisque f est strictement décroissante si, et seulement si, −f est strictement croissante. 432
II Théorèmes de Rolle et des accroissements finis Point méthode Dans la pratique, pour démontrer qu’une fonction dérivable est strictement monotone sur un intervalle, on pensera à regarder si sa dérivée est de signe strict et ne s’annule qu’en un nombre fini de points.
Exo 11.10
x3 . En tant que quotient de fonctions +1 polynomiales dont le dénominateur ne s’annule pas, f est dérivable et et sa dérivée est donnée par : x2 3 + x2 · f ′ : x �→ (1 + x2 )2
Ex. 14. Considérons f définie sur IR par f (x) =
x2
Par conséquent, f ′ est positive et ne s’annule qu’en un seul point. Donc f est strictement croissante sur IR .
4
Variations et extrema
Le plan d’étude d’une fonction a été donné au chapitre 3. Point méthode Pour déterminer les extrema d’une fonction définie et dérivable sur I , on peut faire une étude des variations que l’on résume par un tableau de variations.
Exo 11.11
Ex. 15. Considérons la fonction f définie sur IR par f : x �→ 2x3 + 3x2 − 12x + 5 . La fonction f est polynomiale, donc dérivable. Pour x ∈ IR , on a f ′ (x) = 6x2 + 6x − 12 = 6(x − 1)(x + 2) . On a alors le tableau de variations suivant : x ′
f (x)
−∞
+
−2 0 25
1 −
0
+∞ + +∞
f −∞
−2
La fonction f n’a pas d’extremum global, mais elle a un maximum local en −2 (qui vaut 25 ) et un minimum local en 1 (qui vaut −2 ).
5
Inégalité des accroissements finis
Théorème 22 (Inégalité des accroissements finis) Soit f : I → IR une fonction continue sur I , dérivable sur l’intérieur de I . On suppose qu’il existe M ∈ IR+ tel que pour tout x de l’intérieur de I , on ait f ′ (x) M . Alors : ∀(x, y) ∈ I 2 f (y) − f (x) M |y − x| , c’est-à-dire que f est M -lipschitzienne.
Démonstration page 450
433
Chapitre 11. Dérivation Interprétation géométrique Soit f une fonction continue sur un intervalle I , dérivable sur l’intérieur de I . Si la fonction |f ′ | est majorée par une constante M , alors pour tout c ∈ I , le graphe de f est contenu dans la partie hachurée délimitée par les deux droites d’équation : y = f (c) + M (x − c)
et
y = f (c) + M (c − x).
y
0
a|
c|
|
b
x
Interprétation cinématique C’est le principe des radars tronçons : supposons, par exemple, deux radars installés au bord d’une autoroute rectiligne. Ses deux caméras sont distantes de 2,6 km et la vitesse est limitée à 130 km/h. Tout automobiliste qui passerait entre les deux caméras en strictement moins d’une minute et 12 secondes commettrait une infraction au code de la route. Remarques Reprenons les notations du théorème 22 de la page précédente. • Il y a une réciproque à ce théorème : Si f est K -lipschitzienne, alors la fonction |f ′ | est majorée par K . En effet, soit a ∈ I un point en lequel f est dérivable.
(a) Comme f est K -lipschitzienne, pour tout x ∈ I \ {a} , on a f (x)−f K . En x−a ′ faisant tendre x vers a dans cette inégalité, on obtient f (a) K .
• L’inégalité des accroissements finis écrite avec des valeurs absolues peut encore s’écrire : −M |y − x| f (y) − f (x) M |y − x|. On peut obtenir un encadrement plus précis si la majoration sur f ′ est donnée par une double inégalité plutôt qu’avec une seule inégalité et une valeur absolue.
Plus précisément, s’il existe (m, M ) ∈ IR2 tel que, pour tout t intérieur à I , on ait : m f ′ (t) M, alors on a l’encadrement valable pour tout (x, y) ∈ I 2 tel que x < y : m (y − x) f (y) − f (x) M (y − x) . En effet, d’après le théorème des accroissements finis, il existe c ∈ ]x, y[ tel que : f (y) − f (x) = f ′ c (y − x) .
Puisque m f ′ (c) M et y − x > 0 , on a : m (y − x) f ′ c (y − x) M (y − x), d’où la double inégalité annoncée.
434
II Théorèmes de Rolle et des accroissements finis Application aux inégalités Point méthode Il est fréquent en Analyse d’avoir à établir des inégalités. Parmi les techniques usuelles auxquelles on doit spontanément penser, citons : • l’étude des variations de fonctions,
Exo 11.12
• le théorème ou l’inégalité des accroissements finis. Remarque Nous verrons d’autres techniques, notamment aux chapitres 12 et 13. Ex. 16. Pour tout x ∈ ]−1, +∞[ , on a ln(1 + x) x .
Par opérations, la fonction f : x �→ ln (1 + x) − x est définie et dérivable sur ]−1, +∞[ , et l’on a : x 1 ∀x ∈ ]−1, +∞[ f ′ (x) = −1 = − · x+1 x+1
On a alors le tableau de variations suivant : x f ′ (x)
−1
0 +
0 0
+∞ −
f −∞
−∞
On en déduit que f est négative, d’où l’inégalité annoncée. Remarque Pour x ∈ IR+ , on peut facilement démontrer l’inégalité ln(1 + x) x à l’aide de l’inégalité des accroissements finis. En effet, en posant f : x �→ ln(1+x) , on a pour tout x ∈ IR+ : 0 f ′ (x) =
1 1, 1+x
la conclusion en découle. Ex. 17. La fonction sinus est dérivable sur IR et sa dérivée (la fonction cosinus) est majorée en valeur absolue par 1 . D’après l’inégalité des accroissements finis appliquée à 0 et x , on en déduit : ∀x ∈ IR sin (x) |x| .
6
Application aux suites un+1 = f (un)
On s’intéresse dans cette section aux suites (un )n∈IN vérifiant u0 ∈ I et, pour tout entier naturel n, la relation un+1 = f (un ) , où f : I → I est une fonction. On notera bien l’hypothèse de stabilité, à savoir f (I) ⊂ I . Nous avons déjà rencontré de telles suites au chapitre 9 et nous avons vu au chapitre 10 que si une telle suite converge vers un réel ℓ ∈ I , dans le cas où f est continue, alors ℓ est un point fixe de f (cf.théorème 6 de la page 378). La difficulté est alors de démontrer que la suite converge effectivement. La proposition suivante permet de conclure dans certains cas. 435
Chapitre 11. Dérivation
Exo 11.13
Proposition 23 Soit f : I → I une fonction dérivable. On suppose qu’il existe c ∈ I tel que f (c) = c et qu’il existe k ∈ [0, 1[ tel que |f ′ (x)| k pour tout x ∈ I . Toute suite u vérifiant u0 ∈ I et un+1 = f (un ) pour tout n ∈ IN converge vers c.
Démonstration page 450 Établir l’inégalité |un+1 − c| k |un − c| . En déduire une majoration de |un − c| en fonction de n .
Principe de démonstration.
Ex. 18. Étudions la convergence de la suite définie par u0 ∈ [0, 1] et un+1 = 1 − u2n /4 pour tout n ∈ IN . Considérons la fonction f : x �→ 1 − x2 /4 définie sur [0, 1] . Cet intervalle est √ stable par f et contient 2 2 − 2 , point fixe de f . La fonction f est dérivable et sa dérivée est majorée en valeur absolue par 1/2 . D’après la proposition précédente, la suite (un )n∈IN converge √ vers 2 2 − 2 .
7
Théorème de la limite de la dérivée
Proposition 24 Soit f : I → IR une fonction continue sur I et dérivable sur I \ {a} .
• S’il existe ℓ ∈ IR tel que x→a lim f ′ (x) = ℓ , alors f est dérivable en a et f ′ (a) = ℓ . x�=a
• Si x→a lim f ′ (x) = ±∞, alors lim x�=a
Principe de démonstration.
x→a
Écrire
f (x)−f (a) x−a
= ±∞.
Démonstration page 451 f (x) − f (a) sous la forme f ′ (cx ) . x−a
Théorème 25 Soit f : I → IR une fonction continue sur I et dérivable sur I \ {a} .
Si la restriction de f ′ à I \ {a} admet une limite finie ℓ en a, alors : •
f est dérivable en a ;
• f ′ est continue en a et en particulier f ′ (a) = x→a lim f ′ (x). x�=a
Démonstration. C’est une conséquence immédiate de la proposition précédente. Remarque Avec les notations ci-dessus, si x→a lim f ′ (x) = +∞, alors f n’est pas dérivable en a. Le x�=a
graphe de la fonction possède une tangente verticale au point d’abscisse a. Point méthode Pour déterminer si une fonction f : I → IR, a priori continue sur I et dérivable sur I \ {a} , est effectivement dérivable en a, on peut : • soit étudier le taux d’accroissement en a ;
Exo 11.14
• soit utiliser le théorème de la limite de la dérivée, sans oublier de prouver la continuité de f en a. Cette méthode n’a d’intérêt que si la dérivée est plus simple à étudier que le taux d’accroissement.
436
III Fonctions de classe C k Ex. 19. La fonction f :
[−1, 1] x
−→ �−→
IR Arcsin 1 − x4
est dérivable en 0 .
En effet, sur [−1, 1] \ {0} , f est dérivable par composition de fonctions, et on a : ∀x �= 0
f ′ (x) = √
−4 x3 −4 x = √ · 4 8 2x −x 2 − x4
Pour la dérivabilité en 0 , le théorème 25 de la page précédente s’applique puisque f est continue sur [−1, 1] , dérivable sur [−1, 1] \ {0} et √−4x 4 −→ 0 . Ainsi, la fonction f est dérivable en 0 2−x
x→0
et f ′ (0) = 0 . Ex. 20. Montrons que la fonction f : x �→ (1 − x2 ) Arcsin x , définie sur [−1, 1] est dérivable en 1 . Ici, il est plus simple de revenir à la définition en étudiant la limite du taux d’accroissement plutôt que d’utiliser le théorème de la limite de la dérivée. Pour tout x ∈ [−1, 1[ , on a : f (x) − f (1) = −(1 + x) Arcsin x, x−1 et donc :
f (x) − f (1) −→ −π. x→1 x−1
Ainsi, f est dérivable en 1 et f ′ (1) = −π .
III 1
Fonctions de classe C k Fonctions de classe C 1
Définition 6 Soit f : I → IR une fonction. On dit que f est de classe C 1 sur I si elle est dérivable sur I et si sa dérivée f ′ est continue. Notation On note C 1 (I, IR) l’ensemble des fonctions de classe C 1 sur I à valeurs réelles. Ex. 21. Soit α ∈ ]0, +∞[ . La fonction suivante définie sur IR+ par : α f (x) =
x 0
si x > 0 ; si x = 0.
est continue. Sur IR∗+ , on a f : x �→ exp(α ln x) donc f est de classe C 1 sur cet intervalle, de dérivée f ′ : x �→ αxα−1 (cf. exemple 6 de la page 425). Qu’en est-il sur IR+ ? Montrons que f est de classe C 1 sur IR+ si, et seulement si, α 1 . Si f est de classe C 1 sur IR+ , alors sa dérivée admet une limite finie en 0 donc α − 1 0 . Réciproquement, si α 1 , la dérivée admet une limite finie en 0 (qui vaut 0 si α > 1 et 1 si α = 1 ). D’après le théorème 25 de la page précédente, on en déduit que f ′ est continue en 0 .
437
Chapitre 11. Dérivation Remarques • Une fonction de classe C 1 est encore dite « continûment dérivable ».
• La restriction d’une fonction de classe C 1 à un sous-intervalle d’intérieur non vide est encore de classe C 1 .
• Toute fonction de classe C 1 est bien sûr dérivable. La réciproque est fausse. Dans l’exercice 11.24, on donne l’exemple d’une fonction définie sur IR qui est dérivable sans être de classe C 1 .
• Le premier point du théorème de la limite de la dérivée (cf. page 436) peut s’énoncer avec le vocabulaire précédent : Soit f : I → IR une fonction continue sur I et de classe C 1 sur I \ {a} . S’il existe ℓ ∈ IR tel que x→a lim f ′ (x) = ℓ , alors f est de classe C 1 sur I x�=a
tout entier et f ′ (a) = ℓ . Théorème 26 (Fonctions de classe C 1 sur un segment) Soit a et b deux réels, avec a < b , et f ∈ C 1 [a, b], IR . Alors :
• la dérivée f ′ est bornée ; • en notant M = max f ′ (x) , la fonction f est M -lipschitzienne. x∈[a,b]
Démonstration.
La fonction |f ′ | est une fonction continue sur un segment. D’après le théorème des bornes atteintes, la fonction |f ′ | admet donc un maximum. Pour le caractère lipschitzien de f , il suffit d’appliquer l’inégalité des accroissements finis.
2
Fonctions de classe C n
• Il se peut que la dérivée f ′ = f (1) d’une fonction dérivable f : I → IR soit elle-même dérivable sur I . On dit alors que f est deux fois dérivable. La fonction (f ′ )′ est alors sa dérivée seconde, fonction que l’on note f (2) ou f ′′ . • La dérivée seconde f (2) d’une fonction deux fois dérivable peut éventuellement être dérivable. La fonction f est alors dite trois fois dérivable et sa dérivée ′ troisième est la fonction f (3) = f (2) . On esquisse ainsi un procédé, avec lequel on définirait ce que signifie, pour une fonction f : I → IR, d’être n fois dérivable et permettant de définir la dérivée n-ième d’une telle fonction. Par convention, toute fonction f : I → IR est 0 fois dérivable et f (0) = f . Conformément au programme, nous allons plutôt définir la notion de classe C n .
Définition 7 Soit f : I → IR une fonction.
• Pour tout n ∈ IN, on dit que f est de classe C n lorsqu’elle est n fois dérivable et que la fonction f (n) est continue.
• On dit que f est de classe C ∞ lorsqu’elle est de classe C n pour tout entier naturel n. 438
III Fonctions de classe C k Notations • Pour n ∈ IN, on désigne par C n (I, IR) l’ensemble des fonctions de classe C n sur I à valeurs réelles. • En particulier C 0 (I, IR) est l’ensemble des fonctions continues sur I .
• On désigne par C ∞ (I, IR) l’ensemble des fonctions de classe C ∞ sur I . • Soit f : I → IR une fonction n fois dérivable. La dérivée n-ième de f est notée f (n) n ou Dn (f ). On trouve parfois la notation ddxnf pour désigner la dérivée n-ième de f . Remarques • Comme pour les fonctions continues (cf. page 389), on s’autorise parfois à parler de fonctions de classe C n même dans le cas où elles sont définies sur une réunion d’intervalles d’intérieur non vide. • On sait que si une fonction est dérivable, elle est continue. Ainsi, pour tout entier naturel n, si f a une dérivée (n + 1)-ième, alors elle est de classe C n .
• Pour démontrer qu’une fonction f : I → IR est de classe C ∞ , il suffit de vérifier que, pour tout n ∈ IN, la fonction f (n) est définie. Il n’est pas nécessaire de vérifier la continuité de celle-ci, d’après la remarque précédente. • On dispose ainsi de la chaîne (infinie) d’inclusions : C 0 (I, IR) ⊃ C 1 (I, IR) ⊃ · · · ⊃ C ∞ (I, IR) . Point méthode Pour montrer qu’une fonction est de classe C ∞ , on pourra procéder par récurrence en montrant qu’elle est de classe C n pour tout n ∈ IN.
Dans l’hérédité, pour montrer qu’une certaine fonction f est de classe C n+1 , on pourra essayer de montrer que : • f est dérivable
• f est de classe C ′
n
ou bien
• f est n fois dérivable • f (n) est de classe C 1
Ex. 22. Toute fonction polynomiale f : I → IR est de classe C ∞ .
Pour cela, posons Hn : « toute fonction polynomiale f : I → IR est de classe C n » et démontrons par récurrence que Hn est vraie pour tout entier naturel n . • On sait que les fonctions polynomiales sont continues, ce qui assure H0 . • Soit n ∈ IN tel que Hn soit vraie. Soit f : I → IR une fonction polynomiale. On sait que f est dérivable et que f ′ est une fonction polynomiale. D’après l’hypothèse de récurrence appliquée à f ′ , on en déduit que f ′ est de classe C n . Par conséquent, f est de classe C n+1 .
En particulier, les fonctions fp : x �→ xp , avec p ∈ IN , sont de classe C ∞ sur IR . Une fois p ∈ IN fixé, par récurrence sur n ∈ IN , on vérifie que : ∀x ∈ IR
fp(n) (x)
=
p(p − 1) · · · (p − n + 1)xp−n 0
si n p ; si n > p.
439
Chapitre 11. Dérivation Ex. 23. Les fonctions rationnelles sont de classe C ∞ . En effet, la dérivée d’une fonction rationnelle est une fonction rationnelle ; on peut alors fournir le même type de démonstration que pour les fonctions polynomiales pour montrer qu’une fonction rationnelle est de classe C n pour tout n ∈ IN . En particulier, la fonction f : x �→ 1/x est de classe C ∞ sur I = IR∗+ ou I = IR∗− . Par récurrence, on établit facilement : f (n) (x) = (−1)n
∀x ∈ I
n! · xn+1
Ex. 24. La fonction logarithme est de classe C ∞ . En effet, elle est dérivable et sa dérivée est la fonction inverse qui est de classe C ∞ d’après le point précédent.
Ex. 25. La fonction exponentielle est de classe C ∞ . En effet, elle est dérivable et exp′ = exp. On montre alors par récurrence qu’elle est de classe C n pour tout n ∈ IN et que exp(n) = exp. Ex. 26. Les fonctions sin et cos sont de classe C ∞ . Nous savons que les fonctions sin et cos sont dérivables et que l’on a sin′ = cos et cos′ = − sin . Ces égalités permettent facilement de démontrer par récurrence sur n la propriété Hn : « sin et cos sont de classe C n ». De plus, on démontre, toujours par récurrence, que pour tout entier n :
sin(n) : x �→ sin x + n
3
π 2
et
cos(n) : x �→ cos x + n
π 2
.
Opérations sur les fonctions de classe C n
Linéarité Théorème 27 2
Soit n ∈ IN ∪ {∞} , ainsi que (f, g) ∈ C n (I, IR) et (λ, µ) ∈ IR2 .
Alors la fonction λ f + µ g est de classe C n et, lorsque n ∈ IN, on a : (n)
(λf + µg)
= λf (n) + µg (n) . Démonstration page 451
836
Remarque Comme la fonction nulle est évidemment de classe C ∞ , ce résultat traduit le fait que les ensembles C n (I, IR) et C ∞ (I, IR) sont des sous-espaces vectoriels de F (I, IR) , +, · . Produit
Théorème 28 (Formule de Leibniz) 2
Soit n ∈ IN ∪ {∞} et (f, g) ∈ C n (I, IR) . Alors la fonction f g est de classe C n et, lorsque n ∈ IN, on a : n n (k) (n−k) (n) f g . (f g) = k k=0
Principe de démonstration.
Démonstration page 451
Par récurrence à l’aide de la formule (uv)′ = u′ v + uv ′ et de la relation de Pascal.
Ex. 27. Soit ϕ : IR → IR définie par ϕ(x) = x2 ex .
Posons f : x �→ x2 et g : x �→ ex , qui sont des fonctions de classe C ∞ sur IR . En tant que produit de f et g , la fonction ϕ est de classe C ∞ .
440
III Fonctions de classe C k Pour tout k ∈ IN , on a g (k) = g . De plus f ′ : x �→ 2x , f ′′ : x �→ 2 et f (k) = 0 pour k 3 . La formule de Leibniz donne donc, pour tout entier n 2 : ϕ(n) = f g (n) + nf ′ g (n−1) + soit : ∀x ∈ IR
n(n − 1) ′′ (n−2) , f g 2
ϕ(n) (x) = x2 + 2nx + n(n − 1) ex .
On vérifie que cette expression est encore valable lorsque n ∈ {0, 1} . 689
Remarque Les deux derniers théorèmes et le fait que la fonction constante égale à 1 soit de classe C n impliquent que C n (I, IR) est un sous-anneau de F (I, IR) , +, × . Composition
Théorème 29 Soit I et J deux intervalles d’intérieur non vide et n ∈ IN ∪ {∞} . Si f ∈ C n (I, IR) et g ∈ C n (J, IR) sont telles que f (I) ⊂ J , alors g ◦ f ∈ C n (I, IR).
Démonstration (non exigible) page 452
Remarque Contrairement à la somme et au produit, on ne dispose pas de formule « simple » pour calculer la dérivée n-ième d’une composée. Inverse et quotient Corollaire 30 Soit n ∈ IN ∪ {∞} et f : I → IR une fonction de classe C n qui ne s’annule pas. Alors 1/f est de classe C n .
Démonstration page 453
Principe de démonstration. À l’aide du théorème précédent et de la fonction g : x �→ 1/x . Corollaire 31 2
Soit n ∈ IN ∪ {∞} et (f, g) ∈ C n (I, IR) avec g ne s’annulant pas sur I . Alors f /g est de classe C n .
Ex. 28. La fonction tangente se présentant comme le quotient de la fonction sinus par la fonction cosinus est de classe C ∞ sur tout intervalle non trivial où elle est définie.
Point méthode Soit n ∈ IN ∪ {∞} . Pour montrer qu’une fonction est de classe C n , on pourra d’abord penser à utiliser les « théorèmes généraux ».
Exo 11.23
Si ceux-ci ne s’appliquent pas directement, on pourra essayer de montrer que f est de classe C k pour tout k ∈ IN tel que k n, par récurrence sur k (finie, si n ∈ IN) cf. exercice 11.25.
441
Chapitre 11. Dérivation
Ex. 29. Puisque la fonction exponentielle est de classe C ∞ , par les théorèmes généraux, on en déduit que les fonctions ch et sh sont de classe C ∞ .
Ex. 30. Soit α ∈ IR . La fonction x �→ xα définie sur IR∗+ est de classe C ∞ . En effet, par définition, xα = exp (α ln x), et les fonctions exp et ln sont de classe C ∞ .
Bijections de classe C n Théorème 32 (Bijection de classe C n ) Soit n ∈ IN∗ ∪ {∞} , ainsi que I et J deux intervalles d’intérieur non vide et f : I → J une bijection strictement monotone de classe C n . Si la dérivée première de f ne s’annule pas, alors la bijection réciproque f −1 est de classe C n .
Démonstration (non exigible) page 453
Remarques • On notera, toujours lorsque n 1 , que la condition pour que f −1 soit de classe C n ne porte que sur la dérivée première, à savoir que la fonction f ′ ne s’annule pas. • Comme pour la composition, on ne dispose pas de formule « simple » pour calculer la dérivée n-ième d’une bijection réciproque. • Il y a même une équivalence dans le théorème précédent. Si f −1 est de classe C n , alors f −1 est dérivable, et f ′ ne peut s’annuler en vertu du corollaire 13. √ Ex. 31. La fonction x �→ 3 x est continue sur IR (cf. page 396), et de classe C ∞ sur IR∗ . En effet, cette fonction est la bijection réciproque de la fonction cube qui est de classe C ∞ et dont la dérivée première ne s’annule pas sur IR∗ . Ex. 32. La fonction Arctan est de classe C ∞ sur IR . En effet, Arctan est la bijection réciproque de la fonction tangente restreinte à ]−π/2, π/2[ ; cette dernière fonction est de classe C ∞ et sa dérivée ne s’annule pas. Ce résultat aurait pu être obtenu en remarquant que Arctan est dérivable et que sa déri∞ 1 vée Arctan′ : x �→ 1+x en tant que fonction rationnelle. 2 est de classe C Ex. 33. Les fonctions Arcsin et Arccos restreintes à ]−1, 1[ sont de classe C ∞ . Là encore, ce résultat aurait pu être obtenu en remarquant que Arcsin′ : x �→ √ 1 2 · 1−x
Remarque On peut retenir que les fonctions usuelles sont toutes de classe C ∞ sur le domaine de définition de leur dérivée, à l’exception des fonctions x �→ xα , où α ∈ IR+ \ IN (cf. exercice 11.25).
442
III Fonctions de classe C k Un exemple de fonction de classe C ∞ Ex. 34. Considérons la fonction suivante : f :
IR+
IR
−→
x
�−→
exp
−1 0
si x > 0
x
si x = 0.
Montrons que f est de classe C ∞ en montrant, pour tout n ∈ IN , la propriété Hn suivante : « f est n fois dérivable et il existe Pn ∈ IR[X] tel que : f
(n)
(x) = Pn
1 x
exp
−1 x
si x > 0
f (n) (0) = 0 ».
et
Avant de commencer la récurrence, remarquons que, pour tout polynôme Q , on a, par croissances comparées, lim Q(t) exp(−t) = 0 , de sorte que : t→+∞
lim Q
x→0+
1 1 exp − x x
= 0.
• La propriété H0 est vraie : prendre P0 = 1 . • Soit n ∈ IN tel que Hn soit vraie. Ainsi, la fonction f est n fois dérivable et il existe −1 1 exp si x > 0 et f (n) (0) = 0 . Montrons que Pn ∈ IR[X] tel que f (n) (x) = Pn x x la fonction ϕ = f (n) est dérivable sur IR+ et que sa dérivée est du type annoncé. Tout d’abord, il est clair que ϕ est dérivable sur IR∗+ et que : ∀x > 0
′
ϕ (x) =
−1 ′ Pn x2
1 x
1 + 2 Pn x
1 x
exp
−1 x
en posant Pn+1 = −X 2 Pn′ + X 2 Pn . De plus, on a : ∀x > 0
ϕ(x) − ϕ(0) 1 1 = Pn x−0 x x
exp
= Pn+1
1 x
exp
−1 x
−1 . x
Cette quantité tend vers 0 quand x tend vers 0 (d’après la remarque initiale avec le polynôme Q = XPn ). Ainsi ϕ est dérivable en 0 et l’on a ϕ′ (0) = 0 . On a bien montré que f est n + 1 fois dérivable, que sa dérivée (n + 1) -ième est de la forme attendue sur IR∗+ et que f (n+1) (0) = 0 , c’est-à-dire Hn+1 .
443
Chapitre 11. Dérivation
IV
Extension aux fonctions à valeurs complexes
L’extension des concepts de fonctions dérivables en un point, de fonctions dérivables sur un intervalle et de fonctions de classe C n , aux fonctions de la variable réelle à valeurs complexes ne posent aucune difficulté. Les résultats opératoires restent les mêmes. Il faut cependant ne pas perdre de vue que les propriétés liées à la relation d’ordre n’ont plus de sens dans ce contexte. Définition 8 • Soit f : I → C une fonction. Elle est dite dérivable en a si lim
x→a
f (x)−f (a) x−a
est
définie dans C. Cette limite, lorsqu’elle existe, est le nombre dérivé de f en a. Il est encore noté f ′ (a) ou D(f )(a).
• Lorsque f est dérivable en tout point de I , on dit qu’elle est dérivable sur I . L’application x �→ f ′ (x) est appelée application dérivée et elle est notée f ′ ou D(f ). • La fonction est de classe C 1 (ou continûment dérivable) si f est dérivable et f ′ continue. Remarques • L’ensemble des fonctions dérivables sur I est noté D (I, C) . • L’ensemble des fonctions de classe C 1 est noté C 1 (I, C) . • Comme à la partie III, on définit pour tout n ∈ IN ∪ {∞} les ensembles C n (I, C) et, pour n ∈ IN, les fonctions f (n) . • La restriction d’une fonction dérivable (de classe C n ) sur I à un sous-intervalle J est encore dérivable (de classe C n ). Les notions de dérivées n-ièmes restent des notions locales. • On définit également comme à la page 428 la notion de dérivée à droite et de dérivée à gauche. Le théorème 14 de la page 428 s’étend sans difficulté au cas des fonctions à valeurs complexes. • Bien noter qu’il s’agit de fonctions à valeurs complexes, mais qu’elles restent des fonctions de la variable réelle.
1
Ce qui ne change pas : l’aspect opératoire
Voici deux propositions dont les démonstrations sont analogues au cas réel. Proposition 33 (Linéarité) Soit f et g deux fonctions complexes définies sur I , ainsi que λ et µ deux nombres complexes. • Si les fonctions f et g sont dérivables en a, alors λf + µg est dérivable en a et : ′
(λf + µg) (a) = λf ′ (a) + µg ′ (a).
• Plus généralement, si les fonctions f et g sont de classe C n , où n ∈ IN ∪ {∞} , alors λf + µg est de classe C n et l’on a, lorsque n ∈ IN : (λf + µg)(n) = λf (n) + µg (n) .
444
IV Extension aux fonctions à valeurs complexes Proposition 34 (Produit) Soit f et g deux fonctions complexes définies sur I . • Si f et g sont dérivables en a ∈ I , alors f g est dérivable en a et : (f g)′ (a) = f ′ (a)g(a) + f (a)g ′ (a). • Si f et g sont de classe C n , avec n ∈ IN ∪ {∞} , alors f g est de classe C n . De plus, si n ∈ IN : n n (k) (n−k) (n) f g . (f g) = k k=0
Proposition 35 (Dérivation et conjugaison) Soit f : I → C une fonction.
• La fonction f est dérivable en a, si, et seulement si, la fonction f est dérivable en a, et l’on a f ′ (a) = f ′ (a).
• Plus généralement, la fonction f est de classe C n , où n ∈ IN ∪ {∞} , si, et seulement si, la fonction f est de classe C n et l’on a alors, lorsque n ∈ IN : f (n) = f (n) .
Démonstration. • C’est une conséquence immédiate de la proposition 48 de la page 398. • Par récurrence sur n ∈ IN .
Proposition 36 Soit f une fonction complexe définie sur I . 1. La fonction f est dérivable en a, si, et seulement si, les fonctions Re f et Im f sont dérivables en a et l’on a : ′ ′ f ′ (a) = (Re f ) (a) + i (Im f ) (a). Exo 11.3
2. Plus généralement, f est de classe C n , avec n ∈ IN ∪ {∞} si, et seulement si, les fonctions Re f et Im f sont de classe C n et l’on a alors, lorsque n ∈ IN : (n)
f (n) = (Re f )
(n)
+ i (Im f )
.
Démonstration page 453
Proposition 37 (Puissances) Soit f une fonction complexe définie sur I , dérivable en a. • Soit p ∈ IN∗ . Alors f p est dérivable en a et : ′ (f p ) (a) = p f ′ (a) f p−1 (a). • Soit p ∈ ZZ∗− . Si f ne s’annule pas, alors f p est dérivable en a et : ′
(f p ) (a) = p f ′ (a) f p−1 (a).
Principe de démonstration.
Démonstration page 453
• Dans le cas où p ∈ IN∗ , raisonner par récurrence à l’aide de la proposition 34. • Montrer la dérivabilité de 1/f en passant par les parties réelles et imaginaires. Conclure en remarquant que f p × f1p = 1 .
445
Chapitre 11. Dérivation Corollaire 38 Soit f une fonction complexe de classe C n sur I , avec n ∈ IN ∪ {∞} . • Si p ∈ IN, alors f p est de classe C n .
• Si p ∈ ZZ∗− et si f ne s’annule pas, alors f p est de classe C n .
Proposition 39 (Composition) Soit I et J deux intervalles d’intérieur non vide, ϕ : I → IR et f : J → C deux fonctions telles que ϕ(I) ⊂ J . • Si ϕ est dérivable en a et f dérivable en b = ϕ(a), alors f ◦ ϕ est dérivable ′ en a, et (f ◦ ϕ) (a) = f ′ ϕ(a) ϕ′ (a). • Si ϕ et f sont de classe C n , avec n ∈ IN ∪ {∞} , alors f ◦ ϕ est de classe C n .
Démonstration. Appliquer le théorème 6 de la page 425 et le théorème 29 de la page 441 à Re (f ◦ ϕ) = (Re f ) ◦ ϕ et Im (f ◦ ϕ) = (Im f ) ◦ ϕ . Attention • Bien noter qu’ici f et ϕ ne jouent pas des rôles symétriques : la fonction ϕ est à valeurs réelles, alors que f est à valeurs complexes. • Si ϕ : IR → C est dérivable à valeurs complexes, alors la fonction g : t �→ exp(ϕ(t)) est dérivable et g ′ : t �→ ϕ′ (t) exp ϕ(t) . Contrairement aux apparences, cette relation n’est pas une conséquence de la proposition précédente (puisque la fonction exp considérée est une fonction de la variable complexe) ; elle se démontre en écrivant g(t) = exp x(t) × cos y(t) + i sin y(t) où x = Re(ϕ) et y = Im(ϕ) (cf. proposition 32 de la page 230).
2
Ce qui change : les accroissements finis
Commençons par remarquer que les énoncés des théorèmes de Rolle et des accroissements finis ont un sens pour les fonctions à valeurs complexes, mais qu’ils sont faux. D’ailleurs, la démonstration du théorème de Rolle s’appuie sur la notion d’extremum, ce qui ne permet pas de l’adapter dans le cas complexe. Bien entendu, cette explication ne prouve pas que le théorème est faux. En revanche, voici un contre-exemple. Ex. 35. Soit f : [0, 2π] → C la fonction définie par f (x) = eix . Pour cette fonction, il n’existe pas de réel c ∈ ]0, 2π[ tel que f (2π) − f (0) = 2π f ′ (c) . En effet, f (2π) − f (0) = 0 , alors que pour tout x ∈ [0, 2π] , on a f ′ (x) = ieix �= 0 .
Attention Considérons une fonction f : [a, b] → C que l’on écrit f = g + i h, et que l’on suppose continue sur [a, b] et dérivable sur ]a, b[ . On peut bien sûr appliquer l’égalité des accroissements finis aux fonctions réelles g et h. On obtient alors des éléments c et d de ]a, b[ tels que g(b)−g(a) = (b−a) g ′ (c) et h(b)−h(a) = (b−a) h′ (d). Mais il n’y a évidemment aucune raison pour que c et d soient égaux. Sinon, l’égalité des accroissements finis serait vraie pour les fonctions à valeurs complexes ! 446
IV Extension aux fonctions à valeurs complexes Cela étant, certaines propriétés issues du théorème des accroissements finis sont encore valables pour les fonctions à valeurs complexes. C’est le cas de la caractérisation des fonctions constantes sur un intervalle. Proposition 40 Une fonction dérivable f : I → C est constante si, et seulement si, f ′ = 0 .
Démonstration page 453
Principe de démonstration.
Raisonner sur les parties réelle et imaginaire.
Attention Bien noter que, comme pour les fonctions à valeurs réelles, ce dernier résultat n’est valable que si le domaine de définition I est un intervalle. L’inégalité des accroissements finis est également préservée. Théorème 41 Soit f : I → C une fonction de classe C 1 . S’il existe un réel M tel que |f ′ | M , alors : ∀(x, y) ∈ I 2 f (x) − f (y) M |x − y| . Démonstration.
La démonstration sera donnée dans le chapitre de calcul intégral (cf. corollaire 29 de la page 504).
Remarque Noter la différence entre l’énoncé de l’inégalité des accroissements finis dans le cas réel (cf. page 433) et celui dans le cas complexe. Dans le cas réel, on suppose simplement f dérivable sur l’intérieur de I et non de classe C 1 sur I . Le résultat analogue au cas réel est donné à l’exercice 11.22 de la page 456. Interprétation cinématique Un avion de ligne s’envole de l’aéroport. La vitesse maximale pour ce modèle est de 950 km/h et son autonomie est de 5 heures. On perd toute trace de l’avion au bout de 4 heures après son envol. En supposant en première approximation que les déplacements de l’avion sont plans, les recherches pour l’appareil devront se concentrer dans un disque de rayon 950 km centré en la dernière position connue.
447
Chapitre 11. Dérivation
Démonstrations Proposition 1 • Supposons qu’il existe ℓ ∈ IR et α : I → IR tels que α(x) −→ 0 et, pour tout x ∈ I : x→a
f (x) = f (a) + ℓ (x − a) + (x − a) α (x) . Alors, pour tout x ∈ I \ {a} , on a α(x) =
f (x)−f (a) x−a
− ℓ et donc :
f (x) − f (a) − ℓ −→ 0, x→a x−a
•
ce qui prouve que f est dérivable en a et f ′ (a) = ℓ . Supposons f dérivable en a . Posons α : I → IR l’application définie par : α(x) =
f (x)−f (a)−(x−a) f ′ (a) x−a
0
si x �= a ; sinon.
Soit ε > 0 . Par définition du nombre dérivé, il existe un réel η > 0 tel que :
et donc, puisque α (x) = 0 si x = a , on a : ∀x ∈ I ce qui prouve que lim α(x) = 0 . x→a
|x − a| η =⇒ α(x) ε,
∀x ∈ I \ {a}
|x − a| η =⇒ α(x) ε,
Théorème 3 1. Pour tout x ∈ I \ {a} , on a :
f (x) − f (a) g(x) − g(a) (λf + µg) (x) − (λf + µg) (a) =λ +µ · x−a x−a x−a
2.
On conclut facilement par linéarité de la limite. Pour tout x ∈ I \ {a} , on a :
f (x) − f (a) g(x) + f (a) g(x) − g(a) (f g)(x) − (f g)(a) = x−a x−a =
g(x) − g(a) f (x) − f (a) g(x) + f (a) · x−a x−a
Par continuité de g en a , par définition du nombre dérivé en un point et par les théorèmes généraux sur les limites, le terme de droite dans l’égalité précédente tend vers f ′ (a) g(a) + f (a) g ′ (a) lorsque x tend vers a . Théorème 6 Puisque g est dérivable en b , il existe une fonction α définie sur J de limite nulle en b et telle que pour tout y ∈ J , on ait : g (y) − g (b) = g ′ (b) (y − b) + (y − b) α (y) .
En particulier, pour tout x ∈ I , avec x �= a , on a :
g f (x) − g f (a) f (x) − f (a) f (x) − f (a) = g ′ (b) + α f (x) . x−a x−a x−a
(∗)
Puisque f est continue en a , on a f (x) −→ f (a) . Par composition des limites, on ob-
tient α f (x)
x→a
−→ 0 . D’après les théorèmes généraux le terme de droite dans l’égalité (∗)
x→a
admet g ′ (b) f ′ (a) pour limite (finie) lorsque x tend vers a , et la conclusion s’ensuit.
448
Démonstrations Corollaire 8 •
Pour tout entier naturel n non nul, d’après les exemples traités à la page 422, la fonction ϕn : x �→ xn est dérivable sur IR et ϕ′n : x �→ n xn−1 . Par conséquent, f n = ϕn ◦ f est dérivable en a et (f n )′ (a) = n f ′ (a) f n−1 (a) .
•
Pour tout n ∈ ZZ∗− , toujours d’après les mêmes exemples, la fonction ϕn : x �→ xn est dérivable sur IR∗+ et sur IR∗− . Par ailleurs, si f (a) > 0 (respectivement f (a) < 0 ), il existe, par continuité de f en a , un réel η > 0 tel que, pour tout x ∈ I∩[a−η, a+η] , on ait f (x) > 0 (respectivement f (x) < 0 ). Il suffit alors d’appliquer le théorème 6 de la page 425.
Théorème 12 Commençons par remarquer que J est un intervalle, du fait que f est continue sur un intervalle. • Supposons f −1 dérivable en b . La formule donnant la dérivée d’une composée, appliquée
à f −1 ◦ f donne f −1
•
′
(b)f ′ (a) = 1 , ce qui impose f ′ (a) �= 0 .
Supposons f ′ (a) �= 0 . Soit y ∈ J \ {b} . Puisque f −1 est une bijection de J sur I et que y �= b , on a f −1 (y) �= f −1 (b) . Ainsi : f −1 (y) − f −1 (b) 1 = · y−b f f −1 (y) − f (a) f −1 (y) − a
La fonction réelle f est continue, injective sur un intervalle d’intérieur non vide, donc la fonction f −1 est continue sur J . Par composition des limites, à l’aide de la dérivabilité de f en a , on a : f f −1 (y) − f (a) −→ f ′ (a), y→b f −1 (y) − a et puisque f ′ (a) �= 0 :
f −1 (y) − f −1 (b) 1 −→ ′ · y→b f (a) y−b
Proposition 14 •
Si f est dérivable en a , alors, par restriction, f|I∩[a,+∞[ est dérivable en a (cf. remarque de la
•
Supposons fg′ (a) et fd′ (a) définies et égales.
page 423), et f ′ (a) = f|I∩[a,+∞[
′
(a) = fd′ (a) . On démontre de même que f ′ (a) = fg′ (a) .
Alors la fonction g définie sur I \ {a} par g(x) =
f (x)−f (a) x−a
a une limite à droite et à
gauche en a , et ces limites sont égales. Il s’ensuit que x→a lim g(x) existe (cf.proposition 10 de x�=a
la page 380) et que f est dérivable en a . Théorème 15 Nous démontrons le résultat dans le cas d’un maximum local. Le point a est intérieur à I et f admet un maximum local en a , donc il existe η > 0 tel que [a − η, a + η] ⊂ I et ∀x ∈ [a − η, a + η] f (x) f (a) . • •
Pour tout a < x a + η , on a
f (x)−f (a) x−a
0 et donc, par passage à la limite dans les
inégalités, on a f ′ (a) 0 . On démontre de même f ′ (a) 0 en considérant les x vérifiant a − η x < a .
On a donc montré que f ′ (a) = 0 .
449
Chapitre 11. Dérivation Théorème 17
La fonction g : t �→ f (t) − f (a) +
f (b)−f (a) b−a
(t − a)
est continue sur [a, b] ,
dérivable sur ]a, b[ . On a g(a) = g(b) = 0 et, pour tout t ∈ ]a, b[ , on a par ailleurs : f (b) − f (a) · g ′ (t) = f ′ (t) − b−a On conclut directement à l’aide du théorème de Rolle. Théorème 18 •
Supposons f croissante. Soit x un point intérieur à I . Alors pour tout y ∈ I , avec y �= x ,
on a
f (y)−f (x) y−x
0 (il suffit de distinguer les cas x < y et x > y pour le démontrer). En
faisant tendre y vers x on obtient, par passage à la limite dans les inégalités, que f ′ (x) 0 . •
Supposons que f ′ soit positive sur l’intérieur de I . Soit (x, y) ∈ I 2 , avec x < y . La fonction f est continue sur [x, y] et dérivable sur ]x, y[ (car ]x, y[ est inclus dans l’intérieur de I ). Il existe donc, d’après le théorème des accroissements finis, un réel c ∈ ]x, y[ tel que : f (y) − f (x) = (y − x) f ′ (c) .
Comme (y − x) f ′ (c) 0 , on a f (x) f (y) . Ainsi f est croissante. Théorème 21 •
•
Montrons le sens direct et supposons f strictement croissante. En particulier, f est croissante au sens large, donc f ′ est positive d’après le théorème 18. Montrons l’autre point en raisonnant par l’absurde et en supposant qu’il existe deux points a < b dans I tels que la fonction (f ′ )|]a,b[ soit nulle. Alors f|]a,b[ est constante. On peut donc trouver deux
points x < y dans ]a, b[ donc dans I tels que f (x) = f (y) , ce qui contredit la stricte croissance de f . Montrons le sens indirect et supposons les deux points de la proposition.
Comme f ′ est positive, le théorème 18 affirme que f est croissante. Reste à montrer qu’elle est strictement croissante. Si elle ne l’était pas, alors il existerait deux points a < b de I tels que f (a) = f (b) . Par croissance de f , la restriction de f à l’intervalle non trivial ]a, b[ serait constante et on aurait (f ′ )|]a,b[ = 0 , contredisant le deuxième point de l’hypothèse.
Théorème 22
L’inégalité est immédiate si x = y .
Il reste donc à l’établir pour x �= y . On peut se contenter de traiter le cas x < y (l’autre cas est similaire). La fonction f est continue sur [x, y] et dérivable sur ]x, y[ . D’après l’égalité des accroissements finis, il existe c ∈ ]x, y[ , tel que f (y)−f (x) = f ′ (c) (y − x) . En particulier, c n’est pas une extrémité de I , donc f ′ (c) M et ainsi :
f (y) − f (x) = f ′ (c) |y − x| M |y − x| .
Proposition 23 D’après l’inégalité des accroissements finis appliquée à x = un et y = c , on a, pour tout entier naturel n :
|un+1 − c| = f (un ) − f (c) k |un − c| .
Par une récurrence facile, on obtient pour tout n ∈ IN :
|un − c| kn |u0 − c| .
Puisque 0 k < 1 , on a kn −→ 0 , et donc |un − c| −→ 0 . n→+∞
Ainsi, la suite u converge vers c .
450
n→+∞
Démonstrations Proposition 24
Supposons l’existence de ℓ = x→a lim f ′ (x) dans IR . Pour tout x ∈ I \ {a} , en x�=a
appliquant le théorème des accroissements finis à f entre a et x , il existe cx ∈ ]a, x[ (ou ]x, a[ ), tel que : f (x) − f (a) = f ′ (cx ). x−a
Puisque, pour tout x ∈ I \ {a} , on a |cx − a| |x − a| , on peut conclure que lim cx = a . Par x→a
composition des limites :
f (x) − f (a) = f ′ (cx ) −→ ℓ. x→a x−a
Cela prouve les deux résultats.
Théorème 27 Soit f : I → IR et g : I → IR deux fonctions, ainsi que (λ, µ) ∈ IR2 . Démontrons, par récurrence sur l’entier n , la propriété Hn : « Si f et g sont de classe C n , alors λ f + µ g est de classe C n et (λ f + µ g)(n) = λf (n) + µg (n) ». C’est immédiat si n = 0 . Soit n ∈ IN tel que Hn est vraie.
Considérons f et g de classe C n+1 . En particulier, elles sont de classe C n . L’hypothèse de récurrence Hn implique que λf + µg est de classe C n et : (λf + µg)(n) = λf (n) + µg (n) . Comme f et g sont de classe C n+1 , les fonctions f (n) et g (n) sont de classe C 1 . Par linéarité de la dérivation, la fonction (λf + µg)(n) est dérivable et sa dérivée vaut :
(λf + µg)(n)
′
= λf (n+1) + µg (n+1)
et est continue (toujours car f et g sont de classe C n+1 ). Ainsi λf + µg est de classe C n+1 .
Si f et g sont de classe C ∞ , alors elles sont de classe C n pour tout tout n ∈ IN . D’après ce qui précède, λf + µg est de classe C n pour tout tout n ∈ IN , donc de classe C ∞ . Théorème 28 Soit f : I → IR et g : I → IR deux fonctions. Démontrons, par récurrence sur l’entier n , la propriété Hn : « Si f et g sont de classe C n , alors f g est de classe C n et (f g)(n) =
n n
k=0
k
f (k) g (n−k) ».
C’est immédiat si n = 0 . Soit n ∈ IN tel que Hn est vraie. Supposons f et g de classe C n+1 . En particulier, elles sont de classe C n . D’après l’hypothèse de récurrence Hn , la fonction f g est de classe C n et : (f g)(n) =
n n k=0
Pour tout k ∈ [[0, n]] , on a f même, g
(n−k)
1
(k)
k
f (k) g (n−k) .
de classe C n+1−k , donc de classe C 1 , donc dérivable. De
est de classe C , donc dérivable.
451
Chapitre 11. Dérivation Sachant qu’un produit de fonctions dérivables est dérivable et par linéarité de la dérivation (cf. corollaire 4 de la page 425), la fonction (f g)(n) est dérivable et l’on a : (f g)
(n+1)
=
=
n n
n n
k
k=0
=
f
k
k=0
n n
k
k=0
(k)
g
(n−k)
f (k) g (n−k)
′
′
f (k+1) g (n−k) + f (k) g (n+1−k) .
En séparant et en réindexant la première somme, on obtient :
(f g)
(n+1)
n n
=
k
k=0
f
n+1
=
k=1
(k+1)
g
(n−k)
+
n n k=0
k
n
f (k) g (n+1−k)
n (k) (n+1−k) n f (k) g (n+1−k) + f g . k−1 k k=0
En regroupant à nouveau et en utilisant la relation de Pascal, on a enfin : (f g)(n+1) = f (0) g (n+1) +
n n k=1
n+1
=
k=0
k−1
+
n k
f (k) g (n+1−k) + f (n+1) g (0)
n + 1 (k) (n+1−k) f g . k
Cette fonction (f g)(n+1) est clairement continue, puisqu’elle s’exprime comme somme de produits de fonctions continues. On a donc montré que f g est de classe C n+1 . Théorème 29
Démontrons, par récurrence sur l’entier n , la propriété Hn :
« pour tout f ∈ C n (I, IR) et g ∈ C n (J, IR) tel que f (I) ⊂ J, on a g ◦ f ∈ C n (I, IR) ». Initialisation. La propriété H0 est une traduction du fait que la composée de deux fonctions continues est continue. Hérédité.
Soit n ∈ IN tel que la propriété Hn soit vraie.
Soit f ∈ C n+1 (I, IR) et g ∈ C n+1 (J, IR) telles que f (I) ⊂ J . Les fonctions f et g sont dérivables, du fait que n + 1 1 . De plus (g ◦ f )′ = (g ′ ◦ f ) × f ′ et :
• •
d’après l’hypothèse de récurrence, g ′ ◦ f est de classe C n , car g ′ est de classe C n , ainsi que f (qui est de classe C n+1 et donc de classe C n ), la fonction f ′ est de classe C n .
Ainsi la fonction (g ◦ f )′ est un produit de fonctions de classe C n et est donc elle-même de classe C n .
On a donc montré que g ◦ f est de classe C n+1 .
452
Démonstrations Corollaire 30 D’après le théorème des valeurs intermédiaires, f étant en particulier continue, elle est à valeurs soit dans ]0, +∞[ , soit dans ]−∞, 0[ . Si f est à valeurs dans ]0, +∞[ , la fonction 1/f est la composée de la fonction f et de la fonction x �→ 1/x , qui est de classe C n sur ]0, +∞[ . Même justification lorsque f est à valeurs dans ]−∞, 0[ . Théorème 32 Démontrons, par récurrence sur n ∈ IN∗ , la propriété Hn : « pour toute bijection strictement monotone de classe C n de I sur J telle que f ′ ne s’annule pas, la bijection réciproque f −1 est de classe C n ». • Pour n = 1 , c’est une conséquence du théorème donnant la dérivée d’une bijection réciproque (cf. corollaire 13 de la page 427). •
Soit n 1 tel que Hn soit vraie. Soit f une bijection strictement monotone de classe C n+1 tel que f ′ ne s’annule pas. Alors f −1 est dérivable et (f −1 )′ = f ′ ◦f1 −1 ·
Comme f est de classe C n+1 , sa dérivée f ′ est de classe C n . D’après Hn , la fonction f −1 est de classe C n . Par composition, f ′ ◦ f −1 est de classe C n . Par passage à l’inverse (licite, car f ′ ne s’annule pas), on en déduit que (f −1 )′ est de classe C n . On a donc montré que f −1 est de classe C n+1 . Proposition 36 1.
2.
Si f est dérivable en a , alors f est dérivable en a (cf.proposition 35 de la
−f page 445) et par linéarité Re f = f +f et Im f = f 2i sont dérivables en a . Réciproquement, 2 si Re f et Im f sont dérivables en a , alors f = Re f + i Im f est dérivable en a en vertu de la proposition 33 de la page 444. C’est une récurrence immédiate.
Proposition 37 • Lorsque p ∈ IN∗ , la dérivabilité en a de f p est une conséquence de la proposition 34 de la page 445. La formule s’obtient par récurrence sur p . • Notons x = Re f et y = Im f les fonctions définies sur I à valeurs réelles. On a
•
1 f
=
x x2 +y 2
−i
y · x2 +y 2
La fonction
1 f
est donc dérivable en a . Par récurrence
sur q ∈ IN∗ , on prouve avec la proposition 34 de la page 445 que f1q = ( f1 )q est dérivable en a . Soit p ∈ ZZ∗− . La formule donnée dans l’énoncé s’obtient en dérivant la fonction f p × f1p constante égale à 1 . La fonction
1 fp
est dérivable en a d’après le premier point et la fonc-
p
tion f est dérivable en a d’après ce qui précède. Par produit de fonctions dérivables en a , on obtient : ′ 1 1 p (a) + f (a) × (a) = 0, (f p )′ (a) × fp fp c’est-à-dire, par définition de la fonction puissance et avec la formule de la dérivée du premier point appliquée à −p ∈ IN∗ : (f p )′ (a) ×
1 + f p (a) × f (a)p
− pf ′ (a)f −p−1 (a) = 0.
Finalement, on obtient (f p )′ (a) = p f ′ (a) f p−1 (a) .
Proposition 40 On a f ′ = 0 si, et seulement si, (Re f )′ = 0 et (Im f )′ = 0 . Par la caractérisation des fonctions réelles constantes sur un intervalle (voir le corollaire 20 de la page 432), on a f ′ = 0 si, et seulement si, les fonctions Re f et Im f sont constantes, i.e. si, et seulement si, la fonction f est constante.
453
Chapitre 11. Dérivation
S’entraîner et approfondir Généralités 11.1 1. Que dire de la parité de la dérivée d’une fonction paire dérivable sur IR ? →425 2. La dérivée d’une fonction périodique dérivable sur IR est-elle périodique ? 11.2 1. En utilisant les résultats du chapitre 6, démontrer que la fonction sh définit une bijection →427 dérivable de IR sur IR . On note f sa bijection réciproque. 2. Démontrer que f est dérivable. Donner une expression de f ′ (x) analogue à celle de Arcsin′ (x) . 11.3 Soit f : I → C une fonction dérivable. →445
1. Montrer que |f |2 est dérivable et calculer sa dérivée.
2. Donner un exemple montrant qu’en général, la fonction |f | n’est pas dérivable.
3. Montrer que si f (a) �= 0 , alors la fonction |f | est dérivable en a . 11.4 Soit f une fonction définie sur IR . 1. Démontrer que si f est dérivable en 0 , alors lim
x→0
f (x)−f (−x) 2x
= f ′ (0) .
2. Si la limite précédente est finie, est-ce que f est dérivable en 0 ? ⋆⋆ 11.5 Soit f une fonction réelle définie sur IR , continue en 0 et telle que lim
x→0
f (3x)−f (x) x
existe et
′
soit finie égale à ℓ ∈ IR . Démontrer que f est dérivable en 0 et déterminer f (0) en fonction de ℓ . ⋆ 11.6 Soit f : I → I une fonction dérivable et (un )n∈IN une suite vérifiant un+1 = f (un ) , avec u0 ∈ I . On suppose de plus que (un )n∈IN converge vers c et que |f ′ (c)| > 1 . 1. On suppose que pour tout entier naturel n , on a un �= c . Donner
lim
n→+∞
un+1 −c · un −c
Aboutir à une contradiction. 2. Montrer que la suite (un )n∈IN est stationnaire, égale à c à partir d’un certain rang. 3. Démontrer que la suite définie par u0 =
1 3
et un+1 = 4un (1 − un ) diverge.
11.7 Soit f : I → C une fonction dérivable ne s’annulant pas. On appelle dérivée logarithmique f′ · de f , la fonction f 1. Soit f, g : I → C deux fonctions dérivables ne s’annulant pas. Déterminer la dérivée logarithmique de f p g q où (p, q) ∈ ZZ2 . 2. Lorsque f et g sont à valeurs réelles strictement positives, déterminer la dérivée logarithmique de de f α g β où (α, β) ∈ IR2 . 3
2
3. Soit ϕ : [0, 1] → IR définie par ϕ(x) = (1 − x) 4 x 3 .
À l’aide de la dérivée logarithmique, étudier les variations de ϕ .
454
Exercices
Théorème de Rolle et des accroissements finis 11.8 Soit f : I → IR une fonction dérivable et n 2 un entier. On suppose que f s’annule au →430 moins n fois. Démontrer que l’équation f ′ (x) = 0 admet au moins n − 1 solutions réelles distinctes. 11.9 Étudier la monotonie de la fonction définie sur IR par g(x) = →431 définition de la racine cubique page 92).
√ 3
x3 − x2 + x + 1 (voir la
11.10 Démontrer que la fonction f : x �→ x − sin x est strictement croissante sur IR . →433
11.11 Déterminer les extrema locaux et globaux de la fonction h : →433
11.12 Montrer que : lim
→435
n→+∞
− π2 ,
π 2
x
−→ �−→
IR x2 tan x.
√ √ sin( n + 1) − sin( n) = 0.
11.13 Soit α ∈ [−1, +∞[ . Montrer la convergence de la suite (un )n∈IN définie par u0 = α √ →436 et un+1 = 1 + un , pour tout entier n . 11.14 Montrer que la fonction f : →436
[−1, 1] x
−→ �−→
IR Arcsin 1 − x2
n’est pas dérivable en 0 .
⋆ 11.15 Soit f une fonction dérivable sur un intervalle I d’intérieur non vide. 1. Soit a < b deux éléments de I tels que f ′ (a) < 0 et f ′ (b) > 0 . Démontrer qu’il existe c ∈ [a, b] tel que f ′ (c) = 0 .
2. Démontrer que f ′ (I) est un intervalle (Théorème de Darboux). 11.16 Soit (a, b) ∈ IR2 tel que a < b . Soit f une fonction dérivable sur le segment [a, b] , telle que f (a) = f (b) et f ′ (a) = 0 . Démontrer qu’il existe c ∈ ]a, b[ tel que : f ′ (c) =
f (c) − f (a) · c−a
11.17 Soit (a, b) ∈ IR2 tel que a < b . Soit f et g deux fonctions continues sur le segment [a, b] , dérivables sur ]a, b[ . Démontrer qu’il existe c ∈ ]a, b[ tel que :
f (b) − f (a) g ′ (c) = g(b) − g(a) f ′ (c).
11.18 Soit f : IR+ → IR une fonction continue, dérivable sur IR∗+ , telle que : f (0) = lim f (x) x→+∞
On souhaite montrer qu’il existe c ∈ ]0, +∞[ tel que f ′ (c) = 0 . 1. Dans cette question, on suppose f de classe C 1 sur IR∗+ . Répondre au problème posé.
2. On revient aux hypothèses générales. Répondre au problème posé (on pourra montrer que f est non injective).
455
Chapitre 11. Dérivation ⋆ 11.19 Soit f une fonction de classe C n définie sur I , qui s’annule en a1 < · · · < an , avec n 1 . Démontrer que pour tout x ∈ I , il existe ξ ∈ I tel que f (x) =
(x − a1 ) · · · (x − an ) (n) f (ξ). n!
Indication. Pour x ∈ I \ {a1 , . . . , an } , introduire ϕx : t �→ f (t) − A(t − a1 ) · · · (t − an ) , avec A ∈ IR tel que ϕx (x) = 0 . 11.20 Soit f et g deux fonctions réelles, continues sur I , dérivables sur l’intérieur de I . On suppose que |f ′ | g ′ . Montrer que pour tout (a, b) ∈ I 2 tel que a b , on a f (b) − f (a) g(b) − g(a) .
⋆ 11.21 Soit q une fonction dérivable sur IR telle que : ∃A ∈ IR+
∀x A
q(x) > 0
et
q ′ (x) > 0 .
Montrer que toute fonction y deux fois dérivable vérifiant : ∀x ∈ IR
y ′′ (x) + q(x)y(x) = 0
est bornée au voisinage de +∞ .
Indication. On pourra considérer la fonction définie sur [A + ∞[ par : z : x �→ y 2 (x) +
y ′2 (x) · q(x)
⋆ 11.22 Inégalité des accroissements finis généralisée Soit (a, b) ∈ IR2 tel que a < b . Soit f : [a, b] → C une fonction continue sur [a, b] et dérivable sur ]a, b[ . On suppose qu’il existe un réel M tel que, pour tout x ∈ ]a, b[ , on ait f ′ (x) M .
1. On suppose ici que f (a) et f (b) sont réels. Montrer que f (b) − f (a) M (b − a) .
2. On ne suppose plus f (a) et f (b) réels.
En considérant une application g définie sur [a, b] par g(x) = u f (x)−f (a) , avec u ∈ C
bien choisi, démontrer que f (b) − f (a) M (b − a) .
Fonctions de classe C n
11.23 Soit ϕ : IR → IR une fonction de classe C ∞ et f : I → IR une fonction dérivable vérifiant, →441 pour tout x ∈ I , la relation f ′ (x) = ϕ f (x) . Démontrer que f est de classe C ∞ . 11.24 On considère la fonction f définie sur IR∗ par f (x) = x2 sin x1 ·
1. Démontrer que f admet un prolongement par continuité en 0 . On note encore f ce prolongement. 2. Démontrer que f est dérivable en 0 . 3. Calculer, pour tout x ∈ IR∗ , le nombre dérivé f ′ (x) . Que dire de l’inclusion C 1 (I, IR) ⊂ D (I, IR) ?
456
Exercices 11.25 Soit α ∈ IR+ \ IN . Préciser la classe maximale de la fonction fα définie sur IR+ par : fα (x) =
xα 0
si x > 0 ; si x = 0.
1 · 1 + x2 Démontrer que pour tout entier naturel n , il existe une unique fonction polynomiale Pn Pn (x) telle que, pour tout réel x , on ait f (n) (x) = · (1 + x2 )n+1
11.26 Soit f l’application définie sur IR par f (x) =
⋆ 11.27 Soit f l’application définie sur IR par f (x) = x2 − 1 . Pour tout entier naturel n , on pose Pn la fonction polynomiale définie sur IR par Pn (x) =
1 Dn (f n ) 2n n!
où l’on rappelle que Dn désigne l’opérateur de dérivée n –ième. 1. Démontrer que Pn a la parité de n . 2. Calculer Pn (1) . En déduire Pn (−1) . 3. Démontrer que Pn s’annule n fois sur ]−1, 1[ . ⋆ 11.28 Soit f l’application définie sur [0, 1[ par f (x) = √
1 · 1 − x2
Démontrer, pour tout entier naturel n et pour tout x ∈ [0, 1[ , que f (n) (x) 0 .
Indication. On pourra chercher une relation entre f ′ et f , puis une seconde relation donnant f (n+1) en fonction des f (k) avec k n .
457
Chapitre 11. Dérivation
Solutions des exercices 11.1 1. Soit f une fonction dérivable paire. On a f (x) = f (−x) , pour tout x ∈ IR . Par composition, la fonction g : x �→ f (−x) est dérivable et g ′ (x) = −f ′ (−x) pour tout x ∈ IR . Par conséquent, pour tout x ∈ IR , on a f ′ (x) = −f ′ (−x) . Donc f ′ est une fonction impaire.
2. Si f est une fonction T -périodique définie sur IR , on a f (x+T ) = f (x) pour tout x ∈ IR . Puisque la dérivée de la fonction x �→ f (x + T ) est la fonction x �→ f ′ (x + T ) , on a, pour tout x réel, f ′ (x) = f ′ (x + T ) . Ainsi f ′ est également T -périodique.
11.2 1. La fonction sh est évidemment continue et dérivable sur IR . Le tableau de variation a été donné à la page 226. Il en découle que la fonction sh est une bijection dérivable, strictement croissante de IR sur IR . 2. Puisque sh′ = ch ne s’annule pas, f est dérivable sur IR . Par ailleurs, on a ch2 − sh2 = 1 et donc, comme ch est à valeurs positives :
ch f (x) =
1 + sh2 f (x) =
1 + x2 ,
pour tout x réel. Par conséquent, d’après le théorème 12 de la page 427, on a pour tout x réel : 1 1 = √ f ′ (x) = · (ch ◦f )(x) 1 + x2
11.3 1. Puisque |f |2 = f f , la fonction |f |2 est dérivable comme produit de fonctions dérivables, et on a D(|f |2 ) = f ′ f + f f ′ = 2 Re f ′ f .
On peut également écrire D(|f |2 ) = 2 (Re f ) (Re f )′ + (Im f ) (Im f )′ .
2. La fonction f : x �→ x montre qu’en général |f | n’est pas dérivable.
3. Puisque |f |2 est dérivable en a et prend une valeur strictement positive en a , et puisque √ est dérivable sur IR∗+ , on a, par composition, que |f | = |f |2 est dérivable la fonction en a . 11.4 1. Comme f est dérivable, il existe une fonction α définie sur IR et de limite nulle en 0 telle que pour tout x ∈ IR , on ait f (x) = f (0) + xf ′ (0) + x α(x) . Par conséquent : α(x) − α(−x) f (x) − f (−x) = f ′ (0) + −→ f ′ (0). x→0 2x 2 2. La réponse est non. Considérons par exemple la fonction f : x �→ |x| qui est définie sur IR . D’après l’exemple 12 de la page 428, on sait qu’elle n’est pas dérivable en 0 . En revanche, pour tout x ∈ IR∗ , on a
f (x)−f (−x) 2x
= 0 et a fortiori :
f (x) − f (−x) −→ 0. x→0 2x
458
Solutions des exercices 11.5 Essayons de conjecturer la valeur de f ′ (0) en considérant la fonction affine f : x �→ ax . Pour cette fonction, on a ℓ = 2a et f ′ (0) = a . On peut donc espérer montrer que lim
x→0
f (x)−f (0) x
que lim
x→0
=
ℓ 2
g(x)−g(0) x
en toute généralité. En posant g : x �→ f (x) − 2ℓ x , cela revient à montrer = 0.
Soit ε > 0 . Il existe η > 0 tel que pour tout x ∈ IR vérifiant 0 < |x| η on ait :
g(3x) − g(x) ε. x
(∗)
Fixons un tel x . Puisque pour tout k ∈ IN on a |x/3k+1 | η , l’inégalité (∗) donne :
g(x/3k ) − g(x/3k+1 ) ε · 3k+1 x
Par somme et inégalité triangulaire, on a donc, pour tout n ∈ IN :
n n g(x) − g(x/3n+1 ) g(x/3k ) − g(x/3k+1 ) 1 ε · x x 3k+1 k=0
On a d’une part, part
lim
n→+∞
n 1 k=0
3k+1
n+1
lim g(x/3
n→+∞
) = g(0) par continuité de g en 0 , et d’autre
1 · En faisant tendre n vers +∞ dans l’inégalité, on obtient ainsi : 2
=
On a donc montré que
k=0
g(x) − g(0) ε · 2 x
g(x) − g(0) −→ 0 . x→0 x
11.6 1. Tout d’abord, remarquons que c est un point fixe de f (passer à la limite dans l’égalité un+1 = f (un ) en utilisant la continuité de f en c ). On a ensuite :
′ un+1 − c f (un ) − f (c) = −→ f (c) > 1. un − c
un − c
n→+∞
u −c 1. Il existe donc un rang à partir duquel un+1 n −c
La suite
|un − c|
n∈IN
est croissante à partir d’un rang n0 . Pour n n0 , on
a |un − c| |un0 − c| . En passant à la limite dans cette dernière inégalité, on obtient 0 |un0 − c| , d’où un0 = c , ce qui contredit l’hypothèse.
2. D’après la question précédente, il existe un indice n0 tel que un0 = c . Puisque c est un point fixe, la suite (un )n∈IN est constante à partir du rang n0 . 3. Les points fixes de f : x �→ 4x(1 − x) sont 0 et 3/4 . Puisque f ′ (0) = 4 et f ′ (3/4) = −2 , la suite ne sera convergente que si elle est stationnaire. On vérifie par récurrence que uk = conséquent, uk ∈ / {0,
3 } 4
ak
k
32
, où ak est un entier non divisible par 3 . Par
pour tout entier k , et la suite (uk )k∈IN diverge.
459
Chapitre 11. Dérivation 11.7 1. Par opérations, on a : (f p g q )′ pf ′ f p−1 g q + f p qg ′ g q−1 f′ g′ = =p +q · f p gq f p gq f g 2. Les calculs sont les mêmes qu’à la question précédente en vertu de l’exemple 7 de la page 425, et l’on trouve : f′ g′ (f α g β )′ = α + β · f α gβ f g 3. Commençons par remarquer que cette fonction ϕ est continue sur [0, 1] (rappelons que la fonction x �→ xγ se prolonge par continuité en 0 lorsque γ > 0 ). La fonction ϕ est dérivable sur ]0, 1[ et la dérivée logarithmique vaut : − 17 x + 32 −3/4 2/3 ϕ′ (x) = + = 12 · ϕ(x) 1−x x x(1 − x) La fonction ϕ étant positive, l’étude du signe de ϕ′ découle de l’égalité précédente, et l’on a : 8 x 0 1 17 ϕ′ (x)
+
ϕ 0
0 8 ϕ( 17 )
− 0
Remarque On ne sait rien, ni de la dérivabilité de ϕ en 0 et en 1 , ni de ses dérivées éventuelles en ces points, mais cela n’a pas d’importance pour les variations tant qu’elle est continue.
11.8 Soit α1 , . . . , αn des points distincts de I sur lesquels f s’annule. On peut sans perte de généralité les ordonner et supposer α1 < · · · < αn . Appliquons le théorème de Rolle à f entre αk et αk+1 , pour tout k ∈ [[1, n − 1]] . Cela garantit l’existence d’un βk ∈ ]αk , αk+1 [ tel que f ′ (βk ) = 0 . Puisque α1 < β1 < α2 < · · · < βn−1 < αn , les βk sont deux à deux distincts, et ainsi f ′ s’annule bien au moins n − 1 fois. √ 11.9 Puisque la fonction x �→ 3 x est strictement croissante sur IR , il suffit d’étudier la monotonie de la fonction dérivable g : x �→ x3 − x2 + x + 1 . Les méthodes usuelles de calcul de dérivées donnent que g ′ est la fonction x �→ 3x2 −2x+1 . Le discriminant de cette fonction polynomiale du second degré vaut −8 < 0 . Ainsi g ′ a un signe fixe. Puisque g ′ (0) = 1 > 0 , la fonction g ′ est à valeurs strictement positives et donc g est croissante. Il en est de même de f . 11.10 La fonction f est définie sur IR ; elle est dérivable en tant que différence de fonctions dérivables. Sa dérivée est donnée par f ′ (x) = 1 − cos x . Ainsi f ′ 0 et f ′ (x) = 0 si, et seulement si, x ∈ 2πZZ . Montrons que f est strictement croissante sur IR en revenant à la définition. Fixons a < b . L’ensemble [a, b] ∩ 2πZZ est fini ; on peut appliquer le point méthode de la page 433. On en déduit que f est strictement croissante sur [a, b] . D’où f (a) < f (b) .
460
Solutions des exercices
11.11 D’après les théorèmes généraux, la fonction h est dérivable sur − π2 , h′ : x �→ 2x tan x + x
Étudions le signe de h′ sur − π2 ,
π 2
2
1 + tan2 (x) .
π 2
, et l’on a :
. La fonction h′ est clairement positive sur cet intervalle,
et on a l’équivalence h′ (x) = 0 si, et seulement si, x = 0 . Ainsi, h est strictement croissante sur − π2 , π2 et l’on a le tableau de variations : x
h′ (x)
−π/2
0
+
0
π/2
+ +∞
h −∞
La fonction h n’a donc pas d’extrema globaux ou locaux. 11.12 La fonction sin est dérivable sur IR et sa dérivée cos est majorée en valeur absolue par 1 . √ √ L’inégalité des accroissements finis appliquée à n et n + 1 fournit : ∀n ∈ IN
√ √ 1 sin( n + 1) − sin(√n) n + 1 − √n = √(n + 1) −√n = √ √ · n + 1 + n n+1+ n
Le membre droit tend vers 0 lorsque n tend vers +∞ , d’où le résultat. 11.13 La fonction f : x �→
√
1 + x laisse I = [0, +∞[ stable et on a u1 ∈ I . Montrons la conver-
gence de la suite (un )n1 à l’aide de la proposition 23. La fonction f possède c = comme point fixe. De plus, f est dérivable sur I , et l’on a : ∀x ∈ I
√ 1+ 5 2
∈I
1 1 · 0 f ′ (x) = √ 2 2 1+x
On en déduit que la suite (un )n∈IN converge vers
√ 1+ 5 · 2
11.14 Tout d’abord, f est continue sur [−1, 1] . Par opérations, f est dérivable sur [−1, 1] \ {0} et : −2x −2x √ ∀x �= 0 f ′ (x) = √ = · 2 x2 − x4 |x| 2 − x2 √ −2x √ Comme −→ − 2 , le théorème 25 de la page 436 appliquée à la restriction de f |x| 2−x2 x→0+ √ à ]0, 1[ montre que la fonction f est dérivable à droite en 0 et fd′ (0) = − 2 . De même, la √ fonction f est dérivable à gauche en 0 et fg′ (0) = 2 . Puisque fg′ (0) �= fd′ (0) , la fonction f n’est pas dérivable en 0 . 11.15 1. Considérons la fonction f restreinte à [a, b] . Cette fonction est continue sur un segment donc est bornée et atteint son minimum en un point c . (a) (a) = f ′ (a) < 0 , on a f (x)−f < 0 au voisinage de a ; donc il Puisque lim f (x)−f x−a x−a x→a
existe x0 ∈ [a, b] tel que f (x0 ) − f (a) < 0 donc c �= a . On prouve de la même façon que c �= b . Ainsi, la fonction f|[a,b] est dérivable et atteint un extremum local (global
ici) en c qui est un point intérieur à [a, b] . D’après le théorème 15 de la page 429, on en déduit que f ′ (c) = 0 .
461
Chapitre 11. Dérivation 2. Soit a < b dans I tels que f ′ (a) �= f ′ (b) .
Sans perte de généralité, on peut supposer f ′ (a) < f ′ (b) . Pour montrer que f ′ (I) est un intervalle, il suffit de montrer que tout réel k ∈ f ′ (a), f ′ (b) est atteint par f ′ .
Considérons g la fonction définie par g(x) = f (x) − kx . Cette fonction vérifie toutes les hypothèses de la première question. Il existe alors c ∈ [a, b] tel que g ′ (c) = 0 , soit tel que f ′ (c) = k , ce qui montre que k ∈ f ′ (I) . 11.16 La fonction ϕ : [a, b] → IR définie par :
f (x) − f (a) si x �= a x−a ϕ(a) = 0 ϕ(x) =
est continue sur [a, b] , dérivable sur ]a, b[ et vérifie ϕ(a) = ϕ(b) = 0 . Il existe donc c ∈ ]a, b[ tel que ϕ′ (c) = 0 . Or la dérivée de ϕ sur ]a, b[ est donnée par : ϕ′ : x �→ f ′ (x)
−1 1 + f (x) − f (a) · x−a (x − a)2
L’égalité ϕ′ (c) = 0 fournit donc f ′ (c) =
f (c)−f (a) · c−a
11.17 Introduisons la fonction ϕ définie sur [a, b] par :
ϕ(x) = g(b) − g(a) f (x) − f (a) − f (b) − f (a) g(x) − g(a) . D’après les théorèmes généraux, la fonction ϕ est continue sur [a, b] et dérivable sur ]a, b[ . On a aussi ϕ(a) = ϕ(b) = 0 et, pour tout x ∈ ]a, b[ , on a :
ϕ′ (x) = g(b) − g(a) f ′ (x) − f (b) − f (a) g ′ (x). Le théorème de Rolle appliqué à la fonction ϕ permet de conclure. 11.18 1. Raisonnons par l’absurde en supposant que la dérivée f ′ ne s’annule pas sur IR∗+ . Comme cette fonction est continue par hypothèse, elle garde un signe constant (en vertu du théorème des valeurs intermédiaires). Ainsi, la fonction f est strictement monotone. Cela contredit le fait que f (0) = lim f (x) . x→+∞
2. Comme f (0) = lim f (x) , la fonction f ne peut pas être strictement monotone. x→+∞
Or f est continue sur l’intervalle [0, +∞[ , donc le théorème 42 de la page 395 montre qu’elle est non injective. Ainsi, il existe a < b deux réels positifs tels que f (a) = f (b) . On peut alors appliquer le théorème de Rolle sur [a, b] pour obtenir l’existence d’un réel c ∈ ]a, b[ (donc c est strictement positif) tel que f ′ (c) = 0 . 11.19 Fixons x ∈ I . Si x est égal à l’un des ai , la relation est évidente, en prenant par exemple ξ = a1 . Sinon, posons : f (x) A= (x − a1 ) · · · (x − an )
462
Solutions des exercices et considérons la fonction ϕx définie par : ∀t ∈ I
ϕx (t) = f (t) − A(t − a1 ) · · · (t − an ).
Cette fonction est n fois dérivable et s’annule n + 1 fois (elle s’annule en les ai et en x ). Par récurrence sur k ∈ [[0, n]] , on montre, en appliquant plusieurs fois le théorème de Rolle, (k)
(n)
que ϕx
s’annule n − k + 1 fois sur I . En particulier, ϕx f (n) (ξ) (n) · Or, ϕx (t) = f (n) (t) − n!A , d’où A = n! En reprenant la définition de A , on obtient le résultat.
11.20 Montrons que :
a au moins un zéro ξ dans I .
− g(b) − g(a) f (b) − f (a) g(b) − g(a).
Commençons par prouver l’inégalité de droite. Considérons la fonction ϕ : x �→
g(x) − f (x) . Elle est continue sur I , dérivable sur
l’intérieur de I . De plus, ϕ′ (x) = g ′ (x) − f ′ (x) 0 pour tout x de l’intérieur de I . Il s’ensuit que ϕ est croissante. Ainsi ϕ(a) ϕ(b) . Cette inégalité se réécrit : 0 g(b) − f (b) − g(a) + f (a),
d’où l’inégalité de droite.
En appliquant ce qui précède à −f (qui vérifie les mêmes hypothèses que f ), on obtient : 0 g(b) + f (b) − g(a) − f (a),
d’où l’inégalité de gauche.
11.21 Si y est une solution de l’équation alors la fonction z est dérivable sur [A, +∞[ et : ∀x A
z ′ (x) = 2y ′ (x)y(x) − y ′2 (x) = −y ′2 (x)
q ′ (x) 1 + 2y ′ (x)y ′′ (x) q 2 (x) q(x)
q ′ (x) 0. q 2 (x)
Par suite, la fonction z est une fonction positive et décroissante sur [A, +∞[ donc : ∀x A
0 z(x) z(A).
2
Or pour tout x A , on a y (x) z(x) . On en déduit donc : ∀x A
|y(x)|
z(x)
ce qui prouve que y est bornée au voisinage de +∞ .
z(A),
11.22 1. Puisque f est dérivable sur ]a, b[ , il en est de même de Re f . De plus, pour tout x ∈ ]a, b[ , on a : (Re f )′ (x) (Re f )′ (x) + i(Im f )′ (x) = f ′ (x) M. L’inégalité des accroissements finis appliquée à la fonction réelle Re f nous donne :
(Re f )(b) − (Re f )(a) M (b − a).
Or f (a) et f (b) sont réels par hypothèse, d’où l’inégalité annoncée.
463
Chapitre 11. Dérivation 2. L’inégalité demandée est immédiate si f (b) = f (a) . Dans le cas contraire, soit α un argument de f (b) − f (a) ; posons g l’application définie sur [a, b] par g(x) = e−iα f (x) − f (a) . La fonction g est continue sur [a, b] et déri-
vable sur ]a, b[ . Pour tout x ∈ ]a, b[ , on a g ′ (x) = e−iα f ′ (x) et donc g ′ (x) M . De
plus g(a) = 0 et g(b) = f (b) − f (a) . L’inégalité s’obtient alors en appliquant le résultat de la première question à la fonction g .
11.23 Montrons par récurrence sur n ∈ IN , la propriété Hn : « f est de classe C n ». La fonction f est évidemment de classe C 0 (car dérivable donc continue). Soit n ∈ IN tel que Hn soit vraie. Montrons que f est de classe C n+1 .
La fonction f est dérivable et l’on a f ′ = ϕ ◦ f . D’après Hn , la fonction f est de classe C n . De plus, ϕ est de classe C ∞ d’après l’énoncé, donc est de classe C n . Par composition, f ′ est donc de classe C n . Ainsi, f est de classe C n+1 .
11.24 1. Pour tout x ∈ IR∗ , on a l’inégalité :
f (x) x2 .
Ainsi, puisque lim x2 = 0 , on a par encadrement lim f (x) = 0 . La fonction f admet x→0
x→0
donc un prolongement par continuité en 0 et ce prolongement, encore noté f , vérifie f (0) = 0 . 2. Pour tout x ∈ IR∗ , on a l’inégalité :
On en déduit que lim
x→0
f (x) − f (0) = x sin 1 |x|. x x
f (x)−f (0) x
= 0 et donc que f est dérivable en 0 , avec f ′ (0) = 0 .
3. Par les théorèmes généraux, f est dérivable sur IR∗ . De plus pour tout x ∈ IR∗ , on a f ′ (x) = 2 x sin x1 − cos x1 · Montrons que la limite de f ′ en 0 n’existe pas. Considérons les suites a = On a :
1 2kπ k∈IN∗
et b =
1 2kπ+ π 2
f ′ (ak ) = −1 −→ −1 k→+∞
′
k∈IN∗
et
qui convergent toutes les deux vers 0 . f ′ (bk ) = 2bk −→ 0. k→+∞
′
Ainsi la limite de f en 0 n’existe pas et la fonction f n’est donc pas continue en 0 . Dans cet exercice, on a montré que l’inclusion C 1 (I, IR) ⊂ D (I, IR) est stricte. 11.25 D’après les théorèmes généraux, fα est de classe C ∞ sur IR∗+ . (n)
Pour tout n ∈ IN , la fonction fα
est définie sur IR∗+ par :
fα(n) (x) = α (α − 1) · · · (α − n + 1) xα−n . (n)
Ainsi, fα a une limite finie en 0 si, et seulement si, α − n 0 . On en déduit que si fα est de classe C n sur IR+ , alors n ⌊α⌋ . Réciproquement, on vérifie que la fonction fα est de classe C k sur IR+ pour tout k ∈ [[0, ⌊α⌋]] et que : ∀x ∈ IR+
464
fα(k) (x) = α (α − 1) · · · (α − k + 1) fα−k (x).
Solutions des exercices On procède par récurrence finie. Pour k = 0 , il est facile de vérifier que fα est continue. Soit k ∈ [[0, ⌊α⌋ − 1]] . On suppose que fα est de classe C k sur IR+ et : ∀x ∈ IR+
fα(k) (x) = α (α − 1) · · · (α − k + 1) fα−k (x).
Comme k ⌊α⌋ − 1 , on a k α − 1 , donc α − k 1 et on peut appliquer ce que l’on a vu dans l’exemple 21 de la page 437 : si β 1 , la fonction fβ est de classe C 1 sur IR+ et fβ′ = βfβ−1 . (k)
On en déduit que fα
et de classe C 1 sur IR+ et :
fα(k)
(k+1)
Ainsi fα
′
= α (α − 1) · · · (α − k + 1) (α − k)fα−k−1 .
est donnée par la formule attendue.
11.26 D’après les théorèmes généraux, la fonction f est de classe C ∞ .
L’unicité est immédiate, car, pour tout x réel, Pn (x) = (1 + x2 )n+1 f (n) (x) . Montrons par récurrence que pour tout entier n , il existe une fonction polynomiale Pn telle que f (n) : x �→
Pn (x) · (1+x2 )n+1
La fonction constante P0 = 1 convient lorsque n = 0 . Supposons le résultat vrai pour un entier n ∈ IN . Alors, pour tout x ∈ IR , on a : f (n+1) (x) =
Pn′ (x)(1 + x2 ) − 2(n + 1)xPn (x) · (1 + x2 )n+2
En prenant la fonction Pn+1 : x �→ Pn′ (x)(1 + x2 ) − 2(n + 1)xPn (x) qui est polynomiale d’après l’hypothèse de récurrence et les opérations sur les fonctions polynomiales, on obtient Pn+1 (x) que f (n+1) (x) = · (1 + x2 )n+2
11.27 1. La fonction polynomiale x �→ f (x)n = (x2 − 1)n est paire. Sa dérivée première D1 (f n ) est donc impaire. Plus généralement, pour tout k ∈ IN , la fonction Dk (f n ) est paire si k est pair et impaire si k est impair. D’où le résultat annoncé. 2. On peut écrire f n = g h , où les fonctions g et h sont définies sur IR par g : x �→ (x − 1)n et h : x �→ (x + 1)n . La formule de Leibniz donne :
n 1 n (i) (n−i) Pn = n g h . 2 n! i i=0
(i)
Pour tout i ∈ [[0, n]] et x ∈ IR , on a g (x) = n(n − 1) · · · (n − i + 1)(x − 1)n−i . En particulier, pour tout i ∈ [[0, n − 1]] , on a g (i) (1) = 0 , et donc : Pn (1) =
1 2n n!
n (n) g (1)h(0) (1) = 1. n
En utilisant les propriétés de parité de Pn , on obtient Pn (−1) = (−1)n .
465
Chapitre 11. Dérivation 3. En appliquant comme plus haut la formule de Leibniz à l’ordre k < n , il vient que −1 et 1 sont des zéros de Dk (f n ) . Montrons par récurrence finie que si 0 k n , alors Dk (f n ) admet au moins k zéros distincts dans ]−1, 1[ . C’est immédiat pour k = 0 . Si le résultat est vrai pour un k < n , il existe des zéros x1 , . . . , xk de Dk (f n ) , tels que −1 < x1 < · · · < xk < 1 . En posant x0 = −1 et xk+1 = 1 , qui sont également des zéros de Dk (f n ) , on peut appliquer le théorème de Rolle à Dk (f n ) sur les intervalles [xi , xi+1 ] . Pour tout i ∈ [[0, k]] , il existe un zéro yi ∈ ]xi , xi+1 [ de Dk+1 (f n ) , et donc Dk+1 (f n ) s’annule au moins k + 1 fois dans ]−1, 1[ . Pour la valeur k = n , on obtient que Pn = Dn (f n ) s’annule n fois sur ]−1, 1[ . 11.28 La fonction f est de classe C ∞ . Pour tout x ∈ [0, 1[ , on a f ′ (x) = 2
x (1−x2 )3/2
, c’est-à-
′
dire (1 − x ) f (x) = xf (x) . D’après la formule de Leibniz, pour tout n 2 , on a en dérivant n fois la dernière relation : (1 − x2 ) f (n+1) (x) − 2nxf (n) (x) − n(n − 1)f (n−1) (x) = xf (n) (x) + nf (n−1) (x)
c’est-à-dire, la formule étant encore valable pour n = 1 : (1 − x2 ) f (n+1) (x) = (2n + 1)xf (n) (x) + n2 f (n−1) (x).
Pour tout x ∈ [0, 1[ , on a f (x) 0 et f ′ (x) =
x (1−x2 )3/2
0 . Il est alors facile de démontrer
par récurrence double sur n , à l’aide de la relation précédente, que pour tout x ∈ [0, 1[ on a f (n) (x) 0 .
466
Chapitre 12 : Fonctions convexes I
Fonctions convexes . . . . . . . . . . . . . . . . . . . . . 468 Interprétation graphique . . . . . . . . . . . . . . . . . . . 469 Inégalité de convexité . . . . . . . . . . . . . . . . . . . . 470 Caractérisation de la convexité par la croissance des pentes 471 Régularité des fonctions convexes . . . . . . . . . . . . . . 472 II Convexité et dérivabilité . . . . . . . . . . . . . . . . . . 473 1 Caractérisation des fonctions dérivables convexes . . . . . 473 2 Position par rapport à la tangente . . . . . . . . . . . . . 474 Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . . . 475 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480 1 2 3 4
Fonctions convexes
12
Dans ce chapitre, I désigne un intervalle de IR non vide et non réduit à un point et f une fonction de I dans IR.
I
Fonctions convexes
Définition 1 La fonction f est convexe sur I si : ∀(x, y) ∈ I 2 ∀λ ∈ [0, 1] f (1 − λ) x + λ y (1 − λ) f (x) + λ f (y).
Remarques • Comme l’application λ �→ 1 − λ établit une bijection de [0, 1] dans [0, 1], la fonction f est convexe si, et seulement si : ∀(x, y) ∈ I 2 ∀λ ∈ [0, 1] f λ x + (1 − λ) y λ f (x) + (1 − λ) f (y). • Pour montrer à l’aide de la définition qu’une fonction est convexe, il suffit d’éta blir l’inégalité f (1 − λ) x + λ y (1 − λ) f (x) + λ f (y) dans le cas où x < y et λ ∈ ]0, 1[ . En effet, les cas x = y ainsi que λ = 0 ou λ = 1 sont évidents et les réels x et y jouent des rôles symétriques.
• Soit λ ∈ [0, 1] et (x, y) ∈ I 2 tel que x y . On a (1 − λ) x + λ y ∈ [x, y], donc le réel (1 − λ) x + λ y appartient bien à l’intervalle I . • Si la fonction −f est convexe, on dit que f est concave.
• Toutes les propriétés des fonctions convexes ont leur pendant pour les fonctions concaves (que l’on obtient en les appliquant à −f ) ; en particulier tous les résultats en termes d’inégalités s’obtiennent en changeant le sens de celles-ci.
I Fonctions convexes
1
Interprétation graphique
Soit Γ le graphe de la fonction f dans le plan. Soit (x1 , x2 ) ∈ I 2 tels que x1 < x2 . Notons A1 et A2 les points de Γ d’abscisse x1 et x2 . Lorsque λ parcourt le segment [0, 1], (1 − λ) x1 + λ x2 parcourt le segment [x1 , x2 ]. Ainsi, l’ensemble des points de coordonnées (1 − λ) x1 + λ x2 , f (1 − λ) x1 + λ x2 avec λ ∈ [0, 1] est l’ensemble des points de Γ dont l’abscisse est entre x1 et x2 . f (x2 ) − f (x1 ) Par ailleurs, la droite (A1 A2 ) a pour équation y = (x − x1 ) + f (x1 ). x2 − x1
Exo 12.1
Pour tout λ ∈ [0, 1], le point de (A1 A2 ) d’abscisse (1−λ) x1 +λ x2 = x1 +λ (x2 −x1 ) a donc pour ordonnée (1−λ) f (x1 )+λ f (x2 ). L’ensemble des points de coordonnées ((1 − λ) x1 + λ x2 , (1 − λ) f (x1 ) + λ f (x2 )) avec λ ∈ [0, 1] est donc l’ensemble des points de la corde [A1 A2 ]. Ainsi, la fonction f est convexe sur I si, et seulement si, pour tous points A1 et A2 de Γ d’abscisses respectives x1 et x2 , le graphe de f|[x1 ,x2 ] est en dessous de la
A2
A1
x2
x1
corde [A1 , A2 ].
Ex. 1. Toute fonction affine est convexe. Ex. 2. La fonction valeur absolue est convexe car, pour λ ∈ [0, 1] et (x, y) ∈ IR2 , on a :
(1 − λ) x + λ y |(1 − λ) x| + λ y = (1 − λ) |x| + λ |y|.
Ex. 3. Montrons que la fonction f : x �→ x2 est convexe sur IR tandis que la fonction g : x �→ x3 ne l’est pas. Soit (x, y) ∈ IR2 et λ ∈ [0, 1] . On a :
(1 − λ) x + λ y
2
− (1 − λ) x2 − λ y 2 = λ(1 − λ)(2xy − x2 − y 2 ) = −λ(1 − λ)(x − y)2 0.
Donc f est convexe sur IR . Pour montrer que g n’est pas convexe sur IR , il suffit d’exhiber un contre-exemple que l’on intuite grâce au graphe de g . On a : −1/2 = 1/2 × 0 + 1/2 × (−1) et g(−1/2) = −1/8 > 1/2 × g(0) + 1/2 × g(−1)
donc g n’est pas convexe sur IR .
Remarque On verra dans la section suivante qu’il y a plus rapide pour étudier la convexité des fonctions f et g en considérant leurs dérivées. Proposition 1 Si f et g sont deux fonctions convexes sur I , alors f + g est aussi une fonction convexe sur I .
Démonstration page 475
469
Chapitre 12. Fonctions convexes
Exo 12.2
Remarque Le produit de deux fonctions convexes ne l’est pas forcément. Par exemple, les fonctions x �→ x2 et x �→ −1 sont convexes sur IR mais leur produit ne l’est pas. En effet, si l’on prend x = −1 , y = 1 et λ = 1/2 , alors f (1−λ) x+λ y = 0 et (1 − λ) f (x) + λ f (y) = −1 . Proposition 2 (Position par rapport à une sécante) Soit Γ le graphe d’une fonction f convexe sur I et A1 , A2 deux points de Γ d’abscisses x1 et x2 tels que x1 < x2 . Alors : • le graphe de f|I∩]−∞,x1 ] est situé au-dessus de la droite (A1 A2 ). • le graphe de f|[x1 ,x2 ] est situé en dessous de [A1 , A2 ] ; • le graphe de f|I∩[x2 ,+∞[ , est situé au-dessus de la droite (A1 A2 ).
Démonstration page 475
Principe de démonstration. On a déjà prouvé que le graphe de f|[x
1 ,x2 ]
est
A2
situé en dessous de [A1 , A2 ] .
Pour un point de Γ d’abscisse x x1 , écrire x1 sous la forme λx + (1 − λ)x2 .
2
A1
x
Inégalité de convexité
x1
x2
Lemme 3 Soit p ∈ IN∗ , x1 , . . . , xp des éléments de I et une famille (λi )1ip de réels positifs p p telle que λi = 1 . Alors le réel λi xi appartient encore à I . i=1
i=1
Démonstration page 476
p
Principe de démonstration.
Il s’agit de montrer que le réel
λi xi appartient à :
i=1
[min(x1 , . . . , xp ), max(x1 , . . . , xp )] et d’utiliser que I est un intervalle.
Remarques p λi xi est appelé barycentre des points (xi )1ip pondérés par les • Le réel i=1
poids (λi )1ip . Il correspond à une moyenne pondérée.
• Lorsque les (λi )1ip sont égaux, le barycentre est appelé isobarycentre. Il est p 1 xi . alors égal à p i=1 470
I Fonctions convexes Proposition 4 (Inégalité de Jensen) Étant donné une fonction f convexe sur I et une famille (λi )1ip de réels positifs p telle que λi = 1 , on a : i=1 p p p ∀(x1 , . . . , xp ) ∈ I λi f (xi ). f λi xi i=1
i=1
Démonstration page 476
Principe de démonstration.
Procéder par récurrence.
Remarque La propriété précédente caractérise la convexité, car pour p = 2 , on retrouve la définition. Elle porte le nom d’inégalité de Jensen ou d’inégalité de convexité.
Ex. 4. La convexité de x �→ x2 , implique que pour tout (x1 , . . . , xn ) ∈ IRn , on a :
3 Exo 12.3 Exo 12.4
n 1 xi n i=1
2
n 1 2 xi n
donc
i=1
n
xi
i=1
2
n
n
x2i .
i=1
Caractérisation de la convexité par la croissance des pentes
Proposition 5 (Inégalité des pentes) Si f est convexe sur I , alors : ∀(x, y, z) ∈ I 3
x < y < z =⇒
f (z) − f (x) f (z) − f (y) f (y) − f (x) · y−x z−x z−y
Démonstration page 477
Principe de démonstration.
Faire un dessin et exprimer y sous la forme (1 − λ) x + λ z .
Remarques • Ces inégalités s’expriment en terme de pentes de droites et se retiennent facilement à l’aide d’un dessin. • Si l’on met tout au même dénominateur, on remarque que les inégalités : f (y) − f (x) f (z) − f (x) y−x z−x
x
y
z
f (z) − f (y) f (z) − f (x) z−x z−y y−x · sont équivalentes à f (y) (1 − λ) f (x) + λ f (z) avec λ = z−x Comme y = (1 − λ) x + λ z , on en déduit que la propriété précédente est en fait une équivalence. 471
Chapitre 12. Fonctions convexes
Exo 12.5
Proposition 6 La fonction f est convexe sur I si, et seulement si, pour tout a ∈ I , la fonction τa : I \ {a} −→ IR est croissante. f (x) − f (a) x �−→ x−a
Démonstration page 477
Ex. 5. Si a et b sont deux réels, la fonction g : x �→ f (x) − a x − b est convexe si, et seulement si, f est convexe. En effet, pour tout x0 ∈ I , les fonctions τx0 correspondant à f et à g diffèrent de la constante a . Remarque Dans la proposition précédente, il s’agit bien de la croissance de τa sur I\{a} et pas seulement de sa croissance sur chacun des deux intervalles I∩ ]−∞, a[ et I ∩ ]a, +∞[.
4
Régularité des fonctions convexes
Proposition 7 Si f est une fonction convexe sur un intervalle I et si a un point intérieur de I , alors f est dérivable à droite et à gauche au point a et fg′ (a) fd′ (a). Démonstration page 478
On en déduit que si f est convexe sur I , alors elle est continue à droite et continue à gauche en tout point de l’intérieur de I donc, en particulier : Corollaire 8 Si f est une fonction convexe sur un intervalle ouvert I , alors f est continue sur I .
Démonstration page 478
Attention Il existe des fonctions convexes discontinues. Ex. 6. La fonction [0, 1] −→ x
�−→
IR
est convexe sur [0, 1] et discontinue x 2
si x ∈ [0, 1[ sinon
en 1 . En effet, si l’on considère g : x �→ x , alors g est convexe sur [0, 1] , g et f coïncident sur [0, 1[ et g f . Ainsi, si l’on considère (x, y) ∈ [0, 1]2 tel que x < y et λ ∈ ]0, 1[ , alors on a: = g λ x + (1 − λ) y car λ x + (1 − λ) y ∈ [0, 1[ f λ x + (1 − λ) y λ g(x) + (1 − λ) g(y) car g est convexe = λ f (x) + (1 − λ) g(y) car x ∈ [0, 1[ λ f (x) + (1 − λ) f (y) car g f et 1 − λ 0. La remarque de la page 468 prouve alors que f est convexe.
472
II Convexité et dérivabilité
II 1
Convexité et dérivabilité Caractérisation des fonctions dérivables convexes
Proposition 9 Soit f une fonction dérivable sur un intervalle I . La fonction f est convexe si, et seulement si, la fonction f ′ est croissante. Démonstration page 478
Principe de démonstration.
Utiliser l’inégalité des pentes dans un sens et le théorème des accroissements finis pour l’autre.
Remarques • Dans la première partie de la démonstration précédente, on a en fait établi que si f est une fonction convexe dérivable, on a : f (y) − f (x) x < y =⇒ f ′ (x) f ′ (y), y−x résultat très facile à retrouver sur un dessin. • Comme le théorème des accroissements finis sur lex y quel elle est fondée, la réciproque nécessite en fait seulement la continuité de f sur I et la dérivabilité sur I privé de ses bornes. Par exemple, la fonction Arcsin, qui est continue sur [0, 1], est convexe sur [0, 1], 1 comme le prouvent les variations sur [0, 1[ de sa dérivée x �→ √1−x · 2
Ainsi, si f est continue sur un intervalle I , dérivable en tout point intérieur et si f ′ √ est croissante, alors f est convexe sur I . On prouve ainsi rapidement que x �→ x est concave sur IR+ .
Exo 12.6
Exo 12.7
Ex. 7. On retrouve la convexité de la fonction x �→ x2 . Ex. 8. La monotonie de leurs dérivées prouve que la fonction exp est convexe tandis que la fonction ln est concave.
Corollaire 10 Soit f une fonction deux fois dérivable sur un intervalle I . La fonction f est convexe si, et seulement si, f ′′ est positive. Démonstration. En effet, sous cette hypothèse, f ′ est croissante sur l’intervalle I si, et seulement si, f ′′ 0 .
Ex. 9. Soit a et b deux réels positifs et (p, q) ∈ (R∗+ )2 tel que bq ap + · p q En effet, si a ou b est nul, alors l’inégalité est évidente. Sinon, la fonction ln étant concave, on a :
1 1 + = 1. p q
On a l’inégalité de Young : ab
ln
bq ap + p q
1 1 ln ap + ln bq p q
soit
ln
L’inégalité découle alors de la croissance de la fonction exp .
bq ap + p q
ln(ab).
473
Chapitre 12. Fonctions convexes
2
Position par rapport à la tangente
Proposition 11 Si f est une fonction convexe et dérivable sur un intervalle I , on a : ∀(x, a) ∈ I 2
f (x) f (a) + (x − a) f ′ (a).
Démonstration page 479
Remarque Ainsi, le graphe d’une fonction convexe dérivable est situé au-dessus de chacune de ses tangentes. Voici quelques inégalités de convexité classiques : Ex. 10. ∀x ∈ IR exp x 1 + x ; Ex. 11. ∀x ∈ IR∗+
ln x x − 1 ;
Ex. 12. ∀x ∈ [0, π/2]
2 x π
sin x x .
1. Une équation de la tangente en 0 de la fonction convexe exp est : y = exp(0) + exp′ (0) × x = 1 + x,
d’où l’inégalité. 2. Une équation de la tangente en 1 de la fonction ln est : y = ln(1) + ln′ (1) × (x − 1) = x − 1. Comme ln est concave, on en déduit l’inégalité. 3. La fonction sin est concave sur [0, π/2] . Une équation de la tangente en 0 de la fonction sin est y = sin(0) + sin′ (0) × x = x , d’où l’inégalité : ∀x ∈ [0, π/2]
sin x x.
La corde reliant les points de coordonnées (0, sin(0)) = (0, 0) et (π/2, sin(π/2)) = (π/2, 1) a pour équation y = π2 x . La concavité de sin sur [0, π/2] implique alors que pour tout x ∈ [0, π/2] , on a π2 x sin x .
Un graphique permet de visualiser les inégalités : ∀x ∈ [0, π/2]
2 x sin x x π
0
|
π 2
qui découlent de la position du graphe de la fonction sinus par rapport à sa tangente à l’origine et à la corde reliant les points d’abscisses 0 et π/2 .
Point méthode Des inégalités du type de l’exercice précédent peuvent aussi être obtenues par étude de fonctions ou en utilisant l’inégalité des accroissements finis. Lorsque l’une des deux fonctions est affine, l’inégalité a souvent une interprétation graphique en terme de tangente ou en terme de corde ce qui permet de la démontrer par des arguments de convexité.
474
Démonstrations
Démonstrations Proposition 1
2
Soit (x, y) ∈ I et λ ∈ [0, 1] . On a :
f (1 − λ) x + λ y (1 − λ) f (x) + λ f (y) donc :
g (1 − λ) x + λ y (1 − λ) g(x) + λ g(y)
et
(f + g) (1 − λ) x + λ y (1 − λ) (f + g)(x) + λ (f + g)(y),
ce qui prouve que f + g est convexe sur I . Proposition 2
est situé en dessous de [A1 , A2 ] .
•
On a déjà prouvé que le graphe de f|[x
•
Soit x ∈ I∩]−∞, x1 ] . Si l’on note P et M les points d’abscisse x se trouvant respectivement sur Γ et sur la droite (A1 A2 ) , on a le schéma suivant :
1 ,x2 ]
A2 P A1 M x
x2
x1
x2 − x1 , on a λ ∈ ]0, 1] et x1 = λx + (1 − λ)x2 . x2 − x La fonction f étant convexe, on a donc f (x1 ) λ f (x) + (1 − λ) f (x2 ) puis :
En posant λ =
1 1 f (x1 ) + 1 − λ λ
f (x2 ) f (x).
1 1 1 1 x1 + 1 − x2 , l’ordonnée de M est f (x1 ) + 1 − f (x2 ) λ λ λ λ Comme l’ordonnée de P est égale à f (x) , on en déduit que le graphe de f|I∩]−∞,x ] est De plus, comme x =
1
situé au-dessus de la droite (A1 A2 ) .
•
Soit x ∈ I ∩ [x2 , +∞[ . Notons P et M les points d’abscisse x se trouvant respectivement sur Γ et sur la droite (A1 , A2 ) . x − x2 , on a λ ∈ [0, 1[ et x2 = λ x1 + (1 − λ) x. En posant λ = x − x1 La fonction f étant convexe, on a donc f (x2 ) λ f (x1 ) + (1 − λ) f (x) puis : 1 λ f (x2 ) − f (x1 ) f (x). 1−λ 1−λ λ 1 λ 1 x2 − x1 , l’ordonnée de M est f (x2 ) − f (x1 ) 1−λ 1−λ 1−λ 1−λ Comme l’ordonnée de P est égale à f (x) , on en déduit que le graphe de f|I∩[x ,+∞[ est De plus, comme x =
2
situé au-dessus de la droite (A1 A2 ) .
475
Chapitre 12. Fonctions convexes Lemme 3 Soit (j, k) ∈ [[1, p]]2 tel que xj = min(x1 , . . . , xp ) et xk = max(x1 , . . . , xp ) . Comme les λi sont positifs, pour tout i ∈ [[1, p]] , on a λi xj λi xi λi xk . En utilisant
p
λi = 1 , on en déduit :
i=1
xj =
p
λi x j
i=1
Ainsi,
p i=1
Proposition 4
p
λi x i
i=1
p
λi x k = x k .
i=1
λi xi ∈ [xj , xk ] et comme I est un intervalle contenant xj et xk , on a le résultat. Pour tout p ∈ IN∗ , on note Hp la propriété :
« pour tout (λ1 , . . . , λp ) ∈ (IR+ )p et pour tout (x1 , . . . , xp ) ∈ I p , on a : p
λi = 1 =⇒ f
i=1
• •
p
λi x i
i=1
p
λi f (xi ). »
i=1
H1 est clairement vraie. Soit p 2 tel que Hp−1 soit vraie. Considérons une famille (x1 , . . . , xp ) ∈ I p ainsi qu’une famille (λ1 , . . . , λp ) de réels positifs vérifiant
p
λi = 1 .
i=1
∗
Si λp = 1 , alors pour tout i ∈ [[1, p − 1]] on a λi = 0 car ces λi sont positifs et de somme nulle. Par suite : f
p
λi x i
i=1
∗
= f (xp ) =
λi x i =
i=1
p−1 i=1
La somme des réels positifs
λi xi + λp xp = (1 − λp )
λi 1 − λp
yp =
λi f (xi ).
i=1
Si λp �= 1 , on peut écrire : p
p
p−1 i=1
λi x i + λp x p . 1 − λp
étant égale à 1 , le réel :
1ip−1 p−1 i=1
λi xi 1 − λp
appartient à I d’après le lemme 3 de la page 470. La propriété Hp−1 donne alors : f (yp ) = f
p−1 i=1
λi xi 1 − λp
La convexité de f entraîne alors : f
p
λi x i
i=1
= f (1 − λp ) yp + λp xp
476
λi f (xi ). 1 − λp
+ λp f (xp ) =
i=1
(1 − λp ) f (yp ) + λp f (xp ) (1 − λp )
ce qui prouve Hp .
p−1
p−1 i=1
λi f (xi ) 1 − λp
p i=1
λi f (xi ),
Démonstrations Proposition 5
Considérons x , y et z des éléments de I vérifiant x < y < z . y−x , on a y = (1 − λ) x + λ z et λ ∈ [0, 1] , ce qui implique que : En posant λ = z−x
f (y) (1 − λ)f (x) + λf (z).
Ainsi, on a (1 − λ) f (y) − f (x) λ f (z) − f (y) , c’est-à-dire :
ce qui conduit à :
y − x z −y f (y) − f (x) f (z) − f (y) ; z−x z−x (z − x) f (y) (y − x) f (z) + (z − y) f (x)
car z − x > 0 . On en déduit les deux inégalités. Proposition 6 •
Supposons f convexe sur I et a ∈ I . Montrons la croissance de la fonction τa en utilisant l’inégalité des pentes. Soit (x, x′ ) ∈ (I \ {a})2 tel que x < x′ . ∗
Si a < x < x′ , alors on a : f (x) − f (a) f (x′ ) − f (a) , x−a x′ − a
∗
τa (x) τa (x′ ).
c’est-à-dire
τa (x) τa (x′ ).
c’est-à-dire
τa (x) τa (x′ ).
Si x < a < x′ , alors on a : f (a) − f (x) f (x′ ) − f (a) , a−x x′ − a
∗
c’est-à-dire
Si x < x′ < a , alors on a : f (a) − f (x) f (a) − f (x′ ) , a−x a − x′
La fonction τa est donc croissante. •
Réciproquement, supposons que pour tout a ∈ I , la fonction τa soit croissante.
Soit (x, y) ∈ I 2 tel que x < y et λ ∈ ]0, 1[ . Posons a = (1 − λ) x + λ y . La croissance de la fonction τa implique alors que : f (y) − f (a) f (x) − f (a) · x−a y−a Comme x − a = λ (x − y) < 0 et y − a = (1 − λ) (y − x) > 0 , on a : (x − a) (f (y) − f (a)) (y − a) (f (x) − f (a)) , c’est-à-dire : λ (x − y) (f (y) − f (a)) (1 − λ) (y − x) (f (x) − f (a)) .
Comme y − x > 0 , on obtient :
−λ (f (y) − f (a)) (1 − λ) (f (x) − f (a)) , puis : f (a) (1 − λ) f (x) + λ f (y),
ce qui prouve la convexité de f .
477
Chapitre 12. Fonctions convexes Proposition 7 Supposons f convexe sur I et considérons a un point intérieur de I . D’après ce est croissante. qui précède, la fonction τa : I \ {a} −→ IR f (x) − f (a) x �−→ x−a Ainsi, on a : ∀(x, y) ∈ I 2 x < a < y =⇒ τa (x) τa (y). Soit y tel que y > a (il en existe puisque a n’est pas la borne supérieure de I ). La fonction τa|I∩]−∞,a[ est croissante majorée par τa (y) , donc elle possède une limite en a inférieure ou égale à τa (y) , ce qui entraîne que la fonction est dérivable à gauche en a et que : ∀y ∈ I
y > a =⇒ fg′ (a) τa (y).
Ainsi, la fonction croissante τa|I∩]a,+∞[ est minorée par fg′ (a) . Elle admet donc une limite en a supérieure ou égale à fg′ (a) , ce qui entraîne que la fonction f est dérivable à droite en a et que fg′ (a) fd′ (a) . Corollaire 8 Comme I est un intervalle ouvert, tout point de I est intérieur donc, d’après ce qui précède, f est dérivable à droite et à gauche en tout point de I donc est continue à droite et à gauche en en tout point de I Par conséquent, f est continue sur I . Proposition 9 • Supposons f convexe. Soit x et y deux points de I tels que x < y . f (t) − f (x) f (y) − f (x) ∗ Soit t ∈ ]x, y[ . La proposition 5 de la page 471 donne : · t−x y−x f (y) − f (x) · En passant à la limite lorsque t tend vers x à droite, on obtient : f ′ (x) y−x ∗
•
De la même façon, grâce à l’inégalité
f (y)−f (x) y−x
f (y)−f (t) y−t
valable pour tout t ∈ ]x, y[ ,
f (y) − f (x) f ′ (y). on obtient : y−x f (y) − f (x) f ′ (y), ce qui prouve la croissance de f ′ . Par conséquent : f ′ (x) y−x Supposons f ′ croissante. Soit (x, y) ∈ I 2 tel que x < y et λ ∈ ]0, 1[ . Posons z = λx + (1 − λ)y . D’après le théorème des accroissements finis, il existe c1 ∈ ]x, z[ et c2 ∈ ]z, y[ tels que : f (z) − f (x) = f ′ (c1 ) z−x
f (y) − f (z) = f ′ (c2 ). y−z
x
c1
z
c2
y
Comme x < c1 < z < c2 < y , la croissance de f ′ implique que f ′ (c1 ) f ′ (c2 ) , ce qui f (y) − f (z) f (z) − f (x) f (y) − f (z) f (z) − f (x) , c’est-à-dire · donne z−x y−z (1 − λ)(y − x) λ(y − x) Comme λ , 1 − λ et y − x sont des réels strictement positifs, on en déduit que : Par conséquent, f est convexe.
478
f (z) λf (x) + (1 − λ)f (y).
Démonstrations Proposition 11 ′
Soit a ∈ I . La fonction τa : x �→
f (x)−f (a) x−a
est croissante sur I \ {a} et tend
vers f (a) en a par dérivabilité de f . On a donc, pour tout x ∈ I : x < a =⇒ τa (x) f ′ (a)
et
x > a =⇒ τa (x) f ′ (a).
Par conséquent, f (x) − f (a) (x − a) f ′ (a) pour tout x ∈ I (le cas x = a est évident).
479
Chapitre 12. Fonctions convexes
S’entraîner et approfondir 12.1 Montrer que si f est convexe sur [a, b] et si f (a) = f (b) alors : →469
∀x ∈ [a, b]
f (x) f (a).
12.2 Soit f une fonction de I dans J et g une fonction de J dans IR . On suppose f et g →470 convexes. 1. Montrer que la composée g ◦ f n’est pas toujours une fonction convexe. 2. Montrer que si g est croissante alors g ◦ f est convexe. 12.3 Montrer que si f vérifie ∀(x, y, z) ∈ I 3
x < y < z =⇒
→471
est convexe sur I .
f (z) − f (x) f (y) − f (x) , alors f y−x z−x
12.4 Soit f une fonction convexe sur I admettant un minimum en a ∈ I . Déterminer les varia→471 tions de f . 12.5 Montrer qu’une fonction f est à la fois convexe et concave si, et seulement si, f est affine. →472
12.6 Lien entre la moyenne géométrique et la moyenne arithmétique →473 Soit n ∈ IN∗ et x1 , . . . , xn des réels positifs. 1. Soit λ1 , . . . , λn des réels positifs tels que
n
λk = 1 . Montrer l’inégalité :
k=1
n
xλi i
i=1
n
λi x i .
i=1
2. Prouver et interpréter l’inégalité arithmético-géométrique :
n n 1 n xk xk . k=1
n
k=1
12.7 Soit f une fonction deux fois dérivable sur un intervalle [a, b] vérifiant f (a) = f (b) = 0 et →473 dont la dérivée seconde est bornée par M sur [a, b] . (x − a) (b − x) , montrer que : 2 f (x) M (x − a) (b − x). 2
En utilisant les fonctions x �→ f (x) ± M ∀x ∈ [a, b]
12.8 Montrer que si f et g sont deux fonctions convexes sur le même intervalle I , alors la fonction h = x �→ max f (x), g(x) aussi. 12.9 Soit f et g deux fonctions convexes, positives et de même monotonie sur I . 1. On suppose f et g deux fois dérivables. Montrer que f g est convexe. 2. Montrer que le résultat est conservé dans le cas général.
480
Exercices 12.10 Soit f une fonction convexe sur un intervalle borné I , montrer que f est minorée. 12.11 Une fonction f de I dans IR∗+ est dite logarithmiquement convexe si ln f est convexe. 1. Montrer que si f est logarithmiquement convexe alors f est convexe. La réciproque est-elle vraie ? 2. Soit f une fonction de I dans IR∗+ . Montrer que f est logarithmiquement convexe si, et seulement si, pour tout α ∈ IR∗+ , la fonction fα : x �→ f (x)αx est convexe. 12.12 Soit f une fonction convexe strictement monotone d’un intervalle I sur un intervalle J . Que peut-on dire sur f −1 ? 12.13 Soit f une fonction convexe définie sur [A, +∞[ croissante mais non constante. Montrer que : lim f (x) = +∞. x→+∞
12.14 Soit f une fonction convexe sur IR+ . 1. On suppose que lim f = 0 , montrer que f est positive. x→+∞
2. On suppose que la courbe représentative C de f admet une asymptote D . Quelles sont les positions relatives de C et de D ? 12.15 1. Soit f une fonction convexe majorée sur IR . Montrer que f est constante. Le résultat est-il conservé si f est convexe et majorée sur [A, +∞[ ? 2. En déduire que si f est une fonction deux fois dérivable sur IR bornée et non constante, alors il existe t1 et t2 tels que f ′′ (t1 )f ′′ (t2 ) < 0. 12.16 Soit f une fonction convexe de classe C 1 sur [a, b] . Montrer que : (b − a)f
a+b 2
b
a
f (t) dt (b − a)
f (a) + f (b) · 2
12.17 Soit x1 et x2 deux nombres réels tels que x1 > 1 et x2 > 1 . Montrer que : √ x1 + x2 ln x1 ln x2 . ln 2
1 1 + = 1 ainsi que a1 , . . . , an p q
12.18 Soit p et q deux nombres réels strictement positifs tels que et b1 , . . . , bn des nombres réels positifs. 1. Montrer l’inégalité de Hölder : n
a i bi
i=1
2. En déduire l’inégalité de Minkowski :
n i=1
(ai + bi )
p
1/p
n
api
i=1
p1
n i=1
api
n
bqi
i=1
p1
+
q1
.
n i=1
bpi
p1
.
481
Chapitre 12. Fonctions convexes ⋆ 12.19 Soit f une fonction continue de IR dans IR vérifiant : ∀(x, y) ∈ IR2 Montrer que f est convexe.
f
x + y 2
f (x) + f (y) · 2
⋆ 12.20 Cas de convergence dans la méthode de Newton Soit f une fonction dérivable dont la dérivée est strictement négative sur un intervalle I . On suppose que f est convexe sur I et qu’il existe un point a ∈ I tel que f (a) = 0 . f (un ) · Soit u0 ∈ I tel que u0 a . On considère la suite définie par un+1 = un − ′ f (un ) Montrer que cette suite est bien définie et qu’elle converge vers a .
482
Solutions des exercices
Solutions des exercices 12.1 Soit x ∈ [a, b] . Il existe λ ∈ [0, 1] tel que x = (1 − λ)a + λb . Comme f est convexe, on en déduit que : f (x) (1 − λ)f (a) + λf (b) = f (a).
Graphiquement, cette inégalité découle simplement du fait que la corde reliant les points de coordonnées (a, f (a)) et (b, f (b)) a pour équation y = f (a) .
12.2 1. Les fonctions g : x �→ −x et f : x �→ x2 sont convexes sur IR mais leur composée g ◦ f : x �→ −x2 ne l’est pas. 2. Soit (x, y) ∈ I 2 et λ ∈ [0, 1] . On a :
f (1 − λ) x + λ y (1 − λ) f (x) + λ f (y) donc la croissance de g implique que :
(g ◦ f ) (1 − λ) x + λ y g (1 − λ) f (x) + λ f (y) . Comme g est convexe, on a :
g (1 − λ) f (x) + λ f (y) (1 − λ) (g ◦ f )(x) + λ (g ◦ f )(y) donc :
(g ◦ f ) (1 − λ) x + λ y (1 − λ) (g ◦ f )(x) + λ (g ◦ f )(y),
ce qui prouve g ◦ f est convexe sur I .
12.3 Soit (x, y) ∈ I 2 tel que x < y et λ ∈ ]0, 1[ . Si l’on pose t = (1 − λ) x + λ y alors x < t < y donc : f (x)(t − y) + f (t)(y − x) + f (y)(x − t) 0. Comme t − y = (1 − λ) (x − y) , x − t = λ (x − y) et y − x > 0 , on obtient : f (t) (1 − λ) f (x) + λ f (y),
ce qui prouve la convexité de f , grâce à la remarque de la page 468. 12.4 Montrons que f est décroissante sur I ∩ ]−∞, a] et croissante sur I ∩ [a, +∞[ . • Soit (x, y) ∈ I 2 tel que x < y a . On a
f (y) − f (x) f (a) − f (x) · y−x a−x
On a f (a) − f (x) 0 car f est minimale en a donc, comme a − x > 0 , puis
f (a) − f (x) 0 a−x
f (y) − f (x) 0 ; cela prouve la décroissance de f sur I ∩ ]−∞, a] . y−x
• Soit (x, y) ∈ I 2 tel que a x < y . On a
f (y) − f (x) f (y) − f (a) · y−a y−x
On a f (y) − f (a) 0 car f est minimale en a donc, comme y − a > 0 , 0 puis 0
f (y) − f (x) ; cela prouve la croissance de f sur I ∩ [a, +∞[ . y−x
f (y) − f (a) y−a
483
Chapitre 12. Fonctions convexes 12.5 Si f est une fonction affine, alors f et −f sont affines donc convexes. Réciproquement, supposons f et −f convexes. Si l’on fixe a ∈ I , alors la foncest croissante et décroissante donc constante. Il existe tion I \ {a} −→ IR f (x) − f (a) x �−→ x−a donc C ∈ IR tel que : ∀x ∈ I \ {a} f (x) = f (a) + C(x − a). L’égalité étant également vraie en a , la fonction f est affine. 12.6 1. Si l’un des xi est nul, l’inégalité est évidente. Supposons donc les xi strictement positifs. La concavité de la fonction ln permet alors d’écrire : ln
n
λi x i
i=1
n
λi ln xi = ln
i=1
n
xλi i
i=1
ce qui, puisque la fonction exponentielle est croissante, implique : n
xλi i
i=1
n
λi x i .
i=1
2. En particulier, pour λ1 = λ2 = · · · = λn =
n n1 xi
i=1
1 , on obtient : n
n 1 xi , n i=1
ce que l’on peut exprimer en disant que la moyenne géométrique est inférieure à la moyenne arithmétique. (x − a) (b − x) a pour dérivée seconde g ′′ = f ′′ + M qui est 2 positive sur [a, b] . La fonction g est donc convexe et, comme elle est nulle en a et b , elle est négative sur [a, b] .
12.7 La fonction g : x �→ f (x) − M
On prouve de même que la fonction h : x �→ f (x) + M sur [a, b] . Finalement, on a prouvé : ∀x ∈ [a, b] 12.8 Soit (x, y) ∈ I 2 et λ ∈ [0, 1] . On a :
(x−a) (b−x) 2
f (x) M (x − a) (b − x) · 2
f λ x + (1 − λ) y λ f (x) + (1 − λ) f (y).
Or f (x) h(x) et λ 0 donc λ f (x) λ max (f (x), g(x)). De même (1 − λ) f (y) (1 − λ)h(y) donc :
f λ x + (1 − λ) y λ h(x) + (1 − λ) h(y)
et, par symétrie, on a aussi : donc :
g λ x + (1 − λ) y λ h(x) + (1 − λ) h(y)
h λ x + (1 − λ) y λ h(x) + (1 − λ) h(y),
ce qui prouve que h est convexe.
484
est concave puis positive
Solutions des exercices 12.9 1. La fonction f g est deux fois dérivable et (f g)′′ = f ′′ g + 2f ′ g ′ + g ′′ f . L’hypothèse de convexité implique f ′′ 0 et g ′′ 0 et celle de monotonie conduit à f ′ g ′ 0 . La caractérisation donnée par le corollaire 10 de la page 473 permet de conclure. 2. Soit (x, y) ∈ I 2 et λ ∈ [0, 1] . Comme les fonctions f et g sont positives, les inégalités de convexité conduisent à :
(f g) λ x + (1 − λ) y λ f (x) + (1 − λ) f (y) avec :
λ g(x) + (1 − λ) g(y)
= λ(f g)(x) + (1 − λ)(f g)(y) + (⋆),
(⋆) = (λ2 − λ) (f g)(x) + (f g)(y) − f (x)g(y) − f (y)g(x)
= (λ2 − λ) f (x) − f (y)
L’hypothèse de même monotonie implique alors que :
f (x) − f (y)
g(x) − g(y) 0.
Ainsi, comme λ ∈ [0, 1] , on a (⋆) 0 donc :
g(x) − g(y) .
(f g) λ x + (1 − λ) y λ (f g)(x) + (1 − λ) (f g)(y),
ce qui prouve la convexité de la fonction f g . 12.10 Soit (x0 , x1 , x2 ) ∈ I 3 , tel que x0 < x1 < x2 . On sait que : • le graphe de f|I∩]−∞,x
1]
est au-dessus de la droite reliant
les points de coordonnées (x1 , f (x1 )) et (x2 , f (x2 )) ; • le graphe de f|I∩]x ,+∞[ est au-dessus de la droite reliant 1
les points de coordonnées (x0 , f (x0 )) et (x1 , f (x1 )) . Comme toute fonction affine est minorée sur l’intervalle borné I , on en déduit que f est minorée sur I .
x0
x1
x2
12.11 1. Soit f une fonction logarithmiquement convexe. Considérons (x, y) ∈ I 2 et λ ∈ [0, 1] . On a :
ln f λ x + (1 − λ) y λ ln f (x) + (1 − λ) ln f (y)
donc la croissance de la fonction exponentielle implique que :
f λ x + (1 − λ) y exp λ ln f (x) + (1 − λ) ln f (y) .
Comme la fonction exponentielle est convexe, on a :
exp λ ln f (x) + (1 − λ) ln f (y) λ f (x) + (1 − λ) f (y)
ce qui prouve que f est convexe sur I .
La réciproque est fausse : par exemple, la fonction x �→ x2 est convexe, mais la fonction x �→ 2 ln x ne l’est pas. 2. • Soit f une fonction logarithmiquement convexe. Pour tout α ∈ IR∗+ , on a : ∀x ∈ I
ln(f (x)αx ) = ln f (x) + x ln α.
Toute fonction affine étant convexe, pour tout α ∈ IR∗+ , ln fα est convexe comme somme de deux fonctions convexes. Pour tout α ∈ IR∗+ , la fonction fα est donc logarithmiquement convexe et donc convexe.
485
Chapitre 12. Fonctions convexes • Supposons que, pour tout α ∈ IR∗+ , la fonction fα : x �→ f (x)αx soit convexe. Soit (x, y) ∈ I 2 et λ ∈ [0, 1] . On cherche à prouver que :
(ln f ) λx + (1 − λ)y λ(ln f )(x) + (1 − λ)(ln f )(y),
c’est-à-dire que : Pour tout α ∈ c’est-à-dire :
IR∗+ ,
f λx + (1 − λ)y f (x)λ f (y)1−λ .
on a par hypothèse :
(⋆)
f λx + (1 − λ)y αλx+(1−λ)y λf (x)αx + (1 − λ)f (y)αy ,
f λx + (1 − λ)y λf (x)α(1−λ)(x−y) + (1 − λ)f (y)αλ(y−x) .
Pour conclure, il suffit de prouver que pour un certain α ∈ IR∗+ , on a : α(1−λ)(x−y) = f (y)1−λ f (x)λ−1
ce qui permettra d’obtenir :
et
αλ(y−x) = f (y)−λ f (x)λ ,
f λx + (1 − λ)y λf (x)λ f (y)1−λ + (1 − λ)f (x)λ f (y)1−λ ,
et donc (⋆) . Si x = y , tout réel strictement positif α convient. Si x �= y , alors on prend α =
f (y) f (x)
1 x−y
.
12.12 Soit (x, y) ∈ J 2 et λ ∈ [0, 1] . En appliquant l’inégalité de convexité à f −1 (x) et f −1 (y) qui appartiennent à I , on a :
f λf −1 (x) + (1 − λ)f −1 (y) λx + (1 − λ)y. Ainsi, si f est croissante, alors en composant par f −1 qui est également croissante, on en déduit que f −1 est concave ; et si f est décroissante, alors, de même, f −1 est convexe. 12.13 Comme f n’est pas constante, il existe x1 et x2 deux éléments de [A, +∞[ tels que x1 < x2 et f (x1 ) < f (x2 ) . Si l’on note A1 et A2 les deux points du graphe de f d’abscisses x1 et x2 , alors le graphe de f|]x ,+∞[ est situé au dessus de la droite (A1 A2 ) qui est de pente 2 strictement positive, ce qui prouve que : lim f (x) = +∞.
x→+∞
12.14 1. Soit a ∈ IR+ . Considérons la fonction :
f (x) − f (a) · x−a La fonction τa est croissante sur l’intervalle ]a, +∞[ et τa : x �→
lim τa (x) = 0 puisque f est
x→+∞
bornée au voisinage de +∞ . Par conséquent, elle est négative sur ]a, +∞[ , d’où : ∀x ∈ ]a, +∞[
f (x) f (a).
La fonction f est donc décroissante et tend vers 0 en +∞ , ce qui prouve sa positivité. 2. Soit y = ax + b une équation de l’asymptote D . On a alors : lim
x→+∞
f (x) − ax − b = 0.
Ainsi, la fonction x �→ f (x) − ax − b est convexe et tend vers 0 donc, d’après ce qui précède, elle est positive. Par conséquent, le graphe de la fonction se situe au-dessus de l’asymptote.
486
Solutions des exercices 12.15 1. Soit x et y deux réels tels que x < y et M un majorant de f sur IR . • Pour tout z > y , on a :
f (y) − f (x) f (z) − f (x) M − f (x) , y−x z−x z−x
donc, en faisant tendre z vers +∞ , on obtient • Pour tout z < x . On a :
f (y) − f (x) 0. y−x
f (x) − f (z) f (x) − M f (y) − f (x) , y−x x−z x−z
f (y) − f (x) 0. y−x Finalement f (x) = f (y) , ce qui montre que f est constante. donc, en faisant tendre z vers −∞ , on obtient
Le résultat n’est pas nécessairement conservé si l’on suppose simplement f convexe et majorée sur [A, +∞[ ; il suffit de considérer la fonction x �→ e−x .
2. Supposons que :
∀(t1 , t2 ) ∈ IR2
f ′′ (t1 )f ′′ (t2 ) 0.
Alors, f ′′ garde un signe constant sur IR . Quitte à changer f en −f on peut supposer que f ′′ est positive et donc que f est convexe majorée, ce qui prouve qu’elle est constante d’après la première question.
12.16
(b) Si l’on interprète le réel (b − a) f (a)+f comme 2 l’aire d’un trapèze, la représentation graphique ci-dessous permet de comprendre que l’inégalité :
a
b
f (t) dt (b − a)
f (a) + f (b) 2
découle de la position du graphe de f par rapport à la corde reliant les points d’abscisses a et b . Plus précisément, considérons la fonction affine ϕ telle que ϕ(a) = f (a) et ϕ(b) = f (b) . La fonction f étant convexe, on a : |
|
a
b
∀x ∈ [a, b]
f (x) ϕ(x).
En intégrant entre a et b , on obtient l’inégalité :
a
b
f (t) dt (b − a)
f (a) + f (b) · 2
487
Chapitre 12. Fonctions convexes
Pour la seconde inégalité, le réel (b − a)f a+b peut 2 être vu comme l’aire d’un trapèze car, pour toute fonction affine ψ , on a :
b
a
ψ(t) dt = (b − a)ψ
a+b · 2
Pour montrer la deuxième inégalité, il suffit donc d’écrire que le graphe de la fonction f est au dessus a+b de sa tangente en · 2 Ainsi, si l’on considère la fonction affine :
a + b
a + b
|
|
a a+b a+b 2 ψ : x �→ f +f × x− , 2 2 2 alors ∀x ∈ [a, b] ψ(x) f (x). En intégrant entre a et b , on obtient l’inégalité : ′
(b − a)f
a+b 2
|
b
b
f (t) dt.
a
Remarque le résultat est vrai même si f n’est pas supposée de classe C 1 . Il suffit pour l’inégalité de gauche d’écrire que pour tout x ∈ [a, b] , on a :
1 a+b 1 f (x) + f (a + b − x) 2 2 2 et d’intégrer cette inégalité entre a et b . f
12.17 La fonction x �→ ln(ln x) est définie sur ]1, +∞[ . 1 Elle y est dérivable et sa dérivée x �→ est décroissante. On a donc : x ln x x1 + x2 1 1 ln ln ln(ln x1 ) + ln(ln x2 ). 2 2 2 En utilisant la croissance de la fonction exponentielle, on trouve le résultat demandé. 12.18 1. La fonction x �→ xp est convexe sur IR+ puisque p > 1 . Si l’on considère x1 , . . . , xn dans IR∗+ et λ1 , . . . , λn dans IR+ de somme égale à 1 , on a :
n
λi x i
i=1
p
n
λi xpi
n
soit
i=1
λi x i
i=1
n i=1
λi xpi
p1
.
On aimerait avoir pour tout i ∈ [[1, n]] , les égalités : λi xi = ai bi et λi xpi = api , ce qui q
−p
conduirait à prendre λi = bqi et xi = ai bi
strictement positifs et que
n
mais il faudrait que tous les termes soient
λi = 1 .
i=1
Notons S =
n
bqi . Cette somme n’est pas forcément égale à 1 mais on va s’adapter.
i=1
On a alors
n
i=1
λi =
S S
= 1 , λi xi = ai bi /S et λi xpi = api /S donc : n i=1
488
q
−p
• Si les ai et bi sont tous strictement positifs, alors on prend λi = bqi /S et xi = ai bi
ai bi /S
n i=1
api /S
p1
,
.
Solutions des exercices puis, comme S est strictement positive, on a : n �
a i bi
i=1
�
n �
api
i=1
� p1
S 1−1/p ,
ce qui donne l’inégalité cherchée. • Sinon, on pose I = {i ∈ [[1, n]] : ai bi > 0} , et le cas précédent donne : n �
a i bi =
i=1
�
a i bi
i∈I
�
car les api et bqi sont positifs. 2. Comme q =
p p−1
�
api
i∈I
� p1 � �1 � q q bi
�
i∈I
n �
api
i=1
� p1 �
n � i=1
bqi
� 1q
,
, on va utiliser la question précédente en écrivant que, pour
tout i ∈ [[1, n]] , on a :
(ai + bi )p = ai (ai + bi )p−1 + bi (ai + bi )p−1 . L’inégalité de Hölder donne alors : n �
ai (ai + bi )
p−1
i=1
n �
bi (ai + bi )
p−1
i=1
On en déduit que : n � i=1
Si
n �
�
(ai + bi )p
n �
api
i=1
� �
n �
api
i=1
n �
bpi
i=1
� p1
+
�
� p1 �
� p1 �
n �
bpi
i=1
n �
(ai + bi )
p
i=1
n �
(ai + bi )
p
i=1
� p1 �
(ai + bi )p > 0 , alors on obtient l’inégalité :
n �
� p−1 p
� p−1 p
.
(ai + bi )p
i=1
� p−1 p
.
i=1
� n �
(ai + bi )p
i=1
�1/p
�
n �
api
i=1
� p1
+
�
n �
bpi
i=1
� p1
.
Sinon, l’inégalité est évidente car les réels considérés sont positifs. 12.19 Soit (x, y) ∈ IR2 . Montrons par récurrence la propriété suivante : Hn : ∀p ∈ [[0, 2n ]]
f
�
�
p p x+ 1− n 2n 2
L’assertion H0 est clairement vraie.
� �
y
�
p p f (x) + 1 − n 2n 2
�
f (y).
Supposons Hn vraie pour un certain entier n et considérons p ∈ [[0, 2n+1 ]] .
• Si p est pair, alors il existe k ∈ [[0, 2n ]] tel que p = 2k donc, d’après Hn , on a : f
�
p
�
p x + 1 − n+1 2n+1 2
� �
�
�
� �
k k x+ 1− n y 2n 2 � � k k n f (x) + 1 − n f (y) 2 2 � � p p = n+1 f (x) + 1 − n+1 f (y). 2 2
y =f
489
Chapitre 12. Fonctions convexes p x 2n+1
• Si p est impair, alors X=
+ 1−
p 2n+1
p−1 p−1 x + 1 − n+1 y 2n+1 2
On a donc :
y=
et
X+Y 2
avec :
Y =
p+1 p+1 x + 1 − n+1 y. 2n+1 2
f (X) + f (Y ) p · x + 1 − n+1 y 2n+1 2 2 Comme p − 1 et p + 1 sont deux entiers pairs appartenant à [[0, 2n+1 ]] , le cas précédent donne l’inégalité : f
f
p 2n+1
et montre Hn+1 .
on a |λ − λn | 2
p
x+ 1−
2n+1
λn =
Soit λ ∈ [0, 1] . La suite −n
p
1 2
p−1 p−1 f (x) + 1 − n+1 f (y) 2n+1 2 p+1 1 p+1 f (x) + 1 − n+1 f (y) + n+1 2 2 2 p p = n+1 f (x) + 1 − n+1 f (y), 2 2
y
⌊2n λ⌋ 2n
converge vers λ car, pour tout entier n ,
n∈IN
. De plus, pour tout entier n , on a ⌊2n λ⌋ ∈ [[0, 2n ]] donc : f (λn x + (1 − λn )y) λn f (x) + (1 − λn )f (y).
En utilisant la continuité de f , on en déduit, en faisant tendre n vers +∞ , que : f (λx + (1 − λ)y) λf (x) + (1 − λ)f (y). f (v) a , ce qui prouvera f ′ (v) que la suite u est bien définie, à valeurs dans [u0 , a] et croissante.
12.20 • Montrons que pour tout réel v ∈ I , on a v a =⇒ v v −
Soit v ∈ I tel que v a . La décroissance de f implique alors f (v) f (a) = 0 . On a f (v) donc v v − ′ car f ′ est négative. f (v) Comme f est convexe, la courbe représentative de f est au-dessus de sa tangente en v qui a pour équation y = f (v) + f ′ (v)(x − v) . Par suite : f (v) + f ′ (v)(a − v) f (a) = 0.
f (v) a. f ′ (v) • Ainsi la suite u est croissante et majorée par a . Elle converge donc vers une limite ℓ . La négativité de f ′ conduit alors à v −
Comme f est convexe, la fonction f ′ est croissante, ainsi : ∀n ∈ IN
f ′ (u0 ) f ′ (un ) 0
puis, comme comme f (un ) > 0 , on a : ∀n ∈ IN
un+1 − un = −
Par encadrement, on en déduit que
f (un ) f (un ) − ′ 0. f ′ (un ) f (u0 )
lim f (un ) = 0 . La continuité de f conduit alors
n→+∞
à f (ℓ) = 0 . Enfin, la stricte monotonie de f implique que ℓ = a .
490
Chapitre 13 : Intégration I
Intégrale des fonctions en escalier . . . . . . . . Fonctions en escalier . . . . . . . . . . . . . . . . Intégrale des fonctions en escalier . . . . . . . . . II Intégrale des fonctions continues par morceaux 1 Fonctions continues par morceaux . . . . . . . . 2 Théorème d’approximation . . . . . . . . . . . . 3 Intégrale des fonctions continues par morceaux . 4 Utilisation d’une symétrie ou d’une translation . 5 Sommes de Riemann . . . . . . . . . . . . . . . . III Intégration et dérivation . . . . . . . . . . . . . . 1 Existence d’une primitive . . . . . . . . . . . . . 2 Intégration par parties . . . . . . . . . . . . . . . 3 Changement de variable . . . . . . . . . . . . . . IV Formules de Taylor globales . . . . . . . . . . . . 1 Formule de Taylor avec reste intégral . . . . . . . 2 Inégalité de Taylor-Lagrange . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
492 . 492 . 494 497 . 497 . 498 . 499 . 502 . 503 504 . 504 . 505 . 505 505 . 506 . 506 507 516
Intégration
13
Dans tout le chapitre, les fonctions considérées seront définies sur un intervalle de IR, et même sur un segment dans les deux premières sections, et à valeurs dans IK , avec IK = IR ou IK = C.
I
Intégrale des fonctions en escalier
Dans cette partie, on fixe (a, b) ∈ IR2 tel que a < b .
1
Fonctions en escalier
Subdivision Définition 1 • Une subdivision du segment [a, b] est une suite finie σ = (uk )k∈[[0,n]] telle que a = u0 < · · · < un = b .
• Le support de la subdivision σ , noté supp (σ) , est l’ensemble des valeurs prises par la suite, à savoir supp (σ) = uk | k ∈ [[0, n]] . • On appelle pas de la subdivision σ , noté δ (σ) , l’écart maximal entre deux points consécutifs de la subdivision : δ (σ) = max (uk+1 − uk ) . 0k 0. Par contraposition, si f est non nulle, alors [a,b]
Remarque Il est important de retenir que ces deux derniers résultats ne s’appliquent qu’aux fonctions continues. Par exemple la fonction indicatrice de {0} sur [−1, 1] est une fonction positive et d’intégrale nulle alors qu’elle n’est pas la fonction nulle. Théorème 21 (Inégalité de Cauchy-Schwarz) 2 Soit (f, g) ∈ C [a, b], IR . Alors : 2 fg
Exo 13.3
f2
[a,b]
[a,b]
Il y a égalité si, et seulement si : ∃λ ∈ IR f = λg
g2
[a,b]
.
ou g = λf .
Démonstration. Ce résultat est un cas particulier de la proposition 2 de la page 1027 qui sera démontrée dans le chapitre 27 sur les espaces préhilbertiens réels. Remarque On écrit également l’inégalité de Cauchy-Schwarz sous la forme : 1/2 1/2 2 2 fg . f g [a,b] [a,b] [a,b]
4
Utilisation d’une symétrie ou d’une translation
Proposition 22 (Parité, imparité)
Soit a un réel strictement positif et f ∈ CM [−a, a], IK . 1. Si la fonction f est paire, alors : a f (x) dx = 2 −a
a
f (x) dx = 2
0
2. Si la fonction f est impaire, alors : a
0
f (x) dx.
−a
f (x) dx = 0.
−a
Démonstration page 512
Lemme 23 (Invariance par translation) Soit T ∈ IR et f ∈ F(IR, IK) une fonction continue par morceaux sur tout segment de IR. Pour tout (a, b) ∈ IR2 tel que a < b , on a : b+T b f (x) dx = f (x + T ) dx a+T
a
Démonstration page 512
502
II Intégrale des fonctions continues par morceaux Proposition 24 (Périodicité) Soit un réel T > 0 et f ∈ F(IR, IK) une fonction continue par morceaux sur tout segment de IR et T -périodique. Pour tout a ∈ IR, on a : T a+T f (x) dx = f (x) dx. a
5
0
Démonstration page 512
Sommes de Riemann
Définition 7
Soit f ∈ CM [a, b], IK . Pour tout entier n ∈ IN∗ , on appelle somme de Riemann d’ordre n associée à f la somme : n−1 b−a b−a . f a+k n n k=0
Remarque Avec les notations ci-dessus,
b−a n
n−1 k=0
f a+k
b−a n
fonction en escalier g définie sur [a, b] vérifiant : ∀k ∈ [[0, n − 1]] g|]uk ,uk+1 [ = f (uk ) ,
où l’on a posé uk = a + k pas
Exo 13.4
b−a n
b−a n
est l’intégrale d’une
, de sorte que (uk )0kn est la subdivision régulière de
du segment [a, b].
Théorème 25 (Convergence des sommes de Riemann) Soit f ∈ CM [a, b], IK . Alors : n−1 b−a b−a −→ f. f a+k n→+∞ [a,b] n n k=0
Ex. 13. Puisque la fonction x �→ n−1 k=0
1 1+x
Démonstration page 513
est continue sur [0, 1] , on a :
n−1 1 1 1 = n+k n 1+ k=0
−→
k n→+∞ n
0
1
dx = ln 2. 1+x
Remarque Soit f ∈ CM [a, b], IK . Alors : n b−a b−a −→ f. f a+k Sn′ = n→+∞ [a,b] n n k=1
En effet, en posant Sn = Sn −Sn′
b−a = n
b−a n
n−1 k=0
f a+k
b−a n
, on a :
n−1 n b−a b−a b−a − = f (a)−f (b) . f a+k f a+k n n n k=0
k=1
503
Chapitre 13. Intégration y
La méthode des rectangles à gauche (respectivement à droite) consiste à approcher l’intégrale par la somme de Riemann Sn (respectivement Sn′ ) pour un certain n. L’erreur de la méthode des rectangles est la valeur absolue de la différence entre l’intégrale et l’approximation. Elle est de l’ordre de 1/n dans le cas où la fonction est lipschitzienne (voir la démonstration du théorème 25).
III
Intégration et dérivation
O
x
Dans cette partie, I désigne un intervalle non trivial.
1
Existence d’une primitive
Théorème 26 Soit a ∈ I et f une fonction continue sur I , à valeurs dans IK . Alors l’applica x tion x �→ f (t) dt est une primitive de f . a
C’est l’unique primitive de f s’annulant en a.
Démonstration page 513
Remarque Le théorème 4 de la page 257 (dit « théorème fondamental de l’analyse ») est donc démontré.
Exo 13.5
Corollaire 27 Soit f une fonction continue définie sur I , à valeurs dans IK , et F une primitive de f . Alors pour tout (a, b) ∈ I 2 : b f (t) dt = F (b) − F (a). a
Démonstration. La fonction x �→
a
x
f (t) dt − F (x) + F (a) est dérivable, de dérivée nulle et nulle en a .
Donc c’est la fonction identiquement nulle et en particulier,
b
a
f (t) dt = F (b) − F (a) .
Corollaire 28 Soit f ∈ C 1 (I, IK). Alors pour tout (a, b) ∈ I 2 : b f ′ (t) dt. f (b) − f (a) = a
Corollaire 29 (Inégalité des accroissements finis) Soit f ∈ C 1 (I, IK). On suppose qu’il existe un réel M tel que |f ′ | M . Alors : ∀(x, y) ∈ I 2 f (x) − f (y) M |x − y| . 504
IV Formules de Taylor globales Démonstration. On a alors :
Soit (x, y) ∈ I 2 . Quitte à échanger x et y , on peut supposer x y .
f (y) − f (x) =
y x
f ′ (t) dt
y
x
′ f (t) dt
x
y
M dt = M |y − x|.
Remarque Dans le cas des fonctions réelles, cette inégalité a déjà été démontrée à la page 433 en utilisant l’égalité des accroissements finis et en supposant seulement f dérivable.
2
Intégration par parties
Rappelons la proposition 7 de la page 259 qui est une conséquence du corollaire 27. Proposition 30 Soit (u, v) ∈ C 1 (I, IK)2 . Alors pour tout (a, b) ∈ I 2 : b b b u(t) v ′ (t) dt = u(t) v(t) − u′ (t) v(t) dt. a
a
a
On pourra reprendre les exemples et exercices de la page 259.
3
Changement de variable
Rappelons la proposition 8 de la page 261 qui est une conséquence du corollaire 27. Théorème 31 (Formule de changement de variable) Soit I et J deux intervalles d’intérieur non vide, f : I → IK une fonction continue et u : J → I une fonction de classe C 1 . Alors pour tout (a, b) ∈ J 2 on a : u(b) b f (x) dx = f u (t) u′ (t) dt. u(a)
a
On pourra reprendre les exemples et exercices de la page 261. Remarque Dans le cas de fonctions continues, on retrouve facilement les résultats de la proposition 22 (fonctions paires et impaires) et du lemme 23 (invariance par translation) par les changements de variable x �→ −x et x �→ x + T .
IV
Formules de Taylor globales
Dans cette partie, n désigne un entier naturel, I un intervalle non trivial de IR. Définition 8 Soit a ∈ I et f ∈ C n (I, IK). La fonction polynomiale de Taylor d’ordre n en a associée à f est la fonction définie sur IR par : x �→ 740
n f (k) (a) k=0
k!
(x − a)k .
Remarque
On parle de « polynôme de Taylor d’ordre n en a » quand on considère n f (k) (a) le polynôme (X − a)k . k! k=0
505
Chapitre 13. Intégration
1
Formule de Taylor avec reste intégral
Théorème 32 (Formule de Taylor à l’ordre n avec reste intégral) Soit (a, b) ∈ I 2 et f ∈ C n+1 (I, IK). Alors : f (b) =
n f (k) (a)
k=0
Exo 13.6
où : Rn =
Exo 13.7
a
b
k!
(b − a)k + Rn
(b − t)n (n+1) f (t) dt. n! Démonstration page 514
Principe de démonstration. Par récurrence, en effectuant une intégration par parties sur le reste Rn .
Remarques • Cette formule est également connue sous le nom de formule de Taylor-Laplace. • Il est utile de se rappeler qu’à l’ordre 0 , la formule s’écrit : b f (b) = f (a) + f ′ (t) dt. a
Cela peut servir pour vérifier que l’on ne s’est pas trompé dans les indices et exposants en écrivant la formule.
2
Inégalité de Taylor-Lagrange
Théorème 33 (Inégalité de Taylor-Lagrange à l’ordre n)
Exo 13.8
Soit (a, b) ∈ I 2 et f ∈ C n+1 (I, IK). Si M est un majorant de la fonction f (n+1) sur le segment [min(a, b), max(a, b)], on a : n |b − a|n+1 f (k) (a) (b − a)k M. f (b) − k! (n + 1)! k=0
Principe de démonstration.
Démonstration page 515 Majorer le module du reste intégral de la formule de Taylor.
Remarque Dans le cas particulier où n = 0 , on retrouve l’inégalité des accroissements finis pour une fonction de classe C 1 à valeurs réelles ou complexes.
506
Démonstrations
Démonstrations Proposition 2 Soit σ = (u0 , . . . , un ) une subdivision de [a, b] adaptée à f . Considérons une subdivision σ ′ de [a, b] telle que supp (σ) contienne un point c de plus que supp (σ) . Il existe k ∈ [[0, n − 1]] tel que c ∈ ]uk , uk+1 [ et on a : σ ′ = (u0 , . . . , uk , c, uk+1 , . . . un ) = (v0 , . . . , vn+1 ) .
En distinguant selon que i ∈ [[0, k − 1]] , i = k ou k + 1 , i ∈ [[k + 2, n]] , on vérifie que la fonction f|]v ,v [ est constante et donc σ ′ est adaptée à f . i
i+1
On démontre alors le résultat par récurrence sur card supp(σ ′ ) − card supp(σ) . Proposition 4 Soit σ = (u0 , . . . , un ) une subdivision de [a, b] adaptée à f et g (il en existe au moins une d’après le corollaire 3 de la page 494). Alors, pour tout i ∈ [[0, n − 1]] , (λf + µg)|]u ,u [ est constante. Donc σ est adaptée à λf + µg . i
Lemme 5
i+1
Notons σ = (u0 , . . . , un ) , et αi la valeur prise par f sur l’intervalle ]ui , ui+1 [ .
Considérons d’abord le cas où σ ′ est obtenue, à partir de σ , par ajout d’un nouveau point c . Ainsi, σ ′ est de la forme :
•
σ ′ = (u0 , . . . , uk , c, uk+1 , . . . , un ). Par définition, on a alors : Sσ ′ (f ) =
k−1 i=0
(ui+1 − ui )αi + (c − uk )αk + (uk+1 − c)αk +
En réunissant les deux termes centraux, il vient Sσ ′ (f ) = Sσ (f ) .
n−1
(ui+1 − ui )αi .
i=k+1
•
Ensuite, lorsque σ ′ est une subdivision plus fine que σ , on démontre le résultat par récurrence sur le nombre de points du support de σ ′ qui ne sont pas dans le support de σ .
•
Enfin, en notant σ ′′ la subdivision associée à supp (σ) ∪ supp (σ ′ ) , on a, du fait que σ ′′ est plus fine que σ et σ ′ : Sσ (f ) = Sσ ′′ (f )
Sσ ′ (f ) = Sσ ′′ (f ).
et
Ainsi, Sσ (f ) = Sσ ′ (f ) . Proposition 6 La fonction |f | est en escalier et toute subdivision de [a, b] adaptée à f est adaptée à |f | . En considérant une subdivision σ = (u0 , . . . , un ) adaptée à f et, pour tout i ∈ [[0, n − 1]] , un point ξi de ]ui , ui+1 [ , l’inégalité triangulaire pour une somme donne :
n−1 n−1 f = (ui+1 − ui ) f (ξi ) (ui+1 − ui ) f (ξi ) = |f |. i=0 i=0 [a,b] [a,b]
Théorème 7 Soit σ = (u0 , . . . , un ) une subdivision de [a, b] adaptée à f et g (donc aussi à λf + µg ) et, pour tout i ∈ [[0, n − 1]] , un point ξi de ]ui , ui+1 [ . Alors :
[a,b]
(λf + µg) =
n−1 i=0
=λ
(ui+1 − ui ) λf (ξi ) + µg(ξi )
n−1 i=0
(ui+1 − ui ) f (ξi ) + µ
n−1 i=0
(ui+1 − ui ) g (ξi ) = λ
[a,b]
f +µ
g.
[a,b]
507
Chapitre 13. Intégration Proposition 8 Soit σ = (u0 , . . . , un ) une subdivision adaptée à f et, pour tout i ∈ [[0, n − 1]] , un point ξi de ]ui , ui+1 [ . Quitte à rajouter c au support de σ , on peut supposer que c fait partie de la subdivision. Posons k ∈ [[1, n − 1]] tel que c = uk . Alors (u0 , . . . , uk ) et (uk , . . . , un ) sont des subdivisions de [a, c] et [c, b] adaptées aux restrictions f|[a,c] et f|[c,b] . On a ensuite :
f=
[a,b]
n−1 i=0
=
k−1 i=0
Proposition 10
(ui+1 − ui ) f (ξi ) (ui+1 − ui ) f (ξi ) +
Soit f ∈ CM [a, b], IK
n−1 i=k
(ui+1 − ui ) f (ξi ) =
f+
[a,c]
f.
[c,b]
et (u0 , . . . , un ) une subdivision de [a, b] adaptée à f .
Pour tout i ∈ [[0, n − 1]] , la fonction fi = f|]u
i ,ui+1 [
admet un prolongement continu fi sur le
segment [ui , ui+1 ] . Ce prolongement est donc borné (théorème des bornes atteintes et son adaptation au cas des fonctions complexes) ; il existe ainsi un réel Mi tel que pour tout x ∈ ]ui , ui+1 [ on ait f (x) Mi . Par conséquent, pour tout x ∈ [a, b] on a :
f (x) max M0 , . . . , Mn−1 , f (u0 ), . . . , f (un ) .
Proposition 11 Soit σ = (u0 , . . . , un ) une subdivision adaptée à f et g . Puisque, pour tout i ∈ [[0, n − 1]] , les restrictions f|]u ,u [ et g|]u ,u [ ont des prolongements i
i+1
i
i+1
continus sur [ui , ui+1 ] , il en est de même des fonctions (λf + g)|]u
i ,ui+1 [
et (f g)|]u
i ,ui+1 [
.
Proposition 12 Cas des fonctions continues. Soit ε un réel strictement positif. D’après le théorème de Heine, f est uniformément continue et donc il existe η > 0 tel que, pour tout (x, y) ∈ [a, b]2 , on ait f (x) − f (y) ε dès que |x − y| η . Fixons un tel η ainsi qu’un entier naturel non nul n tel que 0 < b−a η . Notons ak = a + k n escalier sur [a, b] définie par : ϕ(x) =
f (ak ) f (b)
b−a n
pour k ∈ [[0, n]] et ϕ la fonction en
si x ∈ [ak , ak+1 [ où k ∈ [[0, n − 1]] ; si x = b.
Il est clair que f (b) − ϕ(b) = 0 .
Pour tout x ∈ [a, b[ , il existe k tel que x ∈ [ak , ak+1 [ , et puisque |x − ak |
f (x) − ϕ(x) = f (x) − f (ak ) ε.
b−a n
η :
La fonction ϕ répond donc au problème. Cas des fonctions continues par morceaux Considérons σ = (u0 , . . . , un ) une subdivision de [a, b] adaptée à f et, pour tout i ∈ [[0, n − 1]] , notons fi la restriction de
la fonction f à ]ui , ui+1 [ et fi le prolongement par continuité sur [ui , ui+1 ] de fi . Soit ε > 0 . D’après la première partie de l’étude, il existe, pour tout i ∈ [[0, n − 1]] , une
fonction ϕi ∈ E ([ui , ui+1 ], IK) telle que |fi − ϕi | ε . Considérons la fonction ϕ définie sur [a, b] par : ϕ(x) =
ϕk (x) f (uk )
La fonction ϕ répond au problème.
508
si x ∈ ]uk , uk+1 [ où k ∈ [[0, n − 1]] ; si x = uk où k ∈ [[0, n]].
Démonstrations Théorème 13 • Pour n ∈ IN , en prenant ε =
1 n+1
, il existe d’après la proposition 12 de la page 498 une
•
. La suite (ϕn )n∈IN convient.
1 n+1
fonction en escalier ϕn telle que |f − ϕn |
telle que : sup f (x) − ϕn (x) −→ 0. Soit (ϕn )n∈IN ∈ E [a, b], IK n→+∞ x∈[a,b] Notons αn = sup f (x) − ϕn (x) pour tout n ∈ IN .
IN
x∈[a,b]
∗
Montrons que la suite
ϕn
[a,b]
n∈IN
est bornée. Tout d’abord, |f | est bornée par une
constante M (cf.proposition 10 de la page 498). Ainsi, pour tout x ∈ [a, b] et n ∈ IN , on a :
|ϕn (x)| = f (x) + ϕn (x) − f (x) f (x) + ϕn (x) − f (x) M + αn ,
et donc, d’après les propriétés de l’intégrale des fonctions en escalier :
[a,b]
∗
ϕn
[a,b]
|ϕn | (b − a) M + αn .
On conclut en remarquant que la suite (αn )n∈IN , étant convergente, est bornée. D’après le théorème de Bolzano-Weierstraß, il existe une application γ strictement crois-
sante de IN dans IN telle que la suite
ϕγ(n)
[a,b]
soit convergente. Notons L sa
n∈IN
limite. Par ailleurs, pour tout x ∈ [a, b] et n ∈ IN :
ϕn (x) − ϕγ(n) (x) ϕn (x) − f (x) + f (x) − ϕγ(n) (x) αn + αγ(n) ,
et par conséquent :
ϕn − ϕγ(n) = ϕn − ϕγ(n) [a,b] [a,b] [a,b]
[a,b]
Puisque αn −→ 0 et, par extraction, αγ(n) −→ 0 , on a n→∞
•
|ϕn − ϕγ(n) | (b − a) αn + αγ(n) .
n→∞
lim
n→+∞
Soit (ψn )n∈IN une autre suite de fonctions en escalier telle que :
ϕn = L .
[a,b]
sup f (x) − ψn (x) −→ 0
x∈[a,b]
Notons βn = sup f (x) − ψn (x) , pour n ∈ IN .
n→+∞
x∈[a,b]
En remarquant que, pour tout x ∈ [a, b] , on a pour tout entier n : on obtient :
et donc
[a,b]
ϕn (x) − ψn (x) ϕn (x) − f (x) + f (x) − ψn (x) αn + βn ,
[a,b]
ϕn −
ϕn −
[a,b]
[a,b]
ψn
[a,b]
ψn −→ 0. Ainsi n→+∞
|ϕn − ψn | (b − a) (αn + βn ) ,
[a,b]
ϕn
n∈IN
et
[a,b]
ψn
ont même limite.
n∈IN
509
Chapitre 13. Intégration Théorème 14
1 n+1
En prenant ε =
, on introduit deux suites de fonctions en escalier (ϕn )n∈IN
1 1 et (ψn )n∈IN telles que |f − ϕn | n+1 et |g − ψn | n+1 (cf. proposition 12 de la page 498). Toutes les fonctions λϕn + µψn sont en escalier (cf.proposition 4 de la page 494). De plus, pour tout x ∈ [a, b] et n ∈ IN :
(λϕn + µψn )(x) − (λf + µg)(x) |λ| ϕn (x) − f (x) + |µ|ψn (x) − g(x) |λ| + |µ| , n+1
et par conséquent :
|λ| + |µ| −→ 0. 0 sup (λf + µg − λϕn − µψn )(x) n + 1 x→+∞ x∈[a,b]
La suite de fonctions en escalier (λϕn + µψn )n∈IN vérifie les hypothèses du théorème 13 de la page 499 pour λf + µg donc :
(λf + µg) = lim
n→+∞
[a,b]
= lim
n→+∞
[a,b]
n→+∞
ϕn + µ
λ
= λ lim =λ
(λϕn + µψn )
[a,b]
f +µ
Notons A =
ψn [a,b]
ϕn + µ lim
n→+∞
[a,b]
[a,b]
Corollaire 16
•
par linéarité de l’intégrale sur E [a, b], IK ψn
par linéarité de la limite
[a,b]
g.
[a,b]
Re f et B =
[a,b]
•
Im f .
[a,b]
La première formule s’obtient en utilisant la relation f = Re f + i Im f et la linéarité de l’intégrale. La seconde formule s’obtient ainsi :
[a,b]
Proposition 17
f = A + iB = A − iB = 1 n+1
En prenant ε =
telle que ϕn − f
[a,b]
(Re f − i Im f ) =
f. [a,b]
, on considère (ϕn )n∈IN une suite de fonctions en escalier
(cf.proposition 12 de la page 498). Pour tout x ∈ [a, b] et n ∈ IN , l’inégalité triangulaire donne : 1 n+1
ϕn (x) − f (x) ϕn (x) − f (x)
lim
Par conséquent |ϕn |
n∈IN
est une suite de fonctions en escalier telle que :
n→+∞
[a,b]
mite dans l’inégalité
[a,b]
|ϕn | =
ϕn
(cf.proposition 6 de la page 495).
510
sup ϕn (x) − f (x) = 0.
lim
n→+∞ x∈[a,b]
En particulier
1 · n+1
[a,b]
[a,b]
|f | . Le résultat s’obtient alors en passant à la li-
|ϕn | , inégalité valable pour toute fonction en escalier.
Démonstrations Proposition 18 • Soit (ϕn )n∈IN une suite de fonctions en escalier telle que |f − ϕn | On a évidemment, pour tout entier naturel n : 1 et f|[a,c] − ϕn |[a,c] n+1 donc
et
[a,c]
[a,b]
ϕn |[a,c] −→
n→+∞
ϕn −→
n→+∞
[a,c]
f|[a,c] ,
[c,b]
1 · n+1
1 , f|[c,b] − ϕn |[c,b] n+1
ϕn |[c,b] −→
n→+∞
[c,b]
f|[c,b]
f.
[a,b]
Par conséquent, la relation de Chasles pour les intégrales des fonctions en escalier permet d’établir :
ϕn =
[a,b]
et donc :
[a,c]
ϕn |[a,c] +
[c,b]
f=
[a,b]
•
ϕn |[c,b] −→
n→+∞
f+
[a,c]
f+
[a,c]
f
[c,b]
f.
[c,b]
Le cas où x, y, z ne sont pas distincts est un cas évident. Supposons donc x, y, z distincts. Suivant la façon dont ils sont ordonnés, il y a six cas à traiter. Le cas où x < y < z est conséquence du point précédent en considérant f|[x,z] . Traitons en détail le cas y < z < x (les autres cas se traitent de façon similaire). Puisque z ∈ ]y, x[ , on peut écrire d’après le point précédent que :
Par définition, on obtient −
f=
[y,x]
y
f= x
f+
[y,z]
z
y
f−
f.
[z,x]
z
f puis x
z
f=
x
y
x
f+
z
f.
y
Proposition 19 • Soit f ∈ CM [a, b], IR , à valeurs positives. On a f = |f | . Par ailleurs, d’après la proposition
précédente, 0
f |f | , et par conséquent : [a,b] [a,b] f= |f | f 0. [a,b]
[a,b]
[a,b]
Comme cela a déjà été fait pour les fonctions en escalier, le second point est une conséquence de la positivité et de la linéarité. Théorème 20 Si f est non nulle, il existe x ∈ [a, b] tel que f (x) > 0 ( f est à valeurs positives). •
Par continuité de f en x , il existe η > 0 tel que f (t) La fonction g définie sur [a, b] par : g(t) =
f (x)/2 0
f (x) 2
pour tout t ∈ [a, b] ∩ [x − η, x + η] .
si t ∈ [a, b] ∩ [x − η, x + η] ; sinon,
est en escalier et vérifie f g . Par croissance de l’intégrale, on obtient :
[a,b]
f
g = λf (x)/2 > 0,
[a,b]
où λ est la longueur du segment (non trivial) [a, b] ∩ [x − η, x + η] .
511
Chapitre 13. Intégration Proposition 22
Si f est une fonction continue par morceaux sur [0, a] , notons f la fonction
définie sur [−a, 0] par : ∀x ∈ [−a, 0]
f(x) = f (−x) .
Si σ = (u0 , . . . , un ) est une subdivision adaptée à f , il est clair que la fonction f est continue = (−un , . . . , −u0 ) en est une subdivision adaptée. par morceaux sur [−a, 0] et que σ Montrons pour commencer que
f=
[0,a]
Cas d’une fonction en escalier
[−a,0]
f.
Soit ϕ une fonction en escalier sur [0, a] et σ = (u0 , . . . , un ) une subdivision adaptée à ϕ . est Soit i ∈ [[1, n]] ; notons ci la valeur de la fonction ϕ sur ]ui−1 , ui [ . Alors la fonction ϕ est en escalier sur [−a, 0] de subdivision constante égale à ci sur ]−ui , −ui−1 [ . Ainsi, ϕ σ = (−un , . . . , −u0 ) . adaptée On a alors :
ϕ=
[0,a]
n i=1
n
(ui − ui−1 ) ci =
i=1
−ui−1 − (−ui ) ci =
[−a,0]
ϕ .
Cas général Soit f continue par morceaux sur [0, a] et (ϕn ) une suite de fonctions en 1 · escalier sur [0, a] telles que ∀x ∈ [0, a] f (x) − ϕn (x) n+1 Alors ∀x ∈ [−a, 0]
f(x) − ϕn (x)
1 n+1
[0,a]
ϕn =
[0,a]
f.
f=
par passage à la limite,
et les égalités
[−a,0]
[−a,0]
ϕ n donnent,
Considérons maintenant f ∈ CM [−a, a], IK . 1.
Si f est paire, on a donc :
a
f (x) dx =
0
ce qui donne :
f (−x) dx =
−a
a
f (x) dx = 2
−a
2.
0
0
f (x) dx
−a
a
f (x) dx = 2
0
0
f (x) dx. −a
Si f est impaire, alors :
a
f (x) dx = 0
ce qui donne :
0
−a
f (−x) dx = −
0
f (x) dx
−a
a
f (x) dx = 0.
−a
Lemme 23
On adapte facilement le début de la preuve de la proposition 22 de la page 502 en
considérant, pour toute fonction f continue par morceaux sur [a + T, b + T ] , la fonction f
définie sur [a, b] par : ∀x ∈ [a, b]
512
f(x) = f (x + T ) .
Démonstrations Proposition 24
On calcule :
a+T
f (x) dx =
a
T
f (x) dx +
a
=
T
f (x) dx +
f (x) dx
(relation de Chalses)
a
f (x + T ) dx
(invariance par translation)
f (x) dx
(périodicité)
0
T
f (x) dx +
a
=
a+T
T
a
=
a
0
T
f (x) dx
(relation de Chasles).
0
Théorème 25 • La démonstration n’est exigible que dans le cas où la fonction f est lipschitzienne. Supposons donc que f soit λ -lipschitzienne pour un certain λ ∈ IR+ . Soit n ∈ IN∗ ; notons ϕn la fonction en escalier définie sur [a, b] par : ϕn (x) =
où l’on a posé uk = a + k
f (uk ) f (b)
si x ∈ [uk , uk+1 [ où k ∈ [[0, n − 1]] ; si x = b
b−a · n
Soit k ∈ [[0, n − 1]] et x ∈ [uk , uk+1 [ . Alors : |f (x) − ϕn (x)| = |f (x) − f (uk )| λ|x − uk | λ
b−a · n
Cette inégalité est aussi vérifiée lorsque x = b donc : ∀x ∈ [a, b]
|f (x) − ϕn (x)| λ
b−a · n
Par inégalité triangulaire et croissance de l’intégrale des fonctions réelles :
b b 2 f (x) − ϕn (x) dx λ (b − a) · f (x) − ϕ (x) dx n n a
a
On conclut alors en remarquant que
n−1
ϕn =
[a,b]
•
k=0
Donnons une démonstration dans le cas plus général où la fonction f est continue. Soit ε > 0 . Lors de la démonstration du théorème d’approximation (cf. proposition 12 de la page 498), nous avons vu qu’il existait un entier n0 tel que, pour n n0 , on ε . Par conséquent, pour n n0 , par inégalité triangulaire et croisait |f − ϕn | b−a sance de l’intégrale des fonctions réelles :
[a,b]
f−
[a,b]
ϕn =
[a,b]
On conclut comme précédemment.
f − ϕn
Théorème 26 •
b−a b−a f a+k · n n
Notons F l’application définie sur I par F (x) =
[a,b]
|f − ϕn |
[a,b]
ε = ε. b−a
x
f (t) dt . Montrons que F est dérivable
a
′
et que F = f .
513
Chapitre 13. Intégration F (x + h) − F (x) = f (x) . Soit ε > 0 . h Par continuité de f en x , il existe η > 0 tel que, pour tout t ∈ [x − η, x + η] ∩ I , on ait f (t) − f (x) ε . Soit donc h réel tel que 0 < |h| η et x + h ∈ I . D’après la relation de Chasles et la linéarité de l’intégrale : Soit x ∈ I . Montrons que lim
h→0
F (x + h) − F (x) − hf (x) = =
x+h
f (t) dt − hf (x)
x
x+h
f (t) dt −
x
=
x+h
x+h
f (x) dt x
f (t) − f (x) dt.
x
Si h > 0 , on a :
x+h x+h F (x + h) − F (x) − hf (x) = f (t) − f (x) dt f (t) − f (x) dt x x et comme f (t) − f (x) ε pour tout t compris entre x et x + h , on en déduit ; F (x + h) − F (x) − hf (x) ε |h|.
On obtient la même inégalité si h < 0 et ainsi :
Donc lim
h→0
•
F (x + h) − F (x) − f (x) ε. h
F (x + h) − F (x) = f (x) . h
Il est clair que la fonction x �→
x
f (t) dt s’annule en a . Par ailleurs, la différence de deux
a
primitives d’une fonction sur un intervalle est constante, ce qui permet d’obtenir l’unicité. Démontrons par récurrence la propriété Hn : « pour tout f ∈ C n+1 (I, IK) , on a :
Théorème 32
f (b) =
n f (k) (a) k=0
•
k!
k
(b − a) +
b
a
(b − t)n (n+1) f (t) dt ». n!
Pour n = 0 , il s’agit de démontrer que, pour f ∈ C 1 (I, IK) , on a : f (b) = f (a) +
b
f ′ (t) dt. a
Cette assertion n’est autre que le résultat du corollaire 28 de la page 504. •
Supposons le résultat vrai au rang n . Soit f ∈ C n+2 (I, IK) . Alors, en particulier, f est de classe C n+1 et, d’après Hn , on a : f (b) =
n f (k) (a) k=0
k!
k
(b − a) + Rn
avec
Rn =
a
b
(b − t)n (n+1) f (t) dt. n! n+1
Intégrons Rn par parties : les fonctions u : t �→ f (n+1) (t) et v : t �→ − (b−t) (n+1)! 1
′
classe C sur I , avec u (t) = f
514
(n+2)
′
(t) et v (t) =
(b−t)n · n!
(⋆) sont de
Démonstrations Par conséquent :
(b − t)n+1
Rn = −
(n + 1)!
f (n+1) (t)
b
a
n+1
−
a
b
−(b − t)n+1 (n+2) (t) dt f (n + 1)!
(b − a) f (n+1) (a) + Rn+1 . = (n + 1)! La conclusion est alors immédiate, en reportant dans (⋆) .
Théorème 33 Pour tout t ∈ [min(a, b), max(a, b)] , f (n+1) (t)(b − t)n M |b − t|n . Ainsi, lorsque b a , on a :
b b (b − t)n f (n+1) (t) dt (b − t)n f (n+1) (t) dt a a b
a
M (b − t)n dt =
(b − a)n+1 M. n+1
Il suffit d’appliquer cette inégalité au reste Rn de la formule de Taylor avec reste intégral. Le cas où b a se traite de manière similaire.
515
Chapitre 13. Intégration
S’entraîner et approfondir
13.1 Soit f ∈ CM [0, 1], IR →501
telle que f [0, 1]
⊂ [a, b] et
que (f − a)(b − f ) est une fonction positive, montrer que
13.2 Soit f ∈ C [0, 1], IR . →501
1. On suppose que
f = 0 . En remarquant
[0,1]
[0,1]
f 2 −ab .
1
f (t) dt = 0 . Démontrer que f s’annule au moins une fois.
0
2. On suppose de plus que
1
tf (t) dt = 0 . Démontrer que f s’annule au moins deux fois.
0
13.3 Soit A l’ensemble des fonctions continues sur [a, b] à valeurs réelles strictement positives. →502 On pose, pour f ∈ A : 1 · f ϕ (f ) = f [a,b] [a,b] Montrer l’existence et calculer inf ϕ (f ) . f ∈A
n−1
13.4 Déterminer un équivalent simple de
k=0
→503
sin
kπ quand n → +∞ . n
13.5 Soit f une fonction dérivable, strictement croissante, bijective de IR sur IR , telle →504 que f (0) = 0. On définit la fonction g sur IR par : ∀x ∈ IR
g(x) =
x
f (t) dt + 0
0
f (x)
f −1 (t) dt − xf (x).
0
Montrer que g est dérivable et en déduire que : ∀x ∈ IR
x
f (t) dt +
f (x)
f −1 (t) dt = xf (x).
0
Donner une interprétation géométrique du résultat. 13.6 Démontrer que pour tout x ∈ IR , cos x 1 − →506
x2 · 2
13.7 Démontrer que, pour tout réel positif x , on a ln (1 + x) x − →506
x3 x2 + · 2 3
13.8 On note f l’application définie sur ]−1, +∞[ par f (x) = ln (1 + x). →506
1. Expliciter f (n) (x) , pour tout réel x ∈ ]−1, +∞[ et pour tout entier n ∈ IN∗ .
2. Donner max f (n) (t) , pour tout entier n ∈ IN∗ . t∈[0,1]
3. Démontrer, à l’aide d’une formule de Taylor, que, pour tout x ∈ [0, 1] : ln (1 + x) = lim
n→+∞
516
n (−1)k+1 k=1
k
xk .
Exercices 13.9 Formule de la moyenne. Soit f et g deux applications réelles définies sur [a, b] , la fonction f étant continue et la fonction g étant positive et continue par morceaux. Montrer qu’il existe c dans [a, b] tel que :
f g = f (c)
[a,b]
signe fixe.
[a,b]
g.
[a,b]
⋆ 13.10 1. Soit f ∈ C [a, b], IR . Montrer que
2. Soit f ∈ C [a, b], C .
f =
[a,b]
|f | si, et seulement si, f garde un
Donner une condition nécessaire et suffisante pour que f = |f | . [a,b] [a,b] f = f . Indication. On commencera par se ramener au cas où [a,b]
2
[a,b]
⋆⋆ 13.11 Soit (a, b) ∈ IR tel que a < b et f ∈ C [a, b], IR+ . Démontrer que : lim
n→+∞
f
[a,b]
n
1/n
= sup f (x). x∈[a,b]
⋆ 13.12 Soit f une fonction continue réelle continue, définie sur [0, 1] , telle que f (1) = 0 . 1. Démontrer que, pour tout α ∈ [0, 1[ , 2. Déterminer
lim n
n→+∞
lim n
n→+∞
1
α
tn f (t) dt = 0 . 0
tn f (t) dt .
0
13.13 Trouver un équivalent simple de la suite (un ) définie par :
un = (n + 1)(n + 2) · · · (2n)
n1
.
13.14 Soit (a, b) ∈ IR2 tel que a < b . Soit f ∈ CM [a, b], C . On veut montrer que : lim
λ→+∞
b
f (t) eiλt dt = 0.
a
1. En effectuant une intégration par parties, montrer le résultat lorsque f ∈ C 1 [a, b], C .
2. Montrer le résultat lorsque f est en escalier. 3. Conclure.
⋆⋆ 13.15 Soit f une fonction positive ou nulle de classe C 2 sur IR . On suppose que f ′′ est bornée et l’on note : x∈IR
Montrer que :
M = sup f ′′ (x). ∀x ∈ IR
′ f (x) 2M f (x).
517
Chapitre 13. Intégration
Solutions des exercices 13.1 Posons g : x �→ (f (x) − a)(b − f (x)) . Avec les hypothèses de l’énoncé, g est une fonction continue par morceaux et positive. Par positivité et linéarité de l’intégrale, on obtient : 0
g= [0,1]
[0,1]
bf + af − ab − f 2 = (a + b)
Cela donne l’inégalité demandée.
[0,1]
f − ab −
[0,1]
f 2 = −ab −
f 2.
[0,1]
13.2 1. On raisonne par l’absurde. Si f ne s’annule pas, elle garde d’après le théorème des valeurs intermédiaires un signe constant strict, que l’on peut supposer positif (quitte à considérer −f ). D’après le théorème 20 de la page 501, on aurait alors
1
f > 0.
0
2. Supposons que f ne s’annule qu’une seule fois, en un point c . Les restrictions f|[0,c] et f|[c,1] ont des signes fixes. Si f était de signe constant, on aurait
ou
1
1
f > 0
0
f < 0 . Donc ces deux restrictions ne sont pas de même signe et la fonc0
tion h : t �→ (t − c)f (t) est continue, de signe constant. Par linéarité, on a :
1
h=
0
1
tf (t) dt − c
0
1
f (t) dt = 0,
0
donc h = 0 (d’après le théorème 20 de la page 501) puis f est nulle sur [0, 1] \ {c} , ce qui est contraire à l’hypothèse émise. 13.3 Pour f ∈ A , on a :
f
[a,b]
[a,b]
1 0 f
ce qui assure l’existence de la borne inférieure. D’après l’inégalité de Cauchy-Schwarz, on a :
f
[a,b]
[a,b]
1 = f
(
[a,b]
f )2
[a,b]
1 √ f
2
[a,b]
√ 2 f √ = (b − a)2 . f
Il y a égalité dans le cas où f = 1 . Ainsi, la borne inférieure est (b − a)2 . Remarque
On note qu’il y a égalité si, et seulement s’il existe λ ∈ IR tel que
c’est-à-dire si, et seulement si, f est constante.
13.4 Pour n ∈ IN∗ , on pose Sn = où f : [0, π] x vers
0
518
π
−→ �−→
π n
n−1
sin
k=0
kπ n
1 f =λ√ , f
la somme de Riemann à l’ordre n associée à f ,
IR est une fonction continue. Par conséquent, la suite (Sn ) converge sin x
f = 2 . On peut conclure :
n−1 k=0
sin
2n kπ ∼ · n π
Solutions des exercices 13.5 La fonction f est une bijection continue (car dérivable) strictement croissante sur l’intervalle IR . Ainsi f −1 est continue ; soit H la primitive sur IR de f −1 s’annulant en 0 . La x fonction g : x �→ 0 f (t) dt + H f (x) − xf (x) est donc dérivable et à l’aide des formules de dérivation, pour tout x ∈ IR :
g ′ (x) = f (x) + H ′ f (x) f ′ (x) − f (x) − xf ′ (x) = f (x) + x f ′ (x) − f (x) − xf ′ (x) = 0.
Enfin, g(0) = 0 car f (0) = 0 , donc g = 0 . Ainsi, pour tout x ∈ IR :
x
f (t) dt +
0
f (x)
f −1 (t) dt = xf (x).
0
a
Pour tout a ∈ IR , le terme 0 f (t) dt correspond à l’aire algébrique du domaine délimité par l’axe Ox , la courbe y = f (x) et la droite d’équation x = a .
y y = f −1 (x)
Le terme y = f (x)
|
|
f (a)
a
f (a) 0
f −1 (t) dt correspond à l’aire du domaine ha-
churé délimité par l’axe Ox , la courbe d’équation y = f −1 (x) et la droite d’équation x = f (a) . Par symétrie, cette aire est égale à l’aire du domaine grisé délimité par l’axe Oy , la courbe y = f (x) et la droite d’équation y = f (a) . x L’union des deux domaines est un rectangle de côtés a et f (a) . La somme de ces deux aires vaut bien a f (a) .
13.6 Par parité, il suffit d’établir cette inégalité pour tout x 0 . En appliquant la formule de Taylor avec reste intégral à l’ordre 1 à la fonction cosinus, on obtient, sachant que cos′ = − sin et cos′′ = − cos , que pour tout x 0 : 1 − cos x = Soit t ∈ [0, x] .
x
0
(x − t) cos t dt.
En multipliant l’inégalité cos(t) 1 par x − t 0 , on obtient (x − t) cos t x − t . Par croissance de l’intégrale : 1 − cos x
0
x
(x − t)2 (x − t) dt = − 2
x
=
0
x2 · 2
13.7 La fonction f : t �→ ln (t + 1) est de classe C 4 sur l’intervalle IR+ . On a pour tout t 0 : f ′ (t) =
1 1 2 , f (3) (t) = , f ′′ (t) = − 1+t (1 + t)2 (1 + t)3
f (4) (t) = −
et
6 · (1 + t)4
Soit x un réel positif. La formule de Taylor avec reste intégral à l’ordre 3 nous donne : ln (1 + x) = x − Pour tout t ∈ [0, x] , on a
x2 x3 + − R3 2 3
(x−t)3 (1+t)4
avec
R3 =
0
x
(x − t)3 dt. (1 + t)4
0 et donc, par croissance de l’intégrale, on obtient
que R3 0 . La conclusion découle de cette dernière inégalité.
519
Chapitre 13. Intégration 13.8 1. La fonction f : x �→ ln (1 + x) est de classe C ∞ sur l’intervalle ]−1, +∞[ . On vérifie par récurrence que, pour tout x du domaine de définition et pour tout n ∈ IN∗ , on a f (n) (x) =
(−1)n+1 (n−1)! (1+x)n
·
1 2. Pour tout t ∈ [0, 1] , on a 0 1+t 1 . Par conséquent, par croissance des fonctions puissances positives sur IR+ , on a :
(n) (n − 1)! f (t) = (n − 1)!. n (1 + t)
Puisque f (n) (0) = (n − 1)! , on a max f (n) (t) = (n − 1)! . t∈[0,1]
∗
3. Soit x ∈ [0, 1] et n ∈ IN . L’inégalité de Taylor-Lagrange à l’ordre n appliquée à f entre 0 et x donne :
n |xn+1 | (−1)k+1 k xn+1 1 x n! · ln (1 + x) − k n+1 n+1 (n + 1)! k=1
La conclusion en découle.
13.9 La fonction f étant continue à valeurs réelles, l’image du segment [a, b] par f est un segment [m, M ] . Puisque g est à valeurs positives on a mg(x) f (x)g(x) M g(x) pour tout x ∈ [a, b] . Par croissance de l’intégrale : m Ainsi, si
g = 0 , alors
[a,b]
g
[a,b]
fg M
[a,b]
f g = 0 et la relation
[a,b]
tout c ∈ [a, b] . Sinon :
g.
[a,b]
f g = f (c)
[a,b]
g est vérifiée pour
[a,b]
fg
[a,b]
g
∈ [m, M ]
[a,b]
fg · et donc, il existe c ∈ [a, b] tel que f (c) = [a,b] [a,b]
g
13.10 1. L’égalité est immédiate si f a un signe fixe, car alors soit f = |f | , soit f = −|f | .
Supposons
[a,b]
f =
[a,b]
|f | . Les fonctions f + =
1 2
|f | + f
continues, positives, avec f = f + − f − et |f | = f + + f − . En notant A =
[a,b]
f + et B =
[a,b]
et f − =
1 2
|f | − f
sont
f − , la fonction f vérifie |A − B| = A + B .
En distinguant selon que A B , ou B A , on obtient que A = 0 ou B = 0 . Dans le cas où A = 0 , f + est une fonction continue positive d’intégrale nulle, donc nulle ; en d’autres termes, f = −f − donc f est négative. De même, si B = 0 , on obtient f − = 0 c’est-à-dire f = f + , donc f est positive.
520
Solutions des exercices 2. Montrons que l’égalité a lieu si, et seulement s’il existe ϕ ∈ IR tel que f = eiϕ |f | . • Supposons dans un premier temps que Posons A =
Re f et B =
[a,b]
que B = 0 et
[a,b]
f=
[a,b]
[a,b]
|f | .
Im f . Alors A + iB = [a,b]
[a,b]
|f | , ce qui impose
|f | − Re(f ) = 0 . Puisque |f | − Re f est une fonction continue
à valeurs positives, on a |f | = Re f , et donc que f est une fonction réelle à valeurs positives, i.e. f = |f | .
iϕ e f et [a,b] [a,b] g = f ∈ IR+ on pose g = e−iϕ f . Alors g est continue et [a,b] [a,b] donc g = g . Le point précédent montre que g est une fonction à va-
• Dans le cas général, il existe ϕ
[a,b]
∈
IR tel que
f
=
[a,b]
leurs positives. On en déduit que g = |f | et la conclusion est vérifiée. • Le sens réciproque découle de la linéarité et de la positivité de l’intégrale. 13.11 Si f est la fonction nulle, le résultat est immédiat. ∗
Supposons f non nulle. Notons M = sup f (x) et pour tout n ∈ IN , un = x∈[a,b]
On va montrer que
[a,b]
f
n
n1
.
lim un = M par retour à la définition. Soit donc ε > 0 . Dans le
n→+∞
premier point, on montre qu’il existe n0 ∈ IN∗ tel que ∀n n0 un M + ε . Dans le second point, on montre qu’il existe n1 ∈ IN∗ tel que ∀n n1 M − ε un . • Soit n ∈ IN∗ . On a ∀x ∈ [a, b]
0 f (x) M donc par croissance des fonctions 1
puissances positives sur IR+ et croissance de l’intégrale, un M (b − a) n . La suite majorante converge vers M donc il existe n0 ∈ IN∗ tel que ∀n n0 un M + ε .
• La fonction f étant continue sur [a, b] , le réel M est atteint en un point c de [a, b] . La fonction f est positive et non nulle donc M > 0 . Posons ε′ = min M, 2ε · Puisque ε′ > 0 , il existe un segment I , non réduit à un point, contenant c et inclus dans [a, b] tel que : ∀x ∈ I f (x) M − ε′ 0.
La fonction f n est minorée par la fonction en escalier g qui vaut (M − ε′ )n sur I et 0 ailleurs. Soit η la longueur du segment I . On a alors : ∀n ∈ IN Or
lim (M − ε′ )η
n→+∞
On a alors ∀n n1
1 n
∗
f
n
[a,b]
n1
g
[a,b]
n1
1
= (M − ε′ )η n .
= M − ε′ > M − ε , donc il existe n1 ∈ IN∗ tel que : ∀n n1
un 1 − ε.
1
(M − ε′ )η n > 1 − ε.
521
Chapitre 13. Intégration 13.12 1. Notons M un majorant de |f | sur [a, b] ; un tel majorant existe, puisque f est définie et continue sur un segment. Alors, pour tout α ∈ [0, 1[ :
0 n
α
x f (x) dx
α
n
0
Puisque α ∈ [0, 1[ , on a
nxn M dx = 0
n M αn+1 M αn+1 . n+1
lim αn+1 = 0 et donc par encadrement :
n→+∞
lim n
n→+∞
α
xn f (x) dx = 0.
0
2. Soit ε > 0 . Puisque f est continue en 1 et que f (1) = 0 , il existe α ∈ [0, 1[ , tel que pour tout t ∈ [α, 1] on ait |f (t)| 2ε . Par conséquent :
0 n
1
x f (x) dx
1
n
α
nxn
α
ε dx 2
1
n ε ε ε dx = · 2 n+1 2 2
nxn
0
Par ailleurs, α étant fixé, il existe d’après la première question un entier n0 tel que pour α ε n tout n n0 on ait n x f (x) dx . Ainsi, pour tout n n0 : 2 0
n
1
0
En conclusion :
lim n
n→+∞
13.13 Pour n ∈ IN∗ , on a : un =
n
(n + k)
k=1
Considérons :
xn f (x) dx n
1
α
0
xn f (x) dx + n
1
α
xn f (x) dx = 0 .
xn f (x) dx ε.
0
n1
=
n
k=1
k n 1+ n
ln un = ln n +
n1
=n
n
k=1
n k 1 ln 1 + . n n
k 1+ n
n1
.
k=1
n
Or
k
1 ln 1 + n n k=1
est une somme de Riemann qui converge vers
calcul par intégration par parties donne
0
1
où (vn ) est une suite qui tend vers 0 puis un = On conclut que un ∼
522
4 n. e
1
ln(1 + x) dx . Un 0
ln(1 + x) dx = 2 ln(2) − 1 . On a donc :
ln un = ln n + 2 ln 2 − 1 + vn vers 1 .
4 vn ne où (evn ) est une suite qui tend e
Solutions des exercices 13.14 1. Soit λ > 0 . La fonction u : t �→ intégration par parties donne :
eiλt est de classe C 1 , avec u′ : t �→ eiλt . Ainsi, une iλ
b
f (t) eiλt dt = f (t)
a
eiλt iλ
b
a
−
1 iλ
b
f ′ (t) eiλt dt.
a
L’inégalité triangulaire (pour les sommes et pour les intégrales) donne :
b b f (a) + f (b) 1 iλt ′ iλt f (t) e dt f (t) e dt + λ λ a a f (a) + f (b) 1 b f ′ (t) dt −→ 0. + λ
λ
λ→+∞
a
2. Supposons f en escalier. Notons (u0 , . . . , up ) une subdivision adaptée et (f0 , . . . , fp−1 ) ∈ Cp tel que : ∀t ∈ ]uk , uk+1 [
∀k ∈ [[0, p − 1]]
f (t) = fk .
Un calcul direct donne, pour tout λ > 0 :
b
f (t)eiλt dt =
a
p−1 k=0
uk+1
uk
fk eiλt dt =
p−1
fk
k=0
eiλuk+1 − eiλuk · iλ
On a ensuite l’inégalité suivante qui découle de l’inégalité triangulaire : ∀λ > 0
b p−1 2|fk | iλt · f (t)e dt λ a
k=0
On conclut par théorème d’encadrement. 3. Soit ε > 0 . D’après le théorème d’approximation (cf. proposition 12 de la page 498), il ε existe une fonction en escalier g telle que |f − g| 2(b−a) . Ainsi, pour tout λ > 0 :
b b b iλx iλx iλx = f (x) e dx f (x) − g(x) e dx + g(x) e dx a a a b b iλx f (x) − g(x) eiλx dx + g(x) e dx a a b b ε dx + g(x) eiλx dx = 2(b − a) a a b ε = + g(x) eiλx dx . 2 a
Enfin, g ∈ E ([a, b], C) étant fixée, d’après la question précédente, il existe un réel λ0 > 0 tel que pour tout λ λ0 , on ait :
b ε iλx · g(x)e dx 2 a
On a donc, pour λ λ0 :
b iλx f (x)e dx ε a
ce qui permet de conclure.
523
Chapitre 13. Intégration 13.15 Soit x ∈ IR . Appliquons l’inégalité de Taylor-Lagrange à f : ∀h ∈ IR d’où : ∀h ∈ IR
2 f (x + h) − f (x) − hf ′ (x) h M,
2
0 f (x + h) f (x) + hf ′ (x) +
Le trinôme en h : h2 M + 2hf ′ (x) + 2f (x) est toujours positif, donc son discriminant est négatif : 4f ′ (x)2 − 8f (x)M 0
d’où puisque f et M sont positifs :
′ f (x) 2M f (x).
524
h2 M. 2
Chapitre 14 : Analyse asymptotique : Relations de comparaison
I
Fonctions dominées, fonctions négligeables . . . . Définitions, exemples . . . . . . . . . . . . . . . . . Propriétés . . . . . . . . . . . . . . . . . . . . . . . II Fonctions équivalentes . . . . . . . . . . . . . . . . 1 Définitions . . . . . . . . . . . . . . . . . . . . . . 2 Équivalents classiques . . . . . . . . . . . . . . . . 3 Propriétés conservées par la relation d’équivalence III Opérations sur les relations de comparaison . . . 1 Opérations sur les équivalents . . . . . . . . . . . . 2 Substitution . . . . . . . . . . . . . . . . . . . . . . 3 Équivalents et addition . . . . . . . . . . . . . . . IV Relations de comparaison sur les suites . . . . . . 1 Définitions, caractérisations . . . . . . . . . . . . . 2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . 3 Substitution . . . . . . . . . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
527 . 527 . 529 531 . 531 . 534 . 535 536 . 536 . 538 . 539 541 . 541 . 542 . 543 544 546
Analyse asymptotique : Relations de comparaison
14
Ce chapitre permet de revenir sur les notions de limite en permettant, en particulier, de comparer les vitesses de convergence ou de divergence pour des limites de suites ou de fonctions. Ex. 1. Les deux fonctions f :
IR∗+ x
deux vers 0 en +∞ , mais la relation
−→ �−→
IR 1 x
et g :
IR x
−→ �−→
IR e−x
tendent toutes les
lim x e−x = 0 (voir page 217) indique que g tend
x→+∞
vers 0 « plus vite » que f . On dira que g est négligeable devant f au voisinage de +∞ et l’on écrira g(x) = o f (x) . x→+∞
Ex. 2. La limite lim
x→0
sin x x
= 1 indique que la fonction sinus se comporte « de la même façon »
que x �→ x . On dira qu’elles sont équivalentes au voisinage de 0 et l’on écrira sin x ∼ x . x→0
Les relations de comparaisons que nous allons étudier dans ce chapitre vont donc permettre de comparer le comportement local de fonctions au voisinage d’un point a ∈ IR. Par conséquent, le cadre sera le même que dans le chapitre 10 : • ou bien D est un intervalle de IR d’intérieur non vide et a est un réel intérieur à D , ou l’une des extrémités de D (finie ou non) ; • ou bien D désigne un tel intervalle privé d’un de ses points intérieurs a.
Lorsqu’une fonction f est définie sur D et que a est un tel point, nous dirons aussi que f est définie au voisinage de a . Elle peut donc être définie ou non au point a. Toutes les fonctions considérées dans ce chapitre seront définies sur D et à valeurs dans IK = IR ou IK = C.
I Fonctions dominées, fonctions négligeables
I
Fonctions dominées, fonctions négligeables
1
Définitions, exemples
Définition 1 Soit f et ϕ deux fonctions définies sur D .
1. On dit que f est dominée par ϕ au voisinage de a s’il existe une fonction u définie sur D , bornée au voisinage de a, telle que f = ϕ × u au voisinage de a. On note alors f = O(ϕ) ou f (x) = O ϕ(x) . a
Exo 14.1
x→a
2. On dit que f est négligeable devant ϕ au voisinage de a s’il existe une fonction ε définie sur D , tendant vers 0 en a, telle que f = ϕ × ε au voisinage de a. On note alors f = o(ϕ) ou f (x) = o ϕ(x) . a
x→a
Terminologie • Les symboles O et o se lisent respectivement « grand O » et « petit o ». Ainsi, on dira, par exemple, « f est un grand O de ϕ au voisinage de a » ou « f (x) est un petit o de ϕ(x) lorsque x tend vers a ». • S’il n’y a pas d’ambiguïté sur le point a, on pourra écrire : f (x) = O(ϕ(x))
et f (x) = o(ϕ(x))
ou encore : f = O(ϕ)
et
f = o(ϕ).
Remarques • Il est clair que si f = o(ϕ), alors f = O(ϕ) puisqu’une fonction tendant vers 0 a
a
en a est bornée au voisinage de a.
• Si a ∈ D , si ϕ s’annule en a et si f = O(ϕ), alors f s’annule également en a. a
A fortiori, on a la même conclusion lorsque f = o(ϕ). a
Ex. 3. On a x2 sin
1 x
= O(x2 ) . En effet, sur IR∗ , on a :
x→0
x2 sin
et la fonction u : x �→ sin
1 x
1 x
est bornée.
= sin
1 ×x2 x
u(x)
1 et x �→ x2 , x sont a priori définies sur des domaines différents : IR∗ pour la première et IR pour la seconde. 1 = O(x2 ) signifie alors implicitement que l’on considère la Le fait d’écrire la relation x2 sin x x→0 restriction de la fonction x �→ x2 à IR∗ . Remarque
Dans cet exemple, les deux fonctions comparées : x �→ x2 sin
527
Chapitre 14. Relations de comparaison Ex. 4. Montrons que x2 = o(sin x) . Pour tout x ∈ ]−π, 0[ ∪ ]0, π[ , on peut écrire : x→0
x2 = ε(x) sin x
avec
ε(x) =
x2 x =x× −→ 0 × 1 = 0. sin x sin x x→0
Remarque En toute rigueur, il faudrait définir la fonction ε sur tout le domaine de définition des deux fonctions, c’est-à-dire IR . Pour cela, il suffit de prendre ε nulle en dehors de ]−π, 0[ ∪]0, π[ . • Cela ne change évidemment pas le fait que ε tend vers 0 en 0 .
• La relation x2 = ε(x) sin x est toujours vérifiée au voisinage de 0 , en particulier en 0 par nullité de x �→ x2 en ce point.
Dans la pratique, nous nous contenterons de la première rédaction, en sous-entendant cette extension de définition de la fonction ε .
Les résultats suivants découlent de la définition 1 de la page précédente : Proposition 1 1. Une fonction f est bornée au voisinage de a si, et seulement si, elle est dominée par la fonction constante 1 , c’est-à-dire si, et seulement si, f = O(1). 2. Une fonction f tend vers 0 en a si, et seulement si, elle est négligeable devant la fonction constante 1 , c’est-à-dire si, et seulement si, f = o(1). Attention Les écritures f = o(g) et f = O(g) ne sont que des notations, et ne sont pas à manipuler comme des égalités algébriques. Ainsi on peut avoir f = o(h) et g = o(h) sans pour autant que les fonctions f et g soient égales ! En cas de doute lors de l’utilisation de ces notations, ne pas hésiter à revenir à la définition ou à la caractérisation à l’aide du quotient qui sera donnée dans la proposition 3 de la page 530. Soit (α, β) ∈ IR2 avec α < β . Comparons les fonctions puissances x �→ xα et x �→ xβ au voisinage de 0 et au voisinage de +∞ . Ex. 5. Montrons qu’au voisinage de 0 , on a xβ = o(xα ) . Commençons par préciser le domaine D sur lequel ces fonctions sont définies et qui permet de les comparer au voisinage de 0 . On distingue trois cas : • si α et β sont deux entiers naturels, on peut prendre D = [−1, 1] ;
• si α et β sont deux entiers strictement négatifs, alors les fonctions considérées ne sont pas définies en 0 , et l’on peut prendre D = [−1, 1] \ {0} ; • si α et β sont deux nombres réels quelconques, alors on considère D = ]0, 1] .
Pour l’ensemble D en vigueur, on a :
∀x ∈ D
xβ = xβ−α xα .
Puisque β − α est strictement positif, on a donc lim xβ−α = 0 , et, par suite, on a xβ = o(xα ) x→0
au voisinage de 0 .
528
I Fonctions dominées, fonctions négligeables Ex. 6. Au voisinage de +∞ , on a xα = o(xβ ) . Ici, on peut prendre D = ]0, +∞[ , domaine sur lequel les deux fonctions sont bien définies et qui permet de les étudier au voisinage de +∞ . Pour tout x ∈ D , on a l’égalité xα = xα−β xβ .
Puisque xα−β tend vers 0 lorsque x tend vers +∞ d’après l’hypothèse α < β , on a la relation xα = o(xβ ) au voisinage de +∞ .
Remarque Il est clair, d’après la définition, que si λ ∈ IK est non nul, on a g = O(λ f ) si, et seulement si, g = O(f ). Il en est de même pour les o . On évitera donc d’écrire O(3x) ou o(x2 /2) pour privilégier les notations O(x) ou o(x2 ).
2
Propriétés
Règles de calcul Les résultats suivants sont des traductions de propriétés connues sur les fonctions bornées et les fonctions tendant vers 0 . Toutes les relations de comparaison ci-dessous sont données au voisinage d’un point a fixé. Compatibilité : f = o(ϕ)
=⇒
f = O(ϕ)
f1 = O(ϕ1 ) et
f2 = O(ϕ2 )
=⇒
f1 f2 = O(ϕ1 ϕ2 )
f1 = o(ϕ1 )
et
f2 = O(ϕ2 )
=⇒
f1 f2 = o(ϕ1 ϕ2 )
f1 = o(ϕ1 )
et
f2 = o(ϕ2 )
=⇒
f1 f2 = o(ϕ1 ϕ2 )
f1 = O(ϕ)
et
f2 = O(ϕ)
=⇒
f1 + f2 = O(ϕ)
f1 = o(ϕ)
et
f2 = o(ϕ)
=⇒
f1 + f2 = o(ϕ)
f = O(ϕ1 ) et
ϕ1 = O(ϕ2 )
=⇒
f = O(ϕ2 )
f = o(ϕ1 )
et
ϕ1 = O(ϕ2 )
=⇒
f = o(ϕ2 )
f = O(ϕ1 ) et
ϕ1 = o(ϕ2 )
=⇒
f = o(ϕ2 )
f = o(ϕ1 )
ϕ1 = o(ϕ2 )
=⇒
f = o(ϕ2 )
Produit :
Somme :
Transitivité :
et
On utilisera librement ces propriétés dans la suite. Proposition 2 Soit f et ϕ deux fonctions définies sur D .
1. Si f = O(ϕ) et si ϕ est bornée au voisinage de a, alors f aussi. a
2. Si f = O(ϕ) et si la fonction ϕ tend vers 0 en a, alors lim f = 0 . a
a
3. Si f = o(ϕ) et si ϕ est bornée au voisinage de a, alors lim f = 0 . a
Principe de démonstration.
a
Démonstration page 544
Utiliser la proposition 1 de la page précédente ainsi que les règles de calculs énoncées précédemment.
529
Chapitre 14. Relations de comparaison Proposition 3 On suppose que ϕ ne s’annule pas sur D \ {a} ; de plus, si a ∈ D et ϕ(a) = 0 , on suppose f (a) = 0 . Alors, au voisinage de a, on a les équivalences suivantes : 1. f est dominée par ϕ si, et seulement si,
f est bornée au voisinage de a ; ϕ
2. f est négligeable devant ϕ si, et seulement si,
f tend vers 0 en a. ϕ Démonstration page 544
Principe de démonstration. Là où ϕ ne s’annule pas, utiliser l’équivalence f (x) = u(x) × ϕ(x) ⇐⇒
f (x) = u(x) . ϕ(x)
Remarques • Ce résultat, très important en pratique, permet souvent de ramener l’étude des relations de comparaisons à celle de limites de quotients. • Dans la pratique, les hypothèses : « ϕ ne s’annule pas sur D \ {a} » et « (a ∈ D
et ϕ(a) = 0) =⇒ f (a) = 0 »
sont assez évidentes et ne demanderont donc pas de justification explicite car : ∗ les fonctions usuellement considérées ne s’annulent pas sur D \ {a} ;
∗ il est clair que si ϕ(a) = 0 et f (a) �= 0 , alors f n’est pas dominée par ϕ et donc encore moins négligeable devant ϕ. Reformulation des résultats de croissances comparées Proposition 4 Pour tous réels a et b strictement positifs, on a : (ln x)b = o xa et x→+∞
ln xb = o x−a x→0
Démonstration.
x→+∞
e
ax
=o
x→−∞
ax ; e
−b |x| .
Ce ne sont que des traductions des résultats de croissances comparées :
(ln x)b =0 x→+∞ xa lim
b
lim xa ln x = 0
x→0
et
xb = o
et et
xb =0; x→+∞ eax lim
lim |x|b eax = 0.
x→−∞
Remarque Lorsque b < 0 , les résultats subsistent, puisqu’une fonction qui tend vers 0 est évidemment négligeable devant une fonction qui tend vers +∞. Il en est de même lorsque b = 0 . 530
II Fonctions équivalentes
II 1
Fonctions équivalentes Définitions
Définition 2 Soit f et g deux fonctions définies sur D .
On dit que f est équivalente à g au voisinage de a si f − g = o(g) au voisinage de a. On note alors f ∼ g ou f (x) ∼ g(x). a
x→a
Notation Comme pour les notations o et O , s’il n’y a pas d’ambiguïté sur le point au voisinage duquel on se place, alors on note simplement f ∼ g ou f (x) ∼ g(x). Ex. 7. On a x + 1
∼
x→+∞
x puisque 1 = o (x) . x→+∞
Proposition 5 La fonction f est équivalente à g au voisinage de a si, et seulement s’il existe une fonction u définie sur D , tendant vers 1 en a, telle que f = g × u au voisinage de a. Démonstration. • Si f ∼ g , alors f − g = o(g) et donc il existe ε tendant vers 0 telle que f − g = g ε au voisinage de a . La fonction u = 1 + ε convient alors. • Réciproquement, s’il existe une telle fonction u , il suffit de prendre ε = u − 1 pour avoir f − g = g ε au voisinage de a , avec lim ε = 0 . a
Corollaire 6 Soit f et g deux fonctions définies sur D . Si f ∼ g , alors f = O(g). a
a
Démonstration. En effet, une fonction qui tend vers 1 en a est bornée au voisinage de a . Proposition 7 La relation ∼ est une relation d’équivalence sur l’ensemble des fonctions définies sur D .
a
Démonstration page 544
Terminologie Ce résultat permet d’utiliser la formulation symétrique suivante : « f et g sont équivalentes au voisinage de a ». Remarque Au vu de la symétrie, le corollaire 6 dit que si deux fonctions sont équivalentes, chacune d’entre elle est dominée par l’autre. Attention La réciproque du résultat de cette remarque est évidemment fausse puisque, par exemple, 2x = O(3x) et 3x = O(2x) sans que l’on ait 2x ∼ 3x. x→0
x→0
x→0
531
Chapitre 14. Relations de comparaison Proposition 8 Supposons que g ne s’annule pas sur D \ {a} et que, si a ∈ D et g(a) = 0 , alors f (a) = 0 . Alors la fonction f est équivalente à g au voisinage de a si, et f seulement si, lim = 1. a g Démonstration page 545 Conséquence de la proposition 3 de la page 530.
Principe de démonstration.
Point méthode Au même titre que la proposition 3, ce résultat est très utile dans la pratique : pour montrer que deux fonctions sont équivalentes, on se ramène souvent à étudier la limite de leur quotient.
Ex. 8. Pour obtenir l’équivalent sin x ∼ x , il suffit de constater que lim x→0
x→0
évident car il s’agit du taux d’accroissement de la fonction sin en 0 .
sin x = 1 , ce qui est x
Ex. 9. Soit f et g deux fonctions à valeurs strictement positives sur D \ {a} et équivalentes √ f √ en a . Montrons que f ∼ tend vers 1 en a , et par composition avec g . La fonction a g √ f f la fonction racine carrée continue en 1 , on a lim = 1 . Ainsi, le rapport √ tend vers 1 a g g √ √ en a . Les fonctions f et g sont donc équivalentes en a . Ex. 10. Soit f une fonction polynomiale non nulle définie par f (x) =
n
ak xk où p et n
k=p
sont deux entiers naturels vérifiant p n , avec ap �= 0 et an �= 0 . On a alors : f (x) ∼ ap xp
et
x→0
f (x)
∼
x→+∞
an xn .
n f (x) ak k−p = 1 + x −→ 1 , donc f (x) ∼ ap xp . x→0 x→0 ap xp ap
• Pour x ∈ IR∗ , on a
k=p+1
n−1
• Pour x ∈ IR∗+ , on a On a de même f (x)
ak 1 f (x) = + 1 −→ 1 , donc f (x) ∼ an xn . n x→+∞ x→+∞ an x an xn−k
∼
x→−∞
k=p
an xn .
Point méthode On retiendra qu’une fonction polynomiale non nulle est : Exo 14.2
• au voisinage de 0 , équivalente à son terme non nul de plus bas degré ;
• au voisinage de ±∞, équivalente à son terme non nul de plus haut degré. Proposition 9 Soit f une fonction définie sur D et ℓ ∈ IK non nul.
Alors f admet ℓ pour limite en a si, et seulement si, f ∼ ℓ . a
Démonstration. 532
Puisque ℓ �= 0 , on a lim f (x) = ℓ si, et seulement si, x→a
f (x) −→ 1 . ℓ x→a
II Fonctions équivalentes
Attention
Ce résultat est faux si ℓ = 0 . En effet, si f ∼ 0 , alors f est nulle au a
voisinage de a puisqu’il existe une fonction ε telle que f − 0 = ε × 0 au voisinage de a. Il est donc fort peu probable qu’un calcul d’équivalents correct mène à la relation f ∼ 0 . a
Proposition 10 Si f et g sont deux fonctions telles que g = o(f ), alors f + g ∼ f . a
Démonstration.
a
C’est une conséquence immédiate de la définition. 1 x
Ex. 11. Pour trouver un équivalent « simple » en +∞ de x2 +x+ln x+ , il suffit de remarquer que x + ln x +
1 1 = o(x2 ) au voisinage de +∞ . On a donc x2 + x + ln x + x x
∼
x→+∞
x2 .
Point méthode • Lorsque l’on écrit un équivalent pour une fonction, on cherchera toujours à écrire « l’équivalent le plus simple possible ». • La proposition 10 combinée avec la transitivité de la relation ∼ justifie l’habia
tude suivante : si, au voisinage de a, une fonction f vérifie f ∼ g + h, et si de plus h = o(g), alors on a, plus simplement, f ∼ g .
Ex. 12. Si une fonction f vérifie, au voisinage de 0 : f (x) ∼ 1 + x + x2 , alors on simplifiera systématiquement en f (x) ∼ 1 , équivalent plus simple et qui donne exactement la même information que le précédent. Ex. 13. En physique, il arrive que l’on écrive ex ≈ 1 + x pour préciser le comportement de la fonction exponentielle près de 0 . Cette notation n’a rien à voir avec les équivalents : comme dans l’exemple précédent, l’équivalent ex ∼ 1 + x est juste, mais n’apporte pas plus de renseignement que ex ∼ 1 ou même ex ∼ 1 − 3x2 . On verra comment, avec les développements limités, écrire une forme mathématique offrant la même précision : ex = 1 + x + o(x) (voir le chapitre 15).
Proposition 11 (Obtention d’un équivalent par encadrement) Soit f , g et h trois fonctions réelles définies sur D telles que f g h au voisinage de a. Si f et h sont équivalentes à une même fonction ϕ en a, alors g ∼ ϕ. a
Démonstration page 545
Principe de démonstration. Utiliser l’inégalité g(x) − f (x) h(x) − f (x) pour démontrer que g ∼ f ∼ ϕ .
533
Chapitre 14. Relations de comparaison Ex. 14. Déterminons un équivalent en +∞ de la fonction f : x �→ Arctan(x + 1) − Arctan(x) . Soit x 0 . L’égalité des accroissements finis fournit un réel cx ∈ ]x, x + 1[ tel que : f (x) = (x + 1 − x) Arctan′ (cx ) =
1 · 1 + c2x
1 1 f (x) et comme les termes encadrant f (x) sont tous les 1 + (x + 1)2 1 + x2 1 1 deux équivalents à 2 , on en déduit f (x) ∼ 2 · +∞ x x
On a donc
2
Équivalents classiques
La proposition suivante permet d’obtenir de nombreux équivalents. Proposition 12 Soit f une fonction définie sur D . Supposons que f soit dérivable en un point a de D et que f ′ (a) �= 0 . Alors, au voisinage de a : f (x) − f (a) ∼ f ′ (a)(x − a).
Démonstration.
Comme f ′ (a) �= 0 , la quantité f ′ (a)(x − a) ne s’annule pas sur D \ {a} . Donc, d’après la proposition 8 de la page 532, la limite suivante montre l’équivalent souhaité : lim
x→a
f (x) − f (a) = 1. f ′ (a)(x − a)
Ex. 15. On a sh x ∼ x au voisinage de 0 , car sh est dérivable en 0 et sh′ (0) = ch 0 = 1 .
Ex. 16. On a ln(1 + x) ∼ x au voisinage de 0 et ln u ∼ u − 1 au voisinage de 1 .
• Le premier équivalent vient du fait que la fonction f : x �→ ln(1 + x) est dérivable en 0 et vérifie f ′ (0) = 1 .
• Le second vient du fait que la fonction ln est dérivable en 1 et vérifie ln′ (1) = 1 .
Equivalents classiques au voisinage de 0 Les équivalents (au voisinage de 0 ) suivants sont obtenus grâce à la proposition 12. Ils sont à connaître. ex − 1 ∼ x
Arcsin x ∼ x
ln(1 + x) ∼ x
Arctan x ∼ x α
(1 + x) − 1 ∼ α x
sh x ∼ x
sin x ∼ x
th x ∼ x
∗
(avec α ∈ IR )
tan x ∼ x
Remarque Le dernier équivalent ci-dessus est également vrai si α est nul. Il n’est alors pas obtenu par la proposition 12, mais simplement par le fait que la fonction x �→ (1 + x)α − 1 est alors la fonction nulle sur IR∗+ . Ex. 17. On a
534
√
1+x−1 ∼
x 2
au voisinage de 0 .
II Fonctions équivalentes
Attention La proposition 12 de la page ci-contre ne s’applique pas dans le cas où f ′ (a) = 0 . Plus précisément, lorsque f ′ (a) = 0 , on a : f (x) − f (a) = o(x − a). x→a
Ainsi, par exemple, on a cos(x)−1 = o(x) et ch x−1 = o(x) au voisinage de 0 . Nous obtiendrons plus loin (cf. exemple 19 de la page suivante) les équivalents classiques suivants : x2 x2 et ch x − 1 ∼ · cos x − 1 ∼ − x→0 x→0 2 2
3
Propriétés conservées par la relation d’équivalence
Proposition 13 Soit f et g deux fonctions équivalentes en a. Si g possède une limite finie ou infinie en a alors f a une limite en a et lim f = lim g . a
Démonstration.
a
Conséquence immédiate de l’égalité f = g × u avec lim u = 1. a
Attention La réciproque du résultat précédent est fausse. Même s’il est évident, d’après la proposition 9 de la page 532, que si f et g ont la même limite ℓ finie non nulle, alors elles sont équivalentes, le résultat est faux pour des limites nulles ou infinies. Par exemple, les deux fonctions x �→ x et x �→ x2 tendent toutes les deux vers 0 en 0 mais ne sont pas équivalentes. Il en est de même en +∞ où elles tendent toutes les deux vers +∞. Proposition 14 Soit f et g deux fonctions équivalentes en a. 1. Si g est (strictement) positive au voisinage de a, alors f l’est aussi. 2. Si g ne s’annule pas au voisinage de a, alors f non plus. Démonstration.
Comme f ∼ g , on peut écrire f = g × u au voisinage de a , où u est a
une fonction tendant vers 1 en a . La fonction u est alors à valeurs strictement positives au voisinage de a , ce qui permet d’obtenir facilement les propriétés annoncées.
Ex. 18. Soit f la fonction x �→ x5 + x3 − 2x2 . On a : f (x) ∼ g(x) = −2x2 x→0
et
∀x ∈ IR∗
− 2x2 < 0.
Donc, en appliquant le premier point de la proposition précédente aux fonctions f et g , on peut affirmer qu’il existe η > 0 tel que : ∀x ∈ [−η, η] f (x) 0. Par conservation du signe strict, on peut même choisir η > 0 tel que : ∀x ∈ [−η, 0[ ∪ ]0, η] f (x) < 0.
535
Chapitre 14. Relations de comparaison
III 1
Opérations sur les relations de comparaison Opérations sur les équivalents
Produit et quotient Proposition 15 Soit f1 , f2 , g1 et g2 quatre fonctions définies sur D . Les équivalents suivants sont donnés au voisinage d’un même point a. 1. Si f1 ∼ g1 et f2 ∼ g2 , alors f1 f2 ∼ g1 g2 . Exo 14.3
2. Si f1 ∼ g1 et f2 ∼ g2 , et si aucune de ces fonctions ne s’annule sur D \ {a} , f1 g1 alors ∼ · f2 g2
Principe de démonstration.
Démonstration page 545 Écrire f1 = g1 u1 et f2 = g2 u2 avec lim u1 = lim u2 = 1 . a
a
Ex. 19. Équivalents de cos t − 1 et ch t − 1 au voisinage de 0 .
cos2 t − 1 sin2 t =− · cos t + 1 cos t + 1 On a sin t ∼ t , donc par produit, sin2 t ∼ t2 . De plus, cos t + 1 −→ 2 , donc cos t + 1 ∼ 2 . Pour tout t ∈ ]−π, π[ , on a cos t − 1 = t→0
t→0
t→0
t→0
Par quotient, on obtient l’équivalent classique suivant au voisinage de 0 : cos t − 1 ∼ −
De même, pour t ∈ IR , les relations ch t − 1 =
montrer que
ch2 t − 1 sh2 t = permettent facilement de ch t + 1 ch t + 1
ch t − 1 ∼
t→0
Ex. 20. La fonction rationnelle f : x �→
t2 · 2
t2 · 2
2x 2 2x + 3x2 + 4x4 au est équivalente à x �→ = 5x2 + 6x3 5x2 5x
4x4 2x = au voisinage de +∞ . 6x3 3 Ex. 21. Plus généralement, toute fonction rationnelle non nulle est équivalente en 0 au quotient de ses termes de plus bas degré et en ±∞ au quotient de ses termes de plus haut degré. voisinage de 0 et à x �→
Point méthode Pour déterminer la limite d’une expression sous forme de produit/quotient, on peut en chercher un équivalent par équivalent de chacun de ses facteurs. Ex. 22. Au voisinage de 1 , on a : (x + 1)(x − 1) 2(x − 1) x2 − 1 = ∼ = 2 −→ 2. x→1 ln x ln x x−1
536
III Opérations sur les relations de comparaison Élévation à une puissance De manière générale, il est possible de « passer un équivalent à la puissance », ce qui s’exprime par le résultat suivant : Proposition 16 Soit f et g deux fonctions définies sur D , équivalentes au voisinage d’un point a. Soit α un réel. Si les fonctions f α et g α sont bien définies sur D , alors elles sont équivalentes au voisinage de a. Démonstration.
Supposons que les fonctions f α et g α soient bien définies. Comme f et g sont équivalentes au voisinage de a , il existe une fonction u tendant vers 1 en a véri α fiant f = g × u au voisinage de a . On a alors f α = g × u , c’est-à-dire : f α = g α × uα .
Cette dernière relation montre le résultat souhaité, car comme u −→ 1 , on a uα −→ 1 . a
a
Remarque La condition « les fonctions f α et g α sont bien définies sur D » s’exprime différemment suivant la valeur de l’exposant α . De manière générale, en écrivant : f (x)α = exp α ln f (x) et g(x)α = exp α ln g(x) ,
on constate que les fonctions f et g considérées doivent être à valeurs dans IR∗+ . Cependant, certaines valeurs de α permettent de considérer la fonction puissance x �→ xα sur un domaine plus grand que IR∗+ . Cela mène aux cas suivants : • si α ∈ IR+ , alors il suffit que les fonctions f et g soient à valeurs dans IR+ ; • si α ∈ ZZ∗− , alors il suffit que les fonctions f et g ne s’annulent pas ;
• si α ∈ IN, alors il n’y a aucune condition sur les valeurs prises par f et g .
Ex. 23. Soit f et g deux fonctions définies sur D telles que f ∼ g . a
Alors, au voisinage de a : 1. sans autre condition sur f et g , on a f 4 ∼ g 4 ; √ √ 2. si f et g sont à valeurs positives, on a f ∼ g ;
3. si f et g sont à valeurs strictement positives, on a f π ∼ g π .
Mise en garde : pas de composition ! Attention On vient de voir que si ϕ est une fonction de la forme x �→ xα , alors il est possible de « composer » une relation d’équivalence par ϕ. Cela tient au fait que f (x) f (x)α si le quotient tend vers 1 , alors il en est de même pour le quotient · g(x) g(x)α Cela est faux en général si ϕ n’est pas une fonction puissance : en effet, ce n’est f (x) tend vers 1 que l’on peut dire quoi que ce soit du pas parce que le quotient g(x) ϕ f (x) · quotient ϕ g(x) On ne peut donc pas, en général, composer un équivalent par une fonction. 537
Chapitre 14. Relations de comparaison
Ex. 24. Étant donné deux fonctions f et g définies sur D et à valeurs réelles, on a : ef (x) ∼ eg(x) ⇐⇒ f (x) − g(x) −→ 0. x→a
En effet, pour x ∈ D , on a :
Le rapport
x→a
ef (x) = ef (x)−g(x) . eg(x)
ef (x) tend donc vers 1 si, et seulement si, f (x) − g(x) tend vers 0 . eg(x)
Ex. 25. On peut très bien avoir f (x) ∼ g(x) sans avoir exp f (x) x→a
∼ exp g(x) .
x→a
C’est par exemple le cas en +∞ des fonctions f : x �→ x2 et g : x �→ x2 + x définies sur IR .
Remarque Disposant d’un équivalent f ∼ g et d’une fonction ϕ, il se peut que a l’équivalent ϕ f (x) ∼ ϕ g(x) soit vrai. Il est alors nécessaire d’établir rigoureux→a
sement cet équivalent, par exemple en revenant à la définition. C’est ce qui est fait dans l’exemple suivant.
Ex. 26. Montrons qu’au voisinage de 0 , on a ln(sin x) ∼ ln x . Ne pouvant pas composer l’équivalent sin x ∼ x par la fonction ln , il faut procéder autrement. x→0
La présence des deux logarithmes nous pousse à revenir à la définition et donc à étudier la différence : sin x ln(sin x) − ln x = ln · (⋆) x sin x −→ 0 puisque sin x ∼ x et d’autre part ln x −→ −∞ , ce qui assure Or, d’une part, ln x x→0 x→0 sin x que ln = o ln x . La relation (⋆) donne alors l’équivalent ln(sin x) ∼ ln x . x→0 x
Point méthode Comme on l’a fait dans l’exemple précédent, pour trouver un équivalent du logarithme d’une fonction f , on peut lui retrancher le logarithme d’un équivalent de f .
Exo 14.4
2
Substitution
Substitution dans un équivalent Le résultat suivant permet d’obtenir de nombreux équivalents à partir d’équivalents déjà connus. Exo 14.5 Exo 14.6
Proposition 17 (Substitution dans un équivalent) Soit f : D → IK et g : D → IK équivalentes au voisinage d’un point α . Si ϕ est une fonction définie au voisinage d’un point a, à valeurs dans D , et telle que lim ϕ(t) = α , alors on a f ϕ(t) ∼ g ϕ(t) au voisinage de a. t→a
Démonstration page 545
Principe de démonstration.
538
C’est une composition de limites.
III Opérations sur les relations de comparaison
Ex. 27. Comme 2t −→ 0 , l’équivalent sin u ∼ u donne sin(2t) ∼ 2t . t→0
u→0
t→0
Ex. 28. Comme cos t −→ 1 , l’équivalent ln u ∼ u − 1 donne ln(cos t) ∼ cos t − 1 . Étant t→0
u→1
t→0
2
2
donné que cos t − 1 ∼ − t2 , on obtient, par transitivité, ln(cos t) ∼ − t2 · t→0
t→0
Ex. 29. Comme
1 −→ x2 x→+∞
0 , l’équivalent eu − 1 ∼ u donne exp u→0
1 x2
Ex. 30. Trouvons la limite, lorsque x tend vers +∞ , de f (x) = 1 +
1
Pour x > 0 , en écrivant f (x) = exp x ln 1 +
nentielle, à trouver la limite de x ln 1 +
on a, par substitution, x ln 1 + On en déduit donc
1
x
lim x ln 1 +
x→+∞
∼
x
x→+∞
1 x
1 x
1 x
−1
1 ∼ 2· x→+∞ x
1 x . x
, on est ramené, par continuité de l’expo-
. Or, puisque
x×
lim 1 x→+∞ x
= 0 et que ln(1 + h) ∼ h , h→0
= 1.
= 1 , puis lim f = e . +∞
Substitution dans des relations de domination et de négligeabilité Les résultats de substitution donnés pour la relation d’équivalence (proposition 17 de la page précédente) s’adaptent sans difficulté aux symboles o et O : Proposition 18 Soit f : D → IK et g : D → IK deux fonctions définies au voisinage d’un point α . Soit ϕ une fonction définie au voisinage d’un point a, à valeurs dans D , telle que lim ϕ(t) = α . t→a • Si f (x) = O g(x) , alors on a f ϕ(t) = O g ϕ(t) . x→α t→a • Si f (x) = o g(x) , alors on a f ϕ(t) = o g ϕ(t) . x→α
3
t→a
Équivalents et addition
Il n’y a pas de résultat général pour une somme ou une différence d’équivalents : si, au voisinage d’un point a, deux fonctions f1 et f2 sont équivalentes à g1 et g2 respectivement, rien ne dit que la fonction f1 + f2 est équivalente à g1 + g2 . Cela se comprend aisément en pensant à la caractérisation à l’aide du quotient : on f1 f2 f1 + f2 peut très bien avoir → 1 et → 1 sans pour autant avoir → 1. g1 g2 g1 + g2 Ex. 31. En prenant f1 (x) = x , f2 (x) = −x , g1 (x) = x et g2 (x) = −x + x2 , on a : f1 −→ 1 g1 0
et
f2 −→ 1 g2 0
mais
f1 + f2 −→ 0. g1 + g2 0
Donc f1 ∼ g1 et f2 ∼ g2 , mais f1 + f2 et g1 + g2 ne sont pas équivalentes (la première est 0
0
même négligeable devant la deuxième). Ex. 32. Puisque lim cos x = 1 , on a cos x ∼ 1 . En tentant d’ajouter −1 aux deux termes x→0
0
de cet équivalent, on trouve cos x − 1 ∼ 0 , ce qui est manifestement faux (rappelons qu’une fonction équivalente à la fonction nulle est identiquement nulle au voisinage du point considéré).
539
Chapitre 14. Relations de comparaison Les trois exemples suivants illustrent, dans l’ordre, les trois situations classiques fréquemment rencontrées lors de la recherche d’un équivalent d’une somme de deux fonctions : • première situation : l’une des deux fonctions est négligeable devant l’autre ; ce cas a déjà été traité par la proposition 10 de la page 533 ; • deuxième situation : les deux fonctions « apportent chacune une contribution dans l’équivalent final, sans se compenser » ; ce cas se traite en revenant à la définition ; • troisième situation : les deux fonctions « se compensent » ; sans information supplémentaire, il n’est alors pas possible de conclure. Dans les trois situations, on commence donc par chercher un équivalent des deux fonctions (ou plus éventuellement) pour essayer de deviner le résultat et trouver la stratégie pour le prouver. Ex. 33. Cherchons un équivalent en 0 de la fonction f : x �→ sin(x) + sh(x2 ) . L’équivalent sh u ∼ u donne, par substitution : sh(x2 ) ∼ x2 . On a donc : u→0
x→0
2
f (x) = sin(x) + sh(x ) ∼ x
∼x
car x2 = o(x) .
∼ x2
Ex. 34. Cherchons un équivalent en 0 de la fonction f : x �→ sin(5x) − sh(2x) . En 0 , les quantités sin(5x) et sh(2x) sont respectivement équivalentes à 5x et 2x . Cela peut laisser pressentir que f est équivalente en 0 à 5x − 2x , c’est-à-dire 3x . Cette intuition est correcte. En effet, on a pour tout x �= 0 : sin(5x) sh(2x) f (x) = − −→ 5 − 2 = 3 �= 0, x→0 x x x ce qui donne
f (x) x
∼ 3 , soit f (x) ∼ 3x .
Ex. 35. Intéressons-nous à un équivalent en 0 de la fonction f : x �→ sin(2x) − sh(2x) . On sait que : sin(2x) ∼ 2x et sh(2x) ∼ 2x.
Dans ce cas, il ne faut surtout pas penser qu’un équivalent de f s’obtient en soustrayant ces deux équivalents : cela nous mènerait à dire que f est équivalente en 0 à la fonction nulle, ce qui est complètement faux. En fait, dans cette situation, on peut simplement conclure que f (x) = o(x) au voisinage de 0 , puisque : sin(2x) sh(2x) f (x) = − −→ 2 − 2 = 0. x→0 x x x Dans un tel cas, si l’on souhaite obtenir un équivalent de f , il faudra utiliser un outil plus puissant, comme la formule de Taylor-Young ou plus généralement un développement limité (ce qui sera fait dans la suite de ce chapitre, voir l’exemple 28 de la page 578).
Convention d’écriture importante Lorsque f (x) ∼ g(x), on a, par définition, f (x) − g(x) = o g(x) . La fonction h = f − g est donc négligeable devant g et l’on a f = g + h. On pourra alors écrire : f (x) = g(x) + o g(x) .
540
IV Relations de comparaison sur les suites Il faut bien comprendre ce que cela signifie : • jusqu’à présent, le symbole « o » était utilisé seul, à droite d’un symbole « = », pour signifier qu’une fonction était négligeable devant une autre ; • dans la relation f (x) = g(x) + o g(x) , le « o g(x) » veut dire « une certaine quantité » dont on sait qu’elle est négligeable devant g(x). L’existence de cette quantité est une évidence (c’est la différence de. . . ) ; ce qui est important c’est son caractère négligeable ; • il s’agit donc d’un raccourci très utile pour dire : « il existe une fonction ε, négligeable devant g , telle que ∀x ∈ D f (x) = g(x) + ε(x) ». Point méthode Dans un calcul d’équivalent, il peut être utile de remplacer la relation f (x) ∼ g(x) par l’égalité f (x) = g(x) + o g(x) .
On pourra ainsi, par exemple, additionner de telles égalités, ce qui peut permettre de trouver un équivalent de la somme.
Exo 14.7
Ex. 36. Reprenons l’exemple 34 de la page ci-contre. Les équivalents sin(5x) ∼ 5x et sh(2x) ∼ 2x (en 0 ) peuvent se réécrire : sin(5x) = 5x + o(x)
sh(2x) = 2x + o(x)
et
ce qui donne sin(5x) − sh(2x) = 5x + o(x) − 2x + o(x) = 3x + o(x) ∼ 3x .
IV
Relations de comparaison sur les suites
Nous allons maintenant généraliser au cas des suites les relations de comparaison étudiées sur les fonctions. Celles-ci sont destinées à faciliter l’étude du comportement asymptotique d’une suite. Cela revient en fait, à s’intéresser au comportement au voisinage de +∞ d’une fonction définie sur D = IN. Comme cet ensemble n’est pas un intervalle, on ne peut pas utiliser directement les résultats déjà obtenus, mais la généralisation ne pose pas de problème particulier. Nous ne donnerons donc pas systématiquement les démonstrations, laissant au lecteur le soin d’adapter celles qui ont été faites au début du chapitre. Dans toute cette section, les suites seront à valeurs dans IK = IR ou IK = C .
1
Définitions, caractérisations
Définition 3 Étant donné deux suites u et v , on dit que : • u est dominée par v s’il existe une suite w bornée et telle que un = vn wn à partir d’un certain rang ; on note alors un = O(vn ) ; • u est négligeable devant v s’il existe une suite ε tendant vers 0 et telle que un = vn εn à partir d’un certain rang ; on note alors un = o(vn ) ; • u est équivalente à v si un − vn = o(vn ) ; on note alors un ∼ vn . 541
Chapitre 14. Relations de comparaison Remarque Deux suites u et v sont donc équivalentes si, et seulement s’il existe une suite w tendant vers 1 et telle que un = vn wn à partir d’un certain rang. Les caractérisations suivantes donnent les moyens pratiques pour démontrer de telles relations. Proposition 19 Étant donné deux suites u et v , la suite v ne s’annulant pas à partir d’un certain rang : • un = O(vn ) si, et seulement si, uvnn est bornée ; • un = o(vn ) si, et seulement si, lim uvnn = 0 ; • un ∼ vn si, et seulement si, lim uvnn = 1 .
n → 1 , on a n + 1 ∼ n . n+1 Ex. 38. Deux suites ayant la même limite finie non nulle sont équivalentes.
Ex. 37. Comme
an · n! a = n+1 un . Comme
Ex. 39. Soit a ∈ IR ; posons un = On a ∀n ∈ IN
un+1
un rang n0 tel que |un+1 |
On en déduit |un |
|un0 |
2n−n0 n
1 2
a n+1
tend vers 0 lorsque n tend vers +∞ , il existe
|un | pour tout n n0 .
pour tout n n0 et donc que lim un = 0 .
Cela peut se réécrire a = o(n!) .
2
Propriétés
Résultats fondamentaux Proposition 20 La relation ∼ est une relation d’équivalence sur l’ensemble des suites. Les règles de calcul de la page 529 s’adaptent aisément au cas des suites. Proposition 21 Soit v une suite admettant une limite (finie ou infinie). Si u est une suite équivalente à v , alors u tend vers la même limite que v . Proposition 22 Soit u et v deux suites. Si u ∼ v , alors, à partir d’un certain rang, un et vn sont de même signe (strict).
Exo 14.9
La proposition 11 de la page 533 permettant d’obtenir un équivalent par encadrement se généralise sans problème au cas des suites. Proposition 23 Soit (un )n∈IN , (vn )n∈IN et (wn )n∈IN trois suites réelles telles que un vn wn à partir d’un certain rang. Si (un )n∈IN et (wn )n∈IN sont équivalentes à une même suite (zn )n∈IN , alors vn ∼ zn . 542
IV Relations de comparaison sur les suites Opérations sur les suites équivalentes Comme pour les fonctions, les équivalents sont compatibles avec le produit et le quotient. Proposition 24 Soit u , v , u′ et v ′ des suites. 1. Si u ∼ v et u′ ∼ v ′ , alors on a u × u′ ∼ v × v ′ .
2. Si u ∼ v et u′ ∼ v ′ , et si u′ et v ′ ne s’annulent pas à partir d’un certain rang, u v alors ′ ∼ ′ · u v
n(n − 1)(n − 2)(n − 3)(n − 4)(n − 5) n6 n = ∼ car, pour tout entier 6! 720 6 naturel fixé j , on a n − j ∼ n .
Ex. 40. On a
Attention Lorsque l’on effectue un produit d’équivalents, le nombre de facteurs considérés doit être fixe (il ne doit donc pas dépendre de n). Ainsi, la limite clas 1 n → e (obtenue par substitution à partir de l’exemple 30 de la page 539) sique 1+ n 1 n ∼ e , alors qu’une mise à la puissance peu scrupuleuse de nous dit que 1 + n 1 ∼ 1 aboutirait à un résultat faux. l’équivalent 1 + n
3
Substitution
Nous reprenons D et a vérifiant les hypothèses de la page 526.
Exo 14.10 Exo 14.11
Proposition 25 Soit f et g deux fonctions définies sur D et (un ) une suite à valeurs dans D telle que lim un = a. • Si f = O(g), alors f (un ) = O g(un ) . a
n→+∞
• Si f = o(g), alors f (un ) = o g(un ) . a
Exo 14.12
n→+∞
• Si f ∼ g , alors f (un ) a
∼
n→+∞
g(un ).
Démonstration page 545
On peut ainsi comparer facilement des suites en utilisant les propriétés correspondantes sur les fonctions. Ex. 41. Puisque cos(1/n) tend vers 1 lorsque n tend vers l’infini, on peut remplacer u par cos(1/n) dans l’équivalent ln u ∼ u − 1 , ce qui donne ln cos(1/n) ∼ cos(1/n) − 1 . u→1
De même, dans l’équivalent cos x − 1 ∼ −x2 /2 , on peut remplacer x par 1/n , ce qui donne x→0
finalement :
ln cos(1/n) ∼ cos(1/n) − 1 ∼ −
1 · 2n2
543
Chapitre 14. Relations de comparaison
Démonstrations Proposition 2 1. Le fait que ϕ soit bornée au voisinage de a s’écrit ϕ = O(1) . a
Si de plus on a f = O(ϕ) , alors, par transitivité, on a f = O(1) , ce qui signifie que f est a
2.
a
bornée au voisinage de a . Le fait que ϕ tende vers 0 en a s’écrit ϕ = o(1) . Si de plus on a f = O(ϕ) , alors on peut a
a
affirmer que f = o(1) , c’est-à-dire que f tend vers 0 en a . a
3.
De même, si f = o(ϕ) et ϕ = O(1) , alors on a f = o(1) . a
a
a
Proposition 3 La fonction f /ϕ est définie sur D \ {a} ou D suivant que ϕ est nulle ou non en a . 1. Si f est dominée par ϕ , alors on peut trouver une fonction u bornée au voisinage de a telle que f = ϕ u au voisinage de a . La fonction f /ϕ coïncide alors au voisinage de a avec la fonction u ; elle est donc également bornée au voisinage de a . Réciproquement, supposons f /ϕ bornée au voisinage de a et posons : u(x) =
f (x) ϕ(x)
si
x ∈ D \ {a} .
Si a ∈ D , il faut définir u(a) :
f (a) ; ϕ(a) • dans le cas où ϕ(a) = 0 , on a supposé f (a) = 0 . On peut prendre alors n’importe quelle valeur pour u(a) , par exemple u(a) = 1 . On a ainsi : ∀x ∈ D f (x) = ϕ(x) u(x) avec u bornée au voisinage de a , ce qui prouve que f est dominée par ϕ . 2. Si f est négligeable devant ϕ , alors on peut trouver une fonction ε tendant vers 0 telle que f = ϕ ε au voisinage de a . La fonction f /ϕ coïncide alors au voisinage de a avec la fonction ε , donc tend vers 0 en a . f Réciproquement, si lim = 0 , on peut poser : a ϕ •
si ϕ(a) �= 0 , on pose u(a) =
ε(x) =
f (x) ϕ(x)
si
x ∈ D \ {a}.
Si a ∈ D , on pose ε(a) = 0 .
Si ϕ(a) �= 0 , la fonction f /ϕ est définie en a et tend vers 0 en a . Donc elle est continue en a , ce qui donne f (a) = 0 = ε(a) ϕ(a) . • Dans le cas où ϕ(a) = 0 , on a supposé que f (a) = 0 et l’on a donc également f (a) = ε(a) ϕ(a) . On a alors : ∀x ∈ D f (x) = ϕ(x) ε(x) avec lim ε = 0
•
a
ce qui prouve que f est négligeable devant ϕ . Proposition 7 Dans ce qui suit, f , g et h désignent des fonctions définies sur D . Les relations d’équivalence écrites ci-dessous le sont au voisinage de a . Réflexivité. On a f − f = 0 = o(f ) .
544
Démonstrations Symétrie. Supposons f ∼ g . Alors, il existe une fonction u tendant vers 1 en a telle que f = g u au voisinage de a . Soit v la fonction définie sur D par : v(x) =
1 u(x)
si u(x) �= 0
et
v(x) = 1
sinon.
Comme u tend vers 1 en a , au voisinage de a elle ne s’annule pas et l’on a g = f v avec v qui tend vers 1 en a , d’où g ∼ f . Transitivité. Supposons f ∼ g et g ∼ h . Alors f − g = o(g) et g − h = o(h) . Or, le corollaire 6 de la page 531 donne g = O(h) , d’où f − g = o(h) puis f − h = (f − g) + (g − h) = o(h) .
Proposition 8 Posons h = f −g . Par hypothèse, si g(a) = 0 , alors f (a) = 0 et donc h(a) = 0 . La proposition 3 de la page 530 nous dit alors que h = o(g) si, et seulement si, hg = fg − 1 tend vers 0 , c’est-à-dire si, et seulement si,
Proposition 11
f g
tend vers 1 .
Au voisinage de a , on a :
g(x) − f (x) h(x) − f (x)
g(x) − f (x) = O h(x) − f (x) .
donc
Ainsi, si f (x) ∼ ϕ(x) ∼ h(x) , on a f (x) ∼ h(x) par transitivité, i.e. h(x) − f (x) = o f (x) .
On en déduit g(x) − f (x) = o f (x) , soit g(x) ∼ f (x) ∼ ϕ(x) . Proposition 15 1. Si, au voisinage de a , on a : f1 = g1 u1
f2 = g2 u2
avec
lim u1 = lim u2 = 1
f1 f2 = (g1 g2 ) (u1 u2 )
avec
lim u1 u2 = 1,
et
a
a
alors, au voisinage de a , on a : a
ce qui prouve que f1 f2 et g1 g2 sont équivalentes. 2. On a : f1 g1 f1 g2 ÷ = × · f2 g2 g1 f2 Or : f1 f2 lim = lim = 1. a g1 a g2 g1 f1 Ainsi, lim ÷ = 1 , ce qui conclut. a f2 g2 Proposition 17 Comme f ∼ g au voisinage de α , on peut trouver une fonction u définie sur D
l’ensemble de tendant vers 1 en α et telle que f = g × u au voisinage de α . Notons D
et véridéfinition de ϕ . Les trois fonctions f ◦ ϕ , g ◦ ϕ et u ◦ ϕ sont alors définies sur D fient f ◦ ϕ = (g ◦ ϕ) × (u ◦ ϕ) au voisinage de a . Comme ϕ −→ α et u −→ 1 , on a, par a
α
composition de limites, u ◦ ϕ −→ 1 , ce qui prouve l’équivalent souhaité. a
Proposition 25 • • •
Soit h une fonction définie sur D telle que f = gh au voisinage de a .
Si h est bornée au voisinage de a , alors h(un ) est bornée puisque un → a .
Si h tend vers 0 en a , alors h(un ) tend vers 0 par composition des limites.
Si h tend vers 1 en a , alors h(un ) tend vers 1 par composition des limites.
545
Chapitre 14. Relations de comparaison
S’entraîner et approfondir Cas des fonctions 14.1 Montrer que x2 sin →527
1 x
= o(x) .
x→0
14.2 Donner un équivalent, lorsque x tend vers +∞ , de →532
14.3 Donner un équivalent simple de →536
√ x3 − 2x2 + x + 3 .
(ex − 1)2 au voisinage de 0 . (1 + x)5 − 1
14.4 Soit f et g deux fonctions à valeurs strictement positives, tendant vers +∞ en a , et telles →538 que f ∼ g . Montrer qu’alors ln(f ) ∼ ln(g) . a
a
14.5 En exprimant cos t − 1 en fonction de sin →538
au voisinage de 0 .
x2 x→0 2
14.6 En partant de l’équivalent 1 − cos x ∼ →538
t , retrouver l’équivalent classique de cos t − 1 2
, trouver un équivalent en 0+ de Arccos(1 − h) .
14.7 Donner un équivalent en 0 de ch x − cos x . →541
14.8 Déterminer, à l’aide d’équivalents, les limites suivantes : √ x+3 √ ; 1. lim x (3 + x) √ x→0 x sin x 2.
lim
x→0
(1 − ex )(1 − cos x) ; 3x3 + 2x4 1
3. lim (1 + sin x) x . x→0
Cas des suites 14.9 1. Montrer que : →542
∀k ∈ IN∗
√ √ 1 1 √ k+1− k √ · 2 k+1 2 k
2. En déduire un équivalent simple de un =
n 1 k=1
√ · k
14.10 Trouver un équivalent simple de la suite définie par un = →543
√
n+2−
√ n + 1.
14.11 Trouver un équivalent simple de la suite définie par vn = e1/n − e1/(n+1) . →543
14.12 Trouver un équivalent simple de la suite définie par wn = →543
546
1+
1 − 1. ln(n + 1)
Exercices 14.13 La proposition suivante est-elle vraie ? Soit u et v deux suites ne s’annulant pas à partir d’un certain rang et équivalentes ; si v est monotone à partir d’un certain rang, alors u est monotone à partir d’un certain rang. 14.14 Comparer, à l’aide du symbole o , les quatre suites définies par : 2
un = n(ln n) ,
vn = (n2 )ln n ,
wn = (ln n)n ln n
et
zn = (n ln n)n .
14.15 Donner des équivalents simples lorsque n tend vers +∞ pour : 1. 2.
2
ln 1 + e−n en 1 + e−n
⋆ 14.16 Montrer que
n
·
n k=0
n1
k! ∼ n!
14.17 Trouver un équivalent de la suite (un ) définie par : n2 +n
∀n ∈ IN
∗
un =
k=n2 +1
2k − 1 · k
547
Chapitre 14. Relations de comparaison
Solutions des exercices 14.1 La fonction sin étant bornée, on a x sin
prouve que x2 sin
1 x
∀x ∈ IR∗
1 x
x2 sin
= o(x) .
−→ 0 et donc la relation :
x→0
1 x
= x × x sin
1 x
x→0
14.2 Lorsque x tend vers +∞ la quantité x3 − 2x2 + x + 3 est équivalente à x3 et ces deux expressions sont strictement positives au voisinage de +∞ . Donc, en utilisant l’exemple 9 de la page 532 : √ x3 − 2x2 + x + 3 ∼ x3 = x3/2 . 14.3 Comme ex − 1 ∼ x , on a (ex − 1)2 ∼ x2 ; de plus, (1 + x)5 − 1 ∼ 5x . x→0
x→0
x→0
Donc, au voisinage de 0 , on a :
(ex − 1)2 x2 x ∼ ∼ · 5 (1 + x) − 1 5x 5
f f . Or f et g sont équivalentes en a , donc ln tend g g vers 0 . Par ailleurs, ln(g) tend vers +∞ par composition avec ln . On en déduit la rela-
14.4 On a ln(f ) − ln(g) = ln
tion ln(f ) − ln(g) = o ln(g) . Ainsi, ln f ∼ ln g . 14.5 Pour t ∈ IR , on a :
a
cos(t) − 1 = cos 2 ×
t 2
Comme sin u ∼ u , on a, par substitution, sin u→0
cos(t) − 1 = −2 sin2
t 2
− 1 = −2 sin2
t 2
∼
t→0
∼ −2 ×
t→0
t . 2
t , puis, par produit : 2
t 2 2
=−
t2 · 2
14.6 La continuité de la fonction Arccos donne Arccos(1 − h) −→ Arccos(1) = 0 . On a donc : h→0
Arccos(1 − h)2 1 − cos Arccos(1 − h) ∼ 2
soit
Arccos(1 − h)2 ∼ 2h.
La positivité de Arccos donne alors, par passage à la racine, Arccos(1 − h) ∼ 14.7 Les équivalents ch x − 1 ∼
x2 2
ch x = 1 +
2
et cos x − 1 ∼ − x2 peuvent s’écrire :
x2 + o(x2 ) 2
et
ce qui donne ch x − cos x = x2 + o(x2 ) ∼ x2 .
548
cos x = 1 −
x2 + o(x2 ) 2
√
2h .
Solutions des exercices √ √ 14.8 1. Au voisinage de 0 , on a les équivalents 3 + x ∼ 3 et x + 3 ∼ 3 . Par ailleurs, de √ √ l’équivalent classique sin u ∼ u , on déduit par substitution que sin x ∼ x . Ainsi : u→0
√ √ √ x+3 3 √ ∼ x × 3 × √ √ = 3 3. x(3 + x) √ x sin x x x
√ La quantité étudiée a donc une limite quand x tend vers 0 , et cette limite vaut 3 3. 2. Par opérations sur les équivalents, on obtient : (−x) × (x2 /2) x3 1 (1 − ex )(1 − cos x) ∼ =− 3 =− · 3 4 3 3x + 2x 3x 6x 6 1 La quantité étudiée a donc une limite quand x tend vers 0 , et cette limite vaut − · 6 1 π 1 π x 3. Pour x ∈ − , 0 ∪ 0, , on a ln (1 + sin x) = ln(1 + sin x) . 2 2 x On a ln(1 + u) ∼ u et lim sin x = 0, donc, par substitution, ln(1 + sin x) ∼ sin x . u→0
x→0
1 sin x 1 ∼ 1. Il en résulte que lim ln (1 + sin x) x = 1 . Ainsi ln(1 + sin x) ∼ x→0 x x La quantité étudiée a donc une limite quand x tend vers 0 , et cette limite vaut e .
14.9 1. Soit k ∈ IN∗ . On a :
√ √ √ k k+1+ k 1 √ = √ √ · k+1+ k k+1+ k 1 l’encadrement : L’encadrement souhaité s’obtient alors en composant par x �→ x √ √ √ √ 0 < 2 k k + 1 + k 2 k + 1. √
√ k+1− k =
√
k+1− √
2. Soit n ∈ IN∗ . D’après la question précédente, on a : √ √ √ √ 1 ∀k ∈ [[2, n]] k + 1 − k √ k − k − 1. 2 k En additionnant ces n − 1 encadrements, il vient par télescopage : √
n+1−
n √ √ 1 √ n−1 2 2 k k=2
n √ √ √ 1 √ 2 n − 1. 2 n+1−2 2+1 k √ √ k=1
puis
∼2 n
∼2 n
√ Le théorème d’encadrement permet alors d’affirmer que un ∼ 2 n . 14.10 Pour n ∈ IN , on a, en multipliant en haut et en bas par la quantité conjuguée : (n + 2) − (n + 1) 1 √ √ = √ · un = √ n+2+ n+1 n+2+ n+1
On a alors (pour n ∈ IN∗ ) :
Comme 1+
2 2 n
+
1+
1 n
1 un = √ × 2 n 1+
2 2 n
+
1+
→ 1 , on en déduit que un ∼
1 n
·
1 √ · 2 n
549
Chapitre 14. Relations de comparaison 14.11 Pour n ∈ IN∗ , on a :
1
1
1
1
1
vn = e n+1 e n − n+1 − 1 = e n+1 e n(n+1) − 1 . Puisque
1 n(n+1)
→ 0 , on a :
1
e n(n+1) − 1 ∼ 1
1 1 ∼ 2· n(n + 1) n
1
Comme de plus on a e n+1 → 1 et donc e n+1 ∼ 1 , on obtient : 1 vn ∼ 2 · n 14.12 Lorsque x tend vers 0 , on a Comme
1 ln(n+1)
√
1 + x − 1 = (1 + x)1/2 − 1 ∼
x · 2
−→ 0 , on en déduit, par substitution :
n→+∞
wn ∼
1 1 ∼ , 2 ln(n + 1) 2 ln n
le dernier équivalent provenant du fait que ln(n + 1) − ln(n) = ln( n+1 ) tend vers 0 n lorsque n tend vers +∞ , donc est négligeable devant ln(n) qui tend vers +∞ , ce qui donne ln(n + 1) ∼ ln(n) . 14.13 La proposition est fausse. Par exemple, on a n+(−1)n ∼ n , mais la suite de terme général n est croissante tandis que la suite de terme général n + (−1)n n’est pas monotone à partir d’un certain rang. 14.14 Montrons que l’on a : vn = o(un ),
un = o(zn )
et
zn = o(wn ).
Commençons par transformer les expressions de un , vn , wn et zn en utilisant l’exponentielle. Pour n ∈ IN∗ , on a :
un = exp (ln n)3 ,
wn = exp n(ln n) ln(ln n)
et
vn = exp 2(ln n)2 ,
zn = exp n ln(n ln n) = exp n ln n + n ln(ln n) .
• Pour n ∈ IN∗ , on a : vn = exp 2(ln n)2 − (ln n)3 = exp (ln n)2 (2 − ln n) . un →−∞
vn Par composition de limites, on a donc → 0 , c’est-à-dire vn = o(un ) . un • Pour n ∈ IN∗ , on a :
(ln n)3 un − ln(n ln n) = exp (ln n)3 − n(ln(n ln n)) = exp n zn n
.
(⋆)
(ln n)3 → 0 . On obtient alors que : n (ln n)3 − ln(n ln n) → −∞. n n un → 0 , ce qui prouve Donc, d’après (⋆) et par composition de limites, on a zn que un = o(zn ) . Par croissances comparées, on a
550
Solutions des exercices • Pour n ∈ IN∗ , on a : zn = exp n ln n + n ln(ln n) − n(ln n) ln(ln n) wn = exp
ln 1 + e
1 1 + −1 n(ln n) ln(ln n) ln(ln n) ln n →+∞
→−1
zn → 0 , c’est-à-dire zn = o(wn ) . wn
On obtient finalement
14.15 1. Pour n 1 , on a
−n2
n1
= exp
2
1 ln n
ln 1 + e
−n2
.
.
Comme ln(1 + u) ∼ u et que e−n → 0 , on a, par subtitution : 0
2
ln 1 + e−n 2
2
2
∼ e−n
ce qui s’écrit aussi ln(1 + e−n ) = e−n 1 + o(1) . On a ainsi :
2
ln ln 1 + e−n
Ainsi :
2
= ln e−n 1 + o(1) 2
= ln(e−n ) + ln 1 + o(1) = −n2 + o(1).
→0
2 1 1 ln ln(1 + e−n ) = −n + o n n et, en passant à l’exponentielle :
exp
Conclusion. On a donc 2. On a :
2 1 ln ln(1 + e−n ) n
ln 1 + e
n1 −n2
en 1 + e−n
n
( n1 ) ∼ e−n . = e−n × eo →1
∼ e−n . 2
−n
= en × e−n ln(1+e
)
.
On a ln(1 + u) ∼ u et e−n → 0 , donc, par substitution, on a ln 1 + e−n
u→0
∼ e−n , puis
n ln 1 + e−n ∼ ne−n . Par croissances comparées, cette dernière expression tend vers 0 . On en déduit que : Conclusion. On a donc
−n
e−n ln(1+e n
e 1 + e−n
n
∼ e
2
n
)
→ 1.
.
551
Chapitre 14. Relations de comparaison 14.16 Pour n ∈ IN , posons un = Soit n 2 . On a :
n
k! .
k=0
n! un =
n−2 k=0
k! + (n − 1)! + n!
En majorant chacun des termes de la somme par le plus grand, on a : n−2 k=0
k! (n − 1) × (n − 2)! = (n − 1)!,
ce qui donne l’encadrement :
n! un 2(n − 1)! + n! ∼ n!,
puisqu’il est clair que (n − 1)! = o(n!) , et l’on conclut par encadrement : un ∼ n! . 14.17 Soit n ∈ IN∗ . Pour tout k ∈ [[n2 + 1, n2 + n]] , on a
2 1−
1 2n2
n
1 2n2
2k−1 k
=2 1−
Or, 1 −
1 2n2
n
,
n
.
2k − 1 1 2 1− k 2(n2 + n)
= exp (αn ) , avec αn = n ln 1 −
de (∗) est donc équivalent à 2n .
un 2n 1 − 1 2n2
2n2
1 + 2n
, donc :
(∗)
∼ n × (− 2n1 2 ) −→ 0 . Le minorant
De la même façon, un équivalent du majorant est également 2n . Par encadrement, on en déduit donc un ∼ 2n .
552
d’où, par produit d’inégalités entre des termes positifs : 2n 1 −
1 2k
n→+∞
Chapitre 15 : Analyse asymptotique : Développements limités
I
Généralités . . . . . . . . . . . . . . . . . . . . . . . . . Développement limité au voisinage d’un point . . . . . Développements limités en 0 . . . . . . . . . . . . . . Terme prépondérant et signe . . . . . . . . . . . . . . Continuité, dérivabilité . . . . . . . . . . . . . . . . . . Formule de Taylor-Young . . . . . . . . . . . . . . . . Développements limités usuels . . . . . . . . . . . . . Exemples de développement limité en un réel x0 . . . II Opérations sur les développements limités . . . . . . 1 Somme de développements limités . . . . . . . . . . . 2 Produit de développements limités . . . . . . . . . . . 3 Quotient de développements limités . . . . . . . . . . 4 Développements limités de fonctions composées . . . . III Applications des développements limités . . . . . . . 1 Recherche de limites et d’équivalents . . . . . . . . . . 2 Étude d’extrema . . . . . . . . . . . . . . . . . . . . . 3 Étude de l’allure d’une courbe au voisinage d’un point 4 Recherche d’asymptotes . . . . . . . . . . . . . . . . . IV Développements asymptotiques . . . . . . . . . . . . . 1 Exemples de développements asymptotiques . . . . . . 2 Formule de Stirling . . . . . . . . . . . . . . . . . . . . 3 Exemple d’une suite définie par une intégrale . . . . . 4 Développement asymptotique d’une réciproque . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3 4 5 6 7
. . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
554 554 555 558 558 560 562 564 564 565 566 570 574 578 578 580 580 581 582 582 584 585 585 588 592
Analyse asymptotique : Développements limités
15
Dans tout ce chapitre, x0 est un réel et n un entier naturel. Les fonctions considérées sont à valeurs dans IK , avec IK = IR ou IK = C . Si f désigne une telle fonction, nous notons Df l’ensemble de définition de f et nous supposons : • ou bien que Df est un intervalle de IR d’intérieur non vide et x0 intérieur à Df , ou l’une des extrémités de Df ; • ou bien Df désigne un tel intervalle privé de x0 .
I
Généralités
1
Développement limité au voisinage d’un point
Définition 1 On dit que f admet un développement limité à l’ordre n en x0 , s’il existe un (n + 1)-uplet (a0 , . . . , an ) ∈ IKn+1 et une fonction ε définie sur Df tels que : ∀x ∈ Df
f (x) =
n
k=0
ak (x − x0 )k + (x − x0 )n ε(x) avec
lim ε(x) = 0.
x→x0
(⋆)
Remarques • La relation (⋆ ) peut aussi s’écrire : f (x) −
n
k=0
ak (x − x0 )k = o (x − x0 )n . x→x0
Nous conviendrons d’écrire cette relation sous la forme : n f (x) = ak (x − x0 )k + o (x − x0 )n , k=0
x→x0
ou plus simplement, s’il n’y a pas d’ambiguïté sur le point x0 : f (x) =
n
k=0
ak (x − x0 )k + o (x − x0 )n .
(⋆⋆)
I Généralités Le résultat suivant est immédiat par substitution dans un o et permet, dans la pratique, de ne manipuler que des développements limités au voisinage de 0 . Proposition 1 La fonction f admet le développement limité à l’ordre n en x0 : f (x) =
n
k=0
ak (x − x0 )k +
o
x→x0
(x − x0 )n
si, et seulement si, la fonction h �→ f (x0 + h) admet le développement limité à l’ordre n en 0 : n ak hk + o (hn ). f (x0 + h) = h→0
k=0
Désormais, nous allons donc nous intéresser uniquement à des développements limités en 0 . La généralisation des résultats à un point x0 quelconque sera une conséquence immédiate de cette proposition.
2
Développements limités en 0
Ex. 1. La fonction f : ]−1, +∞[ −→ IR x �−→ 1 − x2 + 2x3 + x3 ln(1 + x) admet un développement limité à l’ordre 3 en 0 . En effet, comme ln(1 + x) −→ 0 , on a x3 ln(1 + x) = o(x3 ) , ce qui permet d’écrire : x→0
f (x) = 1 − x2 + 2x3 + o(x3 ).
Ex. 2. La fonction f : IR \ {1}
x
IR
−→
�−→
en 0 . En effet, pour n ∈ IN , on sait que :
1 1−x n
∀x ∈ IR \ {1}
admet un développement limité à tout ordre
xk =
k=0
ce qui s’écrit aussi :
1 − xn+1 , 1−x
n
k xn+1 1 x + = · 1−x 1−x
∀x ∈ IR \ {1} Comme
(⋆)
k=0
xn+1 x = xn × = o(xn ) , il vient de (⋆) que la fonction f admet un développement 1−x 1−x
−→ 0
x→0
limité à l’ordre n :
f (x) =
n
xk + o(xn ).
k=0
En substituant −x à x dans ce développement limité, on obtient : n
1 = (−1)k xk + o(xn ). 1+x k=0
En effet, si une fonction f vérifie f (x) = o(xn ) , on a f (−x) = o (−x)n = o(xn ) .
555
Chapitre 15. Développements limités 2
Ex. 3. La fonction x �→ e−1/x , définie sur IR∗ , possède un développement limité en 0 à tout ordre n ∈ IN (avec tous les coefficients a0 , . . . , an nuls). En effet, pour x ∈ IR∗ , on a :
n/2 1 1 1 −1/x2 exp − 2 · = 2 ne x
Par croissances comparées, on a t
x
n/2
e
−t
x
1 −1/x2 ne x→0 x
−→ 0 , donc, par substitution, lim
t→+∞
= 0,
2
ce qui peut s’écrire e−1/x = o(xn ) . x→0
Remarque Dans un développement limité à l’ordre n en 0 , on peut substituer x2 à x pour obtenir un développement limité à l’ordre 2n. On a ainsi, par exemple : n
1 = (−1)k x2k + o(x2n ). 1 + x2 k=0
Il en est de même pour de la substitution par xp , pour tout p ∈ IN∗ . Nous étudierons des cas de substitutions moins immédiates à la page 574. Proposition 2 (Unicité du développement limité) Soit f une fonction définie au voisinage de 0 . S’il existe (a0 , . . . , an ) et (b0 , . . . , bn ) dans IKn+1 vérifiant, au voisinage de 0 : f (x) =
n
ak xk + o(xn )
et
f (x) =
k=0
n
bk xk + o(xn ),
k=0
alors on a (a0 , . . . , an ) = (b0 , . . . , bn ).
Démonstration page 588 Si l’on suppose les deux listes distinctes, on considère le plus petit entier p tel que ap �= bp pour aboutir à une contradiction.
Principe de démonstration.
Définition 2 Si f possède un développement limité à l’ordre n en 0 de la forme : f (x) =
n
ak xk + o(xn ),
k=0
alors la fonction polynomiale x �→
n
ak xk s’appelle partie régulière du déve-
k=0
loppement limité de f à l’ordre n en 0 . Remarques • La proposition 1 de la page précédente permet immédiatement de voir que si une fonction f admet un développement limité à l’ordre n en x0 : f (x) =
n
k=0
ak (x − x0 )k + o (x − x0 )n
alors il y a unicité de tels coefficients ak . n La fonction polynomiale P : x �→ ak (x − x0 )k est appelée partie régulière k=0
du développement limité de f à l’ordre n en x0 . 556
I Généralités • Par abus de langage, on dit également parfois que P est le développement limité de f à l’ordre n en x0 . Ex. 4. Si une fonction f réelle admet, au voisinage de 0 , un développement limité, en tant n k n ak x + o(x ) , alors les coefficients ak sont réels
que fonction complexe, s’écrivant f (x) =
k=0
et donc f admet un développement limité à l’ordre n en tant que fonction réelle. En effet, partons de la relation f (x) =
n
ak xk + xn ε(x) , avec lim ε = 0 . 0
k=0 n
Comme ε(x) = ε(x) −→ 0 , on a x ε(x) = o(xn ) , donc (on rappelle que la variable x est x→0
réelle) :
f (x) = f (x) =
n
ak xk + xn ε(x) =
k=0
n
ak xk + o(xn ).
k=0
L’unicité du développement limité permet alors de conclure que ak = ak , pour tout k ∈ [[0, n]] .
Corollaire 3 Soit f une fonction admettant un développement limité à l’ordre n en 0 dont la n ak xk . partie régulière est P : x �→ k=0
• Si f est paire, alors P (x) n’est formée que de puissances paires de x.
• Si f est impaire, alors P (x) n’est formée que de puissances impaires de x.
Démonstration page 588 Écrire les développements limités des fonctions f et x �→ f (−x) , puis invoquer l’unicité du développement limité.
Principe de démonstration.
Proposition 4 (Troncature d’un développement limité) Si f est une fonction admettant un développement limité à l’ordre n en 0 , de n ak xk , alors f admet un développement limité en 0 à tout partie régulière x �→ k=0 p ordre p n, dont la partie régulière est x �→ ak xk . k=0
Démonstration.
C’est immédiat, car si f admet un développement limité à l’ordre n en 0
dont la partie régulière est x �→ f (x) =
n k=0
n
ak xk , alors, pour tout p n , on a :
k=0
ak xk + o(xn ) =
p k=0
ak xk + xp+1
n
k=p+1
ak xk−p−1 + o(xn ) .
=o(xp )
Notation Avec les notations de la proposition 4, on dit que la partie régulière du développement limité de f à l’ordre p s’obtient en tronquant à l’ordre p celle du développement de f à l’ordre n. On parle également de troncature à l’ordre p. 557
Chapitre 15. Développements limités
3
Terme prépondérant et signe
Proposition 5 Soit f possédant un développement limité à l’ordre n en 0 de la forme : f (x) =
n
ak xk + o(xn ),
k=0
dont la partie régulière n’est pas nulle. En notant p = min i ∈ [[0, n]] : ai �= 0 , on a f (x) ∼ ap xp . x→0
En particulier, si f est réelle, f (x) a le signe (strict) de ap xp au voisinage de 0 . Démonstration page 589
Terminologie Dans cette situation, le terme ap xp est appelé le terme prépondérant du développement limité. Remarque Même si f admet un développement limité à tout ordre, il se peut qu’aucun de ces développements n’ait de terme prépondérant. C’est le cas de la fonction x �→ exp(−1/x2 ) de l’exemple 3 de la page 556. Ex. 5. Soit f une fonction réelle définie au voisinage de 0 . Si, au voisinage de 0 , on a f (x) = x−x2 +2x3 +o(x3 ) , la fonction f est du signe de x �→ x au voisinage de 0 et f (x) − x est du signe de −x2 toujours au voisinage de 0 .
4
0
x f (x) f (x) − x
− −
0 0
+ −
Continuité, dérivabilité
Développement limité à l’ordre 0 Proposition 6 Une fonction f admet un développement limité à l’ordre 0 en 0 si, et seulement si, elle admet une limite finie en 0 ; en notant alors ℓ = lim f , on a : 0
f (x) = ℓ + o(1). Démonstration page 589
Principe de démonstration.
Poser ε(x) = f (x) − ℓ .
Développement limité à l’ordre 1 Proposition 7 Soit f une fonction définie en 0 . Alors, f est dérivable en 0 si, et seulement si, f admet un développement limité à l’ordre 1 en 0 . Ce développement limité est alors f (x) = f (0) + f ′ (0)x + o(x). Démonstration page 589
Par substitution, on obtient le même résultat en un point x0 quelconque. 558
I Généralités Point méthode Lorsque l’on a pu obtenir, pour une fonction f définie en x0 ∈ IR, un développement limité de la forme : alors on peut affirmer :
f (x) = a0 + a1 (x − x0 ) + o(x − x0 ),
• d’une part, que f est dérivable en x0 ;
• d’autre part, que f (x0 ) = a0 et f ′ (x0 ) = a1 .
Remarque Si la fonction f possédant un tel développement limité n’est pas définie en x0 , on peut la prolonger par continuité en posant f (x0 ) = a0 . La fonction ainsi prolongé est alors dérivable en x0 , avec une dérivée en x0 qui vaut a1 . Ex. 6. L’équivalent ch x − 1 ∼ 0
x2 (cf. page 536) permet d’obtenir, pour x �= 0 : 2 x ch x − 1 = + o(x). x 2
ch x − 1 se prolonge sur IR en une fonction f dérivable en 0 telle x ′ que f (0) = 0 et f (0) = 1/2 . Donc la fonction x �→
Attention Les propositions 6 et 7 de la page précédente ne se généralisent pas à des ordres plus grands. Ainsi, une fonction définie en 0 peut admettre un développement limité à l’ordre 2 en 0 sans pour autant être deux fois dérivable en 0 . Ex. 7. Soit f la fonction définie sur IR par : f (x) = x + x3 sin
1 x2
si x ∈ IR∗
f (0) = 0.
et
• Comme la fonction sin est bornée, il est clair que l’on a : x + x3 sin
1 x2
= x + x2 x sin
1 x2
−→ 0
x→0
= x + o(x2 ).
Comme de plus f (0) = 0 , on en déduit que f possède le développement limité à l’ordre 2 en 0 suivant : f (x) = x + o(x2 ). • Le développement limité à l’ordre 2 de f en 0 obtenu précédemment : ∗ nous assure de l’existence d’un développement à l’ordre 1 pour f , et donc de la dérivabilité de f en 0 ; ∗ nous donne f ′ (0) = 1 (coefficient devant le terme de degré 1 ). D’autre part, d’après les théorèmes généraux, f est dérivable sur IR∗ et : ∀x ∈ IR∗
f ′ (x) = 1 + 3x2 sin
1 x2
− 2 cos
1 x2
.
559
Chapitre 15. Développements limités • Comme la fonction sin est bornée, on a facilement 1 + 3x2 sin
1 x2
−→ 1 , tandis que la
x→0
1 n’admet pas de limite en 0 . Ainsi la restriction de f ′ à IR∗ n’a pas x2 de limite en 0 , et donc f ′ non plus. Comme f ′ n’est pas continue, la fonction f n’est pas deux fois dérivable en 0 . fonction x �→ cos
5
Formule de Taylor-Young
Obtention de développements limités par primitivation Proposition 8 Soit I un intervalle d’intérieur non vide contenant 0 et f une fonction continue sur I possédant un développement limité à l’ordre n en 0 , de partie régun lière x �→ ak xk . Si F est une primitive de f sur I , alors F admet un dévelopk=0
pement limité à l’ordre n + 1 en 0 dont la partie régulière est : x �→ F (0) +
n ak xk+1 . k+1 k=0
Démonstration page 589
Principe de démonstration.
Commencer par traiter le cas où f (x) = o(xn ) et où F est la primitive de f qui s’annule en 0 .
Remarque Le résultat précédent s’énonce également ainsi : si f est une fonction de classe C 1 sur I , et si sa dérivée f ′ admet un développement limité à l’ordre n n ak xk , alors f admet un développement limité à en 0 de partie régulière x �→ k=0
l’ordre n + 1 en 0 , de partie régulière x �→ f (0) +
n
ak k+1 x . k +1 k=0
Ex. 8. Développement limité de la fonction tan à l’ordre 3 en 0 On connaît un équivalent de la fonction tan en 0 : tan x ∼ x .
Il en résulte que tan2 x ∼ x2 , c’est-à-dire tan2 x = x2 + o(x2 ) .
La relation tan′ x = 1 + tan2 x nous donne alors le développement limité à l’ordre 2 en 0 de la dérivée de la fonction tan : tan′ x = 1 + x2 + o(x2 ). Il en résulte, par primitivation, que la fonction tan admet le développement limité suivant à l’ordre 3 en 0 : x3 + o(x3 ), tan x = tan(0) + x + 3 c’est-à-dire, comme tan(0) = 0 : tan x = x +
560
x3 + o(x3 ). 3
I Généralités Ex. 9. Développement limité en 0 de la fonction x �→ ln(1 + x) Pour n 1 , en primitivant le développement limité à l’ordre n − 1 en 0 de x �→
1 : 1+x
1 = 1 − x + x2 + · · · + (−1)n−1 xn−1 + o(xn−1 ), 1+x on obtient rapidement celui de la fonction x �→ ln(1 + x) à l’ordre n : ln(1 + x) = ln(1) + x −
x3 xn x2 + + · · · + (−1)n−1 + o(xn ), 2 3 n
ce qui, comme ln(1) = 0 , donne : x2 x3 xn + + · · · + (−1)n−1 + o(xn ) 2 3 n
ln(1 + x) = x − =
n
(−1)k−1
k=1
xk + o(xn ). k
Ex. 10. Développement limité en 0 de la fonction Arctan Soit n ∈ IN . En partant du développement limité :
1 = 1 − u + u2 − · · · + (−1)n un + o(un ), 1+u
et en substituant x2 à u , on obtient : Arctan′ (x) =
1 = 1 − x2 + x4 − · · · + (−1)n x2n + o(x2n ). 1 + x2
On obtient donc le développement limité de Arctan à l’ordre 2n + 1 en 0 en primitivant le développement limité précédent : Arctan(x) = Arctan(0) + x −
x3 x5 x2n+1 + − · · · + (−1)n + o(x2n+1 ). 3 5 2n + 1
Comme Arctan(0) = 0, on obtient : Arctan(x) = x −
x5 x2n+1 x3 + − · · · + (−1)n + o(x2n+1 ). 3 5 2n + 1
Attention Pour une fonction f dérivable, l’existence d’un développement limité à l’ordre n pour f n’implique pas l’existence d’un développement limité à l’ordre n − 1 pour f ′ . Ex. 11. La fonction f de l’exemple 7 de la page 559 admet un développement limité à l’ordre 2 au voisinage de 0 : f (x) = x + o(x2 ) . Mais comme f ′ n’a pas de limite en 0 , elle n’admet de développement limité à aucun ordre en 0 . Remarque Dans cet exemple, ϕ(x) = f (x) − x est négligeable devant x2 , mais ϕ′ (x) n’est pas négligeable devant 2x , et ne tend même pas vers 0 . En physique, cela traduit le fait qu’un signal de faible amplitude peut présenter néanmoins des variations rapides.
561
Chapitre 15. Développements limités Proposition 9 (Formule de Taylor-Young à l’ordre n en 0 ) Soit n ∈ IN. Si f est de classe C n sur un intervalle I contenant 0 et d’intérieur non vide, alors elle admet un développement limité à l’ordre n en 0 qui s’écrit : f (x) =
n f (k) (0)
k!
k=0
Principe de démonstration.
xk + o(xn ).
Procéder par récurrence sur n .
Démonstration page 590
Ex. 12. Pour tout n ∈ IN , la fonction exp est de classe C n sur IR . On peut donc appliquer la
formule de Taylor-Young à l’ordre n en 0 . Le calcul de la valeur des dérivées successives en 0 donne : ∀k ∈ [[0, n]] exp(k) (0) = 1.
Donc, la formule de Taylor-Young nous donne : ex =
n xk k=0
ou encore : ex = 1 + x +
k!
+ o(xn ),
x3 xn x2 + + ··· + + o(xn ). 2! 3! n!
Théorème 10 (Formule de Taylor-Young à l’ordre n en x0 ) Si f est de classe C n sur un intervalle I contenant x0 et d’intérieur non vide, alors elle admet un développement limité à l’ordre n en x0 qui s’écrit : f (x) =
n f (k) (x0 ) k=0
k!
(x − x0 )k + o (x − x0 )n .
Démonstration. On applique la formule de Taylor-Young en 0 à h �→ f (x0 + h) . Remarques • La formule de Taylor-Young a d’abord un intérêt théorique, car elle garantit l’existence d’un développement limité. • Elle n’est utile pour expliciter le développement limité sur un exemple concret que si les dérivées successives sont faciles à calculer, ce qui est rare.
6
Développements limités usuels
Cette partie est destinée à établir des développements limités en 0 , à un ordre n quelconque, de fonctions usuelles. Tout d’abord, on a déjà obtenu le développement limité à l’ordre n en 0 des fonc1 1 tions x �→ et x �→ (cf. exemple 2 de la page 555) : 1−x 1+x n
1 = xk + o(xn ) = 1 + x + · · · + xn + o(xn ) 1−x k=0 n
1 = (−1)k xk + o(xn ) = 1 − x + x2 + · · · + (−1)n xn + o(xn ) 1+x k=0
(on peut déduire l’un de l’autre en remplaçant x par −x). 562
I Généralités Obtention de développements limités par la formule de Taylor-Young Les fonctions élémentaires suivantes étant de classe C ∞ au voisinage de 0 , la formule de Taylor-Young nous assure qu’elles possèdent chacune un développement limité à tout ordre en 0 , que l’on peut obtenir en déterminant les valeurs en 0 de leurs dérivées successives, comme pour la fonction exponentielle (exemple 12 de la page ci-contre). • Les fonctions exponentielles et hyperboliques : ex =
n xk k=0
ch x =
k!
+ o(xn ) = 1 + x +
xn x2 + ··· + + o(xn ) 2! n!
n x4 x2n x2 x2k + o(x2n+1 ) = 1 + + + ··· + + o(x2n+1 ) (2k)! 2! 4! (2n)! k=0
sh x =
n x5 x2n+1 x3 x2k+1 + o(x2n+2 ) = x + + + ··· + + o(x2n+2 ) (2k + 1)! 3! 5! (2n + 1)! k=0
• Les fonctions trigonométriques : cos x =
n (−1)k x2k k=0
sin x =
(2k)!
+ o(x2n+1 ) = 1 −
n (−1)k x2k+1 k=0
(2k + 1)!
x2 x2n + · · · + (−1)n + o(x2n+1 ) 2! (2n)!
+ o(x2n+2 ) = x −
x3 x2n+1 + · · · + (−1)n + o(x2n+2 ) 3! (2n + 1)!
• Pour α réel quelconque, la fonction x �→ (1 + x)α : (1 + x)α = 1 + αx + Exo 15.1
α(α − 1) 2 α(α − 1)(α − 2) 3 x + x + ··· 2! 3! α(α − 1)(α − 2) · · · (α − (n − 1)) n x + o(xn ) + n!
Ex. 13. Appliquons la formule précédente avec α = à l’ordre 3 en 0 de la fonction x �→ √
√ 1+x :
1 , afin d’obtenir le développement limité 2
1 + x = (1 + x)1/2 =1+
ce qui donne
√
1 1 x+ 2 2!
1+x=1+
1 1 2
2
− 1 x2 +
1 3!
1 1 2
1 1 3 1 x − x2 + x + o(x3 ) . 2 8 16
2
1
−1
2
− 2 x3 + o(x3 ),
563
Chapitre 15. Développements limités Approfondissement : coefficient binomial généralisé Dans le cas où α ∈ IN, les coefficients de la partie régulière du développement limité α , de la fonction x �→ (1 + x)α ne sont rien d’autre que les coefficients binomiaux k ce qui est cohérent avec la formule du binôme. α Il arrive que l’on étende ainsi la notation pour un réel α quelconque : k α(α − 1) · · · (α − k + 1) α = · k k! Avec cette notation, le développement limité de x �→ (1 + x)α s’écrit : n α k (1 + x) = x + o(xn ) k α
k=0
ce qui lui donne une forme particulièrement sympathique et facile à retenir.
7 Exo 15.2 Exo 15.3
Exemples de développement limité en un réel x0 Point méthode Lorsque l’on cherche le développement limité d’une fonction en un point x0 , on se ramène de manière quasi-systématique à effectuer un développement limité en 0 , en considérant la fonction h �→ f (x0 + h).
1 · x ∗ Tout d’abord, il est clair que f est définie sur IR et donc définie au voisinage de 1 . Le développement limité à l’ordre 3 en 0 de la fonction h �→ f (1 + h) s’écrit : 1 = 1 − h + h2 − h3 + o(h3 ). f (1 + h) = 1+h On en déduit le développement limité à l’ordre 3 en 1 de f :
Ex. 14. Donnons un développement limité à l’ordre 3 en 1 de la fonction f : x �→
f (x) = 1 − (x − 1) + (x − 1)2 − (x − 1)3 + o (x − 1)3 .
II
Opérations sur les développements limités
L’utilisation de la formule de Taylor-Young n’est pas en général la meilleure méthode pour calculer effectivement le développement limité d’une fonction f , car elle suppose l’existence des dérivées successives de f et nécessite leur calcul (souvent pénible). Quant à la méthode de primitivation, elle est efficace lorsqu’elle peut s’appliquer, mais cela concerne des cas bien particuliers. On préfère le plus souvent utiliser les résultats que l’on va établir dans cette partie, qui permettent d’obtenir des développements limités par somme, produit, quotient ou encore composition d’autres développements limités.
564
II Opérations sur les développements limités
1 Exo 15.4 Exo 15.5
Somme de développements limités
Proposition 11 Si f et g sont deux fonctions définies sur un même ensemble D et admettent chacune un développement limité à l’ordre n en 0 , alors il en est de même pour la fonction f + g . Démonstration.
C’est immédiat, car si les développements limités de f et g s’écrivent : f (x) = P (x) + o(xn )
alors on a :
et
g(x) = Q(x) + o(xn ),
f (x) + g(x) = P (x) + o(xn ) + Q(x) + o(xn ) = P (x) + Q(x) + o(xn ) + o(xn ).
de degré au plus n
=o(xn )
Remarques • On constate dans la démonstration précédente que la partie régulière du développement limité de f + g s’obtient simplement en additionnant les parties régulières des développements limités de f et g . • Soit (λ, µ) ∈ IK2 . Si f et g sont deux fonctions admettant des développements limités à l’ordre n en 0 , alors il est clair qu’il en est de même pour les fonctions x �→ λf (x) et x �→ µg(x), et donc également, d’après la proposition précédente, pour la combinaison linéaire x �→ λf (x) + µg(x). Ex. 15. Les développements limités à l’ordre 4 en 0 des fonctions sin et cos s’écrivent : sin x = x −
x3 + o(x4 ) 6
et
cos x = 1 −
x4 x2 + + o(x4 ). 2 24
Le développement limité de leur somme à l’ordre 4 en 0 est donc : sin x + cos x = 1 + x −
x3 x4 x2 − + + o(x4 ). 2 6 24
Ex. 16. Retrouvons, à partir du développement limité à l’ordre 2n en 0 de la fonction exp , les développements limités à l’ordre 2n en 0 des fonctions ch et sh . On a : x3 x2n−1 x2n x2 + + ··· + + + o(x2n ) ex = 1 + x + 2 6 (2n − 1)! (2n)! e−x = 1 − x + On retrouve alors :
x2 x3 x2n−1 x2n − + ··· − + + o(x2n ). 2 6 (2n − 1)! (2n)!
ch(x) =
x2 x2n ex + e−x =1+ + ··· + + o(x2n ) 2 2 (2n)!
sh(x) =
x3 x2n−1 ex − e−x =x+ +··· + + o(x2n ). 2 6 (2n − 1)!
565
Chapitre 15. Développements limités
2
Produit de développements limités
Proposition 12 Si f et g sont deux fonctions de D dans IK admettant chacune un développement limité à l’ordre n en 0 , alors il en est de même pour la fonction f × g . Démonstration. Supposons que f et g possèdent des développements limités qui s’écrivent : f (x) = P (x) + xn ε(x)
g(x) = Q(x) + xn η(x),
et
les deux fonctions ε et η tendant vers 0 en 0 . En développant le produit f (x)g(x) , il vient :
f (x)g(x) = P (x)Q(x) + xn P (x)η(x) + Q(x) ε(x) + xn ε(x) η(x) . Comme les fonctions polynomiales P et Q sont continues donc bornées au voisinage de 0 , on a lim P (x)η(x) = lim Q(x)ε(x) = 0 et donc finalement : x→0
x→0
f (x)g(x) = P (x)Q(x) + o(xn ). Soit R la fonction polynomiale obtenue en tronquant à l’ordre n le produit P Q . Alors, R est une fonction polynomiale, de degré au plus n , qui vérifie P (x)Q(x) = R(x)+o(xn) . Il en résulte que : f (x)g(x) = R(x) + o(xn ), ce qui est le développement limité à l’ordre n en 0 de la fonction f × g .
Remarques • La démonstration précédente nous indique que la partie régulière du développement limité de f × g s’obtient en tronquant à l’ordre n le produit des parties régulières des développements limités de f et g . Autrement dit, et en reprenant les notations de la démonstration, R(x) est obtenue, à partir de l’expression polynomiale P (x)Q(x), en ne conservant que les termes de degré au plus n. • Dans la pratique, pour obtenir le développement limité d’un produit, on pourra procéder de la façon suivante, sans avoir à introduire les fonctions ε et η . Supposons que f et g possèdent des développements limités qui s’écrivent : f (x) = P (x) + o(xn )
g(x) = Q(x) + o(xn ).
et
Il vient : f (x)g(x) = P (x)Q(x) + P (x)o(xn ) + Q(x)o(xn ) + o(x2n ) . =o(xn )
Ex. 17. Déterminons le développement limité à l’ordre 3 en 0 de la fonction : f : x �→
ex · 1−x
La fonction f apparaît comme le produit des fonctions x �→ les développements limités à l’ordre 3 en 0 suivants : 1 = 1 + x + x2 + x3 + o(x3 ) 1−x
566
et
1 et x �→ ex , qui admettent 1−x
ex = 1 + x +
x3 x2 + + o(x3 ). 2 6
II Opérations sur les développements limités Il en résulte que :
f (x) = 1 + x + x2 + x3 + o(x3 ) ce qui donne, en développant et en simplifiant : f (x) = 1 + (x + x) +
x2
+ x2 + x2 +
2 5 2 8 3 = 1 + 2x + x + x + o(x3 ). 2 3
Exo 15.6
1+x+
x3 6
+
x3 x2 + + o(x3 ) , 2 6
x3 + x3 + x3 + o(x3 ) 2
Point méthode Comme on l’a fait dans l’exemple précédent, lorsque l’on effectue un produit de développements limités, on écrit les différents termes en les ordonnant par puissances croissantes et en s’arrêtant à l’ordre adéquat. Par récurrence, on déduit de la proposition 12 le résultat suivant. Corollaire 13 Soit p ∈ IN. Si f est une fonction admettant un développement limité à l’ordre n en 0 , alors il en est de même pour la fonction x �→ f (x)p . Démonstration. C’est une récurrence immédiate, car le résultat est évidemment vrai si p = 0 , et si on le suppose vrai pour un certain p ∈ IN , alors en écrivant f (x)p+1 = f (x)f (x)p , il suffit d’appliquer la proposition 12 de la page précédente aux fonctions f et f p . Optimisation des ordres de précision D’après la proposition 12 de la page ci-contre, lorsque l’on cherche le développement limité à l’ordre n d’une fonction de la forme f ×g , il peut sembler nécessaire d’effectuer les développements limités de f et g à l’ordre n. En réalité, il arrive qu’il ne soit pas nécessaire de « pousser » les développements limités de f et g à l’ordre n, mais que l’on puisse se contenter d’un ordre plus petit. Commençons par un exemple. Ex. 18. Développement limité à l’ordre 2 en 0 de la fonction x �→ ex ln(1 + x) .
• Méthode non optimale. Si l’on écrit les développements limités à l’ordre 2 des fonctions x �→ ex et x �→ ln(1 + x) : ex = 1 + x +
x2 + o(x2 ) 2
et
ln(1 + x) = x −
x2 + o(x2 ), 2
alors en effectuant le produit, puis en développant et simplifiant, on obtient le résultat :
ex ln(1 + x) = 1 + x +
x2 + o(x2 ) 2
x−
x2 x2 + o(x2 ) = x + + o(x2 ). 2 2
567
Chapitre 15. Développements limités Cependant, dans le calcul précédent, on constate que, compte tenu du fait que l’on souhaite x2 obtenir un développement à l’ordre 2 , on a écrit un terme inutile. Il s’agit du terme 2 apparaissant dans le premier facteur :
1+x+
x2 + o(x2 ) 2
x−
x2 + o(x2 ) . 2
En effet, lors du développement de l’expression, ce terme donne naissance aux trois nouveaux x3 x4 x2 termes , − et o(x2 ) , qui sont tous négligeables devant x2 . 2 4 2 • Optimisation du calcul. En fait, ici, on peut se contenter d’écrire le développement limité à l’ordre 1 de la fonction x �→ ex pour mener à bien le calcul. En effet, lorsque l’on écrit :
ex ln(1 + x) = 1 + x + o(x)
x−
x2 + o(x2 ) , 2
les deux termes qui limitent la précision du calcul sont :
∗ le o(x) du premier facteur, qui va être multiplié, « au minimum », par x , et donc qui va donner un terme en o(x2 ) ; ∗ le o(x2 ) du deuxième facteur (qui va être multiplié, « au minimum », par 1 ).
On obtient donc bien la précision en o(x2 ) souhaitée :
x2
ex ln(1 + x) = x + −
2
+ x2 + o(x2 ) = x +
x2 + o(x2 ). 2
Remarque Il faut bien comprendre que, dans l’exemple précédent, c’est l’absence de terme constant dans le développement limité de x �→ ln(1 + x) qui permet de se contenter d’un ordre 1 pour le développement limité de l’autre facteur x �→ ex . En effet, en développant le produit, chaque terme du développement limité de x �→ ex , et donc en particulier le terme o(x), est multiplié par des termes polynomiaux dont l’exposant vaut au moins 1 , ce qui entraîne ce « gain » d’un degré de précision. Point méthode Dans un produit de développements limités, la factorisation par le terme prépondérant de chacun des facteurs (s’ils existent) permet de prévoir facilement l’ordre auquel les écrire pour obtenir le résultat souhaité. Ex. 19. Développement limité de tan à l’ordre 5 en 0 . Nous allons utiliser la relation tan′ = 1+tan2 pour trouver le développement limité à l’ordre 5 de la fonction tan . Par primitivation, il suffit donc de connaître le développement limité à l’ordre 4 de sa dérivée, donc de tan2 . Factorisons par son terme prépondérant le développement limité de tan :
tan x = x 1 + · · · + o(· · · )
et donc
(tan x)2 = x2 1 + · · · + o(· · · )
1 + · · · + o(· · · ) .
Nous constatons qu’il suffit d’écrire les deux parenthèses avec un reste en o(x2 ) pour avoir un résultat en x2 o(x2 ) = o(x4 ) .
568
II Opérations sur les développements limités Il convient donc de partir du développement à l’ordre 3 de la fonction tan : tan x = x +
x3 x2 + o(x3 ) = x 1 + + o(x2 ) . 3 3
Il en résulte que :
tan2 x = x2 1 +
x2 + o(x2 ) 3
2
= x2 1 +
2x2 2x4 + o(x2 ) = x2 + + o(x4 ) 3 3
et l’on obtient : tan′ x = 1 + tan2 x = 1 + x2 +
2x4 + o(x4 ). 3
Par primitivation, et comme tan 0 = 0 , on obtient le développement limité de la fonction tan à l’ordre 5 en 0 : 2x5 x3 + + o(x5 ). tan x = x + 3 15 Remarque La fonction tan étant impaire, on obtient, sans effort supplémentaire, son développement à l’ordre 6 en 0 (qui existe par la formule de Taylor-Young puisque la fonction est de classe C ∞ ), le terme en x6 étant nul.
Exo 15.7
Point méthode Dans un produit de développements limités, le terme prépondérant de chacun des facteurs (s’il existe) permet de prévoir facilement l’ordre auquel écrire l’autre facteur pour obtenir le résultat souhaité. Ex. 20. Déterminons le développement limité à l’ordre 6 en 0 de la fonction :
f : x �→ ln(1 + x) − x + Prévision des ordres
x2 cos x − 1 . 2
Le premier terme non nul dans le développement limité en 0 de ln(1 + x) − x + dont l’exposant vaut 3 .
x2 2
est
x3 3
,
De même, le premier terme non nul dans le développement limité en 0 de la fonction 2
x �→ cos x − 1 est − x2 , dont l’exposant vaut 2 . Écrivons donc : f (x) =
x3 + · · · + o(xp ) 3
−
x2 + · · · + o(xq ) 2
= · · · + o(q + 3) + o(p + 2).
Donc, pour obtenir le développement de f à l’ordre 6 , il suffit d’avoir p + 2 = q + 3 = 6 , c’est-à-dire de faire les développements limités : • de la fonction x �→ ln(1 + x) − x +
x2 2
à l’ordre p = 6 − 2 = 4 ,
• de la fonction x �→ cos x − 1 à l’ordre q = 6 − 3 = 3 .
569
Chapitre 15. Développements limités Calcul effectif. On a : ln(1 + x) − x +
x3 x4 x2 = − + o(x4 ) 2 3 4
x2 + o(x3 ), 2
et
cos x − 1 = −
et
cos x − 1 = x2 −
ce qui s’écrit, après factorisation : ln(1 + x) − x +
x 1 x2 = x3 − + o(x) 2 3 4
On a donc : f (x) = x5
3
x 1 − + o(x) 3 4
−
1 + o(x) 2
1 1 x5 x x6 + o(x) = x5 − + + o(x) = − + + o(x6 ). 2 6 8 6 8
Quotient de développements limités
Développement limité de
1 1−u
Proposition 14 Soit u une fonction telle que lim u = 0 . Si u admet un développement limité à 0
1 admet un développement limité à 1 − u(x) l’ordre n en 0 , dont la partie régulière est la même que celle du développement n limité à l’ordre n en 0 de la fonction x �→ u(x)k . l’ordre n en 0 , alors la fonction x �→
k=0
Démonstration page 591
Exo 15.8
Point méthode La proposition 14 nous dit que pour déterminer le développement 1 , où u est une fonction qui tend vers 0 , il suffit de déterminer celui limité de 1−u n de la fonction uk , qui s’obtient, par sommes et produits de développements k=0
limités, à partir du développement limité à l’ordre n en 0 de la fonction u .
1 · 1 − ln(1 + x) La fonction x �→ ln(1 + x) tend vers 0 en 0 , et possède un développement limité à l’ordre 3 en 0 . Donc, d’après la proposition 14, la fonction f possède un développement limité à l’ordre 3 en 0 , qui a même partie régulière que celui de la fonction :
Ex. 21. Déterminons le développement limité à l’ordre 3 en 0 de f : x �→
x �→ 1 + ln(1 + x) + ln(1 + x)2 + ln(1 + x)3 . On a :
x3 x2 x x2 + + o(x3 ) = x 1 − + + o(x2 ) , ln(1 + x) = x − 2 3 2 3 puis :
ln(1 + x)2 = x2 1 − x + o(x) = x2 − x3 + o(x3 )
570
et
ln(1 + x)3 = x3 + o(x3 ).
II Opérations sur les développements limités Il en résulte que :
f (x) = 1 + x + − =1+x+
x2 + x2 + 2
x3 − x3 + x3 + o(x3 ) 3
x3 x2 + + o(x3 ). 2 3
Développement limité d’un quotient Proposition 15 Soit f et g deux fonctions de D dans IK admettant chacune un développement f admet limité à l’ordre n en 0 . Si g a une limite non nulle en 0 , alors la fonction g un développement limité à l’ordre n en 0 . Démonstration.
La fonction g admettant une limite non nulle en 0 , elle ne s’annule pas au f est bien définie au voisinage de 0 . voisinage de 0 , ce qui assure que la fonction g Posons ℓ = lim g . Au voisinage de 0 , on peut écrire : 0
f (x) 1 f (x) = × g(x) ℓ 1− 1−
g(x) ℓ
(⋆)
·
g(x) · Alors, u admet un développement limité à l’ordre n en 0 ℓ 1 admet et lim u = 0 . La proposition 14 de la page précédente donne alors que la fonction 0 1−u un développement limité à l’ordre n en 0 . Notons u la fonction x �→ 1 −
f admet un développement limité à l’ordre n en 0 , g comme produit de fonctions admettant chacune un développement limité à l’ordre n en 0 .
Par suite, d’après la relation (⋆) , la fonction
Point méthode Conformément à la démonstration précédente, pour déterminer un développement limité d’un quotient f /g , où g a une limite finie non nulle ℓ , on met en facteur ℓ au dénominateur de façon à l’écrire g(x) = ℓ 1 − u(x) , où u tend vers 0 .
Ex. 22. Déterminons le développement limité à l’ordre 3 en 0 de x �→
1 · 1 + ex
On voit facilement que le dénominateur 1 + ex tend vers 2 quand x tend vers 0 . Écrivons : 1 1 = × 1 + ex 2 En notant u la fonction x �→
1 1+ex 2
=
1 1 × 2 1− 1−
1+ex 2
=
1 1 x · × 2 1 − 1−e 2
1 1 1 1 − ex , on a donc · = × 2 1 + ex 2 1 − u(x)
571
Chapitre 15. Développements limités Étant donné que lim u = 0 et que la fonction u admet un développement limité à l’ordre 3 0
1 admet un développement 1−u limité à l’ordre 3, de même partie régulière que celui de la fonction 1 + u + u2 + u3 . De plus, on x x2 x3 a u(x) = − − − + o(x3 ) , puis, après calculs : 2 4 12 en 0 , la proposition 14 de la page 570 nous assure que la fonction
u(x)2 =
x3 x2 + + o(x3 ) 4 4
et
u(x)3 = −
x3 + o(x3 ). 8
Il en résulte que :
1 x x2 x2 =1− + − + 1 − u(x) 2 4 4 =1−
x x3 + + o(x3 ), 2 24
+ −
x3 x3 x3 + − 12 4 8
+ o(x3 )
ce qui donne : 1 x x3 1 + o(x3 ). = − + x 1+e 2 4 48 1 sh = sh × · ch ch Comme le premier terme non nul dans le développement limité en 0 de sh est de degré 1 , on 1 à l’ordre 4 ( = 5 − 1 ). peut se contenter d’effectuer un développement de ch 1 1 , et donc : On a = ch(x) 1 − 1 − ch(x) Ex. 23. Calculons le développement limité à l’ordre 5 de la fonction th =
1 1 = ch(x) 1 − u(x)
avec
u : x �→ 1 − ch x.
Comme lim u = 0 et que u possède un développement limité à l’ordre 4 en 0 , la proposition 14 0
1 possède un développement limité à l’ordre 4 en 0 , 1−u de même partie régulière que celui de la fonction 1 + u + u2 + u3 + u4 . de la page 570 assure que la fonction
Mais ici, il est inutile d’utiliser le développement limité à l’ordre 4 de
u(x) = −
x4 x2 − + o(x4 ) = O(x2 ) 2 24
x4 + o(x4 ) , on obtient : 4
572
o u(x)2 = o(x4 ).
et donc
Il suffit donc de s’arrêter à l’ordre 2 . Comme u(x)2 =
1 , puisque : 1−u
1 1 x2 1 = 1 + u(x) + u(x)2 + o u(x)2 = 1 − + − + x4 + o(x4 ). 1 − u(x) 2 24 4
II Opérations sur les développements limités En utilisant le développement limité à l’ordre 5 en 0 de sh , on en déduit : th(x) = sh(x) ×
x3 x5 1 = x+ + + o(x5 ) ch(x) 6 120
=x+ − =x−
x3 x3 + 2 6
+
1−
x2 5x4 + + o(x4 ) 2 24
x5 x5 5x5 − + 24 12 120
2x5 x3 + + o(x5 ). 3 15
+ o(x5 )
Remarque Pour obtenir ce développement limité de th , on aurait pu remarquer que th′ = 1 − th2 et, en partant de l’équivalent th2 x ∼ x2 , procéder par primitivation pour x→0
obtenir un développement limité d’abord à l’ordre 3 et ensuite à l’ordre 5 .
Cas où le dénominateur tend vers 0 f g si la fonction g tend vers 0 . Dans une telle situation, il est encore possible que la f possède un développement limité, mais ce n’est pas certain. fonction g La proposition 15 de la page 571 ne s’applique pas à un quotient de la forme
Exo 15.9
Point méthode Pour déterminer le développement limité d’un quotient (s’il existe), on factorise les développements limités des numérateur et dénominateur par leur terme prépondérant pour se ramener à la situation de la proposition 15 de la page 571. ex − 1 − x · ln(1 + x) On cherche, s’il existe, le développement limité de f à l’ordre 3 en 0 . Partons des développements limités des fonctions x �→ ex − 1 − x et x �→ ln(1 + x) aux ordres 4 et 3 respectivement (ce choix des ordres sera expliqué dans la remarque située après cet exemple). On a :
Ex. 24. Considérons la fonction f : x �→
ex − 1 − x =
x3 x4 x2 + + + o(x4 ) 2 6 24
x3 x2 + + o(x3 ), 2 3
et
ln(1 + x) = x −
et
ln(1 + x) = x 1 −
ou, en factorisant par le terme prépondérant : ex − 1 − x = x 2
x x2 1 + + + o(x2 ) 2 6 24
Cela donne l’égalité suivante : f (x) = x ×
1
2
+
Après calculs, on obtient :
1−
x 2
x2 x + + o(x2 ) . 2 3
1 x x2 · + + o(x2 ) × 2 6 24 1 − x2 − x3 + o(x2 ) 1
−
x2 3
+ o(x2 )
=1+
x2 x − + o(x2 ) 2 12
573
Chapitre 15. Développements limités puis, en calculant le produit : f (x) = x
=x
x x2 x2 1 x + + + o(x2 ) 1 + − + o(x2 ) 2 6 24 2 12 2 x x x2 x2 1 x 2 =x + − + o(x ) + + + + 2 4 6 24 12 24
5x x2 5x2 x3 1 x + + + o(x2 ) = + + + o(x3 ), 2 12 12 2 12 12
ce qui est le développement limité de f à l’ordre 3 en 0 . Remarque Dans cet exemple, pour savoir quels ordres choisir pour les développements limités des fonctions x �→ ex − 1 − x et x �→ ln(1 + x) , il faut essayer d’anticiper le calcul. La factorisation par les termes prépondérants donne :
2
x2 1 + x + x + · · · ex − 1 − x =x× = 2 x6 x24 f (x) = 2 ln(1 + x) x 1 − 2 + 3 +···
1 2
+
1−
x 6 x 2
+ −
x2 24 x2 3
+ ···
+ ···
g(x)
·
Pour obtenir le développement à l’ordre 3 de f souhaité, il faut donc effectuer un développement limité à l’ordre 2 de la quantité g(x) entre crochets. Cela nécessite un développement limité à l’ordre 2 du numérateur et du dénominateur de g(x) . Or, ceux-ci proviennent respectivement : • de la factorisation par x2 du développement limité de x �→ ex − 1 − x ; • de la factorisation par x du développement limité de x �→ ln(1 + x) . Cela explique les choix d’un ordre 4 pour le développement limité de x �→ ex − 1 − x et d’un ordre 3 pour le développement limité de x �→ ln(1 + x) .
Remarque Une mauvaise anticipation du calcul, et donc un choix un peu farfelu des ordres auxquels effectuer les développements limités, peut mener à deux situations. • Première situation. Les ordres n’ont pas été choisis assez grands, et ne permettent pas d’obtenir la précision finale souhaitée. Dans ce cas, il faut recommencer en les choisissant mieux. • Deuxième situation. Les ordres ont été choisis trop grands. Dans ce cas, on voit apparaître, lors du calcul, des termes inutiles qui disparaissent. Cette situation ne présente donc pas de gravité, si ce n’est qu’il est toujours dommage de faire des calculs plus compliqués que nécessaire !
4
Développements limités de fonctions composées
Conformément au programme, illustrons l’obtention de développements limités de fonctions composées à l’aide d’exemples. Ex. 25. Effectuons le développement limité à l’ordre 4 en 0 de x �→ ln(1 + sin x) .
Tout d’abord, le développement limité à l’ordre 4 en 1 de la fonction ln nous donne :
u3 u4 u2 + − + u4 ε(u), 2 3 4 où ε est une fonction définie sur ]−1, +∞[ et qui tend vers 0 en 0 . π π Pour x ∈ − , , on a sin x ∈ ]−1, +∞[ , et on peut donc substituer sin x à u dans le 2 2 développement limité précédent : ∀u ∈ ]−1, +∞[
ln(1 + u) = u −
ln(1 + sin x) = sin x −
574
sin3 x sin4 x sin2 x + − + (sin4 x) ε(sin x). 2 3 4
(∗)
II Opérations sur les développements limités On sait que sin x = x −
x3 + o(x4 ) , ce qui donne : 6
x4 sin3 x = x3 + o(x4 ) et sin4 x = x4 + o(x4 ). + o(x4 ), 3 Puisque sin x ∼ x , on a (sin4 x) ε(sin x) ∼ x4 ε(sin x) = o(x4 ) , et donc : sin2 x = x2 −
→0
x3 1 2 x4 1 3 + o(x4 ) − + o(x4 ) + ln(1 + sin x) = x − x − x + o(x4 ) 6 2 3 3 1 4 − x + o(x4 ) + o(x4 ), 4 ce qui, en simplifiant, donne le développement cherché : ln(1 + sin x) = x −
x3 x4 x2 + − + o(x4 ). 2 6 12
Simplification de rédaction Pour rendre plus efficace la rédaction précédente, on peut utiliser les o de la façon suivante. Partant du développement limité : ln(1 + u) = u −
u2 u3 u4 + − + o(u4 ), 2 3 4
on écrit la relation (∗) sous la forme : ln(1 + sin x) = sin x −
sin2 x sin3 x sin4 x + − + o(sin4 x). 2 3 4
Comme sin x ∼ x = O(x), on a o(sin4 x) = o(x4 ), ce qui donne : ln(1 + sin x) = sin x −
sin2 x sin3 x sin4 x + − + o(x4 ) = · · · 2 3 4
Présentons maintenant l’exemple d’une situation plus délicate, montrant ainsi qu’il y a des précautions à prendre lorsque l’on cherche le développement limité d’une fonction composée. Ex. 26. Effectuons le développement limité à l’ordre 3 en 0 de x �→ ln(1 + ex ) . • Ce qui ne marche pas. Pour x ∈ IR , on a ex ∈ ]−1, +∞[ , donc il est licite de substituer ex à u dans le développement limité à l’ordre 3 en 0 de la fonction u �→ ln(1 + u) : ln(1 + u) = u −
u2 u3 + + u3 ε(u), 2 3
où ε est une fonction définie sur ]−1, +∞[ et qui tend vers 0 en 0 . Cela donne : ln(1 + ex ) = ex −
(ex )3 (ex )2 + + (ex )3 ε(ex ). 2 3
Cependant, cela ne nous avance à rien. En effet, la seule information que l’on ait sur la fonction ε étant lim ε = 0 , et comme ex −→ 1 , on ne peut rien dire de la quantité ε(ex ) 0
x→0
lorsque x tend vers 0 . La formule est donc inexploitable.
575
Chapitre 15. Développements limités • Ce qui marche. Afin de pouvoir tirer parti d’un développement limité de ln(1 + u) , il est nécessaire de substituer à u une quantité qui tend vers 0 . Ici, il s’agit de transfor mer l’expression ln(1 + ex ) de façon à voir apparaître une quantité de la forme ln 1 + h(x) avec h(x) −→ 0 . Pour cela, écrivons : x→0
1
ln(1 + ex ) = ln 2
2
+
ex 2
= ln 2 + ln 1 +
ex − 1 . 2
ex − 1 : 2 ln(1 + ex ) = ln 2 + ln 1 + h(x) .
On a donc, en notant h la fonction x �→
On a h(x) ∼ x2 = O(x) , donc o h(x)3 = o(x3 ) . On peut donc partir du développement limité de ln(1 + u) à l’ordre 3 , ce qui donne : 1 1 (⋆) ln 1 + h(x) = h(x) − h(x)2 + h(x)3 + o h(x)3 . 2 3 De plus, des calculs classiques donnent : x2 x3 x + + + o(x3 ) 2 4 12 La relation ( ⋆ ) devient alors : h(x) =
h(x)2 =
x2 x3 + + o(x3 ) 4 4
x2 x3 x3 x 1 x2 + + + − 2 4 12 2 4 4 Le développement limité cherché est finalement : ln 1 + h(x) =
ln(1 + ex ) = ln 2 +
+
et
h(x)3 =
1 x3 3 8
x3 + o(x3 ). 8
+ o(x3 ).
x x2 + + o(x3 ). 2 8
Point méthode Lorsque l’on cherche le développement limité en un point a d’une fonction composée de la forme g ◦ f , les développements limités dont on a a priori besoin sont : • celui de f en a ;
• celui de g en b , où b est la limite de f en a.
Si l’on connaît ces deux développements limités, alors le développement limité de g ◦ f en a s’obtient en substituant f (x) à la variable utilisée dans l’écriture du développement limité de g . Remarque Dans la pratique, si le développement limité de g s’écrit sous la forme : g(u) = a0 + a1 (u − b) + · · · + an (u − b)n + (u − b)n ε (u − b)n , −→ 0
u→b
alors, en substituant f (x) à u , on obtient : n n g f (x) = a0 + a1 f (x) − b + · · · + an f (x) − b + f (x) − b ε f (x) − b . −→ 0
x→a
Le calcul peut alors se poursuivre en utilisant le développement limité de f en a. 576
II Opérations sur les développements limités Des situations classiques sont les recherches de développements limités pour des fonc tions de la forme x �→ ln f (x) et x �→ ef (x) , comme le détaillent les points méthodes ci-dessous. Point méthode Pour une fonction de la forme x �→ ln f (x) , et dans le cas où la fonction f possède une limite finie ℓ strictement positive, on peut écrire : f (x) f (x) = ln ℓ + ln 1 + −1 , ln f (x) = ln ℓ ℓ ℓ pour se ramener à utiliser le développement limité en 1 de la fonction ln .
Ex. 27. Déterminons le développement limité à l’ordre 4 en 0 de la fonction x �→ ln sin x x
Tout d’abord, remarquons que la fonction x �→ ln Comme la fonction x �→
sin x . x
est définie sur ]−π, 0[ ∪ ]0, π[ .
sin x tend vers 1 en 0 , il est naturel d’écrire : x ln
sin x x
= ln 1 +
sin x −1 x
.
sin x sin x − 1 , on a donc ln = ln 1 + h(x) . x x Par le développement limité de sin en 0 , on a sin x − x = O(x3 ) , donc h(x) = O(x2 ) et o h(x)2 = o(x4 ) . Nous pouvons donc utiliser un développement limité à l’ordre 2 en 0 de u �→ ln(1 + u) : En notant h la fonction x �→
ln(1 + u) = u −
u2 + o(u2 ). 2
Comme h(x) −→ 0 , on a h(x) ∈ ]−1, +∞[ pour x suffisamment proche de 0 , et il est alors x→0
licite de substituer h(x) à u dans le développement limité précédent, ce qui donne : ln
sin x x
= h(x) −
Puis, des calculs classiques donnent : h(x) = −
x2 x4 + + o(x4 ) 6 120
et
1 h(x)2 + o h(x)2 . 2 h(x)2 =
x4 + o(x4 ) = O(x4 ). 36
On obtient finalement le développement limité suivant : ln
sin x x
=−
x4 x2 − + o(x4 ). 6 180
Point méthode Pour une fonction de la forme x �→ ef (x) , et dans le cas où la fonction f possède une limite finie ℓ , on peut écrire : ef (x) = eℓ+f (x)−ℓ = eℓ ef (x)−ℓ , Exo 15.10
pour se ramener à utiliser le développement limité en 0 de la fonction exp.
577
Chapitre 15. Développements limités v(x) Attention Pour une fonction de la forme x �→ u(x) , il ne faut surtout pas essayer d’utiliser le développement limité usuel de u �→ (1 + u)α , qui nécessite que α soit constant et ne dépende pas de x, mais écrire : v(x) = ev(x) ln u(x) , u(x) pour se ramener à une fonction de la forme x �→ ef (x) .
III 1
Applications des développements limités Recherche de limites et d’équivalents
Les développements limités peuvent être utilisés pour obtenir des équivalents. Plus précisément, la proposition 5 de la page 558 entraîne que si une fonction f admet en x0 un développement limité d’ordre n de partie régulière : n
k=p
ak (x − x0 )k
avec ap �= 0,
alors, au voisinage de x0 , on a l’équivalent f (x) ∼ ap (x − x0 )p . Ex. 28. Reprenons l’exemple 3 de la page 540 : on souhaite déterminer un équivalent au voisinage de 0 de la fonction f définie sur IR par : f (x) = sin(2x) − sh(2x). Pour obtenir un équivalent de f , effectuons le développement limité de f à un ordre suffisant pour que la partie régulière soit non nulle. Ici, l’ordre 3 suffit puisque les développements limités des fonctions sin et sh diffèrent à partir de l’ordre 3 : sin(2x) = 2x −
4 3 x + o(x3 ) 3
et
sh(2x) = 2x +
4 3 x + o(x3 ), 3
ce qui donne : 8 f (x) = − x3 + o(x3 ), 3 8 et fournit l’équivalent suivant pour f au voisinage de 0 : f (x) ∼ − x3 . 3
Exo 15.15
Point méthode Pour obtenir un équivalent d’un quotient de deux fonctions, le plus efficace est souvent de déterminer un équivalent du numérateur et un équivalent du dénominateur, puis de conclure par quotient d’équivalents.
578
III Applications des développements limités Ex. 29. Déterminons un équivalent au voisinage de 0 de On a déjà trouvé un équivalent du numérateur :
sin(2x) − sh(2x) · (2x − sin x − tan x)2
8 sin(2x) − sh(2x) ∼ − x3 . 3 Cherchons un équivalent du dénominateur. Pour cela, commençons par calculer un développement limité en 0 à l’ordre 3 de x �→ 2x − sin x − tan x :
1 3 1 x + o(x3 ) − x + x3 + o(x3 ) 6 3 1 3 1 3 3 = − x + o(x ) ∼ − x . 6 6
2x − sin x − tan x = 2x − x −
On en déduit, par produit et quotient d’équivalents : − 8 x3 sin(2x) − sh(2x) 96 ∼ 3 2 ∼ − 3 · 2 1 3 (2x − sin x − tan x) x −6x
Les techniques précédentes de recherche d’équivalents permettent aussi de déterminer des limites. Ex. 30. Étudions la limite en 0 de la fonction : x �→
3 sin x − x cos x − 2x · sin5 x
On a déjà sin5 x ∼ x5 . Pour le numérateur, rappelons les développements limités : sin x = x −
x3 x5 + + o(x5 ) 6 120
cos x = 1 −
et
On en déduit que 3 sin x − x cos x − 2x ∼ −
x2 x4 + + o(x4 ). 2 24
1 5 x , puis : 60
1 5 x 1 3 sin x − x cos x − 2x 60 ∼ − ∼ − . x5 60 sin5 x
1 · 60 Ex. 31. Déterminons un équivalent de la suite de terme général :
La fonction étudiée possède donc une limite en 0 , qui vaut −
Pour n ∈ IN∗ , on a : un = exp
1 n
−
un = exp
1+
1+
1 n 1 n2
=f
1 n
1 n
−
n (n + 1) · 1 + n2
avec
f : x �→ ex −
1+x · 1 + x2
Après calculs, on obtient le développement limité à l’ordre 2 suivant pour f en 0 : f (x) = On en déduit f (x) ∼
x→0
3 2 x + o(x2 ). 2
3 3 2 · x , puis un ∼ 2 2n2
579
Chapitre 15. Développements limités
2
Étude d’extrema
Proposition 16 Soit f une fonction définie sur un intervalle I et à valeurs réelles. On suppose que f admet, en un point x0 intérieur à I , un extremum, local ou global, et un développement limité à l’ordre 1 : f (x) = α + β (x − x0 ) + o(x − x0 ). Alors β = 0 .
Démonstration. L’existence d’un tel développement limité à l’ordre 1 entraîne la dérivabilité de f en x0 , avec f ′ (x0 ) = β . Puisque x0 est intérieur à I , si f admet un extremum en x0 , on a f ′ (x0 ) = 0 , c’est-à-dire β = 0 . Remarque On sait déjà que cette condition de nullité de la dérivée n’est pas suffisante pour avoir un extremum. Un développement limité à un ordre supérieur peut permettre de montrer que l’on a effectivement affaire à un extremum local. Proposition 17 Soit f une fonction à valeurs réelles définie sur un intervalle I et x0 ∈ I . Si f admet un développement limité à l’ordre 2 en x0 de la forme : avec γ �= 0, f (x) = f (x0 ) + γ (x − x0 )2 + o (x − x0 )2 Alors :
• si γ > 0 , la fonction f possède un minimum local en x0 ;
• si γ < 0 , la fonction f possède un maximum local en x0 .
Démonstration. Puisque γ �= 0 , on a f (x)−f (x0 ) = γ (x−x0 )2 +o (x−x0 )2 ∼ γ (x−x0 )2
donc f (x) − f (x0 ) est, au voisinage de x0 , du signe de γ (x − x0 )2 .
Corollaire 18 Soit f ∈ C 2 (I, IR) et x0 ∈ I . Si f ′ (x0 ) = 0 et f ′′ (x0 ) �= 0 , alors f possède : • un minimum local en x0 si f ′′ (x0 ) > 0 ;
• un maximum local en x0 si f ′′ (x0 ) < 0 . Démonstration.
La formule de Taylor-Young donne : f (x) = f (x0 ) +
et la proposition précédente s’applique.
3
f ′′ (x0 ) (x − x0 )2 + o (x − x0 )2 2
Étude de l’allure d’une courbe au voisinage d’un point
Un développement limité peut permettre de déterminer l’allure de la courbe représentative d’une fonction dérivable au voisinage d’un point. • L’existence d’une tangente non verticale au point d’abscisse x0 du graphe d’une fonction f est équivalente à la dérivabilité de f en x0 , c’est-à-dire à l’existence d’un développement limité de f à l’ordre 1 en x0 . 580
III Applications des développements limités • Dans ce cas, l’étude du signe de :
f (x) − f (x0 ) − (x − x0 ) f ′ (x0 )
permet de préciser la position de la courbe représentative de la fonction f par rapport à la tangente. D’après la proposition 14 de la page 535, on sait qu’il suffit d’obtenir un équivalent de cette quantité pour en connaître le signe au voisinage du point x0 . Point méthode Si, en x0 , on dispose d’un développement limité à un ordre p 2 : avec ap �= 0, f (x) = a0 + a1 (x − x0 ) + ap (x − x0 )p + o (x − x0 )p
alors le graphe de f admet la droite d’équation y = a0 + a1 (x − x0 ) pour tangente. De plus, au voisinage de x0 , la position de la courbe par rapport à cette tangente est donnée par le signe de ap (x − x0 )p .
Exo 15.16
Ex. 32. x
e En 0 , la fonction f : x �→ 1−x a pour développement limité à l’ordre 2 (cf. exemple 17 de la page 566) :
f (x) = 1 + 2x +
5 2 x + o(x2 ). 2
Son graphe est donc tangent à la droite d’équation y = 1 + 2x et, au voisinage de 0 , la courbe est au dessus de sa tangente car : f (x) − (1 + 2x) =
4
y=
ex 1−x
5 5 2 x + o(x2 ) ∼ x2 · 2 2
O
Recherche d’asymptotes
Ex. 33. Étudions, au voisinage de +∞ , la fonction f définie sur ]1, +∞[ par f (x) =
x3 · x−1
√ √ x3 ∼ x2 , on a f (x) ∼ x2 ∼ x (on a x = x2 puisque x > 1 > 0 ). x−1 Cela donne en particulier lim f = +∞ .
• Comme
+∞
f (x) à l’aide d’un développement limité. Pour x > 1 , on a • Précisons le comportement de x √ (toujours en utilisant x = x2 ) : f (x) 1 = x x
x3 = x−1
1 x = x−1 1−
1 x
·
Le développement limité suivant à l’ordre 2 en 0 : √
1 1 3 = (1 − u)−1/2 = 1 + u + u2 + o(u2 ) 2 8 1−u
581
Chapitre 15. Développements limités nous donne, au voisinage de +∞ :
f (x) 1 3 1 =1+ + 2 +o x 2x 8x x2 ou encore :
1 3 1 +o · + 2 8x x
f (x) = x +
(1)
(2)
Dans la dernière relation, le terme (1) est affine, et le terme (2) tend vers 0 en +∞ . Plus précisément, on dispose de l’équivalent suivant au voisinage de +∞ : 1 3 f (x) − x + ∼ 2 8x
qui met en évidence qu’au voisinage de +∞ : • la courbe représentative de f se rapproche de la droite ∆ 1 d’équation y = x + ; cette droite est donc une asymptote 2 à la courbe ; • la courbe représentative de f est située (pour x assez grand) O 3 au-dessus de la droite ∆ , car est positif. 8x
Remarques • La droite ∆ est appelée asymptote oblique en +∞ au graphe de la fonction f . • La relation suivante :
f (x) = x +
3 1 + +o 2 8x
1 x
est appelée développement asymptotique de f au voisinage de l’infini à la 1 précision · x
IV 1
Développements asymptotiques Exemples de développements asymptotiques 3
5
Ex. 34. En remplaçant x par 1/n dans le développement limité Arctan x = x− x3 + x5 +o(x5 ) , on obtient :
Arctan
1 n
=
1 1 1 1 − 3 + 5 +o n 3n 5n n5
·
Un tel développement est appelé développement asymptotique. Comme pour les dé veloppements limités, il précise un comportement local, ici de un = Arctan n1 lorsque n tend vers +∞, par « approximations successives » : • le premier terme donne un équivalent un ∼ n1 ; 582
IV Développements asymptotiques • le deuxième terme, qui est négligeable devant le premier, précise la différence entre un et son équivalent : un − n1 ∼ − 3n1 3 ; • de même, le terme suivant précise encore les choses : un −
1 n
+
1 3n3
∼
1 5n5 ·
Ex. 35. De même, l’exemple 33 de la page 581 donne un développement asymptotique de la fonction f au voisinage de +∞ : f (x) = x +
Exo 15.17
3 1 1 · + +o 2 8x x
Dans ces deux exemples, le développement ne fait intervenir que des puissances positives ou négatives de la variable (n ou x suivant les cas). De même, un développement limité au voisinage d’un réel x0 peut être vu comme un développement suivant les puissance entières positives de x − x0 . Parfois, il arrive que l’on obtienne un développement asymptotique faisant intervenir une gamme de fonctions plus large que les fonctions puissances entières x �→ xk utilisées lors de développements limités. Ex. 36. En remplaçant u par
√
2
3
x dans le développement limité ln(1+u) = u− u2 + u3 +o(u3 ) ,
on obtient, au voisinage de 0+ :
√ √ x3/2 x + o x3/2 . x = x− + 2 3 √ C’est ce que l’on appelle un développement asymptotique de ln 1 + x à la précision x3/2 . ln 1 +
Exo 15.18
Mais il se peut aussi qu’il n’y ait pas que des fonctions puissances.
Ex. 37. Donnons un développement asymptotique en 0 de la fonction f : x �→ (e x)x .
La fonction f est définie sur IR∗+ , donc au voisinage de 0 . Pour x > 0 , on a : f (x) = ex xx = ex ex ln x . Écrivons le développement limité de la fonction exp à l’ordre 2 en 0 : eu = 1 + u +
1 2 u + o(u2 ). 2
En remplaçant u par x ln x qui tend vers 0 lorsque x tend vers 0 , on obtient, au voisinage de 0+ : 1 ex ln x = 1 + x ln x + x2 ln2 x + o x2 ln2 x . 2 On a ainsi, au voisinage de 0+ :
f (x) = 1 + x +
x2 + o x2 2
1 + x ln x +
1 2 2 x ln x + o x2 ln2 x . 2
En développant le produit, on constate que, parmi les termes en « o » qui apparaissent : o(x2 )
o(x3 ln x)
o(x4 ln2 x)
qui proviennent du o(x2 ) du premier facteur
o(x2 ln2 x)
o(x3 ln2 x)
o(x4 ln2 x)
qui proviennent du o(x2 ln2 x) du deuxième facteur
583
Chapitre 15. Développements limités
c’est le terme o x2 ln2 x qui « limite » la précision du calcul (tous les autres termes en « o », étant négligeables devant lui, n’ont donc pas à être écrits dans le calcul). Après avoir développé, en écrivant les termes dans l’ordre de précision croissante, on obtient le développement suivant pour f : 1 (⋆) f (x) = 1 + x ln x + x + x2 ln2 x + o x2 ln2 x . 2 2 2 C’est un développement asymptotique à la précision x ln x . Remarque Du développement asymptotique précédent obtenu pour f , on obtient les informations suivantes, qu’il est par ailleurs possible de retrouver directement à partir de l’expression de f : • la fonction f tend vers 1 en 0 et peut donc être prolongée par continuité ; • en appelant encore f le prolongement ainsi obtenu, on a : f (x) − f (0) = ln x + o(ln x) ∼ ln x −→ −∞, x→0 x ce qui se traduit par l’existence d’une tangente verticale à la courbe en 0 .
2
Formule de Stirling
La formule suivante, due à Stirling, donne un équivalent de n! ; elle est démontrée à la page 626 du chapitre 16. Proposition 19 (Formule de Stirling) n n √ n! ∼ 2πn. e Traduction en terme de développement asymptotique On peut réécrire la formule de Stirling sous la forme : √ n! = nn e−n 2πn 1 + o(1) . En appliquant le logarithme, on obtient :
ln(n!) = n ln n − n + ln n +
1 ln(2π) + o(1). 2
Cela donne un développement asymptotique de ln(n!) puisque l’on remarque que chacun des termes est négligeable devant le précédent. On peut remarquer que, réciproquement, il faut bien ce développement asymptotique à quatre termes pour obtenir un équivalent de n!. Ex. 38. Donnons un équivalent de
2n . n
(2n)! 2n = , il suffit de rechercher un équivalent du numérateur et un équivalent du n!2 n dénominateur. En remplaçant n par 2n dans la formule de Stirling, on trouve : Comme
√ √ (2n)! ∼ (2n)(2n) e−2n 2π × 2n ∼ 2 × 4n n2n e−2n π n.
584
IV Développements asymptotiques D’autre part, par produit d’équivalents, on obtient un équivalent de n!2 :
Ainsi obtient-on, par quotient,
3
n!2 ∼ n2n e−2n × 2πn.
2n n
√ 4n 2 × 4n n2n e−2n π × n ∼ √ · 2n −2n n e (2πn) πn
∼
Exemple d’une suite définie par une intégrale
Ex. 39. Dans l’exercice 7.9 de la page 264, on a étudié l’intégrale In =
π/2
sinn x dx . En
0
particulier, on a établi : ∀n ∈ IN∗
In In−1 =
π · 2n
(∗∗)
Soit n ∈ IN . Pour tout x ∈ [0, π/2] , en multipliant l’inégalité sin x 1 par sinn (x) qui est positif, on obtient sinn+1 x sinn x et, par croissance de l’intégrale, cela donne In+1 In . Ainsi, la suite (In )n∈IN est décroissante, à valeurs positives, et l’on a donc, pour tout n ∈ IN∗ : In+1 In In2 In In−1 . Par conséquent, d’après la relation (∗∗) : π π In2 · 2 (n + 1) 2n Comme les deux termes de l’encadrement obtenu sont équivalents à π est aussi équivalent à 2n puis, par positivité de In : In ∼
4
π 2n
, on en déduit que In2
π · 2n
Développement asymptotique d’une réciproque
Ex. 40. Considérons la fonction f : x �→ (1+x2 ) ln(1+x) . Elle est de classe C ∞ sur ]−1, +∞[ et f (x) ∼ x , donc elle est nulle en 0 et f ′ (0) = 1 . Par continuité, sa dérivée f ′ est à x→0
valeurs strictement positives au voisinage de 0 . Donc f définit une bijection d’un intervalle de la forme [−α, α] sur son image J , pour un certain réel α > 0 et sa réciproque g est de classe C ∞ (cf. théorème 32 de la page 442). Par la formule de Taylor-Young, la fonction g admet donc un développement limité à tout ordre en 0 . Déterminons son développement à l’ordre 3 en déterminant les réels a et b tels que : g(y) = y + a y 2 + b y 3 + o (y 3 ) y→0
(on a utilisé les relations g(0) = 0 et g ′ (0) f ′1(0) = 1 puisque les dérivées de deux bijections réciproques en les points correspondants sont inverses l’une de l’autre). Le développement limité de f à l’ordre 3 s’écrit :
f (x) = (1+x2 ) x −
x2 x3 + + o(x3 ) 2 3
= x−
x2 1 x2 4x3 x3 +o(x3 ) = x− + + 1+ +o(x3 ). 2 3 2 3
585
Chapitre 15. Développements limités On peut alors calculer un développement limité de la composée g ◦ f . Sachant que f (x) ∼ x , on a o f (x)3 = o(x3 ) et donc :
g f (x) =
4x3 x2 + + o(x3 ) x− 2 3
x2 + o(x2 ) +a x− 2
1 4 x2 + b − a + x3 + o(x3 ). 2 3
= x+ a−
2
+ b x3 + o(x3 )
Puisque l’on a g f (x) = x pour tout x ∈ [−α, α] , on en déduit, par unicité du développement limité : 4 1 et b − a + = 0. a− =0 2 3 Cela donne donc a =
1 2
puis b = a −
4 3
= − 65 et finalement :
g(y) = y +
5 y2 − y 3 + o(y 3 ). 2 6
Remarque La formule de Taylor-Young nous a permis ici de savoir à l’avance que la fonction g admettait un développement limité. Voyons sur un exemple comment déterminer un tel développement (asymptotique ici) sans savoir a priori qu’il existe. Ex. 41. Posons f (x) = x2 + x3 . Les variations de f sur IR+ sont immédiates et montrent que f définit une bijection strictement croissante de IR+ sur IR+ . Notons g sa réciproque et déterminons un développement asymptotique de g au voisinage de 0 .
1/2
Pour cela nous allons exploiter l’égalité y = g(y)2 + g(y)3 sous la forme g(y) = y − g(y)3 (positivité de g ). Nous allons voir que si l’on possède un développement asymptotique de g(y) à un certain nombre p de termes, en le reportant dans cette égalité, cela donne un nouveau développement asymptotique de g(y) à p + 1 termes. La fonction g est continue comme réciproque d’une bijection continue strictement monotone sur un intervalle. Comme f (0) = 0 , on a g(0) = 0 et donc g(y) −→ 0 . L’équivalent f (x) ∼ x2 y→0 x→0 √ donne alors, par substitution, y ∼ g(y)2 , soit g(y) ∼ y par positivité de g .
On a alors g(y)3 ∼ y 3/2 et donc :
g(y) = y − g(y)3 puis :
1/2
√ √ √ 1/2 √ g(y) = y 1 − y + o( y) = y • On a alors g(y)3 = y 3/2
1−
√
y √ + o( y) 2
y − g(y)3 = y − y 3/2 +
586
= y − y 3/2 + o(y 3/2 )
√
y √ 1− + o( y) 2
3
= y 3/2
1−
1/2
=
√
y−
y + o(y). 2
√ 3 y √ + o( y) , ce qui donne : 2
√ 3y 3y 2 + o(y 2 ) = y 1 − y + + o(y) . 2 2 u(y)
IV Développements asymptotiques u2 u − + o(u2 ) dans lequel on 2 8 √ remplace u par u(y) , on obtient, sachant que u(y) = O( y) :
• En utilisant le développement limité (1 + u)1/2 = 1 +
1−
d’où :
√
y+
3y + o(y) 2
1/2
√ √ 2 1 3y 1 √ − y+ − y + o( y) + o(y) + o(y) − 2 2 8 √ y 5 =1− + y + o(y), 2 8 =1+
g(y) = y − g(y)3
1/2
=
√
y−
5 y + y 3/2 + o(y 3/2 ). 2 8
Bien entendu, rien n’empêche de continuer. . .
587
Chapitre 15. Développements limités
Démonstrations Proposition 2 Raisonnons par l’absurde en supposant que (a0 , . . . , an ) et (b0 , . . . , bn ) sont deux listes distinctes vérifiant : n
ak xk + o(xn ) =
k=0
n
bk xk + o(xn ).
k=0
On a alors : n k=0
(ak − bk ) xk = o(xn ).
(⋆)
Les deux listes étant distinctes, on peut poser p = min k ∈ [[0, n]] : ak �= bk . La relation (⋆) devient alors
n k=p
p
(ak − bk ) xk = o(xn ) .
En divisant par x (pour x �= 0 ), on obtient : =
a p − bp
(bk − ak ) xk−p + o(xn−p ),
k=p+1
constante non nulle, par définition de p
ce qui aboutit à une contradiction. Corollaire 3
n
−→ 0
x→0
Écrivons le développement limité à l’ordre n en 0 de f : ∀x ∈ Df
f (x) =
n
ak xk + xn ε(x)
lim ε = 0.
avec
0
k=0
(1)
La fonction f étant paire ou impaire, son ensemble de définition Df est symétrique par rapport à 0 . Pour x ∈ Df , on a donc −x ∈ Df ce qui permet de substituer −x à x dans la relation précédente. En notant ε la fonction x �→ (−1)n ε(−x) , on a : ∀x ∈ Df
f (−x) =
n k=0
(−1)k ak xk + xn ε(x)
et
lim ε = 0, 0
(2)
qui est donc le développement limité à l’ordre n en 0 de la fonction x �→ f (−x) . •
Si f est paire, alors les fonctions f et x �→ f (−x) sont égales. Les relations (1) et (2) permettent alors, par unicité du développement limité, d’affirmer que : ∀k ∈ [[0, n]]
ak = (−1)k ak ,
ce qui signifie que tous les coefficients d’indice impair sont nuls. •
De même, si f est impaire, alors les fonctions f et x �→ −f (−x) sont égales. Cela entraîne que : ∀k ∈ [[0, n]]
ak = (−1)k+1 ak ,
c’est-à-dire que tous les coefficients d’indice pair sont nuls.
588
Démonstrations Proposition 5
On a au voisinage de 0 , par troncature : n
p
f (x) = ap x +
ak xk = ap xp + o(xp ) = ap xp + o(ap xp ),
k=p+1
la dernière égalité venant du fait que ap �= 0 .
On a ainsi f (x) ∼ ap xp . Si f est réelle, les coefficients de son développement limité sont réels, et la proposition 14 de la page 535 nous dit que f (x) et ap xp ont même signe (strict) au voisinage de 0 . Proposition 6 • Soit f une fonction admettant une limite finie ℓ en 0 . Alors, en considérant la fonction ε : x �→ f (x) − ℓ , on a : f (x) = ℓ + ε(x)
∀x ∈ Df •
lim ε(x) = 0,
et
x→0
ce qui prouve que f admet un développement limité à l’ordre 0 en 0 . Réciproquement, si une fonction f possède un développement limité à l’ordre 0 en 0 , de la forme f (x) = a0 + o(1) , alors il est clair que f possède a0 comme limite en 0 .
Proposition 7 • Supposons que f possède un développement limité à l’ordre 1 en 0 , que l’on écrit : f (x) = a0 + a1 x + o(x).
Comme f est définie en 0 , il en résulte que f est continue en 0 et que f (0) = a0 . L’utilisation du développement limité à l’ordre 1 en 0 de f donne de plus : f (x) − f (0) a0 + a1 x + o(x) − a0 = = a1 + o(1) −→ a1 , x→0 x x •
ce qui prouve que f est dérivable en 0 et f ′ (0) = a1 . Réciproquement, si f est dérivable en 0 , alors on a : f (x) − f (0) = f ′ (0) + o(1). x En multipliant par x , cela donne f (x) = f (0) + f ′ (0)x + o(x) , ce qui est le développement limité à l’ordre 1 en 0 de f .
Proposition 8 Cas particulier. Supposons que F soit la primitive de f qui s’annule en 0 , et que le développement limité de f soit de partie régulière nulle, i.e. : F (0) = 0
f (x) = o(xn ).
et
Montrons qu’on a alors F (x) = o(xn+1 ) , ce qui montrera que F possède un développement limité à l’ordre n + 1 en 0 dont la partie régulière est nulle. Par hypothèse, il existe une fonction u tendant vers 0 telle que ∀x ∈ I f (x) = xn u(x) . Par continuité de f , on a : ∀x ∈ I
F (x) = F (0) +
x
f (t) dt =
0
x
tn u(t) dt.
0
Soit x ∈ I . En effectuant le changement de variable [t = xs] dans cette intégrale, on obtient : F (x) =
0
1
xn sn u(sx) x ds = xn+1
0
1
sn u(sx) ds .
J (x)
589
Chapitre 15. Développements limités Il ne reste donc plus qu’à montrer que J(x) tend vers 0 lorsque x tend vers 0 pour prouver le résultat. Soit ε > 0 . Puisque lim u = 0 , il existe un réel η > 0 tel que ∀x ∈ [−η, η] 0
u(x) ε .
Soit x ∈ [−η, η] . Pour tout s ∈ [0, 1] , on a alors |sx| η donc u(sx) ε , ce qui donne : et permet de conclure. Cas général.
J(x)
1
0
n s u(sx) ds
1
ε ds = ε
0
Comme le développement de f à l’ordre n en 0 s’écrit : f (x) =
n
ak xk + o(xn ),
k=0
alors en notant g la fonction x �→ f (x) −
n
ak xk , on a g(x) = o(xn ) .
k=0
Soit F une primitive de f . On vérifie facilement que la fonction : x �→ F (x) − F (0) − est la primitive de g qui s’annule en 0 .
n ak k=0
k+1
xk+1
D’après la première partie de la démonstration, on a donc : F (x) − F (0) − ce qui donne : F (x) = F (0) +
n ak
k+1
k=0
n ak
k+1
k=0
et prouve le résultat attendu. Proposition 9
xk+1 = o(xn+1 ),
xk+1 + o(xn+1 ),
Montrons, par récurrence sur n ∈ IN : ∀f ∈ C n (I, IK)
Preuve de H0 .
f (x) =
n f (k) (0) k=0
k!
xk + o(xn ).
(Hn )
Soit f ∈ C 0 (I, IK) . La continuité de f en 0 s’exprime ainsi : f (x) = f (0) + o(1) ;
c’est la formule de Taylor-Young à l’ordre 0 . Hérédité.
Supposons Hn vraie à un rang n ∈ IN et prouvons Hn+1 .
Soit f ∈ C n+1 (I, IK) . On a alors f ′ ∈ C n (I, IK) et donc, d’après Hn , la fonction f ′ possède un développement limité à l’ordre n en 0 qui s’écrit : f ′ (x) =
n (f ′ )(k) (0) k=0
590
k!
xk + o(xn ) =
n f (k+1) (0) k=0
k!
xk + o(xn ).
Démonstrations En utilisant la proposition 8 de la page 560, on en déduit que f possède un développement limité à l’ordre n + 1 en 0 , obtenu par primitivation : f (x) = f (0) +
n f (k+1) (0) xk+1 k=0
k+1
k!
+ o(xn+1 ) =
n+1 (k) f (0)
k!
k=0
xk + o(xn+1 ),
ce qui est la formule de Taylor-Young à l’ordre n + 1 , c’est-à-dire Hn+1 . Cela termine la démonstration par récurrence. Comme u tend vers 0 en 0 , la fonction 1 − u ne s’annule pas au voisinage de 0 , 1 est définie au voisinage de 0 . ce qui assure que la fonction 1−u Supposons que u possède un développement limité à l’ordre n en 0 , et montrons qu’il en est 1 · de même pour la fonction 1−u 1 s’écrit : Le développement limité à l’ordre n en 0 de la fonction h �→ 1−h
Proposition 14
n
k 1 = h + hn ε(h), 1−h
∀h ∈ IR \ {1}
k=0
où ε est une fonction définie sur IR \ {1} admettant 0 comme limite en 0 .
Le fait que lim u = 0 assure que, pour x suffisamment petit, on a u(x) �= 1 , ce qui permet de 0
substituer u(x) à h dans le développement limité précédent : n
1 = u(x)k + u(x)n ε u(x) . 1 − u(x)
(⋆)
k=0
•
D’après le corollaire 13 de la page 567, chacune des fonctions uk admet un développement limité à l’ordre n . Il en est donc de même pour la fonction
•
n
uk .
k=0
Montrons pour finir que u(x)n ε u(x) = o(xn ) . Cela entraînera, grâce à la relation (⋆) , 1 possède un développement limité à l’ordre n en 0 , qui a même partie que la fonction 1−u régulière que celui de la fonction
n
uk .
k=0
∗
n
∗
Si n = 0 , le résultat est évident puisque u(x)n ε u(x)
= ε u(x)
donne u(x) ε u(x) = o(1) . Sinon, écrivons le développement limité à l’ordre 1 en 0 de u :
−→ 0 , ce qui
x→0
u(x) = a0 + a1 x + o(x).
Comme lim u = 0 , on a a0 = 0 , ce qui entraîne que u(x) = x a1 + o(1) = O(x) . Il 0
en résulte que u(x)n = O(xn ) , puis que :
u(x)n ε u(x) = O(xn )o(1) = o(xn ).
=O(xn )
−→ 0
x→0
591
Chapitre 15. Développements limités
S’entraîner et approfondir Développements limités 15.1 Déterminer le développement limité à l’ordre 3 en 0 de la fonction x �→ √ →563
15.2 Donner un développement limité à l’ordre 2 de la fonction cos en →564
1 · 1+x
π · 3
15.3 Étant donné x0 ∈ IR , donner un développement limité à l’ordre 3 en x0 de la fonction exp. →564
15.4 Donner le développement limité à l’ordre 3 en 0 de la fonction x �→ ex + ln(1 + x) . →565
15.5 Donner le développement limité à l’ordre 3 en 0 de la fonction x �→ →565
1 − ex . 1−x
15.6 Donner le développement limité à l’ordre 2 en 0 de la fonction x �→ ex (1 + x)1/3 . →567
15.7 Déterminer le développement limité à l’ordre 7 en 0 de la fonction : →569
f : x �→ (1 − cos x)(ex − 1)(x − sin x).
15.8 Déterminer le développement limité à l’ordre 4 en 0 de la fonction f : x �→ →570
√
1+x−1 · x3 − 1 + cos x 1. Montrer que f n’a pas de développement limité en 0 . 2. Montrer que la fonction x �→ xf (x) admet un développement limité à l’ordre 2 en 0 , et le déterminer.
15.9 On considère la fonction f : x �→ →573
1 · cos x
15.10 Déterminer le développement limité à l’ordre 2 en 0 de la fonction x �→ e
√ 1+x
.
→577
15.11 Déterminer le développement limité à l’ordre 3 en 0 de la fonction x �→ ln(1 + cos x) . 15.12 Pour tout entier naturel n , on définit : In =
1 0
dt · 1 + tn
1. Montrer que la suite (In )n∈IN tend vers 1 et, plus précisément, que : In − 1 = O
1 . n
2. En utilisant une intégration par parties, montrer que : In = 1 −
592
1 ln 2 +o · n n
Exercices 15.13 1. Donner le développement limité de f : x �→
√
x à l’ordre 3 au point 2 .
2. La fonction f admet-elle un développement limité d’ordre n 1 en 0 ?
15.14 Calculer les développements limités suivants : √ √ 1. x �→ 1 − x + 1 + x à l’ordre 4 en 0 , 2.
3. 4. 5.
x �→ ln(1 + x)2 à l’ordre 4 en 0 ,
x2 + 1 à l’ordre 3 en 0 , + 2x + 2 1 x �→ ln à l’ordre 4 en 0 , cos x 1 à l’ordre 3 en 0 . x �→ (x + 1)(x − 2) x �→
x2
Applications 15.15 Déterminer lim
x→0
→578
1 1 − x ln(1 + x)
·
15.16 Au voisinage de 0 , étudier la position de la courbe représentative de la fonc→581 1 par rapport à sa tangente. tion f : x �→ 1 + ex
ln2 (1 + x) . sin3 x 1. La fonction f possède-t-elle un développement limité en 0 ?
15.17 Soit f la fonction x �→ →583
√ 2. Donner un développement asymptotique de f à la précision x x . 15.18 Soit f : IR∗+ →583 x
−→ �−→
IR 1 x1+ x .
1. Montrer que f (x) ∼ x . +∞
2. Déterminer un développement asymptotique à trois termes de f . 3. Le graphe de la fonction f admet-il une asymptote oblique en +∞ ?
15.19 1. Trouver la limite lorsque x tend vers 0 de 2. Trouver la limite lorsque x tend vers 0 de
15.20 Montrer que la fonction f : x �→ sur ]−π, π[ .
sin x x x−sin x
sin x
1 + 3 tan2 x
.
1 x sin x
.
1 1 − se prolonge en une fonction de classe C 1 sin x x
593
Chapitre 15. Développements limités 15.21 Déterminer les limites suivantes : a x − bx avec (a, b) ∈ (IR∗+ )2 , 1. lim x→0 x 2.
lim
x→0
3. lim
x→0
a x + bx 2 1
x1
avec (a, b) ∈ (IR∗+ )2 ,
(1 + x) x − e · x
15.22 Déterminer le développement limité de la fonction Arctan à l’ordre 4 en 1 . En déduire l’allure de sa courbe représentative au voisinage du point d’abscisse 1 .
π
15.23 Pour n ∈ IN∗ , on considère la fonction fn définie sur 0,
2
par :
fn : x �→ n cosn x sin x.
1. Montrer que, pour tout n ∈ IN∗ , la fonction fn possède un maximum, atteint en un unique point xn . On note yn = fn (xn ) . 2. Trouver un équivalent pour chacune des suites (xn )n∈IN∗ et (yn )n∈IN∗ . √ 15.24 Soit f l’application définie sur [ 2, +∞[ par :
f (x) = (x2 − 2)(x + 3) 1. Montrer qu’il existe trois réels a , b et c tels que : f (x) = ax + b +
c + x
1/3
o
x→+∞
2. Interpréter graphiquement ce qui précède.
.
1
15.25 Soit f la fonction définie par : f (x) =
x
x2
√
dt · 1 + t2
1. Donner un développement limité de f en 0 à l’ordre 4 . 2. Donner l’allure de la courbe représentative de f en 0 .
594
x
.
Solutions des exercices
Solutions des exercices 1 1 = (1 + x)− 2 , il suffit d’appliquer la formule du développement limité 1+x 1 de x �→ (1 + x)α avec α = − . On obtient : 2 1 1 1 1 1 √ = (1 + x)−1/2 = 1 − x + − − − 1 x2 2 2! 2 2 1+x
15.1 Puisque √
+
ce qui donne : √
1 1 − 3! 2
−
1 −1 2
−
1 − 2 x3 + o(x3 ), 2
3 1 1 5 3 x + o(x3 ). = 1 − x + x2 − 2 8 16 1+x
15.2 La fonction cos est de classe C ∞ et donc de classe C 2 sur IR . On peut donc lui appliquer la formule de Taylor-Young à l’ordre 2 en π3 · La formule de Taylor-Young est efficace ici, car les dérivées de la fonction cos sont immédiates à calculer (on a cos′ = − sin et cos′′ = − cos ). On obtient : √ π π π 3 1 1 cos′ et cos′′ cos = , =− =− · 3 2 3 2 3 2 π Le développement limité à l’ordre 2 en de la fonction cos s’écrit donc : 3 √ 3 1 π 1 π 2 π 2 cos(x) = − x− − x− +o x− . 2 2 3 4 3 3 15.3 La fonction exponentielle est de classe C ∞ et donc de classe C 3 sur IR . On peut donc lui appliquer la formule de Taylor-Young à l’ordre 3 en x0 . Comme ses dérivées successives en x0 valent toutes ex0 , on obtient : ex = ex0 + ex0 (x − x0 ) +
ex0 e x0 (x − x0 )2 + (x − x0 )3 + o (x − x0 )3 . 2 6
On peut aussi écrire ex0 +h = ex0 eh et utiliser le développement limité de la fonction exponentielle en 0 . On obtient :
ex0 +h = ex0 1 + h +
h3 h2 + + o(h3 ) , 2 6
ce qui redonne le résultat obtenu avec la formule de Taylor-Young (tant mieux !) . 15.4 Écrivons les développements limités à l’ordre 3 en 0 des fonctions x �→ ex et x �→ ln(1 + x) : x3 x2 + + o(x3 ) et 2 6 Le développement limité cherché est donc : ex = 1 + x +
ex + ln(1 + x) = (1 + 0) + (1 + 1)x + = 1 + 2x +
ln(1 + x) = x −
x3 + o(x3 ). 2
1 2 1 − x + 2 2
x3 x2 + + o(x3 ). 2 3
1 3 1 + x + o(x3 ) 6 3
595
Chapitre 15. Développements limités 1 et x �→ ex s’écrivent : 1−x
15.5 Les développements limités à l’ordre 3 en 0 des fonctions x �→ 1 = 1 + x + x2 + x3 + o(x3 ) 1−x
ex = 1 + x +
et
1 − ex suivant : 1−x
Cela donne le développement limité de x �→
x3 x2 + + o(x3 ). 2 6
1 1 2 1 3 − ex = (1 − 1) + (1 − 1)x + 1 − x + 1− x + o(x3 ) 1−x 2 6 5 1 = x2 + x3 + o(x3 ). 2 6
15.6 Écrivons les développements limités à l’ordre 2 en 0 des fonctions x �→ ex et x �→ (1+x)1/3 : ex = 1 + x +
x2 + o(x2 ) 2
(1 + x)1/3 = 1 +
et
x2 x − + o(x2 ). 3 9
Il en résulte que :
ex (1 + x)1/3 = 1 + x +
x2 + o(x2 ) 2
ce qui donne, en développant et en simplifiant :
1+
x2 x − + o(x2 ) , 3 9
1 1 2 1 1 +1 x+ − + + x + o(x2 ) 3 9 3 2 13 2 4 x + o(x2 ). =1+ x+ 3 18
ex (1 + x)1/3 = 1 +
15.7 Prévision des ordres. Les premiers termes non nuls dans les développements limités en 0 x2 , x des fonctions x �→ 1 − cos x , x �→ ex − 1 et x �→ x − sin x sont respectivement 2 3 x et , dont les exposants valent respectivement 2 , 1 et 3 . 6 On anticipe que pour obtenir le développement limité de f à l’ordre 7 souhaité, il suffit de faire des développements limités : • à l’ordre 3 ( = 7 − 1 − 3 ) de x �→ 1 − cos x ; • à l’ordre 2 ( = 7 − 2 − 3 ) de x �→ ex − 1 ; • à l’ordre 4 ( = 7 − 1 − 2 ) de x → � x − sin x .
Calcul effectif. Écrivons et factorisons les développements limités annoncés : 1 − cos x = x2 On obtient :
1 + o(x) 2
;
f (x) = x6 = x6
596
x + o(x) 2
x + o(x) 2
ex − 1 = x 1 +
1 + o(x) 2
1+
;
x − sin x = x3 1 + o(x) 6
x6 x x7 1 + + o(x) = + + o(x7 ). 12 24 12 24
1 + o(x) . 6
Solutions des exercices 15.8 Comme lim cos = 1 , la fonction f est définie au voisinage de 0 . 0
En notant u la fonction 1 − cos , on a : f (x) =
1 1 = · 1 − 1 + cos x 1 − u(x)
Comme lim u = 0 et que la fonction u admet un développement limité à l’ordre 4 en 0 , la 0
proposition 14 de la page 570 nous dit que la fonction f admet un développement limité à l’ordre 4 en 0 , qui a même partie régulière que celui de la fonction 1 + u + u2 + u3 + u4 . On sait que u(x) =
x4 x2 − + o(x4 ) , puis des calculs classiques donnent : 2 24
u(x)2 =
x4 + o(x4 ), 4
u(x)3 = o(x4 )
u(x)4 = o(x4 ).
et
Il en résulte que : f (x) = 1 +
x4 x2 x4 + − + 2 24 4
5x4 x2 + + o(x4 ). 2 24
+ o(x4 ) = 1 +
15.9 1. Les premiers termes non nuls dans les développements limités en 0 des fonctions : √ x �→ 1 + x − 1 et x �→ x3 − 1 + cos x
x2 x et − · 2 2 La fonction f ne possède donc pas de développement limité en 0 . Pour le justifier, on peut écrire l’équivalent suivant de f en 0 :
sont respectivement
f (x) ∼
x→0
1 x/2 , c’est-à-dire f (x) ∼ − ; −x2 /2 x→0 x
de cet équivalent on déduit que la fonction f ne possède pas de limite finie en 0 , ce qui prouve qu’elle ne possède pas de développement limité. 2. Partons des développements limités suivants (s’inspirer de la remarque de la page 574 pour le choix des ordres) : √
1+x−1 =
x3 − 1 + cos x = −
ou encore :
x
1
2
x2 −
x2 x2 x4 1 + x3 + + o(x4 ) = x2 − + x + + o(x2 ) . 2 24 2 24
On obtient : xf (x) = x ×
x2 x3 x x2 1 x − + + o(x3 ) = x − + + o(x2 ) 2 8 16 2 8 16
xf (x) = − 1 −
− 1 2
x 8
x2 + o(x2 ) 16 x2 + 24 + o(x2 )
+
+x
x2 x + + o(x2 ) × 4 8
=
1 2
−
x 8
x2 + o(x2 ) 16 , x2 + 24 + o(x2 )
+
− 21 + x
1 · x2 1 − 2x + + o(x2 ) 12
u(x)
La fonction u tend vers 0 et possède un développement limité à l’ordre 2 en 0 , 1 possède un dévedonc, d’après la proposition 14 de la page 570, la fonction 1−u
597
Chapitre 15. Développements limités loppement limité à l’ordre 2 en 0 , qui a même partie régulière que celui de la fonction x �→ 1 + u(x) + u(x)2 . Comme on a : u(x) = 2x +
x2 + o(x2 ) 12
on obtient :
1
1 − 2x +
x2 12
+ o(x2 )
= 1 + 2x +
u(x)2 = 4x2 + o(x2 ),
et
x2 49x2 + 4x2 + o(x2 ) = 1 + 2x + + o(x2 ). 12 12
On peut alors terminer le calcul du développement à l’ordre 2 de x �→ xf (x) :
xf (x) = − 1 −
x2 x + + o(x2 ) 4 8
x = − 1 + 2x − 4 = −1 −
+
1 + 2x +
49x2 + o(x2 ) 12
x2 x2 49x2 − + 12 2 8
89x2 7x − + o(x2 ). 4 24
2
+ o(x )
15.10 Rappelons le développement limité à l’ordre 2 en 0 de exp : u2 + o(u2 ). 2 √ Pour x ∈ [−1, +∞[ , on a, en notant h la fonction x �→ 1 + x − 1 : eu = 1 + u +
e
√
1+x
= e1+(
√ 1+x−1)
=e×e
√ 1+x−1
= e × eh(x) .
Pour x ∈ [−1, +∞[ , la substitution de h(x) à u dans le développement limité de exp donne : eh(x) = 1 + h(x) + De plus, on a :
h(x)2 + o h(x)2 . 2
x x2 x2 − + o(x2 ) + o(x2 ) h(x)2 = et o h(x)2 = o(x2 ). 2 8 4 On en déduit, après simplification, le développement limité cherché : √ x ex + o(x2 ). e x+1 = e × eh(x) = e × 1 + + o(x2 ) = e + 2 2 h(x) =
15.11 Commençons par remarquer que la fonction considérée est paire. Il suffit donc d’établir son développement limité à l’ordre 2 pour le déduire à l’ordre 3 (elle est de classe C ∞ sur ]−π, π[ , donc le développement limité à l’ordre 3 existe). Un tel développement limité est donc de la forme ln(1 + cos x) = a + b x2 + o(x2 ) . Le coefficient a vaut immédiatement ln 2 . Pour trouver b , il suffit donc de connaître un équivalent x de ln(1 + cos x) − ln 2 = ln 1+cos · 2
Or,
1+cos x −→ 2 x→0
1 , donc l’équivalent classique ln u ∼ u − 1 , donne : u→1
1 + cos x ln 2 On obtient finalement : ln(1 + cos x) = ln 2 −
598
cos x − 1 x2 1 + cos x −1= ∼ − · ∼ 2 2 4
x2 + o(x2 ) 4
puis, par parité,
ln(1 + cos x) = ln 2 −
x2 + o(x3 ). 4
Solutions des exercices 15.12 1. On constate que : 1 − In =
1
0
On a donc : 0 1 − In =
1−
1
0
1 1 + tn
dt =
1
0
tn dt 1 + tn
tn dt. 1 + tn
1
tn dt =
1 · n+1
0
Il en résulte, par encadrement, que In → 1 , puis, comme In − 1 bien In − 1 = O
1 . n
(⋆)
1 1 , on a n+1 n
2. Soit n ∈ IN∗ . De la relation (⋆) précédente, on obtient : In − 1 = −
1
tn dt. 1 + tn
0
Intégrons par parties (les fonctions t �→ t et t �→
1
t×
0
tn−1 t dt = ln(1 + tn ) 1 + tn n =
1 ln 2 − n n
Il en résulte que : In − 1 = −
1 ln 2 + n n
1
1 n
1 0
ln(1 + tn ) sont de classe C 1 ) : −
1
0
1 ln(1 + tn )dt n
ln(1 + tn )dt.
0
1
ln(1 + tn )dt.
(⋆⋆)
0
On dispose de l’inégalité de convexité suivante (exemple 11 de la page 474) :
∀u ∈ 0, +∞ qui donne en particulier :
∀t ∈ 0, 1
0 ln(1 + u) u,
0 ln(1 + tn ) tn .
Par croissance de l’intégrale, on obtient : 0
1
ln(1 + tn )dt
0
Il en résulte que
0
1
tn dt =
0
1 · n+1
1
ln(1 + tn )dt → 0 . La relation (⋆⋆) donne alors : In − 1 = −
1 ln 2 +o , n n
ce qui donne bien le développement asymptotique souhaité : In = 1 −
ln 2 1 · +o n n
599
Chapitre 15. Développements limités 15.13 1. Faire un développement limité en 2 pour la fonction x �→ √ pement limité en 0 pour la fonction h �→ 2 + h . On a : √
2+h =
√
2
1+
√
x revient à faire un dévelop-
h · 2
Or, au voisinage de 0 , on a le développement limité : √ 1 1 1 3 u + o(u3 ). 1 + u = 1 + u − u2 + 2 8 16 h En remplaçant u par , on trouve, après simplification : 2 √ √ √ √ √ 2 2 2 2 3 2+h= 2+ h− h + h + o(h3 ). 4 32 128 √ Le développement limité de x �→ x à l’ordre 3 en 2 est donc : √ √ √ √ √ 2 2 2 2 (x − 2) − (x − 2) + (x − 2)3 + o (x − 2)3 . x= 2+ 4 32 128
2. La fonction racine carrée n’est pas dérivable en 0 . Elle n’admet donc pas de développement limité en 0 à l’ordre 1 , ni a fortiori à aucun ordre supérieur. 15.14 1. On a les développements limités : √ 1 1 3 5 4 1 1 + x = 1 + x − x2 + x − x + o(x4 ) 2 8 16 128 √ 1 1 3 5 4 1 1 − x = 1 − x − x2 − x − x + o(x4 ) 2 8 16 128 d’où : √ √ 1 5 4 x + o(x4 ). 1 − x + 1 + x = 2 − x2 − 4 64 2. Un développement limité de ln(1 + x) est, après factorisation par le terme prépondérant, de la forme : ln(1 + x) = x 1 + · · · + o(xr ) , ce qui mène à :
ln(1 + x)2 = x2 1 + · · · + o(xr )
2
= x2 1 + · · · + o(xr ) .
Pour obtenir le développement limité à l’ordre 4 , on choisit donc r = 4 − 2 = 2 . On a : ln(1 + x) = x −
x x3 x2 x2 + + o(x3 ) = x 1 − + + o(x2 ) , 2 3 2 3
puis : ln(1 + x)2 = x2 1 −
x 2
+
x2 3
+ o(x2 )
2
= x2 − x3 +
11 4 x 12
+ o(x4 ) .
3. Le numérateur x2 + 1 est une fonction polynomiale de degré 2 , qui est donc son propre développement limité à l’ordre 3 au voisinage de 0 . 1 Obtenons un développement limité de 2 en écrivant : x + 2x + 2 x2
1 1 1 = × + 2x + 2 2 1 + u(x)
avec
u(x) = x +
x2 · 2
Comme u(x) = O(x) , pour obtenir un développement limité à l’ordre 3 de suffit d’écrire le développement limité de
1 1+u
à l’ordre 3 :
1 = 1 − u + u2 − u3 + o(u3 ). 1+u
600
1 1+u(x)
, il
Solutions des exercices Ainsi, en substituant u(x) à u dans le développement précédent :
1 = 1 − u(x) + u(x)2 − u(x)3 + o u(x)3 1 + u(x) =1−
ce qui donne :
x2 x+ 2
+ x2 + x3 + o(x3 ) − x3 + o(x3 ) + o(x3 )
x2 1 =1−x+ + o(x3 ), 1 + u(x) 2 puis : 1 x x2 1 = − + + o(x3 ). + 2x + 2 2 2 4 En multipliant par 1 + x2 et en simplifiant, on obtient : x2
x2
x2 + 1 1 x 3x2 x3 = − + − + o(x3 ). + 2x + 2 2 2 4 2
1 −→ 1 , la fonction considérée est bien définie au voisinage de 0 . Il est donc cos x x→0 possible de l’étudier au voisinage de 0 . On a :
4. Comme
ln
1 cos x
= − ln cos(x) = − ln 1 + u(x) ,
avec
u(x) = cos(x) − 1.
Comme u(x) = O(x2 ) , pour obtenir un développement limité de ln 1+u(x) à l’ordre 4 , il suffit de partir du développement limité de u �→ ln(1 + u) à l’ordre 2 : ln(1 + u) = u −
u2 + o(u2 ). 2
En substituant u(x) à u dans ce développement limité, on obtient :
ln 1 + u(x) = u(x) − On a : u(x) = cos(x) − 1 = −
x2 x4 + + o(x4 ) 2 24
et
u(x)2 + o(x4 ). 2
u(x)2 =
ce qui donne :
ln 1 + u(x) = − et donc finalement :
ln
1 cos x
=
x2 2
+ o(x2 )
2
=
x4 + o(x4 ) 4
x4 x2 − + o(x4 ), 2 12
x4 x2 + + o(x4 ). 2 12
5. Pour x assez proche de 0 , on a x �= −1 et x �= 2 . La fonction considérée est donc bien définie au voisinage de 0 . On pourrait écrire : 1 1 1 1 = 2 =− × (x + 1)(x − 2) x −x−2 2 1 + u(x) et utiliser un développement limité de u �→
avec
u(x) =
x x2 − , 2 2
1 , mais il est plus simple de remarquer : 1+u
−1/3 1/3 1 1 = + =− (x + 1)(x − 2) x+1 x−2 3
1 1 + · 1+x 2−x
601
Chapitre 15. Développements limités On écrit alors : 1 = 1 − x + x2 − x3 + o(x3 ) 1+x 1 1 1 = × 2−x 2 1−
x 2
=
1 x x2 x3 + + + + o(x3 ) 2 4 8 16
1 1 3 3x 9x2 15x3 + = − + − + o(x3 ) 1+x 2−x 2 4 8 16
pour, finalement, obtenir :
1 1 x 3 5 3 = − + − x2 + x + o(x3 ). (x + 1)(x − 2) 2 4 8 16
15.15 Transformons d’abord l’expression de manière à obtenir un quotient : 1 ln(1 + x) − x 1 − = · x ln(1 + x) x ln(1 + x) • D’une part, on a x ln(1 + x) ∼ x2 .
• D’autre part, un développement limité à l’ordre 2 donne pour le numérateur : 1 1 ln(1 + x) − x = − x2 + o(x2 ) ∼ − x2 . 2 2
Par quotient d’équivalents, on a donc : − 21 x2 ln(1 + x) − x 1 ∼ =− , x ln(1 + x) x2 2 et donc : lim
x→0
1 1 − x ln(1 + x)
1 =− · 2
15.16 On a déjà vu (cf. exemple 22 de la page 571) que la fonction f : x �→ développement limité suivant à l’ordre 3 en 0 : f (x) =
1 admet le 1 + ex
1 1 3 1 − x+ x + o(x3 ). 2 4 48
Au point d’abscisse 0 , le graphe est donc tangent à la droite d’équation : y=
1 1 − x 2 4
et, au voisinage de 0 , la quantité : f (x) −
1 1 − x 2 4
∼
1 3 x 48
est positive à droite et négative à gauche. Le graphe traverse donc la tangente : il s’agit d’un point d’inflexion.
602
Solutions des exercices 15.17 Remarquons déjà que la fonction f est définie sur l’ensemble : {x ∈ IR : 1 + x > 0
et
sin x > 0}
et est donc définie au voisinage de 0 (elle est par exemple bien définie sur l’intervalle ]0, π[ ), ce qui permet d’en faire l’étude en 0 . 1. On a ln(1 + x) ∼ x et sin x ∼ x , donc : x→0
x→0
ln2 (1 + x) 1 ∼ · sin3 x x→0 x 1 Il en résulte que f (x) ∼ √ , et donc que f −→ +∞ . La fonction f , ne possédant pas 0 x→0 x de limite finie en 0 , n’admet donc pas de développement limité en 0 . 2. On a : ln(1 + x) = x −
x2 x3 + + o(x3 ) 2 3
et
sin x = x −
x3 + o(x3 ), 6
donc : ln2 (1 + x) = x2 − x3 +
11 4 x + o(x4 ) 12
sin3 x = x3 −
et
x5 + o(x5 ). 2
On a donc, en faisant le quotient : 11 2 x + o(x2 ) 1−x+ ln2 (1 + x) 1 12 × = x sin3 x x2 + o(x2 ) 1− 2 1 = × x =
1 × x
11 2 x + o(x2 ) 1−x+ 12
1−x+
On obtient : 1 f (x) = √ × x Après calculs, on obtient :
1−x+
puis finalement :
×
x2 + o(x2 ) 1+ 2
17 2 x + o(x2 ) . 12
1−x+
17 2 x + o(x2 ). 12
17 2 x 7 2 x + o(x2 ) = 1 − + x + o(x2 ), 12 2 12
√ √ 7 √ x 1 + x x+o x x . f (x) = √ − 2 12 x 1
ln x
15.18 1. Pour tout x > 0 , on a f (x) = e(1+ x ) ln(x) = xe x . ln x ln x = 0 , on a lim e x = 1 , et donc f (x) ∼ x . Comme lim x→+∞ x→+∞ x 2. Pour x > 0 , on a : 1
f (x) = x × x x = x × exp u(x)
avec
u(x) =
ln x · x
603
Chapitre 15. Développements limités Écrivons le développement limité à l’ordre 2 en 0 de la fonction exp : 1 2 u + o(u2 ), 2
eu = 1 + u + et substituons
ln x x
à u :
exp u(x) = 1 +
ln x ln2 x ln2 x · +o + 2 x 2x x2
En multipliant par x , on obtient le développement suivant pour f : f (x) = x + ln x +
ln2 x ln2 x +o · 2x x
ln2 x · x 3. Le graphe de f n’admet donc pas d’asymptote oblique, car il n’existe aucun réel m tel que f (x) − m x admette une limite finie en +∞ . En effet : C’est un développement limité à trois termes ; il est à la précision
• si m �= 1 , alors f (x) − mx ∼ (1 − m)x −→ ±∞ ; x→+∞
• si m = 1 , alors f (x) − mx ∼ ln x −→ +∞ . x→+∞
15.19 1. On a :
sin x x x−sin x
sin x
Or, puisque lim
x→0
= exp
x = 1 , on a : sin x
ln d’où :
x sin x
sin x x ln x − sin x sin x
∼
(⋆)
.
x −1 sin x
sin x x − sin x x sin x ln × = 1. ∼ x − sin x sin x x − sin x sin x x sin x ln On a donc −→ 1 , et donc, d’après la relation (⋆) , la limite cherchée x − sin x sin x x→0 vaut e .
2. On a :
2
1 + 3 tan x
1 x sin x
= exp
1 × ln(1 + 3 tan2 x) . x sin x
On a ln(1 + u) ∼ u et lim 3 tan2 x = 0 , donc, par substitution, on a : u→0
x→0
ln(1 + 3 tan2 x) ∼ 3 tan2 x ∼ 3x2 . Comme sin x ∼ x , on peut conclure par produit et quotient d’équivalents : 1 1 ln(1 + 3 tan2 x) ∼ × 3x2 ∼ 3. x sin x x×x
La limite cherchée vaut donc e3 .
604
Solutions des exercices 15.20 La fonction f est évidemment de classe C 1 sur ]−π, 0[ et sur ]0, π[ . • On peut écrire, pour x ∈ ]−π, π[ \ {0} : f (x) =
1 1 x − sin x − = · sin x x x sin x
3
3
Le développement limité sin x = x − x6 + o(x3 ) donne donc f (x) ∼ xx2/6 = x6 , ce qui fournit le développement limité f (x) = 0 + x6 + o(x) qui montre que l’on peut prolonger f par continuité en 0 en posant f (0) = 0 et que ce prolongement est dérivable en 0 avec f ′ (0) = 61 ·
• Calculons f ′ (x) pour x ∈ ]−π, π[ \ {0} : f ′ (x) =
1 − cos x sin2 x − x2 cos x + 2 = · 2 x sin x x2 sin2 x
Par élévation au carré du développement de sin x , on obtient sin2 x = x2 −
et avec cos x = 1 −
2
x 2
x4 3
+ o(x4 )
+ o(x2 ) , cela donne : f ′ (x) =
On a donc lim f ′ (x) = x→0 x�=0
1 6
x4 6
4
x + o(x4 ) 1 6 ∼ = · x4 6 x2 sin2 x
= f ′ (0) , ce qui donne la continuité de f ′ en 0 .
Remarque On aurait aussi pu utiliser le théorème de la limite de la dérivée en établissant uniquement la continuité de f (après prolongement) et la dernière limite. 15.21 1. Le développement limité de la fonction exp à l’ordre 1 en 0 : eu = 1 + u + o(u) nous donne facilement : ax = ex ln a = 1 + x ln(a) + o(x)
et
bx = ex ln b = 1 + x ln(b) + o(x).
Il en résulte que : ax − bx = (ln a − ln b)x + o(x),
ou encore :
a x − bx = ln a − ln b + o(1). x Conclusion. La limite recherchée existe et vaut ln a − ln b . 2. On a : x 1 x a + bx x 1 a + bx = exp . ln 2 x 2 Par le même principe qu’à la question précédente, on obtient :
puis :
√ 1 a x + bx = × 2 + x(ln a + ln b) + o(x) = 1 + x ln ab + o(x). 2 2
√ √ a x + bx = ln 1 + x ln ab + o(x) = x ln ab + o(x). 2 On obtient finalement : a x + bx √ √ 1 = ln ab + o(1) −→ ln ab. ln x→0 x 2 ln
Conclusion. Par composition de limites, la limite cherchée existe et vaut
√
ab .
605
Chapitre 15. Développements limités 3. Pour tout x ∈ ]−1, 0[ ∪ ]0, +∞[ , on a : 1
(1 + x) x − e = exp
=e Comme
ln(1 + x) x
−e
ln(1 + x)
exp
x
−1 −1 .
ln(1 + x) − 1 −→ 0 , on a, au voisinage de 0 : x→0 x
ln(1 + x)
exp
x
−1 −1 ∼
ln(1 + x) − 1. x
ln(1 + x) x2 x x + o(x2 ) , on a − 1 = − + o(x) ∼ − · 2 x 2 2 Par transitivité puis produit et quotient d’équivalents, on en déduit que :
Comme ln(1 + x) = x −
1
(1 + x) x − e e ∼ − · x 2 e Conclusion. La limite recherchée existe et vaut − · 2 1
(1 + x) x − e ∼ −e
x 2
puis
15.22 Commençons par effectuer un développement limité à l’ordre 4 en 0 de la fonction h �→ Arctan(1 + h) . Pour h ∈ IR , on a : Arctan′ (1 + h) =
1 1 1 1 = = · 1 + (1 + h)2 2 + 2h + h2 2 1+h+
En notant u la fonction h �→ −h −
h2 2
, la fonction h �→
1 1+h+
h2 2
h2 2
·
possède un développe-
ment limité à l’ordre 3 en 0 , de même partie régulière que 1 + u + u2 + u3 . Après calculs et simplification, on obtient : 1 1+h+
h2 2
=1−h+
h2 + o(h3 ), 2
et donc : Arctan′ (1 + h) = Par primitivation, et comme Arctan(1) =
h h2 1 − + + o(h3 ). 2 2 4
π , il vient : 4
π h h2 h3 + − + + o(h4 ) 4 2 4 12 ce qui donne le développement limité à l’ordre 4 en 1 de la fonction Arctan : Arctan(1 + h) =
Arctan x =
(x − 1)2 (x − 1)3 x−1 π + − + + o (x − 1)4 . 4 2 4 12
Son graphe est donc tangent à la droite d’équa1 π + (x − 1) et, au voisinage de 1 , la tion y = 4 2 courbe est en dessous de sa tangente car : Arctan x −
606
1 π + (x − 1) 4 2
1 ∼ − (x − 1)2 . 4
π 4
O
y = Arctan x
1
Solutions des exercices
15.23 1. La fonction fn est de classe C ∞ . Pour tout x ∈ 0,
π , on a : 2
fn′ (x) = n(1 − n tan2 x) cosn+1 x. Il est alors facile d’établir le tableau de variation de fn : 0
x
π 2
xn
fn′ (x)
+
0
−
yn fn 0
0
La fonction fn atteint son maximum en l’unique point xn ∈ [0, π/2] vérifiant la rela1 tion tan xn = √ , c’est-à-dire xn = Arctan √1n · n √1 n
2. • Puisque xn = Arctan
, et que Arctan x ∼ x , on a xn ∼ x→0
• Pour donner un équivalent de yn , partons de :
√1 · n
yn = n cosn xn sin xn . √ n ∗ D’une part, n sin xn ∼ nxn ∼ √ ∼ n . n ∗ D’autre part, donnons la limite de cosn (xn ) . On a : cosn (xn ) = en ln(cos xn ) . Comme xn → 0 , on a cos xn → 1 , et donc : ln (cos xn ) ∼ (cos xn − 1) ∼ −
1 x2n ∼ − · 2 2n
1 1 Ainsi on a n ln(cos xn ) → − , et donc cosn xn → √ · 2 e n · On obtient finalement yn ∼ e
15.24 1. On a, pour tout x f (x) = x
1−
√ 2 :
2 x2
1+
3 x
1/3
= 1 + u(x)
1/3
avec
u(x) =
2 6 3 − 2 − 3· x x x
Pour avoir un développement asymptotique de f (x) se terminant par o(1/x) , il suffit
d’avoir celui de 1 + u(x) limité de (1 + u)
1/3
1/3
avec o(1/x2 ) . Comme u(x) = O(1/x) , le développement
à l’ordre 2 suffit : (1 + u)1/3 = 1 +
u2 u − + o(u2 ). 3 9
607
Chapitre 15. Développements limités Compte tenu de :
3 2 1 u(x) = − 2 + o x x x2
et
on obtient, en substituant u(x) à u dans ce développement :
3
5 1 1 1 + u(x) = 1 + − 2 + o x 3x x2
Il en résulte que :
9 1 u(x) = 2 + o , x x2 2
·
1 5 · +o 3x x 2. Le résultat obtenu précédemment signifie graphiquement qu’au voisinage de +∞ , • la droite d’équation y = x + 1 est asymptote oblique au graphe de la fonction f , 5 < 0. • la courbe représentative de f est située en-dessous de cette droite, car − 3x f (x) = x + 1 −
15.25 1. Commençons par montrer que la fonction f est de classe C 1 . En notant G une primitive 1 , on a : sur IR de la fonction continue t �→ √ 1 + t2 ∀x ∈ IR 1
f (x) = G(x2 ) − G(x).
La fonction G est de classe C sur IR , donc par composition et somme de fonctions dérivables sur IR , la fonction f l’est aussi. On a : 2x 1 ∀x ∈ IR f ′ (x) = 2xG′ (x2 ) − G′ (x) = √ −√ · 1 + x4 1 + x2 Pour obtenir un développement limité à l’ordre 4 de f , donnons un développement limité à l’ordre 3 de sa dérivée. Partons du développement limité : 1 3 1 √ = (1 + u)−1/2 = 1 − u + u2 + o(u2 ), 2 8 1+u ce qui mène à : √
1 3 x2 1 = 1 − x2 + x4 + o(x4 ) = 1 − + o(x3 ), 2 2 8 2 1+x =o(x3 )
√
1 = 1 + o(x2 ). 1 + x4
On a donc : 1 1 2x −√ = −1 + 2x + x2 + o(x3 ). 2 1 + x4 1 + x2 En primitivant ce développement limité, on trouve (puisque f (0) = 0 ) : 1 f (x) = −x + x2 + x3 + o(x4 ). 6 2. Le développement limité à l’ordre 2 en 0 de f : √
f (x) = −x + x2 + o(x2 ), nous indique que la courbe représentative de f admet une tangente d’équation y = −x en 0 , et que la courbe est située localement au-dessus de sa tangente.
608
Chapitre 16 : Séries numériques I
Séries numériques . . . . . . . . . . . . . . . Définitions . . . . . . . . . . . . . . . . . . Propriétés immédiates . . . . . . . . . . . . Séries alternées . . . . . . . . . . . . . . . . Exemple de la série exponentielle . . . . . . II Séries à termes réels positifs . . . . . . . . . 1 Généralités . . . . . . . . . . . . . . . . . . 2 Théorèmes de comparaison . . . . . . . . . 3 Comparaison série-intégrale . . . . . . . . . III Séries absolument convergentes . . . . . . . 1 Convergence absolue . . . . . . . . . . . . . 2 Théorèmes de comparaison . . . . . . . . . IV Application à l’étude de suites . . . . . . . 1 Constante d’Euler . . . . . . . . . . . . . . 2 Formule de Stirling . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3 4
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . .
610 610 614 616 617 618 618 618 620 622 622 623 626 626 626 628 630
Séries numériques
16
Dans ce chapitre, nous considérons des suites à valeurs dans IK , où IK = IR ou IK = C .
I
Séries numériques
1
Définitions
Définition 1 Soit u ∈ IKIN .
1. On appelle série de terme général un , la suite (Sn )n∈IN de terme génén ral Sn = un ou plus simplement un . up . On la note p=0
n0
On dit donc que la série finie dans IK.
un converge si la suite (Sn )n∈IN admet une limite
Dans le cas contraire, on dit que la série diverge. 2. Si la série un converge, la limite de la suite (Sn )n∈IN est appelée somme de +∞ un . la série et notée n=0
3. Pour n ∈ IN, Sn est appelée somme partielle d’ordre n.
Remarque À partir des sommes partielles Sn d’une série un , on retrouve son terme général : u 0 = S0
et
un = Sn − Sn−1
si n 1 .
Ex. 1. Soit (un )n∈IN une suite constante. Voyons à quelle condition la série de terme général un est-elle convergente. Notons a la valeur constante de la suite. Soit n ∈ IN . On a alors : Sn =
n
up = (n + 1)a.
p=0
Donc
un converge si, et seulement si, a = 0 .
I Séries numériques Terminologie Il est fréquent que l’on demande d’étudier la nature d’une série. Ce qui est alors attendu c’est de déterminer si la série est convergente ou divergente. Extension • Lorsque la suite u est définie seulement à partir d’un certain rang n0 , la série de un ; l’étude de la série de terme général un est terme général un est notée nn0
alors l’étude de la suite (Sn )nn0 des sommes partielles définie par : ∀n n0
Sn =
n
up .
p=n0
Lorsqu’il y a convergence de cette série, sa somme est notée
+∞
un .
n=n0
• Soit (un )n∈IN ∈ IKIN et n0 ∈ IN. Les séries partielles qui diffèrent de la constante C =
un et
un ont des sommes
nn0
n0 n 0 −1
uk , donc elles sont de même
k=0
nature et, lorsqu’elles convergent, leurs sommes diffèrent de C . C’est ce que l’on appelle le caractère asymptotique de la notion de convergence des séries. Attention Ne pas confondre les notations : • un est la série de terme général un (qu’elle soit convergente ou non) ; •
+∞
un est, en cas de convergence, la somme de la série
n=0
On ne peut donc écrire
+∞
un .
un qu’après avoir prouvé la convergence de la série. Voir
n=0
néanmoins la convention de la page 1189. Remarque Une série n’est pas autre chose qu’une suite. On peut donc lui appliquer tous les résultats concernant les suites, qu’elles soient réelles ou complexes. Mais une série est donnée par son terme général et non par ses sommes partielles. Le propos de ce chapitre est de développer des « outils » spécifiques à l’étude d’une série, en s’intéressant non pas à la suite de ses sommes partielles mais à son terme général. Proposition 1 (Condition nécessaire de convergence) Si la série un converge, alors la suite (un )n∈IN tend vers 0 . Démonstration.
Supposons la série un convergente. En notant Sn la somme partielle d’ordre n , on a un = Sn − Sn−1 pour tout n ∈ IN∗ . La suite (un )n1 est la différence de deux suites ayant la même limite finie. Donc lim un = 0 .
Attention La convergence vers 0 du terme général est une condition nécessaire mais non suffisante de convergence ; pour s’en convaincre, il suffit de considérer, par exemple, la série harmonique étudiée ci-dessous. 611
Chapitre 16. Séries numériques Ex. 2. La série
n1
1 n
, appelée série harmonique, diverge.
En effet, si la série était convergente, la suite de ses sommes partielles (Sn )n1 serait convergente et l’on devrait avoir
lim
n→+∞
S2n − Sn = 0 . Or on a, pour tout n ∈ IN∗ :
S2n − Sn =
2n 1 k=1
k
−
n 1 k=1
Cela donnerait, par passage à la limite, 0
Exo 16.1
k
=
2n 1
k=n+1
k
2n
k=n+1
1 1 = · 2n 2
1 et donc une contradiction. 2
Point méthode Lorsque son terme général ne tend pas vers 0 , la série est nécessairement divergente. On dit alors qu’elle est grossièrement divergente. Ex. 3. Pour montrer que la série de terme général (−1)n est divergente, on peut certes calculer ses sommes partielles : 2p+1
S2p+1 =
(−1)k = 0
S2p =
et
2p
(−1)k = 1
k=0
k=0
pour en déduire la divergence de (Sn ) , mais il est beaucoup plus rapide de remarquer que la suite (−1)n n∈IN ne converge pas vers 0 , et donc la divergence grossière de la série associée.
Proposition 2 Soit q ∈ C . La série de terme général q n , appelée série géométrique de raison q , +∞ 1 · qn = converge si, et seulement si, |q| < 1 , et l’on a alors 1−q n=0 Démonstration. • Si |q| 1 , alors ∀n ∈ IN diverge grossièrement.
|q n | 1 , donc le terme général ne tend pas vers 0 et la série
• Si |q| < 1 , alors, en particulier, q �= 1 et ∀n ∈ IN Or
Sn =
1 − q n+1 · 1−q
lim q n+1 = 0 puisque |q| < 1 , donc (Sn )n∈IN est convergente de limite
n→+∞
Définition 2 Soit un une série convergente. Pour tout n ∈ IN, le scalaire : +∞ up Rn =
1 · 1−q
p=n+1
est appelé reste d’ordre n de la série
Remarque
un .
La définition ci-dessus est justifiée par le fait que si la série pour tout n ∈ IN , la série up converge. pn+1
612
un converge, alors
I Séries numériques Ex. 4. Soit q ∈ C tel que |q| < 1 . En reprenant les résultats sur la somme des termes d’une suite géométrique, on obtient, puisque q �= 1 : q n+1 ∀n ∈ IN Rn = · 1−q Attention • On ne parle de reste d’ordre n que pour une série convergente. • On notera bien que le reste d’ordre n est la somme
+∞
up , et non
de disposer, pour toute série convergente, de la relation : ∀n ∈ IN
S = Sn + Rn
avec S =
up , afin
p=n
p=n+1
+∞
+∞
up .
p=0
Proposition 3 La suite des restes d’une série convergente tend vers 0 .
Démonstration. Il suffit de voir que, pour tout n ∈ IN , Rn = S −Sn et que lim Sn = S . On revient ici sur la notion de sommes télescopiques introduite dans le chapitre 4 à la page 109 pour étudier la convergence de telles sommes partielles. Définition 3 Une série télescopique est une série dont le terme général est écrit sous la forme un = vn+1 − vn où (vn )n∈IN ∈ IKIN . On a vu que la convergence d’une série n’est rien d’autre que la convergence d’une suite. Réciproquement, dans certains cas, on ramène l’étude de la convergence d’une suite à l’étude de la convergence d’une série télescopique en utilisant la proposition suivante. Proposition 4 (Lien suite-série) Une suite (vn )n∈IN ∈ IKIN converge si, et seulement si, sa série télescopique asso ciée (vn+1 − vn ) est convergente, et l’on a alors : +∞
Exo 16.2
n=0
(vn+1 − vn ) =
lim vn − v0 .
n→+∞
Démonstration. Les sommes partielles de la série télescopique de terme général un = vn+1 − vn vérifiant : ∀n ∈ IN
n k=0
uk = vn+1 − v0 ,
on obtient immédiatement le résultat annoncé.
613
Chapitre 16. Séries numériques
Ex. 5. La série
√
n1
Ex. 6. La série
n1
n−
√1 n+1
√
−
+∞ n=1
Ex. 7. En remarquant que
n − 1 diverge puisque la suite √1 n
√
n diverge.
converge, et sa somme vaut :
1 = lim √ − 1 = −1. n→+∞ n
1 n+1
, on obtient que la série
1 1 −√ n n+1
1 n(n+1)
√
=
1 n
−
n1
gente, de somme 1 .
2
1 n(n+1)
est conver-
Propriétés immédiates
Les résultats qui suivent ne sont qu’une reformulation, dans le langage des séries, des résultats correspondants sur les suites. Proposition 5 Soit un et vn des séries convergentes ainsi que λ et µ des scalaires. Alors la série (λun + µvn ) converge et : +∞ +∞ +∞ (λun + µvn ) = λ un + µ vn . n=0
n=0
n=0
Remarque Avec la convergence de la série nulle, c’est la traduction des propriétés 836 algébriques suivantes : • l’ensemble des séries convergentes est un sous-espace vectoriel de IKIN ; 872
• l’application qui, à une série convergente, associe sa somme est linéaire.
u et vn des séries numériques telles que un converge et vn diverge. n Alors la série (un + vn ) diverge.
Ex. 8. Soit
En effet, si la série (un + vn ) était convergente, de l’égalité vn = (un + vn ) − un , valable pour tout n ∈ IN , on déduirait la convergence de la série de terme général vn en tant que différence de séries convergentes ; d’où la contradiction.
De l’exemple précédent, on déduit immédiatement : Corollaire 6 On ne change pas la nature d’une série en ajoutant à son terme général le terme général d’une série convergente.
614
I Séries numériques
Attention La série (un + vn ) peut très bien être convergente lorsque un et vn sont 1 1 divergentes. Par exemple, est convergente alors que les séries harmo− n n+1 1 1 niques n et n+1 sont divergentes. +∞ +∞ +∞ Avant d’écrire (un + vn ) = un + vn , il faut s’assurer de l’existence de ces n=0
n=0
n=0
trois sommes (ou au moins de deux d’entre elles, la troisième s’en déduisant).
Proposition 7 (Cas des séries à termes complexes) Soit un une série à termes complexes. La série un converge si, et seulement Im(un ) convergent et l’on a alors : si, les séries Re(un ) et +∞
un =
n=0
+∞
Re(un ) + i
n=0
+∞
Im(un ).
n=0
Démonstration.
Ce résultat découle immédiatement du lien entre la convergence d’une suite complexe et celle des suites de ses parties réelles et imaginaires.
Remarque Dans le cas où un converge, on a donc : +∞ +∞ +∞ +∞ et Re(un ) = Re un Im(un ) = Im un . n=0
n=0
n=0
n=0
Ex. 9. Soit θ ∈ ]0, π[ . Justifions l’existence et calculons : +∞
cos(nθ) cosn (θ)
et
n=0
+∞
sin(nθ) cosn (θ).
n=0
un est géométrique de raison r = eiθ cos(θ) , Posons pour cela un = einθ cosn (θ) . La série avec donc |r| = |cos θ| < 1 puisque θ ∈ ]0, π[ . Elle est donc convergente et sa somme est : S=
1 1−
eiθ
cos(θ)
=
e−iθ
cos(θ) − i sin(θ) e−iθ cos θ = =i + 1. − cos(θ) −i sin(θ) sin θ
On en déduit la convergence des deux séries et leurs sommes : +∞ n=0
cos(nθ) cosn (θ) = 1
et
+∞ n=0
sin(nθ) cosn (θ) =
cos(θ) · sin(θ)
615
Chapitre 16. Séries numériques
3
Séries alternées
Théorème 8 (Théorème des séries alternées) Soit (un )n∈IN une suite réelle décroissante convergeant vers 0 . Alors la série (−1)n un est convergente et, pour tout n ∈ IN, son reste d’ordre n : +∞
Rn =
(−1)p up
p=n+1
est du signe de (−1)n+1 et vérifie |Rn | un+1 .
En particulier, la somme de la série est comprise entre 0 et u0 . Démonstration page 628
Principe de démonstration. suites (S2n+1 )n∈IN et (S2n )n∈IN
En notant Sn les sommes partielles, on montre que les sont adjacentes.
Ex. 10. Pour tout α > 0 , la série
n1
(−1)n−1 nα
alternées ; en effet, elle est alternée et la suite
1 nα
converge, d’après le théorème des séries décroît et tend vers zéro.
Remarque On appelle série alternée, un série réelle un telle que (−1)n un soit de signe constant. Le résultat précédent, quitte à l’appliquer à la suite (−un ), nous dit qu’une série alternée dont la valeur absolue du terme général décroît et tend vers 0 est convergente et que sa somme, et plus généralement tous ses restes, sont du signe de leur premier terme et majorés par la valeur absolue de ce dernier. Attention Une série alternée ne converge pas nécessairement, même si son terme général tend vers 0 . La décroissance de la valeur absolue de son terme général est essentielle. 1
· Ex. 11. Posons, pour tout p ∈ IN , u2p = 0 et u2p+1 = p+1
La série un est divergente, bien qu’elle soit alternée ( ∀n ∈ IN (−1)n un 0 ) et que son terme général tende vers 0 . En effet, les sommes partielles Sn sont telles que : ∀n ∈ IN et la série harmonique
Exo 16.3
1 n
S2n =
n 1 p=1
p
diverge.
Remarque Si la décroissance de la valeur absolue du terme général n’a lieu qu’à partir d’un certain rang n0 , on conserve la convergence de la série : il suffit de s’intéresser un . à nn0
616
I Séries numériques
4
Exemple de la série exponentielle
Soit z ∈ C. On s’intéresse à la série
zn n!
, appelée série exponentielle.
Ex. 12. Soit x un réel positif et n ∈ IN . On remarque que la somme partielle Sn (x) =
n
k=0
xk k!
est la partie régulière du développement limité à l’ordre n de la fonction exponentielle x �→ ex qui est de classe C ∞ . La formule de Taylor avec reste intégral entre 0 et x : x
e =
n xk k=0
Sn (x)
montre alors que la suite
n∈IN
k!
+
0
x
(x − t)n t e dt n!
0
est majorée par ex , donc convergente puisqu’elle est
évidemment croissante par positivité de x . xn La série est donc convergente. On ne sait pas, à ce stade, quelle est sa somme, mais on n! peut quand même en déduire que son terme général tend vers 0 .
Proposition 9 Pour tout z ∈ C, la série
zn n!
converge et l’on a : +∞ n z = ez . n! n=0
Démonstration page 628
Principe de démonstration.
On applique l’inégalité de Taylor-Lagrange à la fonction f : t �→ etz , qui est de classe C ∞ sur [0, 1] , pour obtenir une majoration :
n z |z|n+1 z k e − , M k! (n + 1)! k=0
où M est indépendant de n , et l’on conclut en remarquant que
|z|n+1 n→+∞ (n+1)!
lim
= 0 d’après la
conclusion de l’exemple précédent.
Corollaire 10 Pour tout θ ∈ IR, on a : cos θ =
+∞
(−1)n
n=0
Démonstration. réelle, donne cos θ =
θ2n (2n)!
et
sin θ =
(−1)n
n=0
Soit θ ∈ IR . On part de l’égalité eiθ = +∞
+∞
un où :
+∞ n=0
(iθ)n n!
θ2n+1 · (2n + 1)!
qui, en prenant la partie
n=0
un =
(−1)p θ2p (2p)!
si n = 2p est pair
et
un = 0
si n est impair.
617
Chapitre 16. Séries numériques Pour tout p ∈ IN , on a donc :
2p
un =
n=0
p (−1)k θ2k k=0
(2k)!
·
On en déduit, par passage à la limite : cos θ =
+∞ (−1)k θ2k k=0
(2k)!
·
La même méthode, en utilisant cette fois-ci les parties imaginaires, donne l’autre égalité.
II
Séries à termes réels positifs
Dans cette section, il est question de séries dont les termes généraux sont des réels positifs. En pratique, grâce au caractère asymptotique de la notion de limite, on peut souvent se contenter de la positivité à partir d’un certain rang.
1
Généralités
La suite (Sn ) des sommes partielles d’une série un à terme général réel positif est croissante. En effet, pour tout n ∈ IN, on a Sn+1 − Sn = un+1 0 . Le théorème de la limite monotone donne alors la proposition suivante. Proposition 11 La suite des sommes partielles d’une série de terme général positif converge ou tend vers +∞. Une série à terme général positif converge si, et seulement si, ses sommes partielles sont majorées. Remarque Pour montrer qu’une série à termes réels positifs converge, il suffit donc de montrer que la suite de ses sommes partielles est majorée. Mais, sauf dans de rares cas, on utilisera plutôt les théorèmes de comparaison ci-dessous qui permettent de travailler sur le terme général de la série et non sur ses sommes partielles.
2
Théorèmes de comparaison
Proposition 12 (Théorème de comparaison des séries à termes positifs) Soit un et vn des séries vérifiant : Exo 16.4 Exo 16.5
∀n ∈ IN
• Si • Si
vn converge, alors un diverge, alors
Principe de démonstration.
0 un vn .
un converge, et l’on a
vn diverge.
+∞
un
n=0
vn .
n=0
Démonstration page 629
Comparer les sommes partielles des séries de termes généraux un et vn .
618
+∞
II Séries à termes réels positifs
Ex. 13. Pour tout entier naturel n , on a l’encadrement : 0 Comme la série géométrique
1 2n
1 1 n· 1 + 2n 2
est convergente,
Ex. 14. La divergence de la série harmonique
n1
tout α 1 .
1 n
1 1+2n
l’est aussi.
entraîne la divergence de
n1
1 nα
, pour
Remarque Il va de soi que le résultat subsiste si l’encadrement 0 un vn n’est valable qu’à partir d’un certain rang n0 ; mais, en cas de convergence, on dispose seulement de l’inégalité : +∞ +∞ un vn . n=n0
n=n0
Corollaire 13 Soit un et vn des séries à termes généraux réels positifs. Si un ∼ vn , alors un et vn sont de même nature. Démonstration.
Si un ∼ vn , il existe un rang n0 à partir duquel on a 0
un 2
vn 2un .
1 (cf. exemple 7 de la n(n + 1) 1 page 614) entraîne la convergence de la série de terme général vn = 2 puisque ces séries sont n à termes positifs et vérifient un ∼ vn .
Ex. 15. La convergence de la série de terme général un =
Remarque Dans le cas de l’utilisation du critère d’équivalence, il est inutile de vérifier le caractère positif des termes généraux des deux séries ; vérifier la positivité de l’un des deux suffit puisque, par équivalence, l’autre est alors positif à partir d’un certain rang. Attention Comme le montre l’exemple suivant, la comparaison (en particulier par équivalent) de séries de terme général non positif ne permet pas, en règle générale, de conclure quant à la nature des séries. (−1)n
1 · n est convergente d’après le théorème des séries alternées (théorème 8 de la
Ex. 16. Pour n ∈ IN∗ , posons un = √ n La série
un
n1
page 616), puisque la suite |un |
n∈IN∗
et vn = un +
est décroissante et tend vers 0 . Donc, comme somme
d’une série convergente et de la série harmonique divergente, la série on a vn ∼ un puisque
1 n
=o
√1 n
·
vn diverge. Pourtant,
619
Chapitre 16. Séries numériques
3
Comparaison série-intégrale
Soit f continue par morceaux sur tout segment de [0, +∞[ . Soit n ∈ IN∗ . En utilisant la subdivision (k)0kn du segment [0, n], la méthode des rectangles permet d’approcher l’intégrale de f sur [0, n] par l’une des deux sommes de Riemann : n−1
f (k)
n
et
f (k)
k=1
k=0
qui sont des sommes partielles (au premier terme près pour la seconde) de la sé rie f (n). Inversement, on peut obtenir des renseignements sur les sommes partielles de cette série en utilisant cette intégrale. Cela est d’autant plus intéressant qu’il est souvent n n plus facile d’évaluer l’intégrale f (t) dt que les sommes partielles f (k). k=0
0
Cas des fonctions décroissantes
Lemme 14 Soit f : [0, +∞[ → IR+ continue par morceaux sur tout segment et décroissante. On a : n n+1 f (t) dt f (n) et ∀n 1 f (t) dt f (n). ∀n 0 n
n−1
Démonstration page 629 L’aire de chacun des deux rectangles hachurés vaut f (n) .
Principe de démonstration.
f (n)
y = f (x)
n−1
Remarques • y
n+1
n
y
En additionnant, pour k ∈ [[1, n]], les inégalités : n k+1 f (t) dt f (k) f (t) dt n−1
k
O
1
x O
n
1
n
x
que l’on visualise sur les schémas ci-dessus.
on obtient les relations : n k+1 f (t) dt f (k)
1
k=1
k
f (t) dt
0
• Plus généralement, si p et q sont deux entiers naturels tels que p q , on a : q q q f (t) dt + f (q) f (k) f (t) dt + f (p). p
620
k=p
p
II Séries à termes réels positifs Point méthode Ces inégalités permettent : • de montrer une convergence de série par majoration des sommes partielles, • de montrer une divergence de série par minoration des sommes partielles,
• de trouver, par encadrement, des équivalents de sommes partielles ou de restes.
Exo 16.6
Proposition 15 (Séries de Riemann) 1 converge si, et seulement si, α > 1 . Soit α ∈ IR. La série nα n1
Démonstration.
Lorsque α 0 , la série diverge grossièrement. Sinon, la fonction t �→ t−α est continue positive et décroissante sur [1, +∞[ . • Supposons α 1 . La minoration : n 1 k=1
kα
n+1
1
dt tα
n
1
dt = tα
ln n 1 1−α
n1−α − 1
si α = 1 si α < 1
montre la divergence de la série puisque le minorant tend vers +∞ lorsque n tend vers +∞ . • Supposons α > 1 . La majoration : n 1 k=1
kα
=1+
n 1 k=2
kα
1+
n
1
dt 1 1 =1+ 1 − n1−α 1 + tα α−1 α−1
montre la convergence de la série, puisqu’elle est à termes positifs et que la suite de ses sommes partielles est majorée.
Ex. 17. Dans le cas divergent ( α 1 ), l’encadrement permet de trouver un équivalent des sommes partielles. En effet : • si α = 1 , on a : ln n
n 1 k=1
Donc
n 1 k=1
k
k
1 + ln n ∼ ln n.
∼ ln n ;
• si α < 1 :
n 1 1−α 1 1−α 1 n −1 1+ n −1 α 1−α k 1−α k=1
et l’on obtient
n 1 k=1
à
n1−α · 1−α
kα
∼
n1−α puisque majorant et minorant sont tous les deux équivalents 1−α
621
Chapitre 16. Séries numériques Corollaire 16 Soit un une série à termes réels. On suppose qu’il existe des réels α et ℓ ∈ IR∗+ ℓ un converge si, et seulement si, α > 1 . tels que un ∼ α . Alors n Démonstration.
La série
ℓ
est à terme général positif, donc par équivalence, la nα suite (un ) est positive à partir d’un certain rang. Le corollaire 13 de la page 619 et la proposition 15 de la page précédente permettent alors de conclure.
Cas des fonctions croissantes Lorsque la fonction f est croissante positive, on obtient le même type de majorations/minorations des sommes partielles : il suffit d’inverser les signes des inégalités : n+1 n n f (t) dt f (k) f (t) dt, 1
y
y
0
k=1
O et plus généralement, si p et q sont deux entiers naturels tels que p q , on a : q q f (t) dt + f (q) f (k) p
III 1
k=p
x O
x
q
f (t) dt + f (p). p
Séries absolument convergentes
Convergence absolue
Définition 4 On dit que la série un est absolument convergente, ou converge absolu ment, si la série à termes réels positifs |un | est convergente.
Théorème 17 Toute série absolument convergente est convergente. Principe de démonstration.
Démonstration page 629 Soit (un )n∈IN ∈ IKIN telle que la série |un | converge.
− • Si (un )n∈IN ∈ IRIN , on montre, en posant u+ n = |un |+un et un = |un |−un pour tout n ∈ IN , + − que un et un sont convergentes et l’on en déduit la convergence de un .
• Si (un )n∈IN ∈ CIN , on montre que
Ex. 18. La série
ein n1
de la série de Riemann in
terme général
622
n2
Re(un ) et
Im(un ) sont absolument convergentes.
est convergente. En effet, ∀n 1
1
n2
in e = 1 et la convergence n2 n2
(cf.proposition 15 de la page précédente) assure que la série de
e est absolument convergente, donc convergente. n2
III Séries absolument convergentes
Attention
La réciproque est fausse : le théorème des séries alternées (voir page 616) (−1)n converge alors qu’elle ne converge pas absolument (série nous dit que la série n n1
harmonique divergente).
Inégalité triangulaire pour des séries absolument convergentes Soit
un une série absolument convergente. On a :
+∞ +∞ un |un |. n=0
n=0
En effet, pour tout p ∈ IN , l’inégalité triangulaire sur les sommes finies nous permet d’écrire :
p p un |un |. n=0 n=0
Étant absolument convergente, la série
un est aussi convergente. Un passage à la limite
n0
lorsque p tend vers +∞ dans l’inégalité précédente donne alors la relation annoncée.
2
Théorèmes de comparaison
Proposition 18 Soit un et vn deux séries numériques.
1. Si un = O(vn ) alors la convergence absolue de 2. Si un = o(vn ) alors la convergence absolue de
vn entraîne celle de
vn entraîne celle de
un .
un .
Démonstration. Si un = O(vn ) , il existe un rang N et un réel A ∈ IR+ tels que, pour tout entier n N , on ait 0 |un | A |vn | . Cela permet d’appliquer la proposition 12 de la page 618. Le deuxième résultat est une conséquence du premier, car un = o(vn ) =⇒ un = O(vn ) .
Point méthode Soit vn une série convergente à terme général positif et (un )n∈IN une suite d’éléments de IK . Si un = O(vn ), alors la série un est absolument convergente.
Exo 16.7
En particulier, en utilisant les séries géométriques (proposition 2 de la page 612) ou les séries de Riemann (proposition 15 de la page 621), on en déduit la convergence absolue (a fortiori la convergence) de un dans chacun des cas ci-dessous : • il existe q ∈ [0, 1[ tel que un = O(q n ) ; • il existe α > 1 tel que un = O(n−α ).
623
Chapitre 16. Séries numériques
Ex. 19. La série
ln n n1
n2n
est convergente.
En effet, comme par croissances comparées Comme la série géométrique converge (absolument).
1 2n
lim
n→+∞
ln n 1 ln n = 0 , on a =o n n n2n 2
·
, à terme général positif, est convergente, la série
ln n n2n
√ n n √ est convergente. 2n + n √ √ En effet, on a, par croissances comparées, n = o(2n ) et donc 2n + n ∼ 2n . De même, en √ fixant α ∈ ]1, 2[ (par exemple α = 2 ), on a n3/2 = o(αn ) . Cela donne un = o ( α2 )n et la Ex. 20. La série de terme général un =
convergence absolue de la série géométrique de raison α/2 ∈ ]0, 1[ assure celle de
un .
Remarque Dans l’exemple 9 de la page 615, la convergence des séries pouvait s’obtenir en montrant leur convergence absolue. Cependant, cela ne nous donne pas la valeur de leurs sommes. Voyons maintenant sur un exemple, comment, lors d’une étude asymptotique du terme général d’une série, utiliser des O plutôt que des o pour exprimer le reste d’un développement limité et ainsi gagner en efficacité. 1 1 Ex. 21. Étudions la série de terme général un = n ln 1 + − cos √ ·
n n En utilisant des développements limités en 0 de cos x et ln(1 + x) , on obtient :
un = n
1 1 1 − 2 +o n 2n n2
−
1−
1 1 √ +o n 2( n)2
=o
1 · n
On ne peut malheureusement rien conclure de cette relation quant à la convergence de la sé rie un . Il faut donc être plus précis. On pourrait pousser un cran plus loin les développements limités utilisés, pour obtenir :
1 1 1 1 − 2 + 3 +o un = n n 2n 3n n3 =
7 1 +o 24n2 n2
−
1 1 1 √ 4 +o 1− √ 2 + 2 n 2( n) 24( n)
,
7 ce qui donne un ∼ 24n un par 2 et permet de montrer la convergence absolue de la série comparaison à une série de Riemann. Néanmoins, on peut obtenir la même conclusion sans calculer les deux termes complémentaires des développements limités de départ. Il suffit d’arriver à un = O( n12 ) de la façon suivante : le
terme 3n1 3 + o n13 taire. Cela donne : un = n
peut être remplacé par O( n13 ) et de même pour l’autre terme complémen-
1 1 1 − 2 +O n 2n n3
−
1−
1 1 √ +O n2 2( n)2
=O
1 n2
On en déduit, par comparaison à une série de Riemann convergente, que la série absolument convergente.
624
·
un est
III Séries absolument convergentes Point méthode Si une fonction f admet un développement limité à l’ordre n + 1 en 0 , on peut remplacer son développement limité à l’ordre n : Exo 16.8
n
f (x) =
ak xk + o(xn )
par
f (x) =
k=0
n
ak xk + O(xn+1 ).
k=0
Attention Un o(xn ) n’est pas nécessairement un O(xn+1 ). L’hypothèse d’existence un développement limité à un ordre supérieur est essentielle. Ex. 22. Retour sur la série exponentielle On a vu à la proposition 9 de la page 617 que la série de terme général un = z n /n! convergeait vers ez , pour tout z ∈ C . Retrouvons directement sa convergence en montrant la convergence absolue. Soit z ∈ C . En prenant n0 ∈ IN tel que n0 2|z| , on a : ∀n n0
|un |
1 |un−1 | 2
donc
∀n n0
|un |
1 |un0 |, 2n−n0
ce qui donne la relation un = O(2−n ) et donc la convergence absolue de avec une série géométrique. Ex. 23. Soit α < 1 et β ∈ IR . Considérons la série
un où un =
n2
Par croissances comparées (directement lorsque β 0 ), on a en déduit la relation de comparaison
1 n
un par comparaison
1 · nα (ln n)β
lim n1−α (ln n)−β = +∞ . On
n→+∞
= o(un ) .
La divergence de la série harmonique 1/n entraîne donc la non convergence absolue de la série un . Pour en déduire sa divergence, il suffit alors de remarquer que un est positif.
Remarque Comme on le voit dans l’exemple précédent, les théorèmes de comparaison ne permettent pas directement de montrer une divergence de série : on ne peut qu’obtenir une non convergence absolue. Pour pouvoir conclure à la divergence, on a alors besoin d’un argument de positivité. Corollaire 19 Soit un et vn deux séries telles que un ∼ vn .
La convergence absolue de l’une entraîne la convergence (absolue) de l’autre.
Démonstration.
On a les deux dominations un = O(vn ) et vn = O(un ) .
Ex. 24. La série de terme général un = ln 1 −
puisque un ∼ vn =
n − (−1) n2
et que la série de Riemann
(−1)n n2
est (absolument) convergente
|vn | est convergente.
Attention L’hypothèse du corollaire 19 est bien la convergence absolue. un et vn peuvent ne pas être de même Rappelons que si un ∼ vn , les séries nature (voir l’exemple 16 de la page 619). 625
Chapitre 16. Séries numériques Point méthode On peut montrer la convergence d’une série non absolument convergente à l’aide d’un développement asymptotique de son terme général.
Exo 16.9
Ex. 25. Pour n ∈ IN∗ , posons un = ln 1 +
L’équivalent un ∼ puisque
(−1)n−1 √ n
(−1)n−1 √
n
(−1)n−1 √ n
·
ne permet pas de conclure quant à la convergence de la série
un
ne converge pas absolument. Utilisons un développement limité à l’ordre 2
de la fonction logarithme en 1 : ln(1 + x) = x − x2 /2 + o(x2 ) . On obtient ainsi : un =
xn
(−1)n−1 1 1 √ − · +o n n 2n yn
La série xn est convergente par le théorème des séries alternées, la série yn est divergente 1 un diverge. puisque yn ∼ − 2n qui est le terme général négatif d’une série divergente, donc
IV
1
Application à l’étude de suites
Point méthode Pour montrer la convergence d’une suite (un )n∈IN , on peut mon trer la convergence absolue de la série télescopique (un+1 − un ) ou de la sé rie (un − un−1 ).
Constante d’Euler
Ex. 26. Montrons que la suite (un )n1 définie par un = Soit n 2 . Posons vn = un − un−1 . On a : vn =
n 1 k=1
k
− ln n est convergente.
1 1 1 − ln(n) + ln(n − 1) = + ln 1 − · n n n
Un développement limité à l’ordre 2 de la fonction logarithme donne ln(1 + x) = x + O(x2 ) donc vn = O(n−2 ) . Ainsi vn est (absolument) convergente, ce qui prouve que la suite (un )n1 converge. Sa limite est appelée constante d’Euler et se note γ .
2
Formule de Stirling
L’objectif de cette partie est de prouver la proposition suivante. Proposition 20 (Formule de Stirling) n n √ n! ∼ 2πn. e 626
IV Application à l’étude de suites Étape 1 On va d’abord prouver l’existence d’un réel K strictement positif tel que : n n √ n n √ n c’est-à-dire n! = K n 1 + o(1) , n! ∼ K e e ou encore, par passage au logarithme : ln(n!) = n ln n − n +
1 ln n + ln K + o(1). 2
Montrons donc la convergence de la suite (un )n1 définie par : un = ln(n!) − n ln n + n −
1 ln n. 2
Il suffira alors de prendre K = eℓ où ℓ = lim un . Soit n 1 . 1 1 un+1 − un = ln(n + 1) − (n + 1) ln(n + 1) + n ln(n) + 1 − ln(n + 1) + ln(n) 2 2 1 1 = n+ ln(n) − n + ln(n + 1) + 1 2 2 1 1 =− n+ ln 1 + +1 2 n 1 1 1 1 1 =− n+ − +1=O · +O 2 n 2n2 n3 n2 Ainsi, la série (un+1 − un ) est (absolument) convergente, ce qui prouve le résultat.
Étape 2 Détermination de K .
Rappelons les résultats concernant les intégrales de Wallis In =
π 2
sinn x dx
0
obtenus à l’exercice 7.9 de la page 264 et dans l’exemple 39 de la page 585 : (2n)! π π ∀n ∈ IN I2n = n 2 et In ∼ · (2 n!) 2 2n À l’aide de l’équivalent trouvé à la première étape, on obtient : √ 2n (2n) e−2n 2n K π π (2n)! π ∼ √ · I2n = n 2 ∼ 2n 2n −2n (2 n!) 2 2 n e n K2 2 K 2n √ √ Par unicité de la limite de n I2n , on obtient alors K = 2π .
627
Chapitre 16. Séries numériques
Démonstrations Théorème 8
Soit n ∈ IN . Les relations :
S2n+2 = S2n − u2n+1 + u2n+2
et
= S2n+1 + u2n+2 − u2n+3
S2n+3
ainsi que la décroissance de la suite (un )n∈IN entraînent : et
S2n+2 S2n
S2n+1 S2n+3 .
La suite (S2n+1 )n∈IN est donc croissante et (S2n )n∈IN est décroissante. Par ailleurs, on a : S2n − S2n+1 = u2n+1 ,
∀n ∈ IN donc,
lim (S2n+1 − S2n ) = 0 .
n→+∞
Les suites (S2n+1 )n∈IN et (S2n )n∈IN sont ainsi adjacentes, donc convergent vers un même réel S . un . Cela prouve la convergence de la suite (Sn )n∈IN et donc de la série
De plus, sa somme S est toujours comprise entre deux termes consécutifs Sn et Sn+1 , ce qui donne les schémas suivants : −un+1 Sn+1
(cas n pair) Sn
S Rn un+1
(cas n impair) S
Sn
Sn+1
Rn Donc, pour tout n ∈ IN , le réel Rn est du signe de (−1)n+1 et |Rn | un+1 .
En particulier, |R0 | u1 u0 , donc S = u0 + R0 ∈ [0, u0 ] . Proposition 9
Soit z ∈ C . La fonction f : t �→ etz est de classe C ∞ sur [0, 1] et l’on a : ∀t ∈ [0, 1]
∀n ∈ IN
f (n) (t) = z n etz = z n f (t).
Soit n ∈ IN . On en déduit, d’après l’inégalité de Taylor-Lagrange :
n n f (k) (0) 1 z zk , e − = f (1) − Mn+1 k! k! (n + 1)! k=0 k=0
où Mn+1 est un majorant de f (n+1) sur [0, 1] . Or, la fonction f est continue sur le seg-
ment [0, 1] donc y est bornée par un certain réel M . On peut donc prendre Mn+1 = |z|n+1 M , ce qui donne :
n |z|n+1 z zk · M e − k! (n + 1)! k=0
On conclut en remarquant que appliqué au réel positif x = |z| .
628
|z|n+1 (n+1)!
−→ 0 d’après la fin de l’exemple 12 de la page 617
n→+∞
Démonstrations Proposition 12
Ces résultats sont une conséquence des inégalités : n
∀n ∈ IN
up
p=0
n
(∗)
vp .
p=0
Si vn converge, la suite de ses sommes partielles est majorée ; il en est alors de même de celle de la série un . Donc un est convergente. Un passage à la limite dans la relation (∗) donne alors l’inégalité voulue. Le deuxième point se déduit du premier par contraposition. Lemme 14
Soit n ∈ IN . Par décroissance de la fonction f et croissance de l’intégrale, on a : ∀t ∈ [n, n + 1]
f (n + 1) f (t) f (n).
En intégrant ces inégalités sur [n, n + 1] , on obtient : f (n + 1)
n+1
f (t) dt f (n)
n
Par changement de variable [n = n − 1] dans l’inégalité de gauche, cela donne les relations annoncées. Théorème 17
Soit (un )n∈IN ∈ IKIN telle que la série
Cas des séries réelles. On suppose ici : ∀n ∈ IN
|un | converge. un ∈ IR .
− Pour tout n ∈ IN , les réels u+ n = |un | + un et un = |un | − un sont positifs et véri− + − + − fient un = u+ n − un et |un | = un + un : en particulier, 0 un |un | et 0 un |un | .
La convergence de la série de terme général |un | entraîne donc la convergence des séries à + − termes positifs un et un .
Par suite, (u+ − u− n ) est une série convergente, en tant que différence de séries convern gentes. Donc un est convergente.
Cas des séries complexes. Des inégalités : ∀n ∈ IN
Re(un ) |un | et Im(un ) |un |,
on déduit que les séries à termes généraux positifs | Re(un )| et | Im(un )| sont convergentes ; Re(un ) et Im(un ) sont ainsi absolument convergentes et, d’après le point les séries précédent, convergentes. Donc, la série de terme général un est convergente.
629
Chapitre 16. Séries numériques
S’entraîner et approfondir 16.1 Étudier la convergence de la série de terme général →612
16.2 Nature de la série
n1
→613
ln 1 +
1 n
→616
→618
n+1 · n
?
16.3 Soit x ∈ IR \ IN . Montrer la convergence de la série 16.4 Soit
(−1)n n−x
.
un une série à termes positifs convergente.
Montrer que la série
u2n est convergente.
un et vn des séries à termes généraux positifs. Montrer que la série de terme 16.5 Soit →618 général max(un , vn ) converge si, et seulement si, les séries un et vn sont convergentes. 16.6 À l’aide d’une comparaison avec une intégrale, montrer la divergence de la série
n2
→621
et donner un équivalent de ses sommes partielles. 16.7 Soit (α, β) ∈ IR2 ; on suppose α > 1 . Montrer la convergence de la série →623
16.8 Étudier la série de terme général un = n3/2 →625
16.9 Étudier la convergence de la série →626
n1
√
tan
(−1)n · n − (−1)n
n1
2 · n(n+2)
vn des séries convergentes à termes positifs. √ Montrer que la série de terme général un vn est convergente.
16.11 Soit
un et
n2
1 · (ln n)β nα
1 1 − sh · n n
16.10 Montrer la convergence et calculer la somme de la série
1 n ln n
α
16.12 Soit la série de terme général un = e−n 1. Montrer que pour α 0 , la série
avec α ∈ IR .
un est divergente. 1 et en déduire la nature de un . 2. On suppose α > 0 . Montrer que un = o n2 16.13 Soit x ∈ IR+ . Montrer que le reste d’ordre n de la série d’une série convergente.
630
(−1)n n1
(n + x)2
est le terme général
Exercices
16.14 Soit un une série alternée dont le terme général décroît en valeur absolue et tend vers 0 . Montrer que les sommes partielles sont du signe de u0 et de module majoré par |u0 | . 16.15 Étudier la convergence de la série
1
1
n n − (n + 1) n .
16.16 Étudier la convergence des séries suivantes et calculer leur somme : 1.
n3
n2
1 ; −n
2.
ln
n1
n2 + 3n + 2 n2 + 3n
;
3 + (−1)n
3.
n0
−n
.
16.17 Soit (a, b) ∈ IR2 . Étudier la convergence de la série de terme général : √ √ √ un = n + a n + 1 + b n + 2. Lorsque la série converge, calculer sa somme. ⋆ 16.18 1. Étudier la convergence de la série 2. En remarquant que
1
xp dx =
0
⋆ 16.19 Soit n ∈ IN∗ . On pose un = − 1. Déterminer
lim
5n
n→+∞ k=1
2. En déduire que
16.20 En étudiant les séries
(−1)n · (2n + 1)(2n + 3)
1 pour tout entier p , calculer sa somme. p+1
1 4 si n est multiple de 5 et un = sinon. n n
uk .
uk converge et déterminer
+∞
uk .
k=1
1 nβ
−
1 (n+1)β
la nature des séries de Riemann.
, pour β ∈ IR∗ , et
ln(n + 1) − ln(n) , retrouver
π x . On pose un = ln cos n , pour n ∈ IN∗ . 2 2 un converge. 1. Montrer que
⋆ 16.21 Soit x ∈ 0,
2. Calculer
+∞
un . Indication. On pourra utiliser la formule sin 2a = 2 sin a cos a .
n=1
16.22 Soit (un )n∈IN , (vn )n∈IN et (wn )n∈IN des suites réelles telles que : On suppose que
un et
16.23 Montrer que la série
ln n n1
n
∀n ∈ IN
un vn wn .
wn convergent. Montrer que
vn converge.
diverge et donner un équivalent simple de
16.24 Soit n ∈ IN∗ et α ∈ ]1, +∞[ . Donner un équivalent de un = nature de la série
un .
n ln k k=1
+∞
k=n+1
⋆ 16.25 Soit α ∈ IR . Étudier la nature de la série de terme général un = cos
k
·
1 , et en déduire la kα
1 n
nα
.
631
Chapitre 16. Séries numériques
Solutions des exercices 16.1 La série diverge grossièrement puisque son terme général a pour limite 1 . 16.2 Puisque, pour tout n 1 , on a un = ln(n + 1) − ln n , la série est une série télescopique. D’après la proposition 4 de la page 613, la série est ici divergente car lim ln n = +∞ . n→+∞
16.3 Posons un = pour tout n ∈ IN et prenons n0 ∈ IN tel que n0 x . La suite (un )nn0 est positive, décroissante et tend vers 0 . On en déduit, d’après le théorème des séries alternées, la convergence de la série (−1)n un donc, par le caractère asymptotique de la notion de 1 n−x
nn0
série convergente, celle de
(−1)n un .
n0
16.4 La série un étant convergente, son terme général tend vers 0 . Il existe donc un rang N tel que : ∀n N 0 un 1, et l’on a alors : ∀n N 0 u2 un . La proposition 12 de la page 618 permet alors denconclure. 16.5 • Pour tout n ∈ IN , on a 0 max(un , vn ) un + vn par positivité de un et vn . Si un et vn sont convergentes, alors la série de terme général un + vn est les séries convergente comme somme de deux séries convergentes et l’on en déduit que la série de terme général max(un , vn ) est convergente. max(un , vn ) converge, alors les inégalités 0 un max(un , vn ) • Si la série et 0 vn max(un , vn ) entraînent la convergence des séries un et vn .
1 est continue positive et décroissante sur [2, +∞[ . 16.6 La fonction f : x �→ x ln x On obtient donc l’encadrement, pour tout n 2 :
n
f (t) dt
2
n+1
f (t) dt
2
n
f (k) f (2) +
n
f (t) dt.
(∗)
2
k=2
Or, une primitive de f sur [2, +∞[ est x �→ ln(ln x) , qui tend vers +∞ en +∞ . On en f (n) . Comme : déduit, par minoration, la divergence de la série
n2
n
f (t) dt = ln(ln n) − ln(ln 2) ∼ ln(ln n)
2
et
les majorant et minorant de (∗) sont équivalents à ln(ln n) et donc : n k=2
f (2) = o ln(ln n) ,
1 ∼ ln(ln n). k ln k
1 16.7 Posons un = , pour n 2 . (ln n)β nα Comme α > 1 , on peut trouver γ ∈ IR tel que 1 < γ < α . Alors, par croissances comparées, et même directement si β 0 :
Donc un = o celle de
632
un .
nγ un = (ln n)−β nγ−α −→ 0 1 nγ
n→+∞
puisque γ − α < 0 .
et la convergence absolue de la série
1
nγ
(puisque γ > 1 ) assure
Solutions des exercices 16.8 Les fonctions tan et sh étant de classe C ∞ au voisinage de 0 , elles admettent un développement limité en 0 à l’ordre 3 que l’on peut écrire, par imparité, tan x = x + O(x3 ) et sh x = x + O(x3 ) . Cela donne : un = n3/2 × O et donc la convergence absolue de la série convergente.
1 n3
=O
1 n3/2
,
un par comparaison à une série de Riemann
16.9 Soit n ∈ IN∗ . Utilisons un développement limité : un = √
(−1)n (−1)n = √ n n − (−1) n (−1)n = √ n
(−1)n 1− √ n
−1
(−1)n 1 1+ √ +O n n
La convergence de la série alternée
(−1)n √
n
=
vn
, la divergence de la série harmonique
la convergence absolue, par comparaison à une série de Riemann, de la série donc la divergence de la série un . 16.10 Pour tout n ∈ IN∗ , on a
(−1)n 1 1 √ + +O n n3/2 n
·
1 n
et
vn entraîne
2 1 1 = − , donc les sommes partielles de cette série n(n + 2) n n+2
s’écrivent : n k=1
La série
n
n
k=1
k=1
1 1 1 1 1 2 = − =1+ − − · k(k + 2) k k+2 2 n+1 n+2
un est donc convergente et l’on a
+∞ n=1
n1
3 2 = · n(n + 2) 2
√ √ √ 16.11 Soit n ∈ IN . On a ( un − vn )2 = un + vn − 2 un vn 0 . On en déduit que : ∀n ∈ IN
0
√
un vn
un + vn · 2
Cet encadrement assure la convergence de la série de terme général
√
un vn .
α
16.12 1. La série de terme général un = e−n diverge pour α 0 puisque son terme général ne tend pas vers 0 . 2. Soit α > 0 . Par croissances comparées : α
n2 un = (nα )2/α e−n
−→ 0,
n→+∞
1 · n2 Comme 2 > 1 , on en déduit que un converge absolument. ce qui signifie que un = o
633
Chapitre 16. Séries numériques 16.13 La série
(−1)n
est une série alternée et la suite
(n + x)2
n1
1 (n + x)2
D’après le théorème des séries alternées, on en déduit que la série
décroît et tend vers 0 .
(−1)n n1
que son reste d’ordre n vérifie :
(n + x)2
converge et
+∞ (−1)p 1 1 |Rn | = 2· 2 2 n (n + x) (n + 1 + x) p=n+1
Par comparaison, la série de terme général Rn est absolument convergente, donc convergente. 16.14 Soit N ∈ IN . On considère la série La série
vn où :
vn = un
∀n N
vn = 0.
∀n > N
vn est évidemment alternée, son terme général tend vers 0 et a un module N
décroissant. Donc la somme
+∞
un =
n=0
par |u0 | . 16.15 On peut écrire un = n
1
Comme ln 1 +
n
On en déduit que 1
Donc un = n n − 1
Puisque n n = exp
16.16 1. Comme
et
n3
∼
1 n
− (n + 1)
n1
1 n
= exp
1 1 + o( 2 ) . n2 n n
1 n
=n
1 n
ln n
1 1− 1+ n
1
1 1 , on a ln 1 + n n n
1+
1
vn est du signe de v0 = u0 et majorée en module
n=0
=
.
1
1 +o . n2 n2
1 1 ln 1 + n n
−→ 1 , on a un ∼ −
n→+∞
n1
=1+
1 1 . +o n2 n2
1 , d’où la convergence absolue de un . n2
1 1 1 ∼ 3 , la série à termes positifs est convergente. −n n n3 − n n2
À partir de l’égalité (cf. chapitre 21) :
1 1 1 1 1 1 =− + + , n3 − n n 2n−1 2n+1
∀n 2 on obtient que : N n=2
N N N 1 1 1 1 1 1 =− + + n3 − n n 2 n−1 2 n+1
=− =− Donc
n2
634
n=2
n=2
N
N−1
1 n=2
n
+
n=2
N+1
1 1 1 1 + 2 n 2 n n=1
n=3
1 1
1 1 1 1 1 1 1 − + + + + · = − 2 N 2 4 2 N N +1 4 2N (N + 1)
+∞ 1 1 1 est convergente et = · n3 − n n3 − n 4 n=2
Solutions des exercices 2. De la relation ln par télescopage : N
ln
n=1
n2 + 3n + 2 n2 + 3n
n2 + 3n + 2 n2 + 3n
=
= ln(n + 2) + ln(n + 1) − ln n − ln(n + 3) , on obtient,
N n=1
ln(n + 1) − ln(n) −
N
ln(n + 3) − ln(n + 2)
n=1
= ln(N + 1) − ln(1) − ln(N + 3) + ln 3 = ln 3 − ln On en déduit que la série est convergente et que
+∞
ln
n=1
3. La relation : ∀n ∈ IN prouve que
0
1 3 + (−1)n
(3 + (−1)n )(−n) est convergente.
n
n2 + 3n + 2 n2 + 3n
N +3 · N +1
= ln 3.
1 2n
n0
Soit N ∈ IN . On a : 2N
(3 + (−1)n )(−n) =
n=0
N j=0
N
=
j=0
Par passage à la limite, +∞
(3 + (−1)n )(−n) =
n=0
16.17 On a un =
√
n 1+a
N−1
4(−2j) +
1 1+ +b n
1+
2 n
2(−2j−1)
j=0
1 16
j
+
N−1 1 1 j · 2 4 j=0
1 1 1 + 1 21− 1 − 16
1 4
=
26 · 15
.
• En utilisant le développement limité (1 + t)1/2 = 1 + obtient un développement asymptotique de un :
t 2
+ O(t2 ) au voisinage de 0 , on
√ √ a a 1 1 1 1 +b +O 2 + b √ +O √ . n (1 + a + b) + = (1+a+b) n+ 2 n n 2 n n n √ un est grossièrement divergente. ∗ Si 1 + a + b �= 0 , alors un ∼ (1 + a + b) n et a 1 a + b �= 0 , alors un ∼ + b √ et un diverge d’après le ∗ Si 1 + a + b = 0 et 2 2 n corollaire 13 de la page 619, puisque l’équivalent obtenu est le terme général de signe constant d’une série divergente. 1 a ∗ Si 1+a+b = 0 et et un converge (absolument). +b = 0 , alors un = O √ 2 n n a + b = 0 ⇐⇒ (a = −2 et b = 1) . Or 1 + a + b = 0 et 2 On en conclut que un converge si, et seulement si, (a, b) = (−2, 1).
un =
635
Chapitre 16. Séries numériques • On suppose que (a, b) = (−2, 1) . Dans ce cas, on a, pour tout n ∈ IN : n
uk =
k=0
k=0
=
On en déduit que
+∞ n=0
n √
√
k−2
n+2−
n+1 √
k+
k=1
√
n+2 √
k
k=2
n+1−1 = √
1 √ − 1. n+2+ n+1
un = −1.
(−1)n 1 assure la convergence absolue, et donc la (2n + 1)(2n + 3) 4n2 convergence, de la série. 1 1 1 1 = − pourrait faire penser à une somme 2. La relation (2n + 1)(2n + 3) 2 2n + 1 2n + 3 télescopique ; mais ce n’est pas le cas ici à cause des changements de signes occasionnés par les « (−1)n ».
16.18 1. La majoration
Néanmoins, calculons les sommes partielles. Soit N ∈ IN . 2
N n=0
N
N
(−1)n (−1)n (−1)n = − (2n + 1)(2n + 3) 2n + 1 2n + 3 n=0
n=0
N
=
n=0
=
1
0
=
0
=
0
(−1)n x2n dx −
N n=0
1
1
1
0
1
0
Donc :
1 − x2 (−x2 )N+1 dx 1 + x2 lim
N→+∞
Comme que :
0
1
2
1−x dx = 1 + x2
1 0
0
−1 +
+∞ n=0
636
1 0
1
2 n
1
(−1)n x2n+2 dx
0
n=0
(1 − x ) (−x )
dx
1 − x2 − (1 − x2 ) (−x2 )N+1 dx 1 + x2
1 − x2 dx − 1 + x2
Intéressons-nous à la deuxième intégrale :
2
N
0
1
1 − x2 (−x2 )N+1 dx. 1 + x2
1 − x2 2N+2 x dx 1 + x2
1
x2N+2 dx =
0
1 · 2N + 3
1 − x2 (−x2 )N+1 dx = 0. 1 + x2
2 1 + x2
dx = −1 + 2 Arctan 1 =
(−1)n π 1 = − · (2n + 1)(2n + 3) 4 2
π − 1 , on en déduit 2
Solutions des exercices n
16.19 Notons, pour n ∈ IN , Sn =
uk .
k=1
1. On obtient, pour tout n ∈ IN : S5n =
n−1 k=0
n−1
=
k=0
1 1 1 4 1 + + + − 5k + 1 5k + 2 5k + 3 5k + 4 5k + 5 1 1 1 1 1 + + + + 5k + 1 5k + 2 5k + 3 5k + 4 5k + 5 n
5n
=
1 k=1
k
−
1 k=1
k
1
k=n+1
=
k
n→+∞
2. Comme
5n
−
1 1 · n 1 + k/n
n−1 k=0
5 5k + 5
k=1
On reconnaît une somme de Riemann de la fonction t �→ lim
4n
5n
=
uk =
4
0
k=1
1 , continue sur [0, 4] . Donc : 1+t
dt = ln 5. 1+t
lim up = 0 , S5n+1 = S5n + u5n+1 a aussi pour limite ln 5 .
p→+∞
De la même manière, on montre que : lim S5n+2 = lim S5n+3 = lim S5n+4 = ln 5.
n→+∞
n→+∞
n→+∞
On peut alors facilement montrer (en adaptant la démonstration de la proposition 19 de la page 322) que la suite (Sn )n1 converge vers ln 5 et donc que : +∞
uk = ln 5.
k=1
16.20 Soit β �= 0 . On a :
1 1 1 − = β nβ (n + 1)β n
Comme la suite de terme général vn = la convergence de la série pique
1 nβ
−
1 (n+1)β
1− 1+
β nβ+1
1 nβ+1
En conclusion, on en déduit que la série nα
β · nβ+1
est de signe constant, on en déduit que
1 nβ
ln(n + 1) − ln n = ln 1 +
1
∼
vn est équivalente à la convergence de la série télesco-
et diverge si β < 0 . De la même façon, l’équivalent :
pour α ∈ IR , la série
−β
1 ∼−(−β) n
, c’est-à-dire de la suite
montre la divergence de la série
1 n
1 n
. Or, cette dernière converge si β > 0
∼
1 0 n
lorsque β = 0 .
1 converge si, et seulement si, β > 0 . Donc, nβ+1
converge si, et seulement si, α > 1 .
637
Chapitre 16. Séries numériques 16.21 Remarquons tout d’abord que ∀n ∈ IN
π x ∈ 0, , ce qui assure que cos 2xn > 0 et 2n 2
donc que un est bien défini. 2 x 1. Comme lim cos n = 1 , on a, par l’équivalent usuel 1 − cos t ∼ t2 : t→0 n→+∞ 2 un ∼ cos
x 1 x2 −1 ∼ − , n 2 2 4n
un , donc sa convergence. ce qui assure la convergence absolue de la série x x x 2. Soit k ∈ IN∗ . De la relation 2 sin k cos k = sin k−1 , on tire : 2 2 2 ln
cos
x 2k
= ln
sin
x 2k−1
− ln
sin
x 2k
− ln 2,
puis en sommant pour k allant de 1 à n ∈ IN∗ et par télescopage : n
uk =
k=1
n
ln sin
k=1
x
2k−1
= ln(sin x) − ln sin
− ln sin
x 2n
= ln(sin x) − ln 2n sin
x − n ln 2 2k
− n ln 2
x 2n
·
x x ∼ 2n n = x −→ x . On obtient donc, par continuité de la fonction ln : n→+∞ 2n 2
Or 2n sin
+∞
ln cos
k=1
16.22 On obtient : ∀n ∈ IN
x 2k
= ln(sin x) − ln(x) = ln
sin x · x
0 vn − un wn − un .
La série de terme général wn − un est une série convergente comme différence de deux séries convergentes. La série de terme général positif vn − un l’est donc aussi.
Comme vn = (vn − un ) + un , vn est le terme général d’une série convergente.
16.23 La relation
1 n
ln n
=o
n
convergence absolue de
, ainsi que la divergence de la série harmonique
ln n n
1 n
, assure la non
, donc sa divergence puisqu’elle est à termes positifs.
ln t est continue, positive et décroissante sur ]e, +∞[ . Une comparaison t série-intégrale (cf. page 620) donne :
La fonction f : t �→
3
Comme
3
638
n
n
ln t dt t
3
n+1
n
ln k ln(3) ln t dt + t k 3 k=3
3
n
ln t dt. t
n n 2 1 1 ln t ln k dt = ∼ (ln t)2 3 , on en déduit que ln n . t 2 k 2 k=1
Solutions des exercices 16.24 Comme α > 1 , la série de terme général pour n ∈ IN∗ .
1 est convergente ; cela justifie l’existence de un nα
1 étant continue, positive et décroissante sur [1, +∞[ , une comparaison tα série-intégrale (cf. page 620) donne : La fonction f : t �→
N+1
f (t)dt
n+1
Or,
N+1
n+1
1 1 α − 1 tα−1
f (t)dt = −
1 1 α − 1 tα−1
N
n
f (t)dt = −
N
f (p)
−→
n+1 N→+∞
N
−→
n N→+∞
Par passage à la limite dans (∗) , on obtient :
f (t)dt.
(∗)
n
p=n+1
N+1
N
1 1 α − 1 (n + 1)α−1
1 1 · α − 1 nα−1
1 1 1 1 un · α − 1 (n + 1)α−1 α − 1 nα−1 Cela donne un ∼
1 1 · α−1 nα−1
Par positivité de son terme général, on en déduit que que
n1
1 nα−1
, soit que
n1
seulement si, α > 2 .
un est de même nature
n1
un converge si, et seulement si, α − 1 > 1 c’est-à-dire si, et
16.25 On a un = exp(vn ) avec vn = nα ln cos
1 n
∼ nα cos
−1 ∼−
1 n
nα−2 · 2
On en déduit : • pour α 2 , que (vn ) ne tend pas vers −∞ et donc un ne tend pas vers 0 ; • pour α > 2 , que (vn ) tend vers −∞ et que
ln n vn
ln n ∼ − n2α−2
−→
n→+∞
0 par croissances
comparées. Donc vn + 2 ln n = vn + o(vn ) ∼ vn −→ −∞ . n→+∞
Par suite, n2 un = exp(vn + 2 ln n) −→ 0 . Donc En conclusion,
n→+∞
un est convergente.
un converge si, et seulement si, α > 2 .
639
Chapitre 17 : Arithmétique dans ZZ I
Divisibilité dans ZZ . . . . . . . . . . . . . . . . . Diviseurs, multiples . . . . . . . . . . . . . . . Division euclidienne sur ZZ . . . . . . . . . . . II PGCD, PPCM . . . . . . . . . . . . . . . . . . . 1 Définition du PGCD . . . . . . . . . . . . . . . 2 Caractérisation du PGCD . . . . . . . . . . . . 3 Algorithme d’Euclide . . . . . . . . . . . . . . . 4 Extension au cas des entiers relatifs . . . . . . 5 Coefficients de Bézout . . . . . . . . . . . . . . 6 Entiers premiers entre eux . . . . . . . . . . . . 7 Extension à un nombre fini d’entiers . . . . . . 8 PPCM . . . . . . . . . . . . . . . . . . . . . . . 9 Lemme de Gauss . . . . . . . . . . . . . . . . . III Nombres premiers . . . . . . . . . . . . . . . . . 1 Définition . . . . . . . . . . . . . . . . . . . . . 2 Propriétés . . . . . . . . . . . . . . . . . . . . . 3 Décomposition en produit de facteurs premiers IV Congruences . . . . . . . . . . . . . . . . . . . . 1 Définition, compatibilité . . . . . . . . . . . . . 2 Inverse modulo n . . . . . . . . . . . . . . . . 3 Petit théorème de Fermat . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
642 . 642 . 643 644 . 644 . 644 . 645 . 646 . 646 . 648 . 649 . 650 . 652 652 . 652 . 653 . 654 657 . 657 . 657 . 658 659 665
17
Arithmétique dans ZZ
I
Divisibilité dans ZZ
1
Diviseurs, multiples
Définition 1 Étant donné deux entiers relatifs a et b , on dit que b divise a, et l’on note b | a, s’il existe k ∈ ZZ tel que a = k b . On dit aussi que b est un diviseur de a, ou que a est un multiple de b .
Notations • L’ensemble des diviseurs de a ∈ ZZ est noté D(a).
• L’ensemble des multiples de b ∈ ZZ est noté bZZ = b q | q ∈ ZZ .
Remarques • 1 et −1 divisent tous les entiers, mais ne sont divisibles que par 1 et −1 . • 0 est un multiple de tous les entiers, mais n’est diviseur que de lui-même.
• Si a est non nul et si b divise a, alors |b| |a|. En effet, il existe un entier k tel que a = k b , et puisque a �= 0 , on a k �= 0 donc |k| 1 . Les diviseurs d’un entier a non nul sont donc en nombre fini (alors que D(0) = ZZ est infini).
Proposition 1 Soit (a, b) ∈ ZZ2 . On a a | b et b | a ⇐⇒ |a| = |b|. Deux tels entiers sont dits associés.
Démonstration page 659
Principe de démonstration.
Deux entiers k et k′ tels que k k′ = 1 sont égaux à ±1 .
I Divisibilité dans ZZ Remarques • La divisibilité est une relation d’ordre sur IN, mais pas sur ZZ (voir les exemples 53 de la page 50 et 2.25 de la page 56). • Pour tout ce qui concerne la divisibilité, on peut se limiter à IN puisqu’un entier a les mêmes diviseurs et les mêmes multiples que son opposé. • La divisibilité sur IN∗ est liée à l’ordre naturel de IN∗ par la relation : a | b =⇒ a b.
Ce résultat est faux dans IN puisque, par exemple, 1 | 0 . Proposition 2 Soit (a, b) ∈ ZZ2 .
• Si (u, v) ∈ ZZ2 , alors :
d|a
et d | b =⇒ d | a u + b v.
• Si n est un entier non nul, alors :
b n | a n ⇐⇒ b | a.
2
Démonstration page 659
Division euclidienne sur ZZ
Théorème 3 Soit a un entier relatif et b un entier naturel non nul. Il existe un unique couple d’entiers relatifs (q, r) tel que : a = bq +r
et
0 r < b.
(∗)
• q est appelé quotient de la division euclidienne de a par b , • r est appelé reste de la division euclidienne de a par b .
Démonstration page 659 On peut procéder par analyse-synthèse : si le couple (q, r) convient, alors q est le plus grand entier n tel que n b a et r = a − b q . On vérifie alors qu’un tel couple existe et convient.
Principe de démonstration.
Remarques • Si q est le quotient de la division euclidienne de a par b ∈ IN∗ , on a b q a < b q+b a a où ⌊x⌋ désigne la partie entière de x. c’est-à-dire q < q + 1 . Donc q = b b • Si (a, b) ∈ IN × IN∗ , le quotient de la division euclidienne de a par b est un entier naturel. Proposition 4 Étant donné a ∈ ZZ et b ∈ IN∗ , on a b | a si, et seulement si, le reste de la division euclidienne de a par b est nul. Démonstration page 659
643
Chapitre 17. Arithmétique dans ZZ
II
PGCD, PPCM
1
Définition du PGCD
Soit a et b deux entiers naturels non tous les deux nuls. L’ensemble des diviseurs communs à a et b est une partie de ZZ, non vide puisqu’elle contient 1 , et majorée par exemple par max(a, b) (et même par min(a, b), si a et b sont tous les deux non nuls). Elle possède donc un plus grand élément, supérieur ou égal à 1 . Définition 2 Soit a et b deux entiers naturels non tous les deux nuls. Le PGCD de a et b , noté a ∧ b , est le plus grand des diviseurs communs à a et b . Ex. 1. L’ensemble des diviseurs positifs de 12 est {1, 2, 3, 4, 6, 12} et celui de 15 est {1, 3, 5, 15} , donc 1 et 3 sont les seuls diviseurs positifs communs à 12 et 15 et le plus grand d’entre eux est 12 ∧ 15 = 3 . Ex. 2. Si a est un entier naturel non nul, on a a ∧ 0 = a puisque a est le plus grand diviseur de a et qu’il divise également 0 .
Remarque Deux entiers naturels non tous les deux nuls ont toujours un PGCD supérieur ou égal à 1 .
2
Caractérisation du PGCD
Lemme 5 Soit a, b deux entiers naturels, avec b �= 0 . On suppose a = b q + r , avec q et r des entiers naturels. Alors D(a) ∩ D(b) = D(b) ∩ D(r) et, en particulier, a ∧ b = b ∧ r .
Démonstration page 659
Théorème 6 Soit a et b deux entiers naturels non tous les deux nuls et d leur PGCD. Alors D(d) = D(a) ∩ D(b), c’est-à-dire :
∀n ∈ IN (n | a et
n | b) ⇐⇒ n | d.
(∗)
Le PGCD de a et b est le seul élément d ∈ IN∗ à vérifier l’équivalence (∗).
Démonstration page 660
Principe de démonstration. On démontre par récurrence forte la propriété Hb : « pour tout a , on a D(a) ∩ D(b) = D(a ∧ b) » en utilisant la division euclidienne de a par b . Remarque Si a = b = 0 , on a D(a) ∩ D(b) = ZZ = D(0). On peut donc poser, par convention, 0 ∧ 0 = 0 , ce qui permet d’avoir, dans tous les cas : D(a) ∩ D(b) = D(a ∧ b).
644
II PGCD, PPCM Point méthode Dans la pratique, pour déterminer le PGCD de deux entiers a et b non tous les deux nuls, il suffit d’exhiber un diviseur d commun à a et b qui vérifie l’implication : ∀n ∈ IN (n | a et n | b) =⇒ n | d. L’implication réciproque (indispensable pour déterminer le PGCD d’après le théorème 6 de la page ci-contre) est alors une conséquence immédiate du fait que d divise a et b . Proposition 7 Soit a et b deux entiers naturels non tous les deux nuls et k ∈ IN∗ . Alors : (k a) ∧ (k b) = k (a ∧ b).
Démonstration page 660
Principe de démonstration.
On note d le quotient de la division de (k a) ∧ (k b) par k . Vérifier que d divise a et b et aussi l’implication : ∀n ∈ IN
(n | a
et
n | b) =⇒ n | d.
Remarques • Soit a et b deux entiers naturels non tous les deux nuls. Posons d = a∧b . D’après la définition 2 de la page précédente, d est le plus grand élément de D(a) ∩ D(b) au sens de l’ordre naturel de IN. De plus, on a l’implication : n ∈ D(a) ∩ D(b) =⇒ n | d, donc d est aussi le plus grand élément de D(a) ∩ D(b), au sens de la divisibilité. Ainsi, le pgcd de a et b est le plus grand élément de D(a) ∩ D(b) à la fois pour l’ordre naturel et pour la relation de divisibilité. • En revanche, lorsque a = b = 0 , parmi les diviseurs communs à a et b (c’est-àdire tous les entiers), il n’en existe pas de plus grand pour l’ordre naturel de IN, mais 0 est bien le plus grand d’entre eux pour la relation de divisibilité. La convention 0 ∧ 0 = 0 (remarque de la page ci-contre) prend alors tout son sens.
3
Algorithme d’Euclide
L’algorithme d’Euclide, donné ci-contre en Python 3, permet de calculer un PGCD à l’aide du lemme 5 de la page précédente et de la division euclidienne : si b est non nul, le PGCD de a et b est le même que celui de b et du reste r de la division euclidienne de a par b . Il suffit donc de remplacer (a, b) par (b, r) et de recommencer.
def pgcd(a,b): while b != 0: (a,b) = (b,a%b) return a
645
Chapitre 17. Arithmétique dans ZZ Remarques • Lorsque b = 0 , on n’effectue aucune division et le résultat obtenu est bien a = a∧0 . • Lorsque a < b , la première division donne a pour reste et l’algorithme commence donc par échanger a et b . Par la suite, on a toujours a > b . • La terminaison de l’algorithme est assurée par le fait que la variable entière b diminue strictement à chaque itération et donc finit par s’annuler. • Le PGCD est alors le dernier reste non nul.
4
Extension au cas des entiers relatifs
Les diviseurs et les multiples d’un entier a sont les mêmes que ceux de −a. On peut donc étendre les définitions des PGCD aux entiers relatifs de la façon suivante. Définition 3 Soit a et b deux entiers relatifs. Le PGCD de a et b , noté a ∧ b , est le PGCD de |a| et |b|. On conserve de façon évidente le résultat fondamental suivant : si a et b sont deux entiers relatifs, leur PGCD est l’unique entier naturel d tel que D(d) = D(a) ∩ D(b), c’est-à-dire tel que d divise a et b et : ∀n ∈ ZZ (n | a
5
et n | b) =⇒ n | d.
Coefficients de Bézout
Théorème 8 Soit a et b deux entiers relatifs. Il existe des entiers relatifs u et v tels que : a u + b v = a ∧ b.
Un tel (u, v) est appelé un couple de coefficients de Bézout de a et b . Démonstration page 660
Principe de démonstration.
Quitte à remplacer a par |a| et b par |b| , il suffit de traiter le cas où a et b sont des entiers naturels. On démontre l’existence de u et v par une récurrence sur b similaire à celle du théorème 6 de la page 644 : si a = b q + r et si l’on dispose d’un couple (u′ , v ′ ) tel que b u′ + r v ′ = d , où d = a ∧ b = b ∧ r , alors on trouve facilement u et v tels que a u + b v = d .
Remarque Il n’y a pas unicité d’un tel couple de coefficients de Bézout. En effet, si (u, v) est un tel couple, alors (u−b, v+a) en est un autre car a (u−b)+b (v+a) = d. Exo 17.1
Obtention des coefficients de Bézout par l’algorithme d’Euclide Comme on l’a vu dans la démonstration précédente, lorsque l’on connaît un couple de coefficients de Bézout de b et r , avec a = b q + r , on connaît un couple de coefficients de Bézout de a et b . Dans l’algorithme d’Euclide, il suffit donc de remonter les calculs en partant de la fin. 646
II PGCD, PPCM Ex. 3. Soit a = 19 et b = 7 . • La première division euclidienne s’écrit a = b q1 + c , avec q1 = 2 et c = 5 .
• La deuxième est b = c q2 + d , avec q2 = 1 et d = 2 .
• Enfin, c = d q3 + e , avec q3 = 2 et e = 1 .
Le PGCD de a et b est donc 1 . • On écrit alors 1 = c − 2d .
• Mais, d = b − c , ce qui donne 1 = c − 2(b − c) = −2b + 3c . • Enfin, c = a − 2b , donc 1 = −2b + 3(a − 2b) = 3a − 8b . 19 = 2 × 7 +
5
1=
3 × 19 − 8 × 7
7 = 1×5 +
2
1 = − 2× 7 + 3× 5
5 = 2×2 +
1
1=
1× 5 − 2× 2
(Dans les équations de droite, on remplace l’entier entouré par la valeur tirée de l’équation de gauche correspondante.)
Pour généraliser l’exemple, notons (a0 , a1 , a2 , a3 , a4 ) à la place de (a, b, c, d, e). Les divisions euclidiennes s’écrivent alors : a0 = q1 a1 + a2
a1 = q2 a2 + a3
et a2 = q3 a3 + a4 .
Pour trouver le PGCD et un couple de coefficients de Bézout de deux entiers a et b , on peut utiliser l’algorithme suivant. On pose a0 = a, a1 = b et l’on effectue les divisions euclidiennes successives de ak−1 par ak jusqu’à obtenir un reste nul : a0 = q1 a1 + a2 a1 = q2 a2 + a3 .. . aN −3 = qN −2 aN −2 + aN −1 aN −2 = qN −1 aN −1 + aN aN −1 = qN aN + aN +1
avec
aN +1 = 0.
Le PGCD de a et b est donc d = aN ; l’avant-dernière équation donne immédiatement aN = aN −2 − qN −1 aN −1 soit : d = uN −1 aN −2 + vN −1 aN −1
avec (uN −1 , vN −1 ) = (1, −qN −1 ).
En utilisant l’équation précédente, on peut exprimer aN −1 en fonction de aN −3 et aN −2 , ce qui donne une nouvelle relation du type d = uN −2 aN −3 + vN −2 aN −2 . De proche en proche, on arrive ainsi à la relation de Bézout d = u1 a0 + v1 a1 que l’on cherchait. 647
Chapitre 17. Arithmétique dans ZZ
6
Entiers premiers entre eux
Définition 4 Les entiers relatifs a et b sont premiers entre eux si le seul diviseur positif commun à a et b est 1 , c’est-à-dire si a ∧ b = 1 . Il est immédiat que si deux entiers a et b sont premiers entre eux, alors tout diviseur de a est premier avec tout diviseur de b . Théorème 9 (Identité de Bézout) Les entiers relatifs a et b sont premiers entre eux si, et seulement s’il existe (u, v) ∈ ZZ2 tel que a u + b v = 1 .
Démonstration page 660
Ex. 4. Deux entiers consécutifs sont premiers entre eux. En effet, si n ∈ ZZ , on peut écrire : 1 = 1 × (n + 1) + (−1) × n,
ce qui constitue une identité de Bézout et permet de conclure.
Proposition 10 Soit (a, b) ∈ ZZ2 et d = a ∧ b .
Alors il existe deux entiers a′ et b′ premiers entre eux tels que a = d a′ et b = d b′ .
Démonstration page 660 L’existence est immédiate. Pour montrer que a′ et b′ sont premiers entre eux, on utilise une relation de Bézout entre a et b .
Principe de démonstration. Exo 17.2
Point méthode Soit a et b deux entiers non tous les deux nuls. On peut se ramener b a et b′ = · à deux entiers premiers entre eux en considérant a′ = a∧b a∧b Remarque Réciproquement, si a = k a′ et b = k b′ , avec a′ ∧ b′ = 1 et k ∈ IN∗ , alors a ∧ b = k d’après la proposition 7 de la page 645. Proposition 11 Soit a, b et c trois entiers relatifs. Si a ∧ b = a ∧ c = 1 , alors a ∧ (bc) = 1 .
Démonstration page 661
Principe de démonstration.
Multiplier les identités de Bézout correspondant aux couples (a, b) et (a, c) .
Corollaire 12 Un produit est premier avec un entier a si, et seulement si, chacun de ses facteurs est premier avec a. Principe de démonstration.
Démonstration page 661 Récurrence sur le nombre de facteurs.
Corollaire 13 Si a et b sont deux entiers relatifs premiers entre eux, alors on a : ∀(m, n) ∈ IN2 648
am ∧ bn = 1.
II PGCD, PPCM
7
Extension à un nombre fini d’entiers
Définition 5
Soit k ∈ IN∗ et (a1 , a2 , . . . , ak ) ∈ ZZk \ (0, 0, . . . , 0) . Le PGCD de a1 , . . . , ak est le plus grand diviseur positif commun à tous les ai .
Remarques • L’existence est justifiée par le fait que l’ensemble des diviseurs positifs communs à tous les ai est non vide (puisqu’il contient 1 ), et majoré, par exemple par max |a1 |, . . . , |ak | . • Lorsque k = 1 , le PGCD est évidemment d = |a1 |.
• Il est clair que si l’un des ai est nul, on peut le supprimer de la famille sans changer le PGCD, puisque tout entier est un diviseur de 0 . On pourra donc dans la suite se limiter au cas où tous les ai sont non nuls. Proposition 14
Soit (a1 , a2 , . . . , ak ) ∈ ZZk \ (0, 0, . . . , 0) et d leur PGCD. On a : D(d) =
k
i=1
D(ai ).
Démonstration page 661
Principe de démonstration. Récurrence sur k après s’être ramené à des entiers tous non nuls. On montre que le PGCD de (a1 , a2 , . . . , ak+1 ) est d′ ∧ ak+1 , où d′ est le PGCD de (a1 , . . . , ak ) . Soit (a1 , a2 , . . . , ak ) ∈ ZZk \ (0, 0, . . . , 0) . k On note a1 ∧ a2 ∧ · · · ∧ ak ou ai leur PGCD.
Notation
i=1
La démonstration précédente montre que lorsque a1 , . . . , ak+1 sont tous non nuls, alors : a1 ∧ a1 ∧ · · · ∧ ak+1 = a1 ∧ · · · ∧ ak ∧ ak+1 ,
ce qui permet de calculer le PGCD par récurrence. Proposition 15
Soit (a1 , a2 , . . . , ak ) ∈ ZZk \ (0, 0, . . . , 0) et d leur PGCD. On a l’identité de Bézout :
∃(u1 , . . . , uk ) ∈ ZZk Principe de démonstration.
d = a 1 u 1 + · · · + ak u k .
Démonstration page 661
Par récurrence en utilisant la relation :
a1 ∧ · · · ∧ ak ∧ ak+1 = a1 ∧ a2 ∧ · · · ∧ ak+1 .
649
Chapitre 17. Arithmétique dans ZZ Définition 6 Les entiers a1 , . . . , ak sont premiers entre eux dans leur ensemble s’ils n’ont pas de diviseurs communs autres que 1 ou −1 , c’est-à-dire si leur PGCD est égal à 1. Attention Soit k 2 et (a1 , . . . , ak ) ∈ ZZk . Ne pas confondre la propriété « les entiers a1 , . . . , ak sont premiers entre eux dans leur ensemble » avec le fait que les entiers ai soient premiers entre eux deux à deux, c’est-à-dire 2 que ∀(i, j) ∈ [[1, k]] i �= j =⇒ ai ∧ aj = 1 . Il est clair que si les ai sont premiers entre eux deux à deux, alors ils sont premiers entre eux dans leur ensemble, mais la réciproque est fausse. Ex. 5. En prenant a = 6 , b = 10 et c = 15 , on a a ∧ b ∧ c = 1 tandis que a ∧ b = 2 , a ∧ c = 3 et b ∧ c = 5 .
Proposition 16 (Identité de Bézout) Les entiers a1 , a2 , . . . , ak sont premiers entre eux dans leur ensemble si, et seulement s’il existe une famille (ui )1ik d’entiers relatifs telle que : k
ui ai = 1.
i=1
Démonstration. L’implication directe est une conséquence de la proposition 15 de la page précédente. La réciproque est évidente.
8
PPCM
Définition 7 Le PPCM de deux entiers naturels non nuls a et b , noté a ∨ b , est le plus petit des multiples strictement positifs communs à a et b . Démonstration.
L’ensemble des multiples strictement positifs communs à a et b est une partie de IN , non vide car elle contient a b , ce qui justifie l’existence de son plus petit élément.
Remarques Soit a et b des entiers naturels non nuls. • On a vu que le PGCD de a et b est le plus grand des diviseurs positifs communs à a et b , aussi bien pour l’ordre naturel de IN∗ que pour la divisibilité. • Le PPCM est le plus petit des multiples strictement positifs communs à a et b . Mais est-il aussi le plus petit pour l’ordre de divisibilité, c’est-à-dire a-t-on : ∀n ∈ IN
(a | n
et b | n) ⇐⇒ a ∨ b | n ?
Le théorème suivant répond (positivement) à la question. 650
II PGCD, PPCM
Théorème 17 Soit a et b des entiers naturels non nuls et m leur PPCM. Les multiples de m sont exactement les multiples communs à a et b , c’est-à-dire : ∀n ∈ IN (a | n
et b | n) ⇐⇒ m | n.
(∗)
Le PPCM de a et b est le seul élément m ∈ IN à vérifier l’équivalence (∗).
Démonstration page 662
Principe de démonstration. On montre que le reste de la division euclidienne par m de tout multiple commun à a et b est nul. Point méthode Dans la pratique, pour déterminer le PPCM de deux entiers non nuls a et b , il suffit d’exhiber un multiple m commun à a et b qui vérifie l’implication : ∀n ∈ IN (a | n et b | n) =⇒ m | n.
L’implication réciproque est alors une conséquence immédiate du fait que a et b divisent m.
Ex. 6. Soit (a, b, k) ∈ (IN∗ )3 . Comme dans la proposition 7 de la page 645, on a : (k a) ∨ (k b) = k (a ∨ b). En effet, posons m = a ∨ b . C’est un multiple de a et b , donc k m est un multiple de k a et k b . Soit n un multiple de k a et k b . C’est en particulier un multiple de k et l’on peut donc écrire n = k c , avec c ∈ IN . On a donc k a | k c et k b | k c , avec k �= 0 , ce qui prouve que c est un multiple commun à a et b . Ainsi, c est un multiple de m = a ∨ b . Par suite n = k c est un multiple de k m . Donc (k a) ∨ (k b) = k m = k (a ∨ b) .
Remarques • On peut définir le PPCM de deux entiers relatifs non nuls a et b comme le PPCM de |a| et |b|. On a alors évidemment la relation : ∀n ∈ ZZ
(a | n
et b | n) ⇐⇒ m | n.
• Lorsque a = 0 ou b = 0 , on pose par convention a ∨ b = 0 et la propriété caractéristique : ∀n ∈ ZZ (a | n
et
b | n) ⇐⇒ m | n
est encore vérifiée. 651
Chapitre 17. Arithmétique dans ZZ
9
Lemme de Gauss
Théorème 18 (Lemme de Gauss) Soit a, b et c trois entiers relatifs. Si a divise b c et si a est premier avec b , alors a divise c. Démonstration page 662
Principe de démonstration.
Écrire c = a c u + b c v à l’aide d’une relation de Bézout.
Proposition 19 Soit r un nombre rationnel. 1. Il existe un couple (a, b) ∈ ZZ × IN∗ tel que r = a/b , avec a et b premiers entre eux. La fraction a/b est alors appelée forme irréductible de r . 2. Si (a′ , b′ ) ∈ ZZ × ZZ∗ est un autre couple tel que r = a′ /b′ , alors a | a′ et b | b′ .
3. En particulier, r admet une unique forme irréductible.
Démonstration page 662
Principe de démonstration.
Pour obtenir une forme irréductible de r , il suffit de diviser son numérateur et son dénominateur par leur PGCD. L’unicité est une conséquence du lemme de Gauss.
Proposition 20 Soit a et b deux entiers naturels non nuls. 1. Si a et b sont premiers entre eux, alors a ∨ b = a b et en particulier : ∀n ∈ ZZ (a | n et
Exo 17.3
b | n) =⇒ ab | n.
2. Plus généralement, on a (a ∨ b) (a ∧ b) = a b .
III 1
Démonstration page 662
Nombres premiers Définition
Définition 8 On appelle nombre premier tout entier naturel différent de 1 n’admettant pour diviseurs positifs que 1 et lui-même. Ex. 7.
Les entiers 2 , 3 , 5 , 7 , 11 , . . . , 65 537 , . . . , 314 159, . . . , 2 718 281, . . . sont premiers.
Notation 652
L’ensemble des nombres premiers est noté P .
III Nombres premiers
2
Propriétés
Proposition 21 Si p ∈ P , alors p est premier avec tous les entiers qu’il ne divise pas. En particulier : ∀k ∈ [[1, p − 1]] k ∧ p = 1.
Démonstration.
Soit k un entier non multiple de p . Considérons d un diviseur positif commun à k et p et montrons que d = 1 . Un tel entier d est un diviseur positif de p donc vaut 1 ou p (car p est premier). Si d était égal à p , alors k serait multiple de p , ce qui est impossible, donc d = 1 .
Ex. 8. Deux nombres premiers distincts sont premiers entre eux puisqu’aucun des deux ne divise l’autre.
Corollaire 22 Un nombre premier divise un produit si, et seulement s’il divise l’un de ses facteurs. Démonstration.
S’il ne divise aucun des facteurs, il est premier avec chacun d’entre eux et donc avec leur produit, ce qui, d’après la proposition 21, prouve qu’il ne divise pas ce produit. La réciproque est évidente.
Ex. 9. Le résultat est faux sans l’hypothèse « premier ». Par exemple, 6 divise 4 × 3 mais ne divise ni 4 ni 3 . Point méthode Un entier p est premier si p 2 et si : ∀(a, b) ∈ IN2
p = a b =⇒ (a = 1 ou b = 1).
Par contraposée, un entier n 2 est non premier si, et seulement s’il 2 existe (a, b) ∈ [[2, n − 1]] tel que n = a b . Proposition 23 Tout entier naturel n 2 est un produit de nombres premiers. Exo 17.4
Principe de démonstration.
Démonstration page 662 Par récurrence forte, en utilisant le point méthode ci-dessus.
Conséquence Tout entier naturel n 2 admet un diviseur premier. Proposition 24 L’ensemble des nombres premiers est infini. Principe de démonstration.
Exo 17.5
Démonstration page 663 Pour n ∈ IN , considérer un diviseur premier de n! + 1 .
Point méthode Pour démontrer que des entiers sont premiers entre eux, il suffit de montrer qu’ils n’ont aucun diviseur premier en commun.
653
Chapitre 17. Arithmétique dans ZZ Crible d’Ératosthène Pour donner la liste des nombres premiers strictement inférieurs à un entier n donné, on peut utiliser l’algorithme suivant, appelé crible d’Ératosthène. 1 Écrire tous les entiers de 2 à n − 1 . 2 p = 2 est premier ; barrer tous ses multiples stricts. 3 Le premier nombre non barré suivant p est un nombre premier. On le note à nouveau p et l’on barre tous ses multiples stricts. 4 Tant qu’il reste un nombre non barré après p, on reprend à l’étape 3 . 5 Les nombres premiers strictement inférieurs à n sont les nombres non barrés.
3
Décomposition en produit de facteurs premiers
Dans la proposition 23 de la page précédente, il a été établi que tout entier naturel n 2 est un produit de nombres premiers : n = q1 · · · qk .
On s’intéresse dans cette partie à l’unicité d’une telle décomposition en produit de facteurs premiers, appelée plus simplement décomposition en facteurs premiers. Théorème 25 Soit n un entier naturel supérieur ou égal à 2 . Il existe un entier naturel r non nul ainsi que des nombres premiers p1 < p2 < · · · < pr et des entiers naturels α1 , α2 , . . . , αr non nuls tels que : αr 1 α2 n = pα 1 p2 · · · pr
et cette décomposition est unique.
Les nombres premiers p1 , p2 , . . . , pr sont appelés les facteurs premiers de n. Démonstration page 663
Autres écritures • Si {p1 , p2 , . . . , pr } est un ensemble de nombres premiers contenant tous les facteurs premiers de n, on peut aussi écrire : αr 1 α2 n = pα 1 p2 · · · pr ,
en prenant αi = 0 si pi n’est pas un diviseur de n. • Avec cette convention, 1 peut s’écrire sous cette forme en prenant tous les αi nuls.
• Étant donné deux entiers naturels a et b non nuls, on peut écrire : αr 1 α2 a = pα 1 p2 · · · pr
et
b = pβ1 1 pβ2 2 · · · pβr r ,
en utilisant les mêmes nombres premiers. Il suffit pour cela de prendre tous les facteurs premiers du produit a b . Ex. 10. 7007 = 7 × 7 × 11 × 13 = 72 × 111 × 131 . 654
III Nombres premiers Soit p un nombre premier et n un entier naturel non nul. L’ensemble des entiers naturels k tels que pk divise n est non vide (il contient 0 ) et majoré (par exemple par n puisque pn n par une récurrence évidente). Il possède donc un plus grand élément, ce qui justifie la définition suivante.
Exo 17.6
Définition 9 Soit p un nombre premier. Pour tout entier naturel n non nul, on appelle valuation p-adique de n, que l’on note vp (n), le plus grand entier k ∈ IN tel que pk divise n. Lemme 26 Étant donné p ∈ P et n ∈ IN∗ , on a vp (n) = k si, et seulement s’il existe q ∈ IN∗ premier avec p tel que n = pk q . Démonstration. pas q puisque pk+1
Si k = vp (n) , alors pk | n . Écrivons donc n = pk q ; alors p ne divise ne divise pas n , donc p est premier avec q puisque p est premier.
Réciproquement, supposons n = pk q , avec p ∧ q = 1 . Alors n est divisible par pk mais pas par pk+1 puisque p ne divise pas q .
Remarques • Si n =
Soit n ∈ IN∗ .
1 α2 pα 1 p2
r · · · pα r où p1 < p2 < · · · < pr sont des nombres premiers
et α1 , α2 , . . . , αr des entiers naturels non nuls, alors : ∀i ∈ [[1, r]] vpi (n) = αi .
i En effet, pour tout i ∈ [[1, r]] , on a n = pα i q , avec q =
qui donne le résultat d’après le lemme 26. r vp (n) Ainsi, on a n = pi i .
j�=i
α
pj j premier avec p, ce
i=1
• Pour tout p ∈ P \ {p1 , . . . , pr } , on a vp (n) = 0 . La décomposition en facteurs vp (n) p , ce produit ayant bien un sens premiers de n peut donc se réécrire n = p∈P
puisqu’il n’y a qu’un nombre fini de p ∈ P tels que vp (n) soit non nul, c’est-à-dire tels que pvp (n) �= 1 .
Ex. 11. v7 (7007) = 2, v11 (7007) = v13 (7007) = 1 et ∀p ∈ P \ {7, 11, 13}
vp (7007) = 0.
Ex. 12. Pour tout nombre premier p , on a vp (1) = 0 .
Proposition 27 Soit p ∈ P et (a, b) ∈ (IN∗ )2 . Alors :
vp (a b) = vp (a) + vp (b).
Principe de démonstration.
Démonstration page 663 Utiliser le lemme 26 pour écrire a = pvp (a) q et b = pvp (b) r ,
avec q et r premiers avec p .
655
Chapitre 17. Arithmétique dans ZZ Proposition 28 Étant donné deux entiers naturels non nuls a et b , on a : 1. b | a ⇐⇒ ∀p ∈ P
2. ∀p ∈ P
vp (b) vp (a), vp (a ∧ b) = min vp (a), vp (b) et vp (a ∨ b) = max vp (a), vp (b) .
Démonstration page 663
Ainsi, si : αk 1 α2 a = pα 1 p2 · · · pk
et
b = pβ1 1 pβ2 2 · · · pβk k ,
où p1 , p2 , . . . , pk sont des nombres premiers distincts, alors on a : 1. a | b ⇐⇒ ∀i ∈ [[1, k]] αi βi ; 2. a ∧ b =
k
i=1
min(αi ,βi )
pi
et a ∨ b =
k
max(αi ,βi )
pi
.
i=1
Ex. 13. Étant donné n ∈ IN∗ dont la décomposition en facteurs premiers est : αk 1 α2 n = pα 1 p2 · · · pk ,
les diviseurs d de a s’écrivent : d = pδ11 pδ22 · · · pδkk
avec
∀i ∈ [[1, k]]
0 δi αi .
Un diviseur d est donc déterminé par le k -uplet (δ1 , δ2 , . . . , δk ) appartenant à : E = [[0, α1 ]] × · · · × [[0, αk ]] et donc, le nombre de diviseurs positifs de n est le cardinal de E , c’est-à-dire
k
(1 + αi ) .
i=1
Ex. 14. Étant donné deux entiers naturels non nuls a et b , on retrouve la formule : (a ∧ b)(a ∨ b) = ab, puisque pour tout couple d’entiers (α, β) , on a : max(α, β) + min(α, β) = α + β.
Point méthode Pour déterminer le PGCD de deux entiers, nous disposons donc de deux méthodes : l’algorithme d’Euclide, et la décomposition en facteurs premiers. On peut utiliser la deuxième, même si seul l’un des deux nombres a une décomposition simple. Ex. 15. Calculons le PGCD de a = 201387 et b = 3000 . La décomposition de b en facteurs premiers est immédiate : 3000 = 23 ×3×53 . Le PGCD recherché est donc de la forme 2α ×3β ×5γ , avec α 3 , β 1 et γ 3 . Comme ni 2 ni 5 ne divisent a mais que 3 le divise (la somme des chiffres est un multiple de 3 ), on en déduit a ∧ b = 3 . 656
IV Congruences
IV 1
Exo 17.7
Congruences Définition, compatibilité
Définition 10 Soit n ∈ ZZ. On dit que deux entiers relatifs a et b sont congrus modulo n si n divise b − a, c’est-à-dire s’il existe un entier k ∈ ZZ tel que b = a + k n. On écrit a ≡ b [n]. Nous avons vu dans l’exemple 47 de la page 49 que la congruence modulo n est une relation d’équivalence sur ZZ. Les classes d’équivalence sont appelées classes de congruence modulo n. Les relations de congruence modulo n et modulo −n sont évidemment identiques. Dans la suite, on peut donc supposer n ∈ IN.
Proposition 29 Soit n ∈ IN∗ . Il existe exactement n classes de congruence modulo n. Plus précisément : ∀k ∈ ZZ
Démonstration.
Exo 17.8
∃ ! r ∈ [[0, n − 1]] k ≡ r [n].
C’est le théorème de la division euclidienne.
Proposition 30 Soit n ∈ IN. La congruence modulo n est compatible avec l’addition et la multiplication de ZZ, ce qui signifie : a ≡ a′ [n] a + b ≡ a′ + b′ [n] 2 ′ ′ ∀(a, b, a , b ) ∈ ZZ =⇒ ′ b ≡ b [n] a × b ≡ a′ × b′ [n]. Démonstration. Supposons a ≡ a′ [n] et b ≡ b′ [n] . Alors a′ −a et b′ −b sont des multiples de n donc il en est de même de :
(a′ + b′ ) − (a + b) = (a′ − a) + (b′ − b)
et
a′ b′ − a b = a′ (b′ − b) + (a′ − a) b.
Ex. 16. Soit n un entier naturel qui s’écrit ak . . . a1 a0 en base 10 , de sorte que : n = a0 + 10 a1 + · · · + 10k ak . Comme 10 ≡ 1 [9] , on a, par produit, ∀i ∈ IN 10i ≡ 1 [9] . Donc n ≡ a0 + · · · + ak [9] . On obtient ainsi un critère de divisibilité par 9 : un nombre entier est divisible par 9 si, et seulement si, la somme de ses chiffres est divisible par 9 .
2
Inverse modulo n
Définition 11 Soit (a, b) ∈ ZZ2 et n ∈ IN∗ . On dit que b est inverse de a modulo n si ab ≡ 1 [n]. Proposition 31 Soit (a, n) ∈ ZZ × IN∗ .
Alors a admet un inverse modulo n si, et seulement si, a ∧ n = 1 . 657
Chapitre 17. Arithmétique dans ZZ Démonstration. L’entier a admet un inverse modulo n si, et seulement s’il existe (q, b) ∈ ZZ2 tel que ab = 1 + nq , ce qui, d’après le théorème de Bézout, équivaut à a ∧ n = 1 . Point méthode Conformément à la démonstration précédente, pour déterminer explicitement un inverse de a modulo n (sous réserve d’existence), on pourra expliciter une relation de Bézout pour le couple (a, n). Proposition 32 Soit (a, b, c) ∈ ZZ3 et n ∈ IN∗ . On suppose que b est inverse de a modulo n. Alors : ∀x ∈ ZZ ax ≡ c [n] ⇐⇒ x ≡ bc [n].
Démonstration.
Soit x ∈ ZZ . Le sens direct découle du fait que si ax ≡ c [n] , alors, en multipliant de part et d’autre par b , on obtient x ≡ bc [n] . Le sens réciproque s’obtient de même en multipliant par a .
Remarque L’équation ax ≡ c [n] d’inconnue x ∈ ZZ admet donc une unique solution modulo n. Ex. 17. On cherche à résoudre l’équation 3x ≡ 2 [7] d’inconnue x ∈ ZZ .
Tout d’abord, on observe que 5 est inverse de 3 modulo 7 puisque 3 × 5 = 15 ≡ 1 [7] . Ensuite, d’après la proposition 32, les solutions sont exactement les entiers relatifs congrus à 10 modulo 7 c’est-à-dire congrus à 3 modulo 7 .
3
Petit théorème de Fermat
Proposition 33 Soit p un nombre premier.
p 1. Pour tout k ∈ [[1, p − 1]], le coefficient binomial est divisible par p. k
2. Pour tout (a, b) ∈ ZZ2 , on a (a + b)p ≡ ap + bp [p]. Principe de démonstration.
Exploiter la relation k
p k
=p
p−1 k−1
Démonstration page 664 .
Corollaire 34 (Petit théorème de Fermat) Pour tout nombre premier p et tout entier relatif n, on a np ≡ n [p].
Démonstration page 664
Principe de démonstration. Se ramener à n ∈ IN puis faire une récurrence en utilisant (n + 1)p ≡ np + 1p [p] .
Corollaire 35 Soit p un nombre premier et n un entier non multiple de p. Alors np−1 ≡ 1 [p]. Principe de démonstration. 658
Démonstration page 664 Introduire un entier k tel que n k ≡ 1 [p] .
Démonstrations
Démonstrations Proposition 1 •
Supposons a | b et b | a . Il existe alors des entiers relatifs k et k′ tels que b = k a et a = k′ b , ce qui donne a = k′ k a . ∗ ∗
•
Si a = 0 , alors b = k 0 = 0 et |a| = |b| = 0 . Si a �= 0 , alors k′ k = 1 . Comme k et k′ sont des entiers relatifs, on en déduit |k| = |k′ | = 1 , ce qui montre que |a| = |b| .
Si |a| = |b| , alors a = b ou a = −b . Donc a | b et b | a .
Proposition 2 • •
Supposons que d divise a et b . Il existe donc deux entiers k et k′ tels que a = k d et b = k′ d . Alors pour tout (u, v) ∈ ZZ2 , on a a u + b v = (k u + k′ v) d , donc d divise a u + b v . Soit n ∈ IN∗ . Si b n divise a n , alors il existe un entier k tel que a n = k b n . En simplifiant par n �= 0 , on obtient a = k b , donc b divise a . La réciproque est immédiate (et ne nécessite d’ailleurs pas l’hypothèse n �= 0 ).
Théorème 3
Soit A = {n ∈ ZZ : n b a} .
Unicité. Soit (q, r) ∈ ZZ2 tel que a = b q + r et 0 r < b . Alors b q a , ce qui prouve que q est dans A , et, pour tout n q + 1 : a < b q + b = b (q + 1) n b donc n∈ / A. Ainsi, q est le plus grand élément de A , ce qui prouve son unicité. Alors r = a − b q est aussi unique. Existence. L’ensemble A est une partie de ZZ non vide et majorée. En effet, puisque b 1 , on a |a| b |a| et ainsi : • •
−|a| b −|a| a , ce qui prouve que A contient −|a| donc est non vide, 1 + |a| b > |a| b |a| a , donc : ∀n ∈ ZZ n 1 + |a| =⇒ n b > a =⇒ n ∈ / A, ce qui prouve que A est majorée par 1 + |a| .
Donc A admet un plus grand élément q qui vérifie alors : • q b a puisque q ∈ A , • (q + 1) b > a puisque q + 1 �∈ A .
En posant r = a − b q , on a alors a = b q + r et 0 r < (q + 1) b − b q = b .
Proposition 4 • •
Notons q et r le quotient et le reste de la division euclidienne de a par b .
Si r = 0 , alors a = b q et donc b | a .
Réciproquement, si b | a , alors on a a = k b + 0 avec k ∈ ZZ et 0 0 < b . L’unicité de la division euclidienne nous donne donc k = q et r = 0 .
On a donc l’équivalence b | a ⇐⇒ r = 0 . Lemme 5 L’entier b est non nul donc a ∧ b = max D(a) ∩ D(b) et b ∧ r = max D(b) ∩ D(r) existent. La relation a = q b + r montre que tout diviseur commun à b et r est un diviseur de a (et de b ) donc D(b) ∩ D(r) ⊂ D(a) ∩ D(b) . L’inclusion réciproque provient de même de la relation r = b (−q) + a .
659
Chapitre 17. Arithmétique dans ZZ Théorème 6
Pour tout b ∈ IN , on définit la propriété :
Hb : « pour tout entier naturel a (non nul si b = 0 ), on a D(a) ∩ D(b) = D(a ∧ b) ».
Supposons b = 0 . Soit a ∈ IN∗ ; alors d = a ∧ b = a , donc D(a) ∩ D(b) = D(a) = D(d) ce qui prouve H0 . • Soit b ∈ IN∗ ; supposons Hr , pour tout r ∈ IN tel que r < b . Soit a ∈ IN . En considérant le quotient q et le reste r de la division euclidienne de a par b (supposé non nul), on a a = b q+r et 0 r < b . L’hypothèse Hr nous dit que D(b) ∩ D(r) = D(b ∧ r) et le lemme 5 de la page 644 assure alors que : D(a) ∩ D(b) = D(b) ∩ D(r) = D(b ∧ r) = D(a ∧ b). D’où la propriété Hb . Enfin, deux entiers naturels d et d′ vérifiant (∗) sont égaux. En effet, puisque d | d , on a d | a et d | b et par suite d | d′ . Par symétrie, on a aussi d′ | d , ce qui prouve que d et d′ sont associés puis égaux puisqu’ils sont positifs. •
Proposition 7 • Comme k divise k a et k b , il divise leur PGCD. On peut donc trouver un entier d tel que (k a) ∧ (k b) = k d . • Comme k d divise k a et k b , la proposition 2 de la page 643 implique que d est un diviseur commun à a et b (on a k non nul par hypothèse). • Montrons que d vérifie l’implication du point méthode de la page 645. Soit n un diviseur commun à a et b . Alors k n divise k a et k b , donc leur PGCD, qui vaut k d d’après le premier point. De la même façon que précédemment, on en déduit que n divise d . • Ainsi, d est le PGCD de a et b , ce qui donne la relation souhaitée. Théorème 8 Démontrons, par récurrence sur b ∈ IN , la propriété Hb : « pour tout a ∈ IN , il existe (u, v) ∈ ZZ2 tel que a u + b v = a ∧ b . » • •
H0 est vraie car, pour tout a ∈ IN , on a a × 1 + 0 × 0 = a = a ∧ 0 . Soit b ∈ IN∗ . Supposons la propriété vraie jusqu’au rang b−1 . Soit a ∈ IN ; notons d = a∧b . On effectue la division euclidienne de a par b : a = bq + r
avec
0 r < b.
D’après le lemme 5 de la page 644, on a donc d = b ∧ r et la propriété Hr montre qu’il existe (u′ , v ′ ) ∈ ZZ2 tel que : b u′ + r v ′ = d. On a donc : b u′ + (a − b q) v ′ = d,
ce qui donne a u + b v = d avec u = v ′ et v = u′ − q v ′ . D’où Hb .
Théorème 9 • Si a et b sont premiers entre eux, alors a ∧ b = 1 et, d’après le théorème 8 de la page 646, il existe (u, v) ∈ ZZ2 tel que a u + b v = a ∧ b = 1 . • S’il existe deux entiers relatifs u et v tels que a u + b v = 1 , alors tout diviseur commun à a et b divise a u + b v donc est égal à 1 ou à −1 . On en déduit que a et b sont premiers entre eux. Proposition 10 Comme d divise a et b , il est clair qu’il existe a′ et b′ tels que a = d a′ et b = d b′ . Puisque d est le PGCD de a et b , il existe u et v entiers tels que d = a u + b v . • Dans le cas où (a, b) �= (0, 0) , on a d �= 0 donc 1 = a ′ u + b′ v puis a′ ∧ b′ = 1 . •
Dans le cas où (a, b) = (0, 0) , on choisit a′ = b′ = 1 et on a directement a′ ∧ b′ = 1 ∧ 1 = 1 .
660
Démonstrations Proposition 11
Supposons a ∧ b = 1 et a ∧ c = 1 .
D’après l’identité de Bézout, il existe (u, v, u′ , v ′ ) ∈ ZZ4 tel que : au + bv = 1
a u′ + c v ′ = 1.
et
En multipliant membre à membre ces deux égalités, on obtient alors immédiatement une relation du type a U + b c V = 1 , avec U et V entiers, ce qui prouve que a et b c sont premiers entre eux. Corollaire 12 Si un entier a est premier avec un produit c = b1 b2 · · · bk , il est premier avec tous les bi puisque ce sont des diviseurs de c . Pour la réciproque, démontrons par récurrence sur k la propriété Hk : « Si b1 , b2 , . . . , bk sont des entiers premiers avec a , alors b1 b2 · · · bk est premier avec a . » • La propriété H1 est évidente. • Soit k ∈ IN∗ ; supposons Hk . Soit b1 , b2 , . . . , bk+1 premiers avec a . L’hypothèse Hk , nous dit que b1 b2 · · · bk est premier avec a . Comme bk+1 est aussi premier avec a , le produit (b1 b2 · · · bk ) bk+1 est premier avec a d’après la proposition précédente. D’où Hk+1 . Proposition 14 Conformément à la remarque précédente, on peut supposer tous les ai non nuls. Raisonnons par récurrence sur k . • Pour k = 1 , le résultat est trivial. • Soit k ∈ IN∗ . Supposons le résultat vrai pour n’importe quel k -uplet d’entiers non nuls. Considérons k + 1 entiers non nuls a1 , a2 , . . . , ak+1 . Notons d′ le PGCD de (a1 , . . . , ak ) . L’hypothèse de récurrence donne donc : D(d′ ) = D(a1 ) ∩ · · · ∩ D(ak ). Alors D(d′ ∧ ak+1 ) = D(d′ ) ∩ D(ak+1 ) d’après le théorème 6 de la page 644. On en déduit : D(d′ ∧ ak+1 ) = D(a1 ) ∩ D(a2 ) ∩ · · · ∩ D(ak+1 ),
et comme d′ ∧ak+1 est un entier strictement positif, c’est le plus grand élément de l’ensemble : D(a1 ) ∩ D(a2 ) ∩ · · · ∩ D(ak+1 ).
On en déduit que le PGCD de (a1 , . . . , ak+1 ) est d = d′ ∧ ak+1 et donc que : k+1
D(d) = ce qui montre le résultat pour k + 1 .
i=1
D(ai ),
Proposition 15 Comme précédemment, on peut supposer les ai tous non nuls. • Le résultat est immédiat si k = 1 puisqu’alors d = |a1 | et qu’il suffit donc de prendre u1 = ±1 . • Soit k ∈ IN∗ . Supposons le résultat vrai pour tout k -uplet d’entiers non nuls. Considérons k+1 entiers non nuls a1 , a1 , . . . , ak+1 . Notons d′ le PGCD de (a1 , . . . , ak ) . L’hypothèse de récurrence donne l’existence d’entiers u′1 , . . . , u′k tels que d′ = a1 u′1 + · · · + ak u′k . D’autre part, en notant :
d = a1 ∧ a2 ∧ · · · ∧ ak+1 = a1 ∧ · · · ∧ ak ∧ ak+1 = d′ ∧ ak+1 , l’identité de Bézout (cf. théorème 9 de la page 648) nous fournit (uk+1 , vk+1 ) ∈ ZZ2 tels que d′ vk+1 + ak+1 uk+1 = d . On obtient alors : d = a1 u1 + a2 u2 + · · · + ak+1 uk+1
avec
∀i ∈ [[1, k]]
ui = u′i vk+1 .
661
Chapitre 17. Arithmétique dans ZZ Théorème 17 • Puisque m est un multiple de a et b , on a l’implication : ∀n ∈ IN
•
m | n =⇒ (a | n
et
b | n).
Soit n ∈ IN tel que a | n et b | n . En effectuant la division euclidienne de n par m , on a l’égalité : n = q m + r avec 0 r < m. Alors r = n − q m est un multiple commun à a et b positif ou nul et strictement inférieur à m . Par définition de m , on en déduit r = 0 et donc n = q m est un multiple de m .
S’il existe deux entiers naturels m et m′ vérifiant (∗) , alors, comme dans le cas du PGCD, on a m | m′ et m′ | m puis m = m′ . Théorème 18 Supposons a | bc et a ∧ b = 1 . D’après l’identité de Bézout, il existe deux entiers relatifs u et v tels que a u + b v = 1 , ce qui implique a c u + b c v = c . Comme a | b c , on a a | b c v et donc : a | a c u + b c v = c.
Proposition 19 Soit a0 ∈ ZZ et b0 ∈ IN∗ tels que r = a0 /b0 . 1. En notant d le PGCD de a0 et b0 , il existe deux entiers a et b tels que a0 = d a et b0 = d b . On a directement l’égalité : a0 a da r= = , = b0 db b et b est strictement positif (car b0 et d le sont). D’autre part, d’après la proposition 10 de la page 648, a et b sont premiers entre eux. 2. Si r = a′ /b′ , alors b a′ = a b′ . Donc b divise a b′ ; comme il est premier avec a , il divise b′ . Soit k ∈ ZZ tel que b′ = k b . En divisant par b �= 0 l’égalité b a′ = a k b , on obtient a′ = k a , donc a divise a′ . 3. Si a′ /b′ est une autre forme irréductible de r , alors b divise b′ et b′ divise b d’après ce qui précède, donc b = b′ (ce sont des entiers positifs). On en déduit alors a = a′ . Proposition 20 1. Supposons a ∧ b = 1 . Tout d’abord, a b est un multiple de a et b . Il reste à montrer que : ∀n ∈ IN
2.
(a | n
et
b | n) =⇒ ab | n.
Soit n un multiple de a et b . Alors il existe k ∈ IN tel que n = k a et b divise donc k a . Comme il est premier avec a , il divise k . En écrivant k = k′ b , on obtient n = k′ (a b) . On a d = a ∧ b �= 0 .
Ainsi, on peut écrire a = d a′ et b = d b′ avec a′ ∧ b′ = 1 . On a alors : a b = d2 a′ b′ = d2 (a′ ∨ b′ )
= d (d a′ ) ∨ (d b′ ) = d (a ∨ b).
(d’après le point précédent)
(d’après l’exemple 6 de la page 651)
Proposition 23 Pour tout n 2 , on note Hn la propriété « n est un produit de nombres premiers ». Initialisation H2 est vérifiée car 2 est un nombre premier. Hérédité Soit n 3 tel que Hk soit vérifiée pour tout k ∈ [[2, n − 1]] . Si n est un nombre premier, comme pour l’initialisation, il n’y a rien à faire. Sinon, il existe (a, b) ∈ [[2, n − 1]]2 tel que n = ab . Par hypothèse de récurrence forte, a et b sont des produits de nombres premiers donc n l’est aussi.
662
Démonstrations Proposition 24 Si n est un entier naturel, l’entier N = n! + 1 admet un diviseur premier p (éventuellement lui-même). Si p n , alors p divise N et n! et donc leur différence 1 , ce qui est impossible. Donc p > n . On a montré que, pour tout entier n , il existe un nombre premier p strictement supérieur à n , ce qui prouve que l’ensemble des nombres premiers est non majoré, donc infini. Théorème 25 Existence. L’existence est justifiée par la proposition 23 de la page 653. L’écriture du théorème 25 de la page 654 s’obtient en regroupant les nombres premiers identiques et en les rangeant par ordre croissant. Unicité. Soit n = q1 q2 · · · qk une décomposition en facteurs premiers de n . Chaque nombre premier qi divise n . Réciproquement, si un nombre premier p divise n , alors, d’après le corollaire 22 de la page 653, il divise l’un des qi donc lui est égal puisqu’il s’agit de deux nombres premiers. Les facteurs premiers intervenant dans une telle décomposition sont donc tous les diviseurs premiers de n . Soit alors deux décompositions de n , que l’on peut donc écrire : αr β1 β2 βr 1 α2 n = pα 1 p2 · · · pr = p1 p2 · · · pr ,
où les pi sont des nombres premiers vérifiant p1 < p2 < · · · < pr . Si, pour un entier i , on a αi �= βi , par exemple αi < βi , alors on a :
α
pj j = piβi −αi
j�=i
et donc pi divise
j�=i
premiers entre eux. Par suite ∀i ∈ [[1, r]]
β
pj j ,
j�=i
α
pj j , ce qui est impossible puisque si j �= i , les entiers pi et pj sont αi = βi , ce qui montre l’unicité de la décomposition.
Proposition 27 Le lemme 26 de la page 655 permet d’écrire a = pvp (a) q et b = pvp (b) r , avec q et r premiers avec p . Alors a b = pvp (a)+vp (b) (q r) . En vertu de la proposition 11 de la page 648, q r est premier avec p puisque q ∧ p = r ∧ p = 1 . Le même lemme permet d’en déduire vp (a b) = vp (a) + vp (b) . Proposition 28 1.
Si b | a , alors pour tout p ∈ P , pvp (b) divise b , donc divise a . Donc vp (a) vp (b) .
Réciproquement, supposons que l’on ait ∀p ∈ P On peut alors poser c =
vp (b) vp (a) .
pvp (a)−vp (b) puisque :
p∈P
p ∈ P : vp (a) − vp (b) > 0 ⊂ p ∈ P : vp (a) > 0
est un ensemble fini. Il est alors immédiat que a = b c . 2.
Posons d =
p
p∈P
min vp (a),vp (b)
et m =
p∈P
p
max vp (a),vp (b)
. Cela a bien un sens car :
p ∈ P : min vp (a), vp (b) > 0 ⊂ p ∈ P : max vp (a), vp (b) > 0
⊂ p ∈ P : vp (a) > 0 ∪ p ∈ P : vp (b) > 0 ,
ce qui prouve que tous ces ensembles sont finis. Le premier point prouve que d est un diviseur de a et b et que tout diviseur commun à a et b divise d . Donc d = a ∧ b . De la même façon, on a m = a ∨ b .
663
Chapitre 17. Arithmétique dans ZZ
Si k ∈ [[1, p − 1]] , les égalités :
Proposition 33 1.
p k
donnent k 2.
p k
=p
=
k facteurs
k − 1 facteurs
p (p − 1)(p − 2) · · · p(p − 1)(p − 2) · · · p = = k! k (k − 1)! k
p−1 k−1
et prouvent donc que p divise k
p k
.
Comme p et k sont premiers entre eux, le lemme de Gauss entraîne p | C’est une conséquence immédiate de la formule du binôme de Newton : (a + b)p = ap +
p−1 p k=1
k
p−1 k−1
p k
.
ak bp−k + bp ≡ ap + bp [p].
Corollaire 34 Par compatibilité de la congruence avec la multiplication, la classe de np modulo p ne dépend que de la classe de n . Comme tout entier relatif est congru modulo p à un entier naturel d’après la proposition 29 de la page 657, il suffit donc de prouver le résultat lorsque n est un entier naturel. Démontrons donc par récurrence la propriété Hn : « np ≡ n [p] ». • H0 est évident. • Soit n ∈ IN ; supposons Hn . Alors, d’après la proposition précédente (n + 1)p ≡ np + 1p ≡ np + 1 [p] puis, d’après Hn : D’où Hn+1 .
(n + 1)p ≡ n + 1 [p].
Corollaire 35 • Comme n n’est pas multiple de p premier, on a n ∧ p = 1 . D’après la proposition 32 de la page 658, il existe k ∈ ZZ tel que n k ≡ 1 [p] . •
En multipliant la relation np ≡ n [p] par k et en utilisant la compatibilité de la congruence avec la multiplication, on obtient np−1 ≡ 1 [p] .
664
Exercices
S’entraîner et approfondir 17.1 Soit (Fn ) la suite définie par : →646
F0 = 0
F1 = 1
et
∀n ∈ IN
Fn+2 = Fn+1 + Fn .
1. En utilisant l’algorithme d’Euclide, calculer Fn+1 ∧ Fn , pour n ∈ [[3, 7]] , et en donner un couple de coefficients de Bézout. Que remarque-t-on ? 2. Donner un couple de coefficients de Bézout de Fn+1 et Fn , pour tout n ∈ IN . 17.2 Déterminer tous les couples (a, b) ∈ ZZ2 \ {(0, 0)} tels que a + b = a ∧ b . →648
17.3 Soit n 2 . Calculer : →652 1. n ∨ (2n + 1) ;
2. (n − 1) ∨ (2n + 1) .
17.4 Soit n 2 un entier naturel. →653 1. Montrer que le plus petit diviseur de n supérieur ou égal à 2 est un diviseur premier de n . √ 2. Montrer que si n n’est pas premier, il admet un diviseur premier inférieur ou égal à n . 17.5 Soit (a, b, c) ∈ (IN∗ )3 tel que a2 + b2 = c2 et a ∧ b ∧ c = 1 . →653 Montrer que a ∧ b = a ∧ c = b ∧ c = 1 . 17.6 Soit a et b deux entiers relatifs non nuls et p un nombre premier. →655 1. Montrer que vp (a + b) min vp (a), vp (b) .
2. Trouver a , b et p tels que vp (a + b) > min vp (a), vp (b) .
3. Montrer que si vp (a) �= vp (b) , alors vp (a + b) = min vp (a), vp (b) . 17.7 Soit (a, b, c) ∈ (IN∗ )3 tel que a2 + b2 = c2 et a ∧ b = 1 . Montrer que a et b ne sont pas de →657 même parité. Indication. On pourra utiliser des congruences modulo 4 . 17.8 Déterminer un critère de divisibilité par 11 d’un nombre entier en fonction des chiffres de →657 son écriture en base 10 . 17.9 Trouver le nombre d’entiers relatifs qui, dans la division euclidienne par 23 , ont un quotient égal au reste. 17.10 Déterminer v2 (1000!) . 17.11 Montrer que l’équation x3 + x2 + 2x + 1 = 0 n’a pas de racines dans Q . 17.12 Montrer qu’il existe des intervalles de IN de longueur aussi grande que l’on veut qui ne contiennent aucun nombre premier.
665
Chapitre 17. Arithmétique dans ZZ ⋆ 17.13 Soit a ∈ ZZ et b ∈ IN∗ . Montrer que :
a b
+
a + 1 b
+ ··· +
a + b − 1 b
= a.
Indication. On déterminera les entiers n ∈ [[0, b − 1]] tels que ceux tels que
a+n b
=
a + 1. b
a + n b
=
a b
ainsi que
αr 1 α2 17.14 Soit n ∈ IN∗ et n = pα sa décomposition en facteurs premiers. 1 p2 . . . p r
1. Calculer la somme S(n) des diviseurs positifs de n .
2. Montrer que, si m et n sont premiers entre eux, alors S(mn) = S(m)S(n). ⋆ 17.15 1. Soit n 2 et a ∈ ZZ un entier premier avec n .
Pour tout k ∈ IN , on note rk le reste de la division euclidienne de ak par n . Montrer que la suite (rk )k∈IN est périodique.
2. Quel est le reste de la division euclidienne de 32021 par 5 ? 17.16 Soit n un entier avec n 2 . 1. Montrer que si 2n − 1 est premier, alors n est premier. 2. Que constate-t-on si l’on prend n = 11 ? Les nombres premiers de la forme 2n − 1 (avec donc n premier d’après la première question) sont les nombres de Mersenne. 17.17 Soit m ∈ IN∗ tel que 2m + 1 soit premier. Montrer que m est de la forme 2n , avec n ∈ IN . n
17.18 Pour tout n ∈ IN , on pose Fn = 22 + 1 . 1. Montrer que pour tout n ∈ IN∗ , Fn = 2 +
n−1
Fk .
k=0
2. Montrer que, si n �= m , alors Fn et Fm sont premiers entre eux. 17.19 Montrer qu’il existe une infinité de nombres premiers de la forme 4k + 3 . 17.20 1. Soit a et b deux entiers naturels non nuls. Montrer que : (a + b) ∧ (a ∨ b) = a ∧ b. 2. Trouver tous les couples (a, b) ∈ (IN∗ )2 tels que :
17.21 Soit (a, b, c) ∈ (IN∗ )3 .
a + b = 144 a ∨ b = 420.
En exploitant les valuations p -adiques, montrer que (a ∧ b) ∨ c = (a ∨ b) ∧ (a ∨ c) .
666
Solutions des exercices
Solutions des exercices 17.1 On a F0 = 0 , F1 = 1 , F2 = 1 , F3 = 2 , F4 = 3 , F5 = 5 , F6 = 8 , F7 = 13 et F8 = 21 . 1. On a successivement (d’après la relation de récurrence) : F8 = F7 + F6
F7 = F6 + F5
F6 = F5 + F4
F5 = F4 + F3
et
F4 = F3 + 1.
Donc F8 ∧ F7 = 1 et en remontant les calculs :
1 = F4 − F3 = F4 − (F5 − F4 ) = −F5 + 2F4 = −F5 + 2(F6 − F5 ) = 2F6 − 3F5 = 2F6 − 3(F7 − F6 ) = −3F7 + 5F6 = −3F7 + 5(F8 − F7 ) = 5F8 − 8F7 .
2. On remarque, d’après les résultats qui précèdent, que pour k ∈ [[3, 7]] , on a : Fk−1 Fk − Fk−2 Fk+1 = (−1)k ,
formule valable également pour k = 2 . Montrons ce résultat par récurrence sur k . L’initialisation est (largement !) faite. Soit k 2 tel que Fk−1 Fk − Fk−2 Fk+1 = (−1)k . En remplaçant Fk−2 par Fk − Fk−1 et Fk par Fk+2 − Fk+1 , on trouve :
(−1)k = Fk−1 Fk − Fk−2 Fk+1 = Fk−1 (Fk+2 − Fk+1 ) − (Fk − Fk−1 ) Fk+1 = Fk−1 Fk+2 − Fk Fk+1 ,
donc Fk Fk+1 − Fk−1 Fk+2 = (−1)k+1 . Un couple de coefficients de Bézout de (Fk , Fk+1 ) , pour k 2 , est donc donné par :
(−1)k Fk−1 , −(−1)k Fk−2 .
b a et b′ = , où d = a ∧ b . Les entiers a′ et b′ d d sont alors premiers entre eux et, en divisant la relation a + b = a ∧ b par d qui est non nul, on obtient a′ + b′ = 1 . Donc (a, b) = d a′ , d (1 − a′ ) .
17.2 Soit (a, b) un couple solution. Posons a′ =
Réciproquement, soit k ∈ IN∗ et c ∈ ZZ . Montrons que le couple (a, b) = k c, k (1 − c) est solution. En effet, on a d’une part a + b = d et d’autre part, a ∧ b = k (c ∧ (1 − c)) = k d’après la proposition 7 de la page 645. L’ensemble des solutions est donc
k c, k (1 − c) (k, c) ∈ IN∗ × ZZ .
17.3 1. On a 2n + 1 − 2n = 1 donc 2n + 1 et n sont premiers entre eux et leur PPCM est leur produit (2n + 1) n . 2. La relation 2n + 1 = 2(n − 1) + 3 montre que le PGCD de n − 1 et 2n + 1 est un diviseur de 3 , donc est égal à 3 ou à 1 . Dans le cas où n �≡ 1 [3] , l’entier n − 1 n’est pas divisible par 3 et (n − 1) ∧ (2n + 1) = 1 . Dans le cas où n ≡ 1 [3] , on a alors 2n + 1 ≡ 0 [3] donc 3 divise n − 1 et 2n + 1 ce qui donne (n − 1) ∧ (2n + 1) = 3 . En conclusion : • si n ≡ 1 [3] , alors (n − 1) ∨ (2n + 1) = (n−1) 3(2n+1) ; • sinon, (n − 1) ∨ (2n + 1) = (n − 1) (2n + 1) .
667
Chapitre 17. Arithmétique dans ZZ 17.4 1. Notons d le plus petit diviseur de n supérieur ou égal à 2 . Ce mininimum existe car l’ensemble des diviseurs de n supérieurs ou égaux à 2 est une partie non vide de IN (elle contient n ). Si d n’est pas premier, il s’écrit d = ab avec (a, b) ∈ [[2, d − 1]] et par transitivité, a divise n , ce qui contredit la minimalité de d . 2. Si n 2 n’est pas premier, son plus petit diviseur p > 1 est premier d’après la question précédente. Si l’on écrit n = p q , on a q > 1 puisque n n’est pas premier. Donc q p √ par minimalité de p . On en déduit n p2 , soit p n . Remarque Pour montrer qu’un entier naturel n 2 est premier, il suffit donc de vérifier √ qu’il n’est divisible par aucun entier k vérifiant 2 k n .
17.5 Raisonnons par l’absurde et supposons a ∧ b �= 1 . Alors, il existe un nombre premier p qui divise a et b . Il divise donc a2 + b2 = c2 . D’après le corollaire 22 de la page 653, p divise c donc p divise a ∧ b ∧ c = 1 , ce qui constitue une absurdité. On démontre de même que a ∧ c = b ∧ c = 1 . 17.6 Notons α = vp (a) et β = vp (b) de telle sorte que a = pα q et b = pβ r , avec q et r premiers avec p . Par symétrie, on peut supposer α β .
1. On a a + b = pα q + pβ−α r , donc a + b est divisible par pα , ce qui prouve que : vp (a + b) α = min(α, β).
2. On prend a = b = p = 2 . Alors, vp (a) = vp (b) = 1 et vp (a + b) = v2 (4) = 2 . 3. Supposons α < β . Alors p divise pβ−α mais ne divise pas q , donc ne divise pas q+pβ−α r . Le lemme 26 de la page 655 donne donc vp (a + b) = α = min(α, β) . 17.7 Tout d’abord, a et b ne sont pas tous les deux pairs sinon 2 divise a ∧ b = 1 . Raisonnons par l’absurde et supposons que a et b soient tous les deux impairs. Alors on peut trouver k ∈ ZZ tel que a = 2k + 1 , puis a2 = 4k2 + 4k + 1 donc a2 ≡ 1 [4] et de même, b2 ≡ 1 [4] . Par somme, c2 ≡ 2 [4] . Or un carré d’entier est congru à 0 ou à 1 modulo 4 . Conclusion : a et b sont de parités différentes. 17.8 On a 10 ≡ −1 [11] donc 10k ≡ (−1)k [11] . Soit n un entier naturel qui s’écrit ak . . . a1 a0 en base 10 . On a donc n ≡ a0 − a1 + · · · + (−1)k ak [11] . On obtient ainsi un critère de divisibilité par 11 : un nombre entier est divisible par 11 si, et seulement si, la somme de ses chiffres d’indices pairs ( a0 + a2 + · · · ) est congrue, modulo 11 à la somme de ses chiffres d’indices impairs ( a1 + a3 + · · · ). 17.9 Les entiers qui conviennent sont ceux de la forme n = 23q + q = 24q avec 0 q < 23. Il y en a donc 23 . 17.10 Entre 1 et n = 1000 , il y a multiples de 8 . . . On a donc :
n 2
nombres pairs, dont
n 4
qui sont multiples de 4 ,
v2 (1000!) = 500 + 250 + 125 + 62 + 31 + 15 + 7 + 3 + 1 = 994.
668
n 8
Solutions des exercices 17.11 Supposons que l’équation admette une solution rationnelle x =
p avec p ∧ q = 1 et q > 0 . q
Dans ce cas, on aurait : p3 + p2 q + 2pq 2 + q 3 = 0. 2
2
3
Puisque q | p q + 2pq + q , on aurait q | p3 et donc q = 1 car q ∧ p3 = 1 . Or l’équation ne peut admettre de solution entière. En effet, quelle que soit la parité de x , l’entier x3 + x2 + 2x + 1 est impair donc non nul. 17.12 Soit n 2 . On considère l’intervalle [[n! + 2, n! + n]] . Il est de longueur n − 1 et, pour tout i entre 2 et n , l’entier n! + i n’est pas premier car divisible par i . 17.13 Effectuons la division euclidienne de a par b . On a : a = bq + r , 0 r < b Soit n ∈ [[0, b − 1]] . On a
a+n b
a+n b
=q+
= q ⇐⇒
r+n b
et
a b
= q.
donc les équivalences :
r+n ∈ [0, 1[ ⇐⇒ n ∈ [[0, b − r − 1]]. b
On a aussi les équivalence suivantes :
a+n b
= q + 1 ⇐⇒
r+n ∈ [1, 2[ ⇐⇒ n ∈ [[b − r, 2b − r − 1]]. b
Enfin, on observe que 2b − r − 1 b − 1 car b r et on peut finir le calcul : b−1 a+n n=0
b
= (b − r)q + r(q + 1) = bq + r = a.
17.14 1. D’après l’exemple 13 de la page 656, les diviseurs de n sont tous les entiers de la forme : d = pβ1 1 · · · pβr r
avec
(β1 , . . . , βr ) ∈ [[0, α1 ]] × · · · × [[0, αr ]] = E.
On calcule la somme : S(n) =
pβ1 1
(β1 ,...,βr )∈E
· · · pβr r
=
r i=1
=
αi
pβi i
βi =0
r pαi +1 − 1 i
i=1
pi − 1
(distributivité généralisée)
·
2. Comme pour n , on décompose l’entier m en facteurs premiers : m = q1β1 · · · qsβs
avec
(β1 , . . . , βs ) ∈ (IN∗ )s .
Les entiers m et n sont premiers entre eux donc les nombres premiers p1 , . . . , pr , q1 , . . . , qs sont deux à deux distincts. Ainsi, la décomposition en facteurs premiers de l’entier mn s’obtient directement : αr 1 α2 mn = q1β1 · · · qsβs pα 1 p2 . . . p r . On termine par un calcul direct en exploitant la question précédente : S(mn) =
β +1 s r qj j − 1 pαi +1 − 1 i
j=1
qj − 1
i=1
pi − 1
= S(m)S(n).
669
Chapitre 17. Arithmétique dans ZZ 17.15 1. • Soit k ∈ IN . Tout d’abord, a ∧ n = 1 donc ak ∧ n = 1 . Or, ak ∧ n = n ∧ rk d’après le lemme 5 de la page 644 donc n ∧ rk = 1 . • L’application k �→ rk de IN dans {0, 1, . . . , n−1} étant non injective, il existe k1 < k2 tels que rk1 = rk2 . Notons r cette valeur. Posons T = k2 − k1 et montrons que la suite (rk )k∈IN est T -périodique. On a : r ≡ ak1 +T [n]
ak1 +T = ak1 aT ≡ r aT [n],
et
donc n | r(aT − 1) . D’après le point précédent, r ∧ n = 1 donc d’après le théorème de Gauss, n | aT − 1 , ce qui montre que aT ≡ 1 [n] . • Enfin, soit k ∈ IN . En exploitant le point précédent, on obtient : rk+T ≡ ak+T [n]
ak+T = ak aT ≡ rk × 1 = rk [n]
et
ce qui montre que la suite (rk )k∈IN est T -périodique. 2. On applique le résultat précédent avec n = 5 et a = 3 : r0 = 1 , r1 = 3 , r2 = 4 , r3 = 2 et r4 = 1 . La suite est donc 4 -périodique. Le reste de la division euclidienne de 2021 par 4 est 1 donc le reste cherché est 3 . 17.16 1. Soit d un diviseur positif de n . Alors il existe p ∈ IN∗ tel que n = dp et : 2pd − 1 = (2d )p − 1 = (2d − 1)(1 + 2d + 22d + · · · + 2(p−1)d ).
L’entier 2d − 1 divise 2n − 1 d’où d = 1 ou d = n , ce qui montre que n est premier.
2. On s’aperçoit que 211 − 1 = 2047 = 23 × 89 n’est pas un nombre premier. La réciproque de la question précédente est donc fausse. 17.17 Posons q ∈ IN∗ impair tel que m = 2v2 (m) q et d = 2v2 (m) . Alors :
2m + 1 = (2d )q + 1 = (2d + 1)(2d(q−1) − 2d(q−2) + · · · + 1),
donc 2d + 1 est un diviseur positif de 2m + 1 . Or d 0 donc 2d + 1 2 , puis 2d + 1 = 2m + 1 car 2m + 1 est un nombre premier. On en déduit m = d = 2v2 (m) , ce qui conclut. Remarque Actuellement, les seuls nombres premiers connus de cette forme sont 3, 5, 17, 257 et 65537 (nombres premiers de Fermat). 17.18 1. On démontre le résultat par récurrence sur n . Tout d’abord, F0 + 2 = 21 + 1 + 2 = 5 = F1 . Ensuite, soit n ∈ IN∗ tel que Fn = 2 + n+1
On calcule, en observant que 22 2+
n
k=0
n−1 k=0
n
= 22
Fk .
2
= (Fn − 1)2 :
Fk = 2 + (Fn − 2)Fn = 2 + Fn2 − 2Fn = 1 + (Fn − 1)2 = Fn+1 ·
L’hérédité est démontrée.
670
(hypothèse de récurrence)
Solutions des exercices 2. Soit d le PGCD de Fn et de Fm . Supposons, par exemple, n > m . Alors d divise Fn et F0 F1 · · · Fn−1 , donc leur différence 2 . Comme Fn est impair, il en est de même de d , donc d = 1 et Fn ∧ Fm = 1 .
Remarque Chaque terme de la suite (Fn )n∈IN admettant (au moins) un diviseur premier, ceux-ci sont deux à deux distincts, ce qui prouve (une nouvelle fois) le caractère infini de l’ensemble des nombres premiers.
17.19 On utilise, dans cette question, que hormis 2 , les nombres premiers sont congrus à ±1 modulo 4 (une congruence à 0 ou 2 entraîne une divisibilité par 2 ). Supposons qu’il y ait un nombre fini de nombres premiers de la forme 4k + 3 et considérons n = 3 × 7 × 11 × 19 . . . le produit de ces nombres. Le nombre m = 4n − 1 est impair et ne possède aucun facteur premier de la forme 4k + 3 car il est premier avec chacun d’entre eux. Donc m = p1 p2 · · · pr où tous les pi sont congrus à 1 modulo 4 . Ainsi, m serait congru à 1 modulo 4 ce qui est impossible. 17.20 1. Notons d = a ∧ b et m = a ∨ b . D’après la proposition 10 de la page 648, on a a = d a′ et b = d b′ (avec a′ et b′ premiers entre eux) d’où : a + b = d (a′ + b′ ). De plus, d’après la proposition 20 de la page 652, d m = a b , d’où m = d a′ b′ . D’après la proposition 7 de la page 645, pour montrer que d est le PGCD de a + b et de m , il suffit de montrer que a′ b′ et a′ + b′ sont premiers entre eux. Si ce n’est pas le cas, il existe p un nombre premier diviseur commun de a′ b′ et a′ + b′ . D’après le corollaire 22 de la page 653, p divise a′ ou p divise b′ . Comme de plus, p divise a′ + b′ , il divise a′ et b′ : absurde car a′ ∧ b′ = 1 .
On conclut que a′ b′ est premier avec a′ + b′ . 2. Si a et b conviennent, alors, avec les mêmes notations : ′
d = a ∧ b = (a + b) ∧ m = 144 ∧ 420 = 12,
′
′ ′
donc a + b = 12 et a b = 35 . Les entiers a′ et b′ sont donc solutions de X 2 − 12X + 35 = 0 , soit {a′ , b′ } = {5, 7} , ce qui donne {a, b} = {60, 84} . Réciproquement, les couples (60, 84) et (84, 60) sont évidemment solutions.
17.21 Soit p ∈ P . Montrons l’égalité des valuations p -adiques, ce qui suffira à conclure. D’après la proposition 28 de la page 656 :
vp (a ∧ b) ∨ c = max min(v p (a), vp (b)), vp (c) vp (a ∨ c) ∧ (b ∨ c) = min max(vp (a), vp (c)), max(vp (b), vp (c) .
Sans perte de généralité, on peut supposer que vp (a) vp (b) .
Alors, on a immédiatement max vp (a), vp (c) max vp (b), vp (c) puis l’égalité souhaitée. Remarque
On démontre de même que (a ∨ b) ∧ c = (a ∧ c) ∨ (b ∧ c) .
671
Chapitre 18 : Structures algébriques usuelles I
Lois de composition interne Généralités . . . . . . . . Itérés d’un élément . . . . Produit de n éléments . . Partie stable, loi induite . Morphismes . . . . . . . . II Groupes . . . . . . . . . . . . 1 Définitions, exemples . . . 2 Sous-groupes . . . . . . . 3 Noyau, image . . . . . . . III Anneaux . . . . . . . . . . . . 1 Définitions . . . . . . . . 2 Règles de calcul . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
3 Éléments inversibles, unités . . . . . . . . . 4 Corps . . . . . . . . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . 690 . . 691 . 692 . 695
1 2 3 4 5
. . . . . . . . . .
674 674 678 678 680 681 682 682 683 685 686 686 687
Structures algébriques usuelles
18
Le but de ce chapitre est de définir le vocabulaire élémentaire concernant les structures algébriques usuelles (groupes, anneaux, corps). Ce vocabulaire permet d’unifier les propriétés classiques des ensembles IN, ZZ, Q , IR et C munis de leurs opérations usuelles + et × , propriétés que nous supposerons connues, et de se rendre compte que l’on retrouve des propriétés analogues sur d’autres ensembles tels que des sousensembles stricts des précédents ou encore des ensembles de fonctions ou de suites. Dans tout ce chapitre, E, X et Ω désignent des ensembles.
I
Lois de composition interne
1
Généralités
Définition 1 On appelle loi de composition interne sur E , toute application de E × E dans E . Traditionnellement, on utilise la notation x ∗ y pour désigner l’image d’un couple (x, y) ∈ E 2 par une loi ∗ plutôt que la notation fonctionnelle ∗(x, y).
Ex. 1. L’addition, la multiplication sur IN , ZZ , Q , IR et C . La soustraction sur ZZ , Q , IR et C . La division sur Q∗ , IR∗ , IR∗+ et C∗ . Ex. 2. On a sur P(X) les lois de composition interne suivantes : • l’intersection : (A, B) �→ A ∩ B , • la réunion : (A, B) �→ A ∪ B ,
• la différence : (A, B) �→ A \ B .
I Lois de composition interne Ex. 3. La composition des applications, notée ◦ , est une loi de composition interne sur :
• l’ensemble des applications de X dans X , noté X X , • l’ensemble des permutations de X , c’est-à-dire des bijections de X dans X , noté SX .
Ex. 4. L’addition et la multiplication sur IR+ sont prolongées à [0, +∞] = IR+ ∪ {+∞} de la façon suivante : ∀x ∈ [0, +∞]
x + (+∞) = (+∞) + x = +∞,
∀x ∈ ]0, +∞]
x × (+∞) = (+∞) × x = +∞, 0 × (+∞) = (+∞) × 0 = 0.
On observe que : ∀x ∈ [0, +∞]
x + (+∞) = +∞ x × 0 = 0,
ce qui fait de +∞ et 0 des éléments dits absorbants pour les lois de composition interne + et × respectivement.
Propriétés des lois de composition interne Soit ∗ une loi de composition interne sur un ensemble E . Définition 2 On dit que ∗ est :
• associative si : ∀(x, y, z) ∈ E 3
• commutative si : ∀(x, y) ∈ E
2
(x ∗ y) ∗ z = x ∗ (y ∗ z), x ∗ y = y ∗ x.
Ex. 5. Sur IN , ZZ , Q , IR et C , l’addition et la multiplication sont associatives et commutatives. Ex. 6. Sur P(X) , les lois ∩ et ∪ sont associatives et commutatives (voir page 34). Ex. 7. Sur IR , la soustraction n’est ni commutative, ni associative.
Ex. 8. Sur X X , la composition des applications est associative. C’est la traduction, dans un cas particulier, du résultat de la proposition 1 de la page 43. Ex. 9. L’addition et la multiplication définies sur [0, +∞] dans l’exemple 4 sont associatives et commutatives. On le démontre facilement par disjonction de cas en utilisant les propriétés correspondantes de ces lois sur IR+ .
Exo 18.1
Remarques • La notation additive + n’est utilisée que pour une loi commutative.
• On dit que deux éléments x et y de E commutent, si x ∗ y = y ∗ x. La loi est donc commutative si, et seulement si, les éléments de E commutent deux à deux. 675
Chapitre 18. Structures algébriques usuelles Définition 3 Soit ⊕ et ⊗ deux lois de composition interne sur E . On dit que ⊗ est distributive par rapport à ⊕ si pour tout (x, y, z) ∈ E 3 , on a : x ⊗ (y ⊕ z) = (x ⊗ y) ⊕ (x ⊗ z) et (x ⊕ y) ⊗ z = (x ⊗ z) ⊕ (y ⊗ z).
Ex. 10. Sur IR , la multiplication est distributive par rapport à l’addition. En revanche, l’inverse n’est pas vrai, car par exemple on a : 1 + (2 × 3) = 7 �= 12 = (1 + 2) × (1 + 3). Ex. 11. Sur P(X) , la réunion et l’intersection sont chacune distributives par rapport à l’autre. C’est la traduction de propriétés de la page 34. Ex. 12. Sur [0, +∞] , la multiplication est distributive par rapport à l’addition. On le démontre par disjonction de cas. Par exemple, si (a, b) ∈ IR∗+ × IR+ , alors :
a × (b + (+∞)) = a × (+∞) = +∞ (a × b) + (a × (+∞)) = ab + (+∞) = +∞.
Propriétés des éléments Soit ∗ une loi de composition interne sur un ensemble E .
Définition 4 On dit que e ∈ E est élément neutre pour ∗ si : ∀x ∈ E
x ∗ e = e ∗ x = x.
Proposition 1 Un tel élément neutre, quand il existe, est unique. Démonstration.
Soit e et e′ deux éléments neutres. Comme e est élément neutre, on a e ∗ e = e et de même e ∗ e′ = e puisque e′ est élément neutre. On en déduit e = e′ . ′
′
Ex. 13. Sur IR , ainsi que sur [0, +∞] , 0 est élément neutre pour l’addition et 1 est élément neutre pour la multiplication. Ex. 14. IdX est élément neutre pour la composition sur X X . Ex. 15. Sur P(X) , X est élément neutre pour l’intersection et ∅ est élément neutre pour la réunion.
Définition 5 Soit E un ensemble muni d’une loi ∗ et possédant un élément neutre e. Un élément x de E est symétrisable si : ∃y ∈ E 676
x ∗ y = y ∗ x = e.
I Lois de composition interne Proposition 2 En plus des hypothèses de la définition précédente, supposons la loi associative. S’il existe un tel élément y , celui-ci est unique. On l’appelle le symétrique de x. Démonstration. Soit y et z de E tels que x ∗ y = z ∗ x = e . Alors : z ∗ (x ∗ y) = z ∗ e = z
et
(z ∗ x) ∗ y = e ∗ y = y.
Par associativité de la loi, on en déduit y = z .
Notation Le symétrique d’un élément x se note : • x−1 pour une loi notée multiplicativement et s’appelle inverse de x et on dit aussi que x est inversible • −x pour une loi notée additivement et s’appelle opposé de x. Ex. 16. Pour l’addition dans ZZ , Q , IR ou C , tout élément admet un opposé. Ex. 17. Pour la multiplication de IR , Q ou C , tout élément non nul admet un inverse. Ex. 18. S’il existe, le neutre de (E, ∗) est symétrisable pour ∗ et il est son propre symétrique.
Remarque Une application f de X dans X est symétrisable dans (X X , ◦), de symétrique g si, et seulement si, f ◦ g = g ◦ f = IdX , c’est-à-dire si, et seulement si, f est bijective et admet pour réciproque g . Son symétrique est alors cette application réciproque. Lorsque f est une bijection de X dans X , il n’y a donc pas ambiguïté dans la notation f −1 : il s’agit aussi bien de son application réciproque que de son symétrique pour la loi ◦ . Proposition 3 Soit E un ensemble muni d’une loi ∗ associative et possédant un élément neutre e. Soit a et b sont deux éléments symétrisables. Alors a ∗ b est symétrisable et : (a ∗ b)−1 = b−1 ∗ a−1 .
Démonstration.
L’associativité de la loi ∗ permet de vérifier que :
(a ∗ b) ∗ (b−1 ∗ a−1 ) = e
719
et
(b−1 ∗ a−1 ) ∗ (a ∗ b) = e.
Ex. 19. Si f et g sont deux bijections d’un ensemble X dans lui-même, alors g ◦ f est aussi bijective et sa réciproque est f −1 ◦ g −1 . Ex. 20. Si A et B sont deux matrices inversibles de même format, alors le produit AB est également inversible et (AB)−1 = B −1 A−1 .
677
Chapitre 18. Structures algébriques usuelles Remarque Soit E un ensemble muni d’une loi associative ∗ et possédant un élément neutre e. Soit x ∈ E inversible et (a, b) ∈ E 2 . Si x ∗ a = x ∗ b , alors, en multipliant à gauche par le symétrique de x, on obtient a = b . On démontre de même l’implication a ∗ x = b ∗ x =⇒ a = b .
2
Itérés d’un élément
Notation multiplicative Soit E un ensemble muni d’une loi associative ∗ et possédant un élément neutre e . Pour x ∈ E et n ∈ IN∗ , on note : xn = x ∗ x ∗· · · ∗ x . n fois
Plus formellement, on définit l’itéré n-ième de x ∈ E , pour n ∈ IN, par récurrence de la façon suivante : x0 = e
et
∀n ∈ IN xn+1 = x ∗ (xn ).
Si x ∈ E est inversible, alors, pour tout entier naturel n, l’élément xn est inversible n et son inverse est x−1 , que l’on note x−n .
Proposition 4
Étant donné x ∈ E , on a pour tout (p, q) ∈ IN2 : xp+q = xp ∗ xq
(xp )q = xpq .
et
Si x est inversible, alors ces relations sont vraies pour tout (p, q) ∈ ZZ2 .
Démonstration page 692
Remarque Puisque p + q = q + p, la propriété précédente montre que les itérés de x commutent deux à deux.
3
Produit de n éléments
Soit E un ensemble muni d’une loi associative ∗ et possédant un élément neutre e. Étant donné une famille (xp )p∈[[1,n]] d’éléments de E , le produit : x1 ∗ · · · ∗ xn = est défini par récurrence : 0
p=1
xp = e
et
∀n ∈ IN
∗
n
xp
p=1
n
p=1
xp =
n−1 p=1
xp
∗ xn .
Lorsque tous les xi sont inversibles, le produit x1 ∗ x2 ∗ · · · ∗ xn est inversible, d’in−1 −1 verse x−1 n ∗ · · · ∗ x2 ∗ x1 .
678
I Lois de composition interne Cas des lois commutatives Lorsque la loi ∗ est commutative, on peut effectuer le produit x1 ∗ · · · ∗ xn dans xp . n’importe quel ordre ; on peut alors le noter p∈[[1,n]]
Plus généralement, si I est un ensemble fini, et (xi )i∈I une famille d’éléments de E xi le produit (dans n’importe quel ordre) des termes de la indexée par I , on note i∈I
famille. Par convention, ce produit est égal à e si I est vide.
Avec ces définitions, si J et K sont deux ensembles finis disjoints, on a : xi . xi ∗ xi = i∈J
i∈J∪K
i∈K
Notation additive Lorsque la loi est commutative et qu’elle est notée additivement : • l’élément neutre est noté 0 , • au lieu de xn , l’itéré n-ième d’un élément x s’écrit n.x ou n x pour n ∈ IN (ou n ∈ ZZ si x est symétrisable).
Les résultats de la proposition 4 de la page ci-contre s’écrivent alors de la façon suivante, pour tout (p, q) ∈ IN2 : (p + q).x = p.x + q.x
et
p.(q.x) = (pq).x
et, si x admet un opposé, ces relations sont vraies pour tout (p, q) ∈ ZZ2 . La somme de n éléments x1 , . . . , xn est notée :
xp ,
1pn
xp
n
ou
xp ,
p=1
p∈[[1,n]]
et vérifie donc : 0
xp = 0
et
p=1
∀n ∈ IN
∗
n p=1
xp =
n−1 p=1
xp
+ xn .
Plus généralement, si I est un ensemble fini, et (xi )i∈I une famille d’éléments de E indexée par I , on note xi la somme (dans n’importe quel ordre) des termes de i∈I
la famille. Par convention, cette somme est égale à 0 si I est vide.
Avec ces définitions, si J et K sont deux ensembles finis disjoints, on a : xi . xi + xi = i∈J
i∈K
i∈J∪K
679
Chapitre 18. Structures algébriques usuelles
4
Partie stable, loi induite
Définition 6 Soit E muni d’une loi de composition interne ∗ et F une partie de E . On dit que F est stable par ∗ si :
∀(x, y) ∈ F 2
x ∗ y ∈ F.
La loi de composition interne alors définie sur F par
F2 (x, y)
pelée loi induite par ∗ sur F .
−→ F est ap�−→ x ∗ y
Ex. 21. IR∗ et C∗ sont stables pour les multiplications respectives de IR et de C . Ex. 22. U est stable par la multiplication de C . Ex. 23. IN est stable par l’addition et la multiplication de ZZ . Ex. 24. L’ensemble des injections et l’ensemble des surjections de X dans X sont des parties de X X stables par la loi de composition interne ◦ .
Loi produit Définition 7 Soit (E, ⊤) et (F, ⊥) deux ensembles munis de lois de composition interne. On définit une loi de composition interne sur E × F , appelée loi produit, en posant : (x, y) ∗ (x′ , y ′ ) = (x⊤x′ , y⊥y ′ ).
Ex. 25. On définit ainsi une addition sur IR2 en posant : (x1 , x2 ) + (y1 , y2 ) = (x1 + y1 , x2 + y2 ). Ex. 26. Si IR∗+ est muni de la multiplication et IR de l’addition, alors la loi produit sur IR∗+ × IR est définie par : (r, θ) ∗ (r ′ , θ′ ) = (rr ′ , θ + θ′ ).
On peut généraliser ce procédé de construction à un produit quelconque d’ensembles munis de lois de composition interne, ce qui permet, par exemple, de définir une addition sur IRn : (x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ). Remarque On observe que la loi produit correspond à des opérations terme à terme des éléments d’un produit cartésien.
680
I Lois de composition interne Lois sur E Ω Notation Soit E un ensemble muni d’une loi de composition interne ∗ et Ω un ensemble. On définit sur E Ω une loi de composition interne, notée encore ∗ , en posant : ∀x ∈ Ω (f ∗ g)(x) = f (x) ∗ g(x).
Les propriétés (associativité, commutativité,. . . ) de la loi ainsi définie sur E Ω sont les mêmes que celles de la loi correspondante sur E . Par exemple si E a un élément neutre e pour ∗ , alors E Ω possède un élément neutre pour ∗ , qui est : Ω −→ E x �−→ e.
Ex. 27. Si f et g sont des fonctions définies sur un même ensemble Ω et à valeurs dans IR , on définit leur somme f + g et leur produit f g par : ∀x ∈ Ω • • • •
(f + g)(x) = f (x) + g(x)
et
(f g)(x) = f (x) g(x).
L’élément neutre pour l’addition est l’application nulle. Tout élément f admet pour opposé l’application (−f ) : x �→ −f (x) . L’élément neutre pour la multiplication est l’application constante égale à 1 . Une fonction f est inversible pour la multiplication si, et seulement si, elle ne s’annule pas ; son inverse est alors : 1 1 : x �−→ · f f (x)
Remarque On la note parfois f −1 , mais attention au risque de confusion avec la fonction réciproque lorsque f est bijective.
5
Morphismes
Définition 8 Soit E et E ′ deux ensembles, ∗ une loi de composition interne sur E , et ∗′ une loi de composition interne sur E ′ . On dit qu’une application f de E dans E ′ est un morphisme de (E, ∗) dans (E ′ , ∗′ ) si : ∀(x, y) ∈ E 2 f (x ∗ y) = f (x) ∗′ f (y). • Un morphisme bijectif est appelé isomorphisme.
• Un morphisme de (E, ∗) dans lui-même est appelé endomorphisme de E . • Un endomorphisme bijectif est appelé automorphisme.
Ex. 28. La fonction logarithme népérien est un isomorphisme de (IR∗+ , ×) sur (IR, +) . Sa réciproque, l’exponentielle, est un isomorphisme de (IR, +) sur (IR∗+ , ×) .
Ex. 29. Si ∗ est une loi de composition interne sur E , l’application IdE est un automorphisme de (E, ∗) .
681
Chapitre 18. Structures algébriques usuelles Ex. 30. Soit x ∈ ZZ . • L’application
ZZ n
−→ �−→
ZZ nx
est un endomorphisme de (ZZ, +) .
• L’application
IN n
−→ �−→
ZZ xn
est un morphisme de (IN, +) dans (ZZ, ×) .
Ex. 31. Soit E un ensemble muni d’une loi de composition interne ∗ . On peut énoncer la règle xp ∗ xq = xp+q de calcul sur les itérés en disant que l’application : IN n
−→ �−→
E xn
est un morphisme de (IN, +) dans (E, ∗) .
Proposition 5 La composée de deux morphismes est un morphisme. Démonstration page 692
Proposition 6 La réciproque d’un isomorphisme est un isomorphisme. Démonstration page 692
II
Groupes
1
Définitions, exemples
Définition 9 Étant donné un ensemble G muni d’une loi de composition interne ∗ , on dit que (G, ∗) est un groupe si : • ∗ est associative,
• (G, ∗) possède un élément neutre,
• tout élément de G possède un symétrique dans G.
Si de plus ∗ est commutative, on dit que G est un groupe commutatif. Remarques • Par abus de langage et lorsqu’il n’y a aucune ambiguïté, on dit souvent « soit G un groupe » sans préciser la loi. • On parle aussi parfois de groupe abélien au lieu de groupe commutatif. Ex. 32. (ZZ, +) , (IR, +) , (IR∗ , ×) , (IR∗+ , ×) , (C, +) , (C∗ , ×) sont des groupes commutatifs. Ex. 33. (IN, +) et (IR, ×) ne sont pas des groupes. Dans le premier cas, 1 (ou encore n’importe quel entier naturel non nul) est non symétrisable. Dans le deuxième cas, 0 n’est pas symétrisable.
682
II Groupes Ex. 34. Soit n ∈ IN∗ . En munissant IRn de la loi produit définie par : (x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ) on obtient un groupe commutatif. Le neutre est (0, . . . , 0) et l’opposé de (x1 , . . . , xn ) ∈ IRn est (−x1 , . . . , −xn ) . L’associativité et la commutativité découlent de l’associativité et la commutativité de l’addition des réels. Il en est de même en remplaçant IR par C . Ex. 35. Si G et H sont des groupes, alors G × H muni de la loi produit est un groupe. Le neutre de G × H est (e, e′ ) où e est le neutre de G et e′ celui de H .
Le symétrique de (x, y) ∈ G × H est (x−1 , y −1 ) .
Proposition 7 L’ensemble SX des permutations de X muni de la loi de composition interne ◦ est un groupe. Il n’est pas commutatif si X a au moins trois éléments. Démonstration page 692
Remarque Lorsque X n’a que deux éléments a et b , il n’y a que deux bijections de X dans X : l’identité et l’application qui échange a et b . Il est alors évident que SX est commutatif.
2 Exo 18.2 Exo 18.3
Sous-groupes
Définition 10 Soit G un groupe. Une partie H de G est un sous-groupe de G si elle est stable par la loi de G et par passage au symétrique, et si elle contient le neutre de G.
Ex. 36. ZZ et Q sont des sous-groupes de (IR, +) . Ex. 37. IR∗+ est un sous-groupe de (IR∗ , ×) mais pas de (IR, +) puisqu’il ne contient pas 0 . Ex. 38. L’ensemble U des complexes de module 1 et l’ensemble Un des racines n -ièmes de l’unité sont des sous-groupes de (C∗ , ×) . Ex. 39. Les parties G et {e} sont des sous-groupes du groupe G . On les appelle sous-groupes triviaux de G . Ex. 40. Si A et B sont deux sous-groupes de G , alors A ∩ B est un sous-groupe de G .
683
Chapitre 18. Structures algébriques usuelles Proposition 8 Muni de la loi induite, un sous-groupe est un groupe. Démonstration page 692
Point méthode C’est la méthode habituelle, car la plus efficace, pour montrer que l’on a affaire à un groupe : on démontre en général que c’est un sous-groupe d’un groupe connu. Cela permet, en particulier, de ne pas à avoir à montrer l’associativité. Le lecteur est donc invité à bien connaître les exemples classiques de la page 682, afin de pouvoir les utiliser pour démontrer qu’une de leurs parties est un groupe.
Morphismes de groupes Définition 11 Soit G et G′ deux groupes et f une fonction de G dans G′ . On dit que f est un morphisme de groupes de G dans G′ lorsque : Exo 18.4
∀(x, y) ∈ G2
f (x ∗ y) = f (x) ∗ f (y).
Remarques • On retrouve la définition d’un morphisme donnée par la définition 8 de la page 681. Exo 18.5
• On utilise la terminologie (isomorphisme, endomorphisme et automorphisme) de la définition 8 de la page 681.
Ex. 41. La fonction logarithme népérien est un isomorphisme de groupes de (IR∗+ , ×) dans (IR, +) .
997
Ex. 42. L’application constante qui envoie tous les éléments d’un groupe G sur l’élément neutre d’un groupe G′ est un morphisme de groupes. Ex. 43. L’application : GLn (IR) A
−→ �−→
IR∗ det A
est un morphisme de groupes de (GLn (IR), ×) dans (IR∗ , ×) .
Ex. 44. Si U est l’ensemble des nombres complexes de module 1 , l’application (ρ, u) �→ ρ u est un isomorphisme de groupes de (IR∗+ , ×) × (U, ×) dans (C∗ , ×) .
Proposition 9 Soit f un morphisme de groupes de G (d’élément neutre e) dans G′ (d’élément neutre e′ ). On a : • f (e) = e′ , −1 • ∀x ∈ G f (x) = f x−1 , n • ∀x ∈ G ∀n ∈ ZZ f (x) = f xn . 684
Démonstration page 693
II Groupes
Ex. 45. Dans le cas particulier de la fonction logarithme, on obtient : ln 1 = 0 996
et
∀x > 0
ln(1/x) = − ln x.
Ex. 46. Si A est une matrice inversible, alors det A−1 =
3
1 · det A
Noyau, image
Soit G et G′ deux groupes d’éléments neutres respectifs e et e′ , ainsi que f un morphisme de groupes de G dans G′ . Proposition 10 • Si H est un sous-groupe de G, alors f (H) est un sous-groupe de G′ .
• Si H ′ est un sous-groupe de G′ , alors f −1 (H ′ ) est un sous-groupe de G.
Démonstration page 693
Corollaire 11 • L’ensemble f (G), appelé image de f , est un sous-groupe de G′ .
On le note Im(f ). • L’ensemble f −1 {e′ } , appelé noyau de f , est un sous-groupe de G. On le note Ker(f ).
Ex. 47. Si n ∈ IN∗ , l’application
C∗ −→ C∗ est un endomorphisme surjectif du z �−→ z n ∗ groupe C . Son noyau est Un , l’ensemble des racines n -ièmes de l’unité, ce qui permet de prouver que ce dernier est un sous-groupe de (C∗ , ×) . Ex. 48. Le morphisme
G x
−→ �−→
G′ e′
a pour noyau G et pour image {e′ } .
Ex. 49. L’application θ → � eiθ est un morphisme surjectif du groupe (IR, +) sur le groupe (U, ×) . Son noyau est 2πZZ .
Ex. 50. L’application z �→ ez est un morphisme surjectif du groupe (C, +) sur le groupe (C∗ , ×) . Son noyau est 2iπZZ .
Théorème 12 Le morphisme f est injectif si, et seulement si, Ker f = {e}.
Démonstration page 693
Comme f (e) = e′ , il suffit de montrer l’inclusion Ker f ⊂ {e} , c’est-à-dire : Point méthode Pour montrer l’injectivité du morphisme de groupes f , on vérifie l’implication : ∀x ∈ G f (x) = e′ =⇒ x = e. 685
Chapitre 18. Structures algébriques usuelles
III
Anneaux
1
Définitions
Définition 12 Soit A un ensemble muni de deux lois de composition interne, notées en général + et × . On dit que (A, +, ×) est un anneau si : • (A, +) est un groupe commutatif,
• A possède un élément neutre pour × ,
• × est associative, et distributive par rapport à + .
On dit que l’anneau est commutatif si × est commutative. Notation Dans un anneau A : • on note 0 (ou 0A ) l’élément neutre pour + , • on note 1 (ou 1A ) l’élément neutre pour × , • on note couramment x.y ou même x y à la place de x × y , • on utilise simultanément les deux notations : ∗ n.a ou n a avec n ∈ ZZ pour l’itéré additif,
∗ an avec n ∈ IN (ou n ∈ ZZ si a est inversible) pour l’itéré multiplicatif, Remarque D’après la définition des itérés (cf. page 678) : ∀x ∈ A
x0 = 1A
et en particulier
00A = 1A .
Ex. 51. ZZ , Q , IR et C sont des anneaux commutatifs pour l’addition et la multiplication usuelles. Ex. 52. On sait déjà, par l’exemple 34 de la page 683, que (IRn , +) est un groupe commutatif. En le munissant de la loi produit définie par : (x1 , . . . , xn ) × (y1 , . . . , yn ) = (x1 y1 , . . . , xn yn ) on obtient un anneau. En effet, l’associativité et la distributivité se démontrent à partir des mêmes propriétés sur IR (en travaillant coordonnée par coordonnée). De plus, l’élément (1, . . . , 1) ∈ IRn est neutre pour la multiplication. Il en est de même si on remplace IR par C . Ex. 53. L’ensemble des suites réelles IRIN muni des lois usuelles (somme et produit de deux suites termes à termes) est un anneau commutatif. Il en est de même si on remplace IR par C .
686
III Anneaux
2
Règles de calcul
Proposition 13 Dans un anneau A, on a les propriétés suivantes : • ∀a ∈ A 0 × a = a × 0 = 0 , • ∀(a, b) ∈ A2
(0 est absorbant)
(−a) × b = a × (−b) = −(a × b).
Principe de démonstration.
(règle des signes) Démonstration page 694
Calculer a × 0 + a × 0 et a × b + a × (−b) .
Remarque Soit A un anneau dans lequel 0A = 1A . Pour tout x ∈ A, on a x = 1A x = 0A x = 0A donc A = {0A } . Un tel anneau est appelé anneau nul (ou anneau trivial). Par distributivité, on démontre par une récurrence immédiate sur le nombre d’éléments de l’ensemble fini I : Proposition 14 Si (ai )i∈I est une famille finie d’éléments d’un anneau A, on a, pour tout x ∈ A : x ai = xai et ai x. ai x = i∈I
i∈I
i∈I
i∈I
Proposition 15 (Distributivité généralisée) Si (ai )i∈I et (bj )j∈J sont deux familles d’éléments d’un anneau A, indexées par des ensembles finis I et J , on a : ai bj = ai b j . i∈I
(i,j)∈I×J
j∈J
Démonstration page 694
Principe de démonstration.
Récurrence sur le nombre d’éléments de l’ensemble fini I ,
l’ensemble fini J étant fixé.
Remarque En particulier, on peut développer ainsi le carré d’une somme dans un anneau non nécessairement commutatif : (a1 + · · · + an )2 =
n
k=1
a2k +
ai aj .
1i�=jn
Dans le cas où les termes de la somme commutent deux à deux (par exemple si l’anneau est commutatif), on retrouve l’identité suivante évoquée dans 16 de la page 113 : (a1 + · · · + an )2 =
n
k=1
a2k + 2
ai aj .
1i j =⇒ ai,j = 0 ; i < j =⇒ ai,j = 0 .
Notation Dans Mn (IK), on note Tn+ (IK) l’ensemble des matrices triangulaires supérieures, et Tn− (IK) l’ensemble des matrices triangulaires inférieures. Remarques • Une matrice carrée est dite triangulaire si elle est triangulaire supérieure ou triangulaire inférieure. • Une matrice est triangulaire inférieure si, et seulement si, sa transposée est triangulaire supérieure, et réciproquement. • On a Tn+ (IK) ∩ Tn− (IK) = Dn (IK).
• On voit facilement que les ensembles Tn+ (IK) et Tn− (IK) contiennent la matrice nulle et sont stables par combinaison linéaire : il sera dit au chapitre 22 que ce sont des sous-espaces vectoriels de Mn (IK). 717
Chapitre 19. Calcul matriciel Proposition 17 Les ensembles Tn+ (IK) et Tn− (IK) sont stables par produit.
Démonstration page 729
Remarques • Si A et B sont deux matrices triangulaires supérieures (ou deux matrices triangulaires inférieures), alors la diagonale du produit AB est le produit terme à terme des deux diagonales : ∀i ∈ [[1, n]] [AB]i,i = [A]i,i [B]i,i . • Les ensembles Tn+ (IK) et Tn− (IK) sont des sous-anneaux de (Mn (IK), +, ×). Définition 15 Une matrice A = (ai,j )1i,jn ∈ Mn (IK) est dite :
2
• symétrique si AT = A, c’est-à-dire : ∀(i, j) ∈ [[1, n]]
ai,j = aj,i ; 2
• antisymétrique si AT = −A, c’est-à-dire : ∀(i, j) ∈ [[1, n]]
ai,j = −aj,i .
On note Sn (IK) l’ensemble des matrices symétriques, et An (IK) l’ensemble des matrices antisymétriques. Remarques • Les coefficients diagonaux d’une matrice antisymétrique sont nuls. • On a Sn (IK) ∩ An (IK) = {0} . Ex. 19. Montrons que tout matrice M ∈ Mn (IK) s’écrit de manière unique comme somme
d’une matrice symétrique et d’une matrice antisymétrique. Soit M ∈ Mn (IK) . Procédons par analyse-synthèse. • Supposons que M s’écrive M = S + A avec (S, A) ∈ Sn (IK) × An (IK) . En transposant, on a M T = S T + AT = S − A , ce qui donne : S=
M + MT 2
et
A=
M − MT · 2
Cela assure l’unicité. • Réciproquement, il est immédiat de vérifier que le couple de matrices (S, A) défini précédemment convient : S est symétrique, A est antisymétrique, et leur somme vaut M .
718
III Anneau des matrices carrées
3 Exo 19.6 Exo 19.7
Éléments inversibles de Mn (IK) : le groupe GLn (IK)
Définition 16 Une matrice A ∈ Mn (IK) est dite inversible si elle est inversible dans l’anneau (Mn (IK), +, ×), c’est-à-dire s’il existe B ∈ Mn (IK) vérifiant : AB = BA = In .
Notations • Une matrice B vérifiant la double égalité ci-dessus est unique (comme c’est le cas dans tout anneau). On l’appelle l’inverse de A, et on la note A−1 . • On désigne par GLn (IK) l’ensemble des éléments inversibles de Mn (IK). C’est le groupe des éléments inversibles de l’anneau (Mn (IK), +, ×). Ex. 20. Les deux matrices A =
A−1 =
1 2
0
2 0 0 1
0 1
et B =
et
1 0
B −1 =
1 1
1 0
sont inversibles, et : −1 1
.
Ex. 21. Une matrice diagonale D = Diag(α1 , . . . , αn ) est inversible si, et seulement si, ses coefficients diagonaux αk sont tous non nuls. En effet : • si les αk sont tous non nuls, alors la matrice ∆ = Diag D ∆ = ∆ D = In ;
1 , . . . , α1n α1
vérifie :
• s’il existe i ∈ [[1, n]] tel que αi = 0 , alors pour tout matrice M ∈ Mn (IK) , la i -ème ligne de la matrice DM est nulle, donc DM �= In .
Exo 19.8
Remarque Dans certains calculs, on peut « simplifier » par une matrice inversible en multipliant, à gauche ou à droite, par sa matrice inverse. Ainsi, si A est une matrice inversible, alors : • en multipliant à gauche par A−1 , une relation de la forme AB = AC donne B = C ; • en multipliant à droite par A−1 , une relation de la forme BA = CA donne B = C . Proposition 18 Si A et B sont deux matrices inversibles de (Mn (IK), +, ×), alors AB est inversible et : (AB)−1 = B −1 A−1 . Démonstration. Conséquence
C’est un cas particulier de ce que l’on a vu sur les anneaux.
Pour A ∈ GLn (IK) et k ∈ IN, Ak est inversible et (Ak )−1 = (A−1 )k . 719
Chapitre 19. Calcul matriciel
Attention Pour n 2 , le groupe (GLn (IK), ×) n’est pas commutatif. Par exemple, dans M2 (IK), les matrices A et B de l’exemple précédent sont inversibles mais ne commutent pas, car : 2 2 2 1 AB = et BA = . 0 1 0 1 Proposition 19
−1 −1 T Si A ∈ GLn (IK), alors AT ∈ GLn (IK) et l’on a AT = A .
Démonstration.
A−1
T
Les relations suivantes prouvent que AT est inversible, d’inverse A−1
AT = AA−1
T
= In T = In
et
AT A−1
T
= A−1 A
T
= In T = In .
T
:
Opérations élémentaires et inversibilité Proposition 20 Toute matrice d’opération élémentaire est inversible. Démonstration.
Pour chacun des trois types de matrices d’opérations élémentaires, on sait expliciter la matrice inverse (la vérification est immédiate en calculant le produit matriciel) : • transvection : la matrice de transvection Ti,j,λ a pour matrice inverse Ti,j,−λ ; • dilatation : la matrice de dilatation Di,µ a pour matrice inverse Di, µ1 ;
• permutation : la matrice de permutation Pi,j est sa propre matrice inverse. Remarque Une manière intuitive d’obtenir ces résultats est de comprendre comment inverser une opération élémentaire. Si l’on raisonne par exemple sur les colonnes : • une transvection Cj ← Cj + λCi a pour opération inverse la transvection Cj ← Cj − λCi ; • une dilatation Ci ← µCi a pour opération inverse la dilatation Ci ←
1 C µ i
;
• un échange Ci ↔ Cj est une opération involutive, i.e. est son propre inverse.
Corollaire 21 Les opérations élémentaires préservent l’inversibilité. Démonstration.
Effectuer une opération élémentaire revient à multiplier, par la gauche ou par la droite, par une matrice d’opération élémentaire (cf.proposition 9 de la page 710 et la proposition 10). On en déduit le résultat, car toute matrice d’opération élémentaire est inversible, et qu’un produit de matrices inversibles est inversible.
720
III Anneau des matrices carrées Calcul de l’inverse d’une matrice par résolution du système AX = Y . Proposition 22 Étant donné A ∈ Mn (IK), les deux assertions suivantes sont équivalentes : (i) A ∈ GLn (IK) ;
(ii) pour tout Y ∈ Mn,1 (IK), le système linéaire AX = Y possède une unique solution. L’unique solution du système linéaire AX = Y est alors A−1 Y . Démonstration page 729
Terminologie Un système linéaire carré de la forme AX = Y est dit de Cramer si la matrice A est inversible. Remarque En conséquence de la proposition précédente, si une matrice A ∈ Mn (IK) est inversible, alors le système homogène AX = 0 possède comme unique solution la solution nulle. Point méthode Pour prouver qu’une matrice carrée A n’est pas inversible, on peut chercher à montrer que le système homogène associé AX = 0 possède une solution non nulle, ce qui revient à obtenir 0 comme combinaison linéaire non nulle des colonnes de A.
Ex. 22. Montrons que la matrice A =
1 1 1
1 0 1
1 1 1
n’est pas inversible. Pour cela, constatons
que les première et troisième colonnes de A sont égales. Donc, en notant C = a AC = 0 . Comme C �= 0 , cela prouve la non-inversibilité de A .
1 0 −1
, on
Lemme 23 Soit (A1 , A2 ) ∈ Mn (IK)2 . Si pour tout X ∈ Mn,1 (IK), on a A1 X = A2 X , alors A1 = A2 .
Démonstration page 729
De ce qui précède on déduit une méthode pour prouver l’inversibilité d’une matrice A ∈ Mn (IK) et calculer A−1 : Point méthode Soit A ∈ Mn (IK). Supposons que, pour tout Y ∈ Mn,1 (IK), le système AX = Y possède une unique solution. Alors : • on en déduit que A est inversible, d’après la proposition 22 ;
• si l’on réussit à exprimer la solution sous la forme X = M Y avec M ∈ Mn (IK), alors, ayant également X = A−1 Y , et en vertu du lemme 23, on a A−1 = M .
721
Chapitre 19. Calcul matriciel �
1 1 Ex. 23. Montrons que la matrice A = 1 Pour cela, fixons Y ∈ M3,1 (IK) et résolvons le
�
x1 x2 x3
�
(S) ⇐⇒
�
x1 + x2 + x3 x1 + 2x2 + 3x3 x1 + 3x2 + 6x3
= = =
y1 y2 y3
⇐⇒
�
x1 + x2 + x3 x2 + 2x3 2x2 + 5x3
= = =
⇐⇒
�
y1 −y1 + y2 −y1 + y3
x1 + x2 + x3 x2 + 2x3 x3
= = =
y1 −y1 + y2 y1 − 2y2 + y3 .
En notant X =
et Y =
�
y1 y2 y3
�
�
1 1 2 3 est inversible et calculons son inverse. 3 6 système (S) : AX = Y .
, on a :
L2 ← L2 − L1 L3 ← L3 − L1 L3 ← L3 − 2L2
Le système obtenu est triangulaire et possède une unique solution. Cela prouve déjà que A est inversible. De plus, l’unique solution de (S) , obtenue par résolution du bas vers le haut, � � 3y1 − 3y2 + y3 est X = −3y1 + 5y2 − 2y3 . L’unique solution du système (S) s’écrivant X = M Y y1 − 2y2 + y3 Exo 19.9
avec M =
�
3 −3 1
−3 5 −2
1 −2 1
�
, on en déduit que A−1 = M .
Calcul de l’inverse d’une matrice par opérations élémentaires Lemme 24 Soit A = (ai,j )1i,jn ∈ Mn (IK) vérifiant : ∀i ∈ [[2, n]] ai,1 = 0.
Si A est inversible, alors on a nécessairement a1,1 �= 0 , et la sousmatrice A˜ = (ai,j )2i,jn est inversible.
A=
a1,1 0 .. . 0
(⋆) � A
Démonstration page 730
Proposition 25 Soit A ∈ GLn (IK). On peut transformer A en In par une suite d’opérations élémentaires sur les lignes. Démonstration page 730
Principe de démonstration. On procède en trois étapes : on transforme d’abord A en une matrice triangulaire supérieure, puis on rend tous les coefficients diagonaux égaux à 1 , et enfin on obtient In . 722
III Anneau des matrices carrées Remarque Soit A ∈ GLn (IK). Notons en respectant l’ordre E1 , . . . , Ep les matrices d’opérations élémentaires sur les lignes permettant de transformer A en In . Alors : Ep · · · E1 A = In .
En multipliant à droite par A−1 , on en déduit : A−1 = Ep · · · E1
ou encore A−1 = Ep · · · E1 In .
Point méthode (Calcul de l’inverse d’une matrice par opérations élémentaires) Étant donné A ∈ GLn (IK), on obtient donc A−1 en effectuant, sur la matrice In , les mêmes opérations élémentaires sur les lignes que celles qui ont permis de transformer A en In .
1 1 1 1 2 3 . Montrons que A est inversible et calEx. 24. Considérons la matrice A = 1 3 7 culons son inverse. Pour cela, transformons A en I3 à l’aide d’opérations élémentaires sur les lignes, et appliquons en parallèle ces opérations élémentaires sur la matrice I3 .
A
I3
=
1 1 1
1 2 3
1 3 7
1 0 0
0 1 0
0 0 1
1 0 0
1 1 2
1 2 6
0 1 0
0 0 1
1 −1 −1
1 0 0
1 1 0
1 2 2
1 −1 1
0 1 −2
0 0 1
0 0
1 0 0
1 1 0
1 2 1
1 −1
0 1 −1
1 0 0
1 1 0
0 0 1
1 2
− 12 −1
1 3 −1
1 0 0
0 1 0
0 0 1
−2 3 −1
1 2
Conclusion : la matrice A est inversible et A
1 2
−2 1 2
5 2
−2 1 2
−1
1 = 2
1 2
1 2
−1 1 2
5 −4 1
−4 6 −2
L2 ← L2 − L1 L3 ← L3 − L1 L3 ← L3 − 2L2 L3 ← 12 L3 L1 ← L1 − L3 L2 ← L2 − 2L3 L1 ← L1 − L2
1 −2 1
.
Attention En général, deux opérations élémentaires ne commutent pas : l’ordre dans lequel on les applique importe. Par conséquent, on ne s’autorisera à effectuer plusieurs opérations élémentaires lors d’une seule étape uniquement après avoir vérifié que celles-ci commutent (comme c’est le cas pour les transvections L2 ← L2 − L1 et L3 ← L3 − L1 lors de la deuxième étape de l’exemple précédent). 723
Chapitre 19. Calcul matriciel Remarques • Cette méthode de calcul de l’inverse d’une matrice par opérations élémentaires présente l’avantage d’être un peu plus concise que la méthode précédemment exposée utilisant la résolution d’un système linéaire ; concrètement, elle évite d’avoir à écrire les inconnues. En revanche, dans certaines situations, et en particulier lorsque les matrices considérées ont beaucoup de coefficients nuls, la méthode « résolution du système linéaire AX = Y » peut se révéler plus efficace. • Comme illustré par l’exemple qui suit, dans certaines situations, pour transformer A en In à l’aide d’opérations élémentaires sur les lignes, on peut trouver plus efficace que d’appliquer scrupuleusement la méthode du pivot. �
�
0 1 1 Ex. 25. Considérons la matrice A = . Montrons que A est inversible et cal1 0 1 1 1 0 culons son inverse. Pour cela, transformons A en I3 à l’aide d’opérations élémentaires sur les lignes, et appliquons en parallèle ces opérations élémentaires sur la matrice I3 . Au début du processus, on constate qu’en ajoutant à la dernière ligne les deux autres, puis en divisant par 2 , on obtient une ligne remplie de 1 , ce qui facile la suite du processus.
�
A
I3
�
0 1 1
1 0 1
1 1 0
1 0 0
0 1 0
0 1 1
1 0 1
1 1 1
1 0
0 1
1 2
1 2
−1 0 1
0 −1 1
0 0 1
1 2 − 21 1 2
− 21
0 0 1
1 2 − 21 1 2
− 21 1 2 1 2
=
−1 0 0
1 0 0
0 −1 0 0 1 0
0 0 1
− 21 1 2 1 2
Conclusion : la matrice A est inversible et A−1
1 2 1 2
1 2 1 −2 1 2
0 0 1
0 0
1 2
L3 ← 21 (L1 + L2 + L3 )
− 12 L1 ← L1 − L3 − 12 L2 ← L2 − L3 1 2
− 12 − 12 − 12 1 2 1 2 − 12
L3 ← L3 + L1 + L2 L1 ← −L1
L2 ← −L2
−1 1 = 1 2 1
1 −1 1
1 1 . −1
Remarque Pour inverser cette matrice, une méthode plus efficace sera proposée dans l’exercice 19.12 de la page 733.
724
III Anneau des matrices carrées
4
Inversibilité et matrices triangulaires
Proposition 26 Une matrice triangulaire est inversible si, et seulement si, ses coefficients diagonaux sont tous non nuls.
Démonstration page 731
Proposition 27 Soit A une matrice triangulaire supérieure (respectivement inférieure) et inversible. Alors A−1 est aussi triangulaire supérieure (respectivement inférieure). Démonstration page 731 Lorsqu’on applique la méthode du pivot de Gauss sur une matrice triangulaire, la forme triangulaire est conservée.
Principe de démonstration.
Remarque Les ensembles Tn+ (IK) ∩ GLn (IK) et Tn− (IK) ∩ GLn (IK) sont stables par produit et passage à l’inverse, et contiennent In . Ce sont donc des sous-groupes de (GLn (IK), ×). Point méthode Le caractère inversible ou non d’une matrice triangulaire est immédiat à voir (il suffit de regarder les coefficients diagonaux), et les opérations élémentaires préservent l’inversibilité. Par conséquent, lorsque l’on s’intéresse au caractère inversible ou non d’une matrice, on peut chercher à la transformer, par opérations élémentaires sur les lignes et/ou colonnes, en une matrice triangulaire.
1 2 3 Ex. 26. Cherchons pour quelles valeurs de (a, b) ∈ IR la matrice A = est 1 3 a 1 4 b inversible. Les deux transvections (qui commutent) L2 ← L2 − L1 et L3 ← L3 − L1 trans 1 2 3 forment A en la matrice A1 = 0 1 a−3 . Puis, la transvection L3 ← L3 − 2L2 0 2 b−3 2
1 2 3 0 1 a−3 transforme A1 en la matrice A2 = . La matrice A2 , triangulaire supé0 0 3 − 2a + b rieure, est inversible si, et seulement si, 3 − 2a + b �= 0 . Cela répond à la question, puisque A est inversible si, et seulement si, A2 l’est (car on passe de A à A2 par opérations élémentaires).
725
Chapitre 19. Calcul matriciel
Démonstrations Proposition 2 Les deux formules se démontrent de manière analogue. Montrons la première. Prenons (A, B) ∈ Mn,p (IK)2 et C ∈ Mp,q (IK) . Notons ai,j , bi,j et ci,j les coefficients d’indice (i, j) de A , B et C respectivement. Pour (i, j) ∈ [[1, n]] × [[1, q]] , on a :
(λA + µB) C
i,j
=
p
[ λA + µB ]i,k ck,j
k=1
=
p
λai,k + µbi,k ck,j
k=1
=λ
p
ai,k ck,j + µ
k=1
p
bi,k ck,j = λAC + µBC
k=1
i,j
.
Proposition 3 Puisque A est de taille (n, p) et B de taille (p, q) , la matrice AB est de taille (n, q) . Le produit matriciel (AB) C est donc licite, et la matrice obtenue est de taille (n, r) . Notons ai,j , bi,j et ci,j les coefficients d’indice (i, j) de A , B et C respectivement. Pour (i, j) ∈ [[1, n]] × [[1, r]] , le coefficient d’indice (i, j) de (AB) C vaut :
(AB) C
i,j
=
q
[ AB ]i,k ck,j =
k=1
q p
ai,ℓ bℓ,k ck,j .
k=1 ℓ=1
De même, on vérifie qu’on peut bien effectuer le produit matriciel A (BC) , qu’il s’agit également d’une matrice de taille (n, r) , dont le coefficient d’indice (i, j) vaut :
A (BC)
i,j
=
p
ai,ℓ [ BC ]ℓ,j =
ℓ=1
D’où la conclusion, car les symboles
q q
ai,ℓ bℓ,k ck,j .
ℓ=1 k=1
d’une somme rectangulaire finie peuvent être intervertis.
Proposition 4 Prenons Ei,j ∈ Mn,p (IK) et Ek,ℓ ∈ Mp,q (IK) . Ainsi on a Ei,j Ek,ℓ ∈ Mn,q (IK) . Pour (a, b) ∈ [[1, n]] × [[1, q]] , calculons le coefficient d’indice (a, b) de Ei,j Ek,ℓ :
Ei,j Ek,ℓ
a,b
=
p
[ Ei,j ]a,c [ Ek,ℓ ]c,b .
c=1
Par définition des matrices élémentaires, les termes de la somme précédente valent 0 ou 1 , les termes valant 1 étant ceux pour lesquels (a, c) = (i, j) et (c, b) = (k, ℓ) . Par conséquent :
•
si j �= k , alors tous les termes de la somme sont nuls, et donc Ei,j Ek,ℓ
•
si j = k , alors :
cas, Ei,j Ek,ℓ est donc la matrice nulle ;
Ei,j Ek,ℓ
a,b
=
dans ce cas, on a donc Ei,j Ek,ℓ = Ei,ℓ .
726
1 0
si (a, b) = (i, ℓ) sinon ;
a,b
= 0 ; dans ce
Démonstrations Proposition 5 • Soit A = (ak,ℓ )(k,ℓ)∈[[1,n]]×[[1,p]] ∈ Mn,p (IK) et Ei,j ∈ Mq,n (IK) . On a : A=
donc
ak,ℓ Ek,ℓ
Ei,j A =
1kn 1ℓp
ak,ℓ Ei,j Ek,ℓ .
1kn 1ℓp
En utilisant le résultat de la proposition 4 de la page 707, on a :
Ei,j A =
1kn 1ℓp
•
ak,ℓ δk,j Ei,ℓ =
aj,ℓ Ei,ℓ ,
1ℓp
ce qui justifie la forme annoncée pour la matrice Ei,j A . Soit A = (ak,ℓ )(k,ℓ)∈[[1,n]]×[[1,p]] ∈ Mn,p (IK) et Ei,j ∈ Mp,q (IK) . On a : A=
ak,ℓ Ek,ℓ
donc
1kn 1ℓp
ak,ℓ Ek,ℓ Ei,j .
1kn 1ℓp
En utilisant la proposition 4 de la page 707, on a : AEi,j =
AEi,j =
ak,ℓ δℓ,i Ek,j =
1kn 1ℓp
ak,i Ek,j ,
1kn
ce qui justifie le résultat annoncé. Proposition 6 Notons ai,j et bi,j les coefficients d’indice (i, j) de A et B respectivement. • Soit j ∈ [[1, q]] . Montrons que la j -ème colonne de AB vaut ACj , en montrant l’égalité de leurs coefficients. Pour i ∈ [[1, n]] : ∗ le i -ème coefficient de la j -ème colonne de AB est le coefficient d’indice (i, j) de AB : [AB]i,j =
p
ai,k bk,j ;
k=1
∗
le i -ème coefficient de la matrice colonne ACj vaut : [ACj ]i,1 =
p
ai,k [Cj ]k,1 =
k=1
•
p
ai,k bk,j .
k=1
D’où le résultat. Le second point de la proposition s’obtient de la même manière : on montre, en regardant les coefficients, que la i -ème ligne de la matrice AB est Li B .
Proposition 9
Notons L1 , . . . , Ln les lignes de la matrice A ∈ Mn,p (IK) .
•
Soit (i, j) ∈ [[1, n]]2 tel que i �= j , et λ ∈ IK . On a :
•
Or, Ei,j A est la matrice dont les lignes sont nulles, exceptée la i -ème qui vaut Lj . Par conséquent, les lignes de la matrice Ti,j,λ A sont celles de A , exceptée la i -ème qui vaut Li +λLj . Ainsi, la matrice Ti,j,λ A est bien obtenue à partir de A par la transvection Li ← Li + λ Lj . Soit (i, µ) ∈ [[1, n]] × IK∗ . On a :
Ti,j,λ A = (In + λEi,j )A = A + λEi,j A.
Di,µ A = (In + (µ − 1)Ei,i )A = A + (µ − 1)Ei,i A.
Or, les lignes de Ei,i A sont nulles, exceptée la i -ème qui vaut Li . Par conséquent, les lignes de Di,µ A sont celles de A , exceptée la i -ème qui vaut 1 + (µ − 1) Li , i.e. µLi . Ainsi, la matrice Di,µ A est bien obtenue à partir de A par la dilatation Li ← µ Li .
727
Chapitre 19. Calcul matriciel •
Soit (i, j) ∈ [[1, n]]2 tel que i �= j . On a : Pi,j A = (In − Ei,i − Ej,j + Ei,j + Ej,i )A = A − Ei,i A − Ej,j A + Ei,j A + Ej,i A. ∗ ∗ ∗
Pour k ∈ [[1, n]] \ {i, j} , les k -ièmes lignes des matrices Ei,i A , Ej,j A , Ei,j A et Ej,i A sont nulles ; par conséquent, la k -ième ligne de Pi,j A vaut Lk ; les i -èmes lignes des matrices Ej,j A et Ej,i A sont nulles, tandis que les i -èmes lignes de Ei,i A et Ei,j A et valent respectivement Li et Lj ; par conséquent, la i -ème ligne de Pi,j A vaut Li − Li + Lj , i.e. Lj ; par un raisonnement analogue, la j -ème ligne de Pi,j A vaut Lj − Lj + Li , i.e. Li .
Ainsi, la matrice Pi,j A est bien obtenue à partir de A par l’échange Li ↔ Lj .
Proposition 12
un système obtenu à partir de (S) par une Soit (S) un système linéaire et (S)
ont les mêmes solutions. opération élémentaire sur les lignes. Montrons que (S) et (S) •
C’est évident si l’opération réalisée est un échange de deux lignes.
•
Supposons que l’opération réalisée soit une transvection : Li ← Li + λLj ( λ ∈ IK et i �= j ). ∗
. Toutes les Montrons que toute solution (x1 , . . . , xp ) de (S) est aussi solution de (S)
sauf éventuellement la i -ème sont vérifiées (car ce sont les mêmes que équations de (S)
, elle est également vérifiée car : celles de (S) ). Quant à la i -ème équation de (S) ai,1 x1 + · · · + ai,p xp +λ (aj,1 x1 + · · · + aj,p xp ) = bi + λ bj .
∗ •
= bi
= bj
est également Réciproquement, le point précédent nous donne que toute solution de (S)
à (S) en appliquant la transvection Li ← Li −λLj . solution de (S) , car on passe de (S)
Le cas où l’opération est une dilatation : Li ← µLi (avec µ �= 0 ) se traite de la même
à (S) étant alors la manière que le cas précédent (l’opération permettant de passer de (S) 1 dilatation Li ← Li ). µ
Proposition 13 vérifiés :
Les axiomes de la définition d’un anneau ( la définition 12 de la page 686) sont
•
il a déjà été mentionné que (Mn (IK), +) est un groupe commutatif ;
•
le produit matriciel est une loi de composition interne sur Mn (IK) , associative (cf. proposition 3), distributive par rapport à l’addition (cf. proposition 2), et possédant la matrice In comme élément neutre.
728
Démonstrations Proposition 17 •
Soit (A, B) ∈ Tn+ (IK)2 . En notant ai,j et bi,j les coefficients des matrices A et B , on a, pour 1 k < i n : [AB]i,k =
n
(∗)
ai,j bj,k .
j=1
Soit j ∈ [[1, n]] :
∗ ∗
si j > k , alors bj,k = 0 car B est triangulaire supérieure ; si j k , alors j < i (puisque k < i ) et donc ai,j = 0 car A est triangulaire supérieure.
Donc tous les termes intervenant dans la somme de la relation (∗) sont nuls, et l’on en déduit que [AB]i,k est nul. Par suite, AB est une matrice triangulaire supérieure. On peut de plus remarquer que, pour tout i ∈ [[1, n]] : [AB]i,i = ai,i bi,i .
•
T
T
= (B T AT ) donne, d’après le Si (A, B) ∈ Tn− (IK)2 , alors la relation AB = (AB)T point précédent, que AB est la transposée d’une matrice triangulaire supérieure, donc est triangulaire inférieure.
Proposition 22 •
•
(i) ⇒ (ii) . Supposons A ∈ GLn (IK) . Soit (X, Y ) ∈ Mn,1 (IK)2 .
Supposons AX = Y . En multipliant à gauche par A−1 , on a déjà A−1 (AX) = A−1 Y . D’autre part, par associativité, A−1 (AX) = (A−1 A)X = (In )X = X . On en déduit que X = A−1 Y . D’où l’unicité. ∗ Réciproquement, si X = A−1 Y , alors, en multipliant à gauche par A , on a AX = Y . D’où l’existence. (ii) ⇒ (i) . Supposons que, pour tout Y ∈ Mn,1 (IK) , le système linéaire AX = Y possède une unique solution. ∗
∗
∗
Pour i ∈ [[1, n]] , notons Ei la i -ème colonne de la matrice In . Par hypothèse, pour tout i ∈ [[1, n]] , il existe Xi ∈ Mn,1 (IK) telle que AXi = Ei . Alors, en notant B la matrice carrée de taille n dont les colonnes sont X1 , . . . , Xn , on constate (cf.proposition 6 de la page 708) que AB = In . Prouvons alors que BA = In , ce qui offrira l’inversibilité de A (et donnera A−1 = B ). ⋆ En multipliant à droite par A dans la relation AB = In , il vient (AB)A = In A , ce qui s’écrit aussi (à gauche, par associativité, et à droite, car In A = A = AIn ) : A(BA) = AIn
ou encore
A(BA − In ) = 0Mn (IK) .
Chaque colonne de la matrice BA − In est alors solution du système linéaire : AX = 0Mn,1 (IK) .
La colonne nulle étant également solution de ce système linéaire homogène, on en déduit, par unicité de la solution (ce qui est vrai par hypothèse), que les colonnes de BA − In sont toutes nulles. On a donc BA = In . Lemme 23 Supposons : ∀X ∈ Mn,1 (IK) A1 X = A2 X . Notons E1 , . . . , En les colonnes de la matrice In . L’hypothèse faite donne en particulier : ∀i ∈ [[1, n]]
A1 Ei = A2 E i .
(⋆)
Or, pour tout i ∈ [[1, n]] , les matrices colonnes A1 Ei et A2 Ei sont respectivement la i -ème colonne de A1 et la i -ème colonne de A2 (cf. proposition 6 de la page 708). La propriété (⋆) offre alors que les matrices A1 et A2 ont les mêmes colonnes, donc sont égales.
729
Chapitre 19. Calcul matriciel Lemme 24 • Supposons a1,1 nul. Alors pour tout B ∈ Mn (IK) , la première colonne de la matrice BA est nulle. Cela contredit en particulier la relation A−1 A = In . Donc a1,1 est non nul. ˜ , en utilisant la proposition 22 de la page 721. • Montrons maintenant l’inversibilité de A
y2 .. ˜ : AX ˜ = Y˜ ˜ Soit Y = . ∈ Mn−1,1 (IK) . Montrons que le système linéaire (S) yn possède une unique solution X ∈ Mn−1,1 (IK) . Pour cela, considérons le système linéaire : (S) : AX = Z
avec
Ce système linéaire (S) s’écrit :
(S) :
∗
a1,1 x1
+
a1,2 x2 a2,2 x2 .. . an,2 x2
0 y2 Z= ... ∈ Mn,1 (IK). yn
+ +
··· ···
+ +
+
···
+
a1,n xn a2,n xn .. . an,n xn
= = =
0 y2 .. . yn .
Le coefficient a1,1 étant non nul, la première équation du système (S) est équivalente à x1 = −
n 1 �
a1,1
a1,j xj .
j=2
Ensuite, les n − 1 dernières lignes du système (S) constituent un système linéaire, carré ˜ et de second membre Y˜ . de taille n − 1 , dont la matrice associée est A Finalement, les solutions de (S) sont de la forme :
∗
x1 .. X= . xn
avec
x2 .. ˜ . solution de (S) xn
et
x1 = −
n 1 �
a1,1
a1,j xj .
j=2
Or, la matrice A étant inversible, la proposition 22 de la page 721 assure que le système ˜ admet égalinéaire (S) admet une unique solution. Par conséquent, le système linéaire (S) ˜. lement une unique solution. Cela permet de conclure à l’inversibilité de la matrice A Proposition 25 Détaillons l’algorithme du pivot de Gauss permettant, via des opérations élémentaires sur les lignes, de transformer A en In . Par abus de notation, à chaque instant de l’algorithme, la matrice considérée sera toujours notée A , et ses coefficients ai,j . •
Étape 1 : on transforme A en une matrice triangulaire. Ce procédé se fait par récurrence sur la taille de la matrice. ∗ Si la matrice est de taille 1 , il n’y a rien à faire. ∗ Sinon, on remarque que, pour que la relation A−1 A = In puisse avoir lieu, il est nécessaire que la première colonne de A soit non nulle. ⋆ Choisissons un coefficient non nul ai,1 , avec i ∈ [[1, n]] , que l’on appelle pivot, et plaçons-le en position (1, 1) , via l’échange de lignes L1 ↔ Li . ⋆ Annulons ensuite tous les coefficients situés sous le pivot, via les transvections : aj,1 Lj ← Lj − L1 pour j ∈ [[2, n]]. a1,1
730
Démonstrations ⋆
•
La matrice ainsi obtenue vérifie les hypothèses du lemme 24 de la page 722 ; la sousmatrice (ai,j )2i,jn est donc inversible. On poursuit alors l’algorithme sur cette sous-matrice (on peut remarquer que chaque opération élémentaire sur les lignes de cette sous-matrice correspond à une opération élémentaire sur les lignes L2 , . . . , Ln de A , ne modifiant pas sa première colonne puisque tous les coefficients ai,1 sont nuls pour i ∈ [[2, n]] ).
Étape 2 : on fait apparaître une diagonale de 1 . Pour cela, on effectue les dilatations : Li ←
•
1 Li ai,i
pour
Étape 3 : on obtient finalement In en annulant tous les coefficients non diagonaux. Pour j allant de n à 2 , on effectue les transvections : Li ← Li − ai,j Lj
pour
i ∈ [[1, j − 1]].
Lors de ce processus, chacune des transvections Li ← Li − ai,j Lj annule le coefficient d’indice (i, j) de la matrice, sans en modifier aucun autre.
i ∈ [[1, n]].
1
⋆ 0 0
(⋆)
(0)
0 1 0 1 0
⋆ ai,j 0
1
Proposition 26 La transposition conservant l’inversibilité, on peut, quitte à transposer, montrer le résultat pour une matrice triangulaire supérieure. • •
Soit A ∈ Tn+ (IK) . Si les coefficients diagonaux de A sont tous non nuls, alors il est immédiat que pour tout Y ∈ Mn,1 (IK) , le système AX = Y possède une unique solution, donc la matrice A est inversible. Montrons l’autre sens par récurrence sur n . ∗ Le cas n = 1 est évident. ∗ Soit n 2 . Supposons le résultat vrai au rang n − 1 et montrons-le au rang n . Soit A = (ai,j )1i,jn ∈ Tn+ (IK) ∩ GLn (IK) . La matrice A vérifiant les hypothèses du lemme 24 de la page 722, on obtient, d’une part, a1,1 �= 0 , et d’autre part, l’inversibilité ˜ est aussi triangulaire supérieure, l’hyde la sous-matrice A˜ = (ai,j )2i,jn . Puisque A ˜ sont tous non nuls. pothèse de récurrence s’applique : les coefficients diagonaux de A ˜ Cela termine la preuve, car les coefficients diagonaux de A sont les ai,i , pour i ∈ [[2, n]] .
Proposition 27
�
La relation (AT )−1 = A−1
�T
nous permet, quitte à transposer, de montrer le ré-
sultat uniquement pour des matrices triangulaires supérieures. Soit donc A ∈ Tn+ (IK) ∩ GLn (IK) . Appliquons la méthode d’inversion d’une matrice par opérations élémentaires présentée à la page 722 ; on obtient A−1 en effectuant, sur la matrice In , les mêmes opérations élémentaires que celles permettant transformer A en In . Puisque A est triangulaire supérieure, seules les deux dernières étapes de l’algorithme sont à réaliser : • rendre les coefficients diagonaux égaux à 1 ; pour cela, on réalise des dilatations ; • annuler tous les coefficients situés strictement au dessus de la diagonale ; pour cela, on réalise des transvections de la forme Li ← Li + λLj avec i < j . Or, toute opération élémentaire de la forme ci-dessus préserve le caractère triangulaire supérieur d’une matrice. La matrice In étant triangulaire supérieure, la matrice A−1 l’est aussi.
731
Chapitre 19. Calcul matriciel
S’entraîner et approfondir 4
19.1 Pour (y1 , y2 , y3 , y4 ) ∈ IK , résoudre le système (S) : →714
2 x1 + x2 + x3 + x4
x1 + 2 x2 + x3 + x4 x1 + x2 + 2 x3 + x4 x1 + x2 + x3 + 2 x4
= = = =
y1 y2 y3 y4 .
Indication. On pourra s’intéresser à la somme des quatre équations du système (S) .
19.2 Soit M = →715
�
1 0 0
1 1 0
0 1 1
�
. En utilisant la formule du binôme, calculer M n pour n 2 .
19.3 Dans M2 (IR) , on pose A = →715
�
1 0
0 0
�
et B =
�
0 1
1 0
Calculer AB , BA , A2 − B 2 et (A + B)(A − B) .
�
.
19.4 Soit U ∈ Mn (IK) la matrice dont tous les coefficients sont égaux à 1 . En calculer toutes les →715 puissances positives. 19.5 Soit n ∈ IN∗ . On appelle centre de Mn (IK) l’ensemble des matrices qui commutent avec →717 toutes les autres. Montrer que le centre de Mn (IK) est l’ensemble des matrices scalaires. Indication. Utiliser les matrices élémentaires.
19.6 Soit A = →719
�
0 1 1
1 0 1
1 1 0
�
. Calculer A2 − A . En déduire que A ∈ GL3 (IR) et donner A−1 .
1 −1 1 0 19.7 On souhaite prouver que la matrice A = 0 0 →719 0 0 son inverse. 1. On note J = I4 − A . Calculer J 2 , J 3 et J 4 .
0 −1 1 0
0 0 est inversible et calculer −1 1
2. En écrivant I4 = I44 − J 4 , montrer que A est inversible et expliciter son inverse.
19.8 Soit (A, B, C) ∈ Mn (IK)3 . Montrer que si ABC = 0 , et si deux des trois matrices sont →719 inversibles, alors la troisième est nulle.
19.9 Montrer que la matrice A = →722
�
1 1 1
Indication. On rappelle que j = e
732
1 j 2 2iπ 3
1 2 j
�
est inversible et calculer son inverse.
et que 1 + j + 2 = 0 .
Exercices
1 1 19.10 Montrer que la matrice A = 1 1
1 2 3 4
1 3 6 10
1 4 est inversible, et calculer son inverse. 10 20
Indication. Pour Y ∈ M4,1 (IR) , on pourra résoudre le système linéaire AX = Y .
19.11 1. Déterminer toutes les puissances positives de A =
�
1 −1
1 0
�
.
2. On considère deux suites réelles définies par la donnée de u0 et v0 et par les relations : ∀n ∈ IN
un+1 = un + vn
et
vn+1 = −un .
Déterminer une expression de un et vn en fonction de n . Indication. On pourra s’intéresser à
�
un vn
�
.
19.12 Soit n 2 . 1. Soit J ∈ Mn (IR) la matrice dont tous les coefficients valent 1 . Posons A = J − In . (a) Trouver une relation entre A2 , A et In . (b) En déduire que A est inversible, et exprimer A−1 en fonction de A .
2. Soit M = (mi,j )1i,jn la matrice définie par mi,j =
�
j 0
si i �= j si i = j.
En exprimant M à l’aide de A et de D = Diag(1, 2, . . . , n) , justifier que M est inversible et déterminer M −1 . 19.13 Une construction de C L’objet de cet exercice est d’exhiber une partie de M2 (IR) formant un corps isomorphe à C . Pour (a, b) ∈ IR2 , posons M (a, b) =
�
a b
−b a
�
�
�
et C = M (a, b) | (a, b) ∈ IR2 .
1. (a) Posons J = M (0, 1) . Que vaut J 2 ? (b) Pour (a, b, c, d) ∈ IR4 , expliciter (α, β) ∈ IR2 tel que M (a, b)M (c, d) = M (α, β) . 2. Prouver que C est un corps. 3. Expliciter un isomorphisme de corps de C vers C .
733
Chapitre 19. Calcul matriciel
Solutions des exercices 19.1 Raisonnons par analyse-synthèse. • Analyse. Soit (x1 , x2 , x3 , x4 ) ∈ IK4 une solution de (S) . La somme des quatre équations donne : 1 x1 + x2 + x3 + x4 = (y1 + y2 + y3 + y4 ) . 5 En retranchant cette nouvelle relation à chacune des équations de (S) , on obtient :
x1
1 5 1 5 1 5 1 5
=
x2
=
x3 x
= =
4
(4 y1 − y2 − y3 − y4 )
(−y1 + 4 y2 − y3 − y4 ) (−y1 − y2 + 4 y3 − y4 )
(−y1 − y2 − y3 + 4 y4 ) .
Synthèse. Réciproquement, on vérifie facilement que la liste (x1 , x2 , x3 , x4 ) obtenue dans l’analyse est bien solution de (S) . Conclusion : le système linéaire (S) possède une unique solution : la liste (x1 , x2 , x3 , x4 ) obtenue précédemment lors de l’analyse. 952
Remarque En notant A ∈ M4 (IR) la matrice du système (S) , la partie « analyse » du raisonnement a montré que, quel que soit le second membre Y , le système AX = Y admet au plus une solution ; c’est en particulier le cas pour le système homogène AX = 0 , qui a donc la solution nulle comme unique solution. Il sera vu plus tard qu’alors la matrice A est inversible, et que pour tout Y , le système AX = Y admet exactement une solution. Cela permet d’éviter la partie « synthèse » du raisonnement précédent.
�
0 0 19.2 On a M = I3 + J avec J = 0 matrice, elle commute en particulier
�
1 0 0 1 . Puisque la matrice I3 commute avec toute 0 0 avec M . La formule du binôme donne :
∀n ∈ IN Or, on a J 2 =
Mn =
�
0 0 0
2 � � � n k=0
Remarque
0 0 0
k
1 0 0
�
n
M =
k
k=0
, puis ∀k 3
J k = I3 + n J +
n � � � n
Jk.
J k = 0 . Donc, pour n 2 on a :
n(n − 1) 2 J 2
i.e.
1 Mn = 0 0
n 1 0
n(n−1) 2
n 1
La formule obtenue est également vraie pour n = 0 et n = 1 .
19.3 Par calcul, on a AB = 2
2
�
A −B =
0 0
�
1 0 0 0
�
0 −1
et B A =
�
et
�
0 1
0 0
�
.
ainsi que :
(A + B) (A − B) =
�
0 1
−1 −1
�
.
Remarque On peut ici constater que A2 − B 2 �= (A + B) (A − B) , ce qui n’a rien d’étonnant vu que A et B ne commutent pas.
734
Solutions des exercices 19.4 • La formule donnant le terme général d’un produit de matrice montre immédiatement que chaque coefficient de U 2 vaut n , ce qui s’écrit U 2 = n U . • À l’aide de cette dernière formule et des règles de calcul dans un anneau, on déduit, par une récurrence élémentaire : U 0 = In
∀p ∈ IN∗
et
U p = np−1 U.
19.5 • Un sens est évident : si A est une matrice scalaire, alors on a A = λIn avec λ ∈ IK . Ainsi, pour tout matrice B ∈ Mn (IK) , on a : AB = λIn B = λB
et
BA = B(λIn ) = λBIn = λB
donc
AB = BA.
• Réciproquement, soit A ∈ Mn (IK) commutant avec tous les éléments de Mn (IK) . ∗ Pour i ∈ [[1, n]] , on a AEi,i = Ei,i A . En regardant les lignes d’indices i des deux matrices Ei,i A et AEi,i , qui sont respectivement :
�
ai,1
on obtient :
···
ai,i
···
ai,n
�
�
et
0
···
0
ai,i
0
0
···
�
,
∀j ∈ [[1, n]] j �= i =⇒ ai,j = 0. Les coefficients non diagonaux de la i -ème ligne de A sont donc nuls. Cela étant vrai pour tout i ∈ [[1, n]] , on en déduit que A est diagonale. ∗ Alors, pour (i, j) ∈ [[1, n]]2 , les coefficients des matrices AEi,j et Ei,j A valent respectivement ai,i et aj,j . Comme AEi,j = Ei,j A , on a donc nécessairement ai,i = aj,j . Conclusion : A est une matrice scalaire. 19.6 On a A2 =
�
2 1 1
1 2 1
1 1 2
�
, donc A2 − A = 2I3 . On a donc : A
�
A − I3 2
�
=
Par suite, la matrice A est inversible, et A
0 0 19.7 1. On a J = I4 − A = 0
1 0 0 0
0
0 0 0 0 J2 = 0 0 0
0
4
1 0 0 0
0 1 0 0
�
−1
A − I3 2
�
A = I3 .
A − I3 1 = = 2 2
�
−1 1 1
1 −1 1
1 1 −1
�
.
0 0 . Par produit matriciel, on a : 1 0
0 1 ; 0 0
0 0 J3 = 0 0
0 0 0 0
0 0 0 0
1 0 0 0
puis
J 4 = 0.
2. Étant donné que J = 0 et que I4 commute avec J , on a, d’après le corollaire 15 de la page 715 : I4 = I44 − J 4 = (I4 − J)(I4 + J + J 2 + J 3 ) = (I4 + J + J 2 + J 3 )(I4 − J).
Ainsi la matrice A = I4 − J est inversible, et : A−1
1 0 2 3 = I4 + J + J + J = 0 0
1 1 0 0
1 1 1 0
1 1 . 1 1
735
Chapitre 19. Calcul matriciel 19.8 • Si A et B sont inversibles, alors en multipliant la relation ABC = 0 à gauche par B −1 A−1 , on obtient C = 0 . • Si B et C sont inversibles, alors en multipliant la relation ABC = 0 à droite par C −1 B −1 , on obtient A = 0 . • Si A et C sont inversibles, alors en multipliant la relation ABC = 0 à gauche par A−1 et à droite par C −1 , on a B = 0 .
�
�
y1 y2 ∈ M3,1 (IR) . Montrons que le système linéaire (S) : AX = Y admet une 19.9 Soit Y = y3 unique solution et explicitons-la. • Analyse. Supposons X =
�
�
x1 x2 x3
x1 x1 x1
�
+ + +
∈ M3,1 (IR) soit solution de (S) . Alors on a : x2 jx2 2 x2
+ + +
x3 2 x3 jx3
= = =
y1 y2 y3 .
En utilisant la relation 1 + j + 2 = 0 : ∗ la somme L1 + L2 + L3 donne 3x1 = y1 + y2 + y3 ; ∗ la relation L1 + 2 L2 + jL3 donne 3x2 = y1 + 2 y2 + jy3 ; ∗ la relation L1 + jL2 + 2 L3 donne 3x3 = y1 + jy2 + 2 y3 . Par suite, on a X =
1 3
�
y1 + y2 + y3 y1 + 2 y2 + jy3 y1 + jy2 + 2 y3
�
.
• Synthèse. Réciproquement, on vérifie facilement que la matrice colonne X ci-dessus est bien solution du système (S) . Conclusion : le système linéaire (S) : AX = Y admettant une unique solution (et cela quel que soit Y ∈ M3,1 (IR) , on en déduit que A est inversible. L’expression de la solution X nous fournit de plus : � � 1 1 1 1 −1 A = . 1 2 j 3 1 j 2
y 1 y2 ∈ M4,1 (IR) . Considérons le système linéaire (S) : AX = Y . Si l’on 19.10 Soit Y = y 3
y4 x 1 x1 + x2 + x3 + x4 x x1 + 2x2 + 3z + 4x4 note X = 2 , le système (S) s’écrit x3 x1 + 3x2 + 6x3 + 10x4 x4 x1 + 4x2 + 10x3 + 20x4
= y1 = y2 = y3 = y4 .
Les opérations L2 ← L2 − L1 , L3 ← L3 − L1 et L4 ← L4 − L1 donnent : (S) ⇐⇒
736
x + x2 + x3 + 1
x4 x2 + 2x3 + 3x4 2x2 + 5x3 + 9x4 3x2 + 9x3 + 19x4
= y1 = y2 − y1 = y3 − y1 = y4 − y1 .
Solutions des exercices Les opérations L3 ← L3 − 2 L2 et L4 ← L4 − 3 L2 donnent alors : (S) ⇐⇒
x + x2 + x3 + 1
x4 x2 + 2x3 + 3x4 x3 + 3x4 3x3 + 10x4
Enfin, L4 ← L4 − 3 L3 donne : (S) ⇐⇒
= y1 = y2 − y1 = y3 + y1 − 2y2 = y4 + 2y1 − 3y2 .
x + x 2 + x 3 + x 4 = y1 1
x2 + 2x3 + 3x4 = y2 − y1 x3 + 3x4 = y3 + y1 − 2y2 x4 = −y1 + 3y2 − 3y3 + y4 .
En résolvant alors de proche en proche, on obtient après simplification : (S) ⇐⇒
x = 4y1 − 6y2 + 4y3 − y4 1 x2 = −6y1 + 14y2 − 11y3 + 3y4
x3 = 4y1 − 11y2 + 10y3 − 3y4
x4 = − y1 + 3y2 − 3y3 + y4 .
Le système (S) possédant une unique solution, et cela pour tout Y ∈ M4,1 (IR) , on en déduit que A est inversible. L’expression de la solution nous offre de plus : A−1
4 −6 = 4 −1
−6 14 −11 3
A3p+1 = (−1)p A
−1 3 . −3 1 A3p = (−1)p I3 .
19.11 1. On obtient par calcul A3 = −I3 , et donc ∀p ∈ IN On en déduit directement : ∀p ∈ IN
4 −11 10 −3
A3p+2 = (−1)p A2 = (−1)p
et
2. La relation vérifiée par les suites u et v s’écrivant aussi : ∀n ∈ IN
�
un+1 vn+1
�
=
�
un + vn −un
�
une récurrence élémentaire montre que : ∀n ∈ IN Pour tout p ∈ IN , on en déduit alors :
�
u3p = (−1)p u0 v3p = (−1)p v0
�
u3p+1 = (−1)p (u0 + v0 ) v3p+1 = (−1)p+1 u0
�
=A
un vn
�
�
�
un vn
= An
� �
�
0 −1
1 −1
�
.
, u0 v0
�
·
u3p+2 = (−1)p v0 v3p+2 = (−1)p+1 (u0 + v0 ).
19.12 1. (a) Par calcul matriciel, on a J 2 = nJ . Ainsi, puisque In et J commutent : A2 = (J − In )2 = J 2 − 2J + In = (n − 2)J + In = (n − 2)A + (n − 1)In . (b) La relation précédente donne : A2 − (n − 2)A = (n − 1)In
puis
AB = BA = In
� 1 � avec B = A − (n − 2)In . Par suite, la matrice A est inversible et : n−1 � 1 � A−1 = A − (n − 2)In . n−1
737
Chapitre 19. Calcul matriciel 2. On a simplement M = AD . Ainsi, M est inversible, comme produit de deux matrices inversibles ( A l’est d’après la première question, et D l’est car diagonale avec des coefficients diagonaux tous non nuls). On a de plus : M −1 = D−1 A−1 =
1 1 1 A − (n − 2)In . Diag 1, , . . . , n−1 2 n
19.13 1. (a) Un calcul élémentaire prouve J 2 = −I2 . (b) On a : M (a, b) M (c, d) = (aI2 + bJ)(cI2 + dJ) = acI2 + (ad + bc)J + bdJ 2 = (ac − bd)I2 + (ad + bc)J = M (ac − bd, ad + bc). 2. • Prouvons que C est un sous-anneau de (M2 (IR), +, ×) : ∗ on vérifie facilement que C est une partie stable par l’addition des matrices et passage à l’opposé, et que la matrice nulle appartient à C ; par suite, C est un sous-groupe de (M2 (IR), +) ; ∗ la question précédente entraîne que le produit matriciel laisse stable C , et que deux éléments de C commutent ; ∗ enfin, C contient la matrice I2 , élément neutre pour le produit matriciel. Par suite, C est un sous-anneau commutatif de (M2 (IR), +, ×) . • Tout élément non nul de C est inversible et a son inverse dans C . Soit M (a, b) un élément non nul de C . On constate que : M (a, b)M (a, b)T = (a2 + b2 )I2 . De plus, puisque (a, b) ∈ IR2 \ {(0, 0)} , on a a2 + b2 �= 0 ; on en déduit que M (a, b) 1 T a −b est inversible et son inverse est 2 M (a, b) , i.e. M , , qui est donc 2 2 2 2 a +b a +b a + b2 bien dans C . 3. Montrons que l’application ϕ : C −→ C est un isomorphisme : z �−→ Re(z)I2 + Im(z)J • l’application ϕ est un morphisme d’anneaux car : ∗ pour tout (z1 , z2 ) ∈ C2 , on vérifie que : f (z1 + z2 ) = f (z1 ) + f (z2 )
et
f (z1 z2 ) = f (z1 )f (z2 ) ;
la seconde égalité étant vraie d’après le calcul fait à la question 1b ; ∗ on a f (1) = I2 . • l’application ϕ est bijective car pour tout A ∈ C , il existe un unique couple (a, b) ∈ IR2 tel que A = aI2 + bJ , et alors z = a + ib est l’unique antécédent de A par ϕ .
738
Chapitre 20 : Polynômes I 1 2 3 4 5 6 II
Anneau des polynômes à une indéterminée . Qu’est-ce qu’un polynôme ? . . . . . . . . . . Construction de l’ensemble des polynômes . L’anneau des polynômes à une indéterminée . Degré d’un polynôme . . . . . . . . . . . . .
Évaluation en un point . . . . . . Composition . . . . . . . . . . . Divisibilité et division euclidienne 1 Multiples, diviseurs . . . . . . . . 2 Division euclidienne dans IK[X] .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. 745 . 746 747 . 747 . 748
III
Fonctions polynomiales et racines . . . . . . . . . . . . 1 Fonction polynomiale . . . . . . . . . . . . . . . . . . . . 2 Racines . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Détermination d’un polynôme par sa fonction polynomiale 4 Formule d’interpolation de Lagrange . . . . . . . . . . . . 5 Ordre de multiplicité d’une racine . . . . . . . . . . . . . 6 Relations entre coefficients et racines (formules de Viète) IV Dérivation . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Polynôme dérivé . . . . . . . . . . . . . . . . . . . . . . . 2 Dérivées successives, formule de Taylor . . . . . . . . . . . 3 Caractérisation de l’ordre d’une racine . . . . . . . . . . . V Factorisation dans C[X] et IR[X] . . . . . . . . . . . . . 1 Théorème de d’Alembert-Gauss . . . . . . . . . . . . . . . 2 Factorisation dans C[X] . . . . . . . . . . . . . . . . . . . 3 VI
740 740 741 742 743
749 749 749 751 751 752 754 755 755 756 758 759 759 759
Factorisation dans IR[X] . . . . . . . . . . . . . . . . . . . 760
Arithmétique dans IK[X] . . . . . . . . . . . . . . . . 1 PGCD . . . . . . . . . . . . . . . . . . . . . . . . . 2 Caractérisation du PGCD . . . . . . . . . . . . . . . 3 Algorithme d’Euclide . . . . . . . . . . . . . . . . . . 4 Coefficients de Bézout . . . . . . . . . . . . . . . . . 5 Polynômes premiers entre eux . . . . . . . . . . . . . 6 Polynômes premiers entre eux et racines communes . 7 Extension à un nombre fini de polynômes . . . . . . 8 PPCM . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Lemme de Gauss . . . . . . . . . . . . . . . . . . . . 10 Polynômes irréductibles de IK[X] . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . .
760 760 761 762 763 764 765 765 766 767 767 770 782
Polynômes
20
Dans tout ce chapitre, IK désigne IR ou C.
I
Anneau des polynômes à une indéterminée
1
Qu’est-ce qu’un polynôme ?
Un polynôme (en l’indéterminée X ) est une expression comme 1 + 3X , 1 − 2X + X 2 ou 1 + X + X 2 + · · · + X 1000 , c’est-à-dire une expression obtenue en formant une combinaison linéaire (cf. page 835) des puissances X 0 = 1 , X 1 = X , X 2 , X 3 , etc. de l’indéterminée X . +∞ ak X k , où (ak )k∈IN est une famille À ce titre, on peut l’écrire comme une somme k=0
749
presque nulle d’éléments de IK, c’est-à-dire une suite (ak )k∈IN d’éléments de IK nulle à partir d’un certain rang. La notion de polynôme est une abstraction de celle de fonction polynomiale. On verra d’ailleurs que les différentes opérations définies sur les polynômes (somme, produit, évaluation, composition, dérivation) seront des calques des opérations du même nom définies sur les fonctions. De fait, tout polynôme définira une fonction polynomiale qui – sous certaines conditions – le déterminera entièrement. On donne ainsi plus de souplesse à la notion de fonction polynomiale. En voyant par exemple le polynôme X 2 − X comme l’instruction calculatoire « élever l’objet au carré, puis faire la différence de ce résultat et de l’objet initial », on peut l’appliquer à des nombres, des fonctions, des matrices, etc. Ainsi, ce polynôme pourra aussi bien s’incarner dans la fonction scalaire x �→ x2 − x (de IK dans IK) que dans la fonction matricielle A �→ A2 − A (de Mn (IK) dans Mn (IK)) ou dans l’opérateur f �→ f 2 − f (de C (I, IK) dans C (I, IK) , par exemple).
I Anneau des polynômes à une indéterminée
2
Construction de l’ensemble des polynômes
Cette construction est hors programme. Dans une première lecture, il est possible de passer directement à la partie I.3 de la page suivante et d’admettre les résultats énoncés. Pour construire formellement l’ensemble des polynômes, on va « encoder » un polynôme comme X 2 + 2X + 4 en ne retenant de lui que la suite (nulle à partir d’un certain rang) de ses coefficients (4, 2, 1, 0, 0, . . .). Par construction, deux polynômes seront donc égaux si, et seulement s’ils ont les mêmes coefficients. Définition 1 On appelle polynôme à une indéterminée à coefficients dans IK toute suite presque nulle d’éléments de IK , c’est-à-dire toute suite d’éléments de IK nulle à partir d’un certain rang. Terminologie
Les éléments de la suite sont appelés les coefficients du polynôme.
Notation On désigne par 0 le polynôme nul, c’est-à-dire le polynôme associé à la suite nulle (0)k∈IN . Proposition 1 Soit A = (ak )k∈IN , B = (bk )k∈IN deux polynômes et λ un élément de IK . Les suites S = (sk )k∈IN , P = (pk )k∈IN et Q = (qk )k∈IN définies par : • ∀k ∈ IN
sk = a k + b k ;
• ∀k ∈ IN
pk =
• ∀k ∈ IN
qk = λ ak
k
ai bk−i =
i=0
ai b j ;
i+j=k
sont des polynômes, notés respectivement A + B , A × B (ou A B ) et λ A.
Démonstration page 770 Il s’agit de prouver que les suites S , Q et P sont presque nulles en utilisant le fait qu’il existe des entiers naturels n et m tels que ∀k > n ak = 0 et ∀k > m bk = 0 . En particulier, pour le produit, on prouvera que ∀k > n + m pk = 0 .
Principe de démonstration.
Anneau des polynômes Proposition 2 Muni de l’addition et de la multiplication, l’ensemble des polynômes à coefficients dans IK est un anneau commutatif.
Démonstration page 770 On vérifie que l’addition et la multiplication satisfont toutes les propriétés requises et en particulier, que les polynômes (0, 0, 0, . . .) et (1, 0, 0, . . .) sont les éléments neutres respectivement pour l’addition et la multiplication.
Principe de démonstration.
Notation
En posant X = (0, 1, 0, 0, . . .), on vérifie par récurrence que : ∀k ∈ IN∗
X k = ( 0 , 0 , 0 , . . . , 0, 1 , 0, . . .). ↑ ↑ ↑ 0
1
k
741
Chapitre 20. Polynômes En utilisant la convention usuelle dans les anneaux, on pose X 0 = (1, 0, 0, . . .). On peut alors écrire : A = (a0 , a1 , . . . , an , 0, 0, . . .) =
n
ak X k
k=0
où X s’appelle l’indéterminée. En pratique, on oubliera que les polynômes ont été définis comme des suites presque nulles et on utilisera exclusivement cette notation.
3
L’anneau des polynômes à une indéterminée
Avec la notation qui vient d’être mise en place, on peut réécrire les définitions et propriétés vues précédemment. p • Si p ∈ IN et a0 , a1 , . . . , ap sont des éléments de IK , alors ak X k est appelé k=0
polynôme à une indéterminée à coefficients dans IK . p
Pour un polynôme A =
k=0
ak X k , on complète parfois la suite (an )n∈IN des
coefficients de A en posant an = 0 si n > p. On peut alors écrire : p
ak X k =
k=0
+∞
ak X k .
k=0
Malgré son apparence, cette dernière somme est une somme finie, car il n’y a qu’un nombre fini de coefficients ak non nuls. Cette écriture s’avère pratique lorsqu’on ne veut pas particulariser un rang à partir duquel la suite est nulle, par exemple pour faire la somme de deux polynômes. • Si
+∞
ak X k et
k=0
+∞
bk X k sont deux polynômes, alors :
k=0 +∞
ak X k =
k=0
+∞
k=0
ak = b k .
bk X k ⇐⇒ ∀k ∈ IN
Autrement dit, un polynôme est entièrement déterminé par ses coefficients. En particulier, un polynôme est nul si, et seulement si, tous ses coefficients sont nuls. +∞ n +∞ m • Si A = bk X k = bk X k , alors : ak X k = ak X k et B = k=0
k=0
k=0
k=0
max(n,m)
A+B =
(ak + bk ) X k =
k=0
• Si A =
n
ak X k et B =
k=0
AB =
n+m k=0
742
m
+∞
(ak + bk )X k .
k=0
bk X k , alors :
k=0
i+j=k
k
ai b j X =
m n i=0 j=0
ai b j X
i+j
=
+∞
k=0
i+j=k
ai b j X k .
I Anneau des polynômes à une indéterminée • Si A =
n
ak X k =
k=0
+∞
k=0
ak X k et λ ∈ IK , alors : λA =
n
k=0
Notation 832
λ ak X k =
+∞
λ ak X k .
k=0
On désigne par IK[X] l’ensemble des polynômes à coefficients dans IK.
Remarque Muni des opérations précédemment définies, on a vu à la proposition 2 de la page 741 que (IK[X], +, ×) est un anneau commutatif. On montre de façon analogue que (IK[X], +, ·) est un espace vectoriel sur IK . Définition 2 On appelle polynôme constant tout polynôme de la forme λ X 0 , avec λ ∈ IK , c’est-à-dire tout polynôme dont les coefficients sont nuls à partir du rang 1 . Inclusion de IK dans IK[X] Dans l’ensemble des polynômes constants, l’addition et la multiplication des polynômes ont « le même effet » que l’addition et la multiplication dans IK . On identifie alors l’élément λ de IK avec le polynôme constant λ X 0 correspondant à la suite (λ, 0, 0, . . .), ce qui permet d’écrire : n
k=0
a k X k = a 0 + a1 X + · · · + an X n .
On peut alors vérifier que multiplier un polynôme P par un élément λ de IK revient à multiplier ce polynôme par le polynôme constant λ : on a λX 0 P = λP .
Inclusion de IR[X] dans C[X] Comme IR ⊂ C , un polynôme à coefficients dans IR peut aussi être vu comme un polynôme à coefficients dans C. On a donc IR[X] ⊂ C[X].
4
Degré d’un polynôme
Soit A =
+∞
k=0
ak X k un polynôme non nul. L’ensemble {k ∈ IN
ak �= 0} est
une partie non vide de IN, majorée puisque la suite (ak )k∈IN est nulle à partir d’un certain rang ; cet ensemble admet donc un plus grand élément. Cela nous conduit à la définition suivante. Définition 3 +∞ Soit A = ak X k un polynôme non nul de IK[X]. On définit le degré de A, k=0
noté deg A, par :
deg A = max{k ∈ IN ak �= 0}.
Par convention, le degré du polynôme nul est −∞.
743
Chapitre 20. Polynômes Remarques • Si A ∈ IK[X] et A �= 0 , alors deg A ∈ IN. • Soit n ∈ IN. Un polynôme peut s’écrire
n
ak X k si, et seulement s’il est de degré
k=0
inférieur ou égal à n, ce qui contient le cas du polynôme nul, de degré −∞ ; il est alors de degré n si, et seulement si, an �= 0 . Définition 4 • Soit A =
+∞
ak X k un polynôme non nul de IK[X] et n = deg A.
k=0
Le coefficient (non nul) an s’appelle le coefficient dominant du polynôme. • Un polynôme non nul dont le coefficient dominant est égal à 1 est appelé polynôme unitaire. Remarque Le polynôme nul est le seul polynôme qui n’a pas de coefficient dominant. En particulier, il n’est pas unitaire. Proposition 3 Soit A et B deux polynômes de IK[X]. On a : • deg(A + B) max(deg A, deg B) ;
de plus, si deg A �= deg B , alors deg(A + B) = max(deg A, deg B) ;
• deg(A B) = deg A + deg B . Principe de démonstration.
Démonstration page 770 Distinguer d’abord le cas où A ou B est nul.
• Pour la somme, on pose n = max(deg A, deg B) ∈ IN et on montre que les coefficients de A + B sont nuls à partir du degré n ; on étudie ensuite le coefficient an + bn en X n . • Pour le produit, si l’on pose n = deg A et m = deg B , on a déjà montré que les coefficients de AB sont nuls à partir du rang n + m + 1 . Il reste à déterminer le coefficient en X n+m et prouver qu’il est non nul.
Attention Quand deux polynômes sont de même degré, le degré de leur somme peut être strictement inférieur à ce degré commun, comme le montrent A = 3X 3 + 3X − 2 et B = −3X 3 + X 2 , ou encore l’exemple extrême de A et −A. Cela se produit exactement quand A et B ont des coefficients dominants opposés. Notation Soit n ∈ IN. On note IKn [X] l’ensemble des polynômes de degré inférieur ou égal à n. On a en particulier 0 ∈ IKn [X], puisque −∞ n. Proposition 4 Soit A et B deux polynômes de IKn [X]. On a alors : ∀(λ, µ) ∈ IK2 Démonstration. 744
λA + µB ∈ IKn [X].
Cela résulte immédiatement des propriétés sur les degrés.
I Anneau des polynômes à une indéterminée
836
Remarques • Comme il contient en outre le polynôme nul, l’ensemble IKn [X] est un sousespace vectoriel de l’espace vectoriel IK[X]. • Si A ∈ IK[X] est de degré n et λ ∈ IK, on a deg(λA) n.
Plus précisément, on a deg(λA) = n si λ �= 0 , et deg(λA) = −∞ si λ = 0 .
Point méthode Pour montrer qu’un polynôme P est de degré n, il peut être utile de procéder en deux temps : • d’abord, montrer que deg P n, c’est-à-dire que P ∈ IKn [X] ;
Exo 20.1
• ensuite, montrer que le coefficient en X n de P est non nul.
Proposition 5 Le produit de deux polynômes non nuls est non nul. Autrement dit : ∀(A, B) ∈ IK[X]2 Démonstration.
A B = 0 ⇒ (A = 0 ou B = 0).
La formule deg(A B) = deg A + deg B entraîne immédiatement :
(A �= 0 et B �= 0) ⇒ A B �= 0. La deuxième formulation se déduit par contraposée de la première.
Remarque L’anneau commutatif IK[X], +, × est donc intègre (cf. définition la définition 13). Corollaire 6 ∀(A, B, C) ∈ IK[X]3 Démonstration. proposition 5.
AC = BC
et
C �= 0 ⇒ A = B.
Il suffit d’écrire AC = BC sous la forme (A − B)C = 0 et d’appliquer la
Proposition 7 Les éléments inversibles de IK[X] sont les polynômes de degré 0 , soit encore les polynômes constants non nuls. Principe de démonstration.
Démonstration page 771 Deux polynômes dont le produit vaut 1 sont nécessairement
de degré nul.
5
Évaluation en un point
Définition 5 +∞ Soit A = ak X k ∈ IK[X] et α ∈ IK . k=0
On appelle évaluation de A en α la somme A(α) =
+∞
k=0
ak αk ∈ IK .
745
Chapitre 20. Polynômes Remarques • Malgré les apparences, la somme définissant A(α) est finie : pour tout entier n n ak αk . supérieur ou égal à deg A, on a A(α) = k=0
• Soit n ∈ IN. L’évaluation en α ∈ IK d’un polynôme A =
n
ak X k de degré au
k=0
plus n peut s’effectuer à l’aide de n multiplications et n additions (ou soustractions) dans le corps IK, grâce à la méthode de Horner : A(α) = · · · (an × α + an−1 ) × α + an−2 × α + · · · × α + a1 × α + a0 .
Par exemple, si A = 3X 3 − 4X 2 − 7X + 2 et α = 3 , on calcule : A(α) = (3 × 3 − 4) × 3 − 7 × 3 + 2 = 26
en 3 additions et 3 multiplications, au lieu des 3 additions et 5 multiplications demandées par la méthode la plus naïve (deux multiplications pour calculer les puissances α2 et α3 , puis trois multiplications par les coefficients).
Proposition 8 Soit A et B deux polynômes de IK[X] ainsi que (α, λ, µ) ∈ IK3 . On a : (λ A + µ B)(α) = λ A(α) + µ B(α)
Principe de démonstration.
et
(A B)(α) = A(α) B(α).
Démonstration page 771 C’est une vérification directe à partir de la définition des
opérations sur les polynômes.
872
Remarque L’évaluation P �→ P (α) est donc un morphisme d’anneaux de IK[X] dans IK . Le premier point de la proposition dit également qu’il s’agit d’une forme linéaire de IK[X].
6
Composition
Définition 6 +∞ ak X k et P deux polynômes de IK[X]. Soit A = k=0
Exo 20.2
On pose A ◦ P = Notation
+∞
k=0
ak P k ∈ IK[X].
On note également A(P ) = A ◦ P .
Remarques • La somme définissant A ◦ P est en fait finie. On a, en utilisant le fait que P 0 = 1 : ∀n deg A A ◦ P = 746
n
k=0
a k P k = a 0 + a 1 P + · · · + an P n .
II Divisibilité et division euclidienne • Dans le cas particulier où P = X , le polynôme A(P ) = A(X) est donc égal à A, c’est pourquoi on utilise aussi bien A que A(X) pour désigner ce dernier polynôme. • Comme dans la proposition 8 de la page ci-contre et avec une démonstration similaire, on a, pour tous (A, B, P ) ∈ IK[X]3 et (λ, µ) ∈ IK2 : (λ A + µ B)(P ) = λ A(P ) + µ B(P ) et (A B)(P ) = A(P ) B(P ).
II 1
Divisibilité et division euclidienne Multiples, diviseurs
Définition 7 Soit A et B deux polynômes de IK[X]. On dit que B divise A ou que A est multiple de B , et l’on note B | A, s’il existe C ∈ IK[X] tel que A = B C . On dit aussi que B est un diviseur de A ou que A est un multiple de B .
Ex. 1. Le polynôme B = (X − 1)(X − 2) divise A = (X − 1)2 (X − 2)(X 2 + X + 1) . En effet, A = B C , où C = (X − 1)(X 2 + X + 1) .
Remarques • Si B | A et si A est non nul, alors deg A deg B .
En effet, il existe alors un polynôme C non nul tel que A = B C , et donc : deg A = deg B + deg C deg B.
• Soit A, B et D trois polynômes. On a alors : D | A et D | B ⇒ D | P A + QB. ∀(P, Q) ∈ IK[X]2
Proposition 9 Soit A et B deux polynômes de IK[X]. Il est équivalent de dire : (i) A divise B et B divise A ; (ii) il existe un scalaire λ ∈ IK∗ tel que A = λB .
Dans ce cas, A et B sont dits associés.
Démonstration page 771 Le point-clef est que si A divise B et B divise A , on peut trouver (C1 , C2 ) ∈ IK[X]2 tels que A = A C1 C2 . Les deux polynômes C1 et C2 sont alors constants et non nuls, sauf si A = 0 . La réciproque est immédiate.
Principe de démonstration.
Remarques 1. Soit A et B deux polynômes. L’ensemble des diviseurs (respectivement multiples) de A est égal à l’ensemble des diviseurs (respectivement multiples) de B si, et seulement si, A et B sont associés, puisqu’alors A et B se divisent simultanément. 2. La relation de divisibilité dans IK[X] est réflexive et transitive, mais elle n’est pas antisymétrique, car deux polynômes associés distincts se divisent mutuellement. 747
Chapitre 20. Polynômes
2
Division euclidienne dans IK[X]
Théorème 10 (Division euclidienne) Soit A et B deux polynômes de IK[X], avec B �= 0 . Il existe un unique couple (Q, R) de polynômes de IK[X] vérifiant : A=BQ+R
et
deg R < deg B.
On appelle Q le quotient et R le reste de la division euclidienne de A par B . Démonstration page 772
Principe de démonstration. • Pour l’unicité, on suppose qu’il existe deux couples (Q1 , R1 ) et (Q2 , R2 ) vérifiant les conditions demandées et l’on étudie deg(R2 − R1 ) . • L’existence se démontre par récurrence en « suivant » l’algorithme présenté ci-dessous.
Proposition 11 Soit A et B deux polynômes de IK[X] avec B �= 0 . Le polynôme B divise A si, et seulement si, le reste de la division de A par B est nul. Démonstration page 772
Remarque Soit (A, B) ∈ IR[X]2 , avec B �= 0 . En effectuant la division euclidienne, on obtient un quotient Q et un reste R tels que deg R < deg B et A = B Q + R . Plus précisément, si on applique le théorème précédent avec IK = IR, on obtient ainsi un couple de polynômes réels (Q, R) ∈ IR[X]2 . Par unicité, on obtiendra nécessairement les mêmes polynômes en appliquant le résultat à IK = C : le quotient et le reste dans la division euclidienne de A par B sont les mêmes sur IR et sur C. En particulier, grâce à la proposition 11, on en déduit que B divise A dans IR[X] si, et seulement s’il le divise dans C[X]. Algorithme de la division euclidienne On peut effectuer une division euclidienne en la « posant », comme pour une division d’entiers. Comme dans le cas des entiers, l’idée est de trouver les termes du quotient un à un (c’est-à-dire, monôme par monôme), en partant des termes les plus importants (c’est-à-dire de plus haut degré). Pour commencer, on choisit le monôme c X i de telle sorte que c X i B et A aient le même degré et le même coefficient dominant. On se ramène ainsi à la division euclidienne de A − c X i B (qui est de degré strictement inférieur à celui de A) par B , et ainsi de suite jusqu’à aboutir à un polynôme de degré strictement inférieur à celui de B . Par exemple, dans le calcul suivant, le monôme 2X 3 du quotient a été choisi pour que le produit 2X 3 (X 2 + 2) = 2X 5 + 4X 3 ait précisément le même degré et le même coefficient dominant que 2X 5 − 3X 4 + 3X 3 + 5X + 1 ; on recommence alors le procédé avec la différence de ces deux polynômes, qui est maintenant de degré 4 , etc. 748
III Fonctions polynomiales et racines
2X 5 5 − 2X Exo 20.3
− 3X 4 −3X 4 − −3X 4
+ 3X 3 + 4X 3 − X3
+ 5X + 1
+ 5X + 1 − 6X 2 − X 3 + 6X 2 + 5X + 1 − − X3 − 2X 6X 2 + 7X + 1 2 − 6X + 12 7X − 11
X2 + 2 2X 3 − 3X 2 − X + 6
On a alors : 2X 5 − 3X 4 + 3X 3 + 5X + 1 = (X 2 + 2)(2X 3 − 3X 2 − X + 6) + (7X − 11).
III 1
Fonctions polynomiales et racines Fonction polynomiale
Définition 8 Soit A un polynôme de IK[X]. La fonction
: A
fonction polynomiale associée au polynôme A.
IK x
−→ IK �−→ A(x)
est appelée
Définition 9 Soit I une partie de IK et f ∈ IKI . La fonction f est dite polynomiale s’il existe un polynôme P ∈ IK[X] tel que ∀x ∈ I f (x) = P (x). Ex. 2. La fonction définie sur IK par x �→ x4 + 5x + 10 est une fonction polynomiale.
x2 − 1 est également polynomiale. En x−1 f (x) = P (x) .
Ex. 3. La fonction f définie sur IR \ {1} par f (x) = effet, en posant P = X + 1 , on a ∀x ∈ IR \ {1}
2
Racines
Définition 10 Soit A ∈ IK[X] un polynôme. Un élément α de IK est racine du polynôme A si A(α) = 0 . Proposition 12 Soit A ∈ IK[X]. Un élément α de IK est racine de A si, et seulement si, (X − α) divise A. Principe de démonstration. Le reste de la division euclidienne de A par (X −α) est A(α) . 749
Chapitre 20. Polynômes Démonstration page 772
Exo 20.7
Proposition 13 Soit A un polynôme de IK[X] et p ∈ IN∗ . Si α1 , . . . , αp sont p racines distinctes p de A, alors A est divisible par (X − αi ). i=1
Démonstration page 773
Principe de démonstration.
Par récurrence sur p .
Corollaire 14 Soit n ∈ IN. Un polynôme de degré n admet au plus n racines distinctes. Démonstration.
Si A ∈ IK[X] non nul admet p racines distinctes α1 , . . . , αp , la proposi-
tion 13 montre qu’il est divisible par le produit
p
(X − αi ) , d’où p deg A .
i=1
Corollaire 15 • Un polynôme de IKn [X] admettant au moins n + 1 racines est nul. • Un polynôme de IK[X] admettant une infinité de racines est nul.
Point méthode On applique souvent ce corollaire à la différence A − B pour montrer que deux polynômes A et B sont égaux : Exo 20.8
• soit en montrant que A et B coïncident en n + 1 points lorsque l’on sait que A et B appartiennent à IKn [X] ;
Exo 20.9
• soit, plus radicalement, en montrant que A et B coïncident en une infinité de points. Ex. 4. Soit n ∈ IN . On peut montrer, comme dans l’exercice 5.37 de la page 192, qu’il existe un polynôme A tel que : ∀x ∈ IR A(cos x) = cos(n x). Montrons son unicité. S’il existe deux tels polynômes A et B , on a alors : ∀x ∈ IR
A(cos x) = B(cos x)
donc, comme la fonction cosinus a pour image [−1, 1] : ∀u ∈ [−1, 1]
A(u) = B(u).
Les polynômes A et B coïncident donc sur une infinité de points, et on a A = B .
Corollaire 16 Soit A un polynôme de IK[X] et n ∈ IN∗ . Si A est de degré n, de coefficient dominant λ, et admet n racines distinctes α1 , . . . , αn , alors : A=λ
Exo 20.10
n
i=1
750
(X − αi ).
III Fonctions polynomiales et racines Démonstration.
Sous les hypothèses de l’énoncé, la proposition 13 de la page ci-contre
entraîne l’existence d’un polynôme Q tel que A = Q
n
(X − αi ) . Comme les polynômes A
i=1
et
n
(X − αi ) sont tous deux de degré n , le polynôme Q est de degré 0 , c’est-à-dire constant
i=1
et non nul. L’examen des coefficients dominants montre alors Q = λ .
Ex. 5. Pour n ∈ IN∗ , le polynôme X n − 1 possède pour racines les racines n -ièmes de l’unité, qui sont au nombre de n . Comme il est de degré n et unitaire, on a :
n−1
Xn − 1 =
3
k=0
X −e
2ikπ n
.
Détermination d’un polynôme par sa fonction polynomiale
Soit A un polynôme de IK[X] tel que la restriction de sa fonction polynomiale sur une partie infinie de IK soit nulle. Alors, A admet une infinité de racines et est donc nul. Comme la fonction polynomiale associée à la différence des polynômes A et B −B , on a immédiatement la proposition suivante. est A
Proposition 17 Si A et B sont deux polynômes de IK[X] dont les fonctions polynomiales associées coïncident sur une partie infinie de IK , alors A = B . Remarques • Un polynôme de IK[X] est entièrement déterminé par la donnée de la fonction polynomiale associée. est une application injective de IK[X] dans F (IK, IK) qui • L’application ϕ : A �→ A vérifie, pour tous polynômes A et B et pour tous réels α et β : ∗ ϕ(α A + β B) = α ϕ(A) + β ϕ(B) ;
∗ ϕ(AB) = ϕ(A)ϕ(B) ;
∗ ϕ(1) = 1 où 1 est la fonction constante égale à 1 .
Au vu de ces propriétés, on peut se permettre de confondre un polynôme et sa fonction polynomiale associée ; on dit alors qu’on « identifie polynôme et fonction polynomiale ».
4
Formule d’interpolation de Lagrange
Définition 11 Soit n ∈ IN∗ et x1 , . . . , xn des éléments de IK distincts. On appelle polynômes de Lagrange associés à la famille (x1 , . . . , xn ) les n polynômes définis par : X − xj ∀i ∈ [[1, n]] Li = · xi − xj 1jn j=i
751
Chapitre 20. Polynômes Ex. 6. Les trois polynômes de Lagrange associés à la famille (1, 2, 3) sont : L1 =
(X − 2)(X − 3) , 2
L2 =
(X − 1)(X − 3) −1
et
L3 =
(X − 1)(X − 2) · 2
Remarque Avec les notations de la définition, les polynômes de Lagrange vérifient : 1 si i = j ∀j ∈ [[1, n]] Li (xj ) = δi,j avec δi,j = 0 si i �= j.
Exo 20.11
Théorème 18 (Interpolation de Lagrange) Soit n ∈ IN∗ , y1 , . . . , yn des éléments de IK et x1 , . . . , xn des éléments de IK distincts. Alors, il existe un unique polynôme P de IKn−1 [X] tel que : ∀i ∈ [[1, n]] P (xi ) = yi .
Principe de démonstration.
Démonstration page 773 Pour l’unicité, on montre que si deux polynômes conviennent,
ils coïncident en suffisamment de points pour être égaux. Pour l’existence, on considère
n
yj Lj ,
j=1
où L1 , . . . , Ln sont les polynômes de Lagrange associés à la famille (x1 , . . . , xn ) .
Remarque Soit f une fonction d’une partie I de IK à valeurs dans IK. Soit n ∈ IN∗ . Étant donné x1 , . . . , xn des éléments de I distincts, il existe un et un seul polynôme P de IKn−1 [X] tel que : ∀i ∈ [[1, n]] P (xi ) = f (xi ). Ce polynôme est alors appelé polynôme d’interpolation de Lagrange de f associé à la famille (x1 , . . . , xn ). Ex. 7. Il existe un unique polynôme P de IR2 [X] tel que P (1) = 2 , P (2) = 3 et P (3) = 6 . En reprenant les polynômes de Lagrange associés au triplet (1, 2, 3) donnés dans l’exemple de la présente page, il s’agit du polynôme : P = 2L1 + 3L2 + 6L3 = X 2 − 2X + 3.
5
Ordre de multiplicité d’une racine
Soit A un polynôme non nul et α ∈ IK une racine de P . L’ensemble k ∈ IN∗ : (X − α)k | A est une partie de IN non vide (elle contient 1 ) et majorée par deg A d’après la remarque de la page 747. Cet ensemble admet donc un plus grand élément, ce qui justifie les définitions suivantes. Définition 12 Soit A un polynôme non nul et α ∈ IK une racine de A. L’ordre de multiplicité de α est le plus grand entier p tel que (X − α)p divise A. On dit alors que α est racine d’ordre p de A.
Remarques • Si α est racine d’ordre p de A, alors (X − α)p divise A et (X − α)p+1 ne divise pas A. 752
III Fonctions polynomiales et racines • Par extension, on dit qu’un élément α de IK est racine d’ordre 0 de A si α n’est pas racine de A. • L’ordre de multiplicité d’une racine de A est inférieur ou égal à deg A. Terminologie On dit qu’une racine est simple (resp. double, triple, etc.) si son ordre de multiplicité est 1 (resp. 2 , 3 , etc.). Elle est dite multiple si elle est d’ordre au moins 2 . Proposition 19 Soit A un polynôme non nul de IK[X], α ∈ IK et p ∈ IN∗ .
• α est racine d’ordre au moins p de A si, et seulement s’il existe B ∈ IK[X] tel que A = (X − α)p B .
• α est racine d’ordre p de A si, et seulement s’il existe B ∈ IK[X] tel que A = (X − α)p B et B(α) �= 0 .
Démonstration page 773 Le premier point est une reformulation de la définition. Pour le deuxième, le fait crucial est qu’un polynôme (X − α)p B est divisible par (X − α)p+1 si et seulement si B(α) = 0 .
Principe de démonstration.
Ex. 8. Un élément α ∈ IK est donc racine simple (racine d’ordre 1 ) de A si, et seulement si : ∃B ∈ IK[X]
A = (X − α) B
et
B(α) �= 0.
Proposition 20 Soit A un polynôme non nul de IK[X]. Si α1 , . . . , αp sont p racines distinctes de A d’ordre respectivement au moins égal à r1 , . . . , rp , alors A est divisible p par (X − αi )ri . i=1
Démonstration page 774
Principe de démonstration.
Par récurrence sur p .
Lorsque l’on dénombre les racines d’un polynôme non nul, on peut : • soit compter le nombre de racines distinctes ;
• soit compter chaque racine avec son ordre de multiplicité ; dans ce cas, une racine d’ordre r compte comme r racines.
Ex. 9. Le polynôme (X − 1)(X − 2)2 (X − 3)3 possède :
∗ 3 racines distinctes : 1, 2, 3 ; ∗ 6 racines comptées avec leur ordre de multiplicité : 1, 2, 2, 3, 3, 3 .
De même que pour les racines distinctes, on a les deux résultats suivants, qui se démontrent de manière analogue. Corollaire 21 Soit n ∈ IN. Un polynôme (non nul) de degré n possède au plus n racines comptées avec leur ordre de multiplicité. 753
Chapitre 20. Polynômes Corollaire 22 Un polynôme de IKn [X] admettant plus de n + 1 racines comptées avec leur ordre de multiplicité est le polynôme nul. Corollaire 23 Soit A un polynôme non nul de IK[X]. Si α1 , . . . , αp sont p racines de A p distinctes, d’ordres respectivement égaux à r1 , . . . , rp , et si deg A = rk , k=1
alors A = λ
p
i=1
6
(X − αi )ri , où λ est le coefficient dominant de A.
Relations entre coefficients et racines (formules de Viète)
Définition 13 Un polynôme A de IK[X] est dit scindé sur IK s’il existe un entier naturel n, un élément λ ∈ IK non nul et des éléments α1 , . . . , αn de IK tels que : A=λ
n
i=1
(X − αi ).
Remarques • Un polynôme scindé est donc soit un polynôme constant non nul, soit un polynôme s’écrivant sous forme de produit de polynômes de degré 1 . • Un polynôme de degré n ∈ IN∗ qui admet n racines dans IK comptées avec leur ordre de multiplicité est scindé sur IK. En particulier, un polynôme de degré n qui admet n racines distinctes dans IK est scindé sur IK. Soit n ∈ IN. Soit A un polynôme de degré n scindé sur IK . On dispose alors de deux écritures de A : A = an X n + an−1 X n−1 + · · · + a1 X + a0
et A = an
n
i=1
(X − αi )
où a1 , . . . , an , α1 , . . . , αn sont des éléments de IK avec an �= 0 . On peut faire le lien entre ces deux écritures en développant la seconde, puis en identifiant les coefficients. On a ainsi : A = an (X − α1 )(X − α2 ) · · · (X − αn ) = an X n − σ1 X n−1 + σ2 X n−2 − · · · + (−1)p σp X n−p + · · · + (−1)n σn
avec :
∀p ∈ [[1, n]] σp = 754
1i1 max(n, m)
On prouve que P est un polynôme en montrant : ∀k > n + m
sk = a k + b k = 0 .
pk = 0 .
En effet, soit k > n + m . Si (i, j) est un couple tel que i + j = k , on a i > n ou j > m
(sinon i+j n+m < k ) et le produit ai bj est nul. Tous les termes de la somme
a i bj
i+j=k
•
étant nuls, on en déduit pk = 0 . Q est un polynôme, car on a, de façon évidente : ∀k > n
qk = λ ak = 0 .
Proposition 2 • •
C’est un sous-groupe additif de IKIN car il contient la suite nulle, la somme de deux polynômes est un polynôme, et l’opposé d’un polynôme P est −P qui reste un polynôme. La multiplication des polynômes : ∗ est une loi de composition interne ; ∗ est commutative, car la formule donnant les coefficients du produit de deux polynômes est symétrique ; ∗ est associative, car si A , B et C sont des polynômes, alors on a, en posant D = A (B C) : ∀n ∈ IN
dn =
ai
i+ℓ=n
j+k=ℓ
bj ck
=
ai bj ck ,
i+j+k=n
et l’expression obtenue étant symétrique en A , B et C , on en déduit : (A B) C = (B C) A ; puis, en utilisant la commutativité, on prouve ainsi que : (A B) C = (B C) A = A (B C) ; ∗ ∗
possède comme élément neutre le polynôme (1, 0, 0, . . .) ; est distributive par rapport à l’addition (évident sur la formule donnant les coefficients du produit).
Proposition 3 •
Si A = B = 0 , alors A + B = 0 et le résultat est évident. Sinon, posons n = max(deg A, deg B) ∈ IN ; on peut alors écrire : A=
n
ak X k
k=0
Cela donne A + B =
n
(ak + bk ) X
et
B=
n
bk X k .
k=0
k
et prouve que deg(A + B) n .
k=0
•
De plus, le coefficient en X n dans A + B est an + bn . Si deg A �= deg B , par exemple deg A < deg B , alors an = 0 et bn �= 0 , et par suite an + bn �= 0 ; ce qui prouve que A + B est de degré n . Si A = 0 ou B = 0 , alors A B = 0 et : deg(A B) = deg(0) = −∞ = deg A + deg B, car, avec l’extension des opérations arithmétiques sur IR (cf. page 324), on a : ∀n ∈ IN ∪ {−∞}
770
n + (−∞) = −∞ + n = −∞.
Démonstrations Sinon, posons n = deg A et m = deg B et écrivons A =
n
ak X k et B =
k=0
∗ ∗
m
bk X k .
k=0
Les calculs faits dans la démonstration de la proposition 1 de la page 741 prouvent que les coefficients de A B d’indice strictement supérieur à n + m sont nuls, ce qui donne déjà deg(A B) n + m . Le coefficient de A B de degré n + m vaut ai bj . Si (i, j) est un couple tel i+j=n+m
que i + j = n + m , on a soit i > n , soit j > m , soit (i, j) = (n, m) . Dans les deux premiers cas, le produit ai bj est nul. Le coefficient de A B de degré n + m est ainsi simplement an bm , non nul en tant que produit de deux éléments non nuls de IK . Ainsi, deg(A B) = n + m .
Proposition 7 •
Si A est un polynôme de degré nul, c’est-à-dire un scalaire non nul λ , le polynôme constant λ−1 est l’inverse de A .
•
Réciproquement, si A est un polynôme inversible, c’est-à-dire tel qu’il existe un polynôme B vérifiant A B = 1 , alors A et B sont non nuls et l’on a : 0 = deg(1) = deg(A B) = deg A + deg B. Comme deg A et deg B sont des entiers naturels, on en déduit deg A = 0.
Proposition 8
La première propriété est immédiate, via les règles de calcul dans IK[X] et dans IK .
Pour le produit, si A =
n
ak X k et B =
k=0
m
bℓ X ℓ , alors :
ℓ=0
AB =
m n
ak bℓ X k+ℓ
k=0 ℓ=0
et, d’après les règles de calcul dans IK : (A B)(α) =
m n
ak bℓ αk+ℓ
k=0 ℓ=0
=
m n
k
ℓ
a k α bℓ α =
k=0 ℓ=0
n k=0
k
ak α
m ℓ=0
ℓ
bℓ α
= A(α) B(α).
Proposition 9 (i) ⇒ (ii)
Supposons (i) . On peut alors trouver des polynômes C1 et C2 tels que : A = B C1
• •
et
B = A C2
et donc
A = A C1 C 2 .
Si A = 0 , alors la relation B = A C1 prouve que B = 0 , et donc toute valeur λ ∈ IK∗ convient. Si A �= 0 , on peut simplifier par A , en utilisant le corollaire 6 de la page 745, ce qui donne C1 C2 = 1 . D’après la proposition 7 de la page 745, on en déduit que C1 est un polynôme de degré 0 , c’est-à-dire une constante non nulle.
(ii) ⇒ (i) Si l’on peut trouver λ ∈ IK∗ tel que A = λB , on a B = λ−1 A , et les deux polynômes se divisent l’un l’autre.
771
Chapitre 20. Polynômes Théorème 10 Unicité. • •
Soit (Q1 , R1 ) ∈ IK[X]2 et (Q2 , R2 ) ∈ IK[X]2 tels que :
A = B Q1 + R1 A = B Q2 + R2
avec avec
deg R1 < deg B, deg R2 < deg B.
On a alors : (Q1 − Q2 ) B = R2 − R1 .
Les hypothèses sur R1 et R2 entraînent deg(R2 − R1 ) < deg B . Par ailleurs, on a
deg(R2 − R1 ) = deg (Q1 − Q2 )B = deg(Q1 − Q2 ) + deg B. En retranchant deg B (qui est un entier car B �= 0 ), on obtient deg(Q1 − Q2 ) < 0 , donc Q1 − Q2 = 0 , d’où l’on tire Q1 = Q2 , puis R1 = R2 . Existence.
Notons m = deg B . On peut donc écrire B =
m
k=0
bk X k , avec bm �= 0 .
Si m = 0 , le polynôme B est constant non nul, donc il suffit de poser Q = b−1 m A et R = 0 . Dans la suite, on suppose donc m ∈ IN∗ et on démontre par récurrence sur n ∈ IN∗ la propriété Hn : « pour tout polynôme A de IKn−1 [X] , il existe un couple (Q, R) ∈ IK[X]2 tel que A = B Q + R et deg R < m . » • •
La propriété Hn est vraie pour tout entier n m , car si deg A < m , il suffit de prendre R = A et Q = 0 . Supposons Hn pour un certain n m , et démontrons Hn+1 . Soit A ∈ IKn [X] . On peut alors écrire A =
n
ak X k et le polynôme :
k=0
n−m A1 = A − an b−1 B m X
(a)
appartient à IKn−1 [X] . On peut donc lui appliquer l’hypothèse de récurrence : il existe un couple (Q1 , R) tel que : A1 = B Q1 + R
avec
deg R < m.
(b)
En posant : n−m Q = Q1 + an b−1 m X
et en utilisant (a) et (b) , on obtient : A = B Q + R. Proposition 11 • •
Soit A et B deux polynômes de IK[X] avec B �= 0 .
Si le reste de la division euclidienne de A par B est nul, il existe Q ∈ IK[X] tel que A = B Q donc B divise A . Réciproquement, si B divise A , il existe un polynôme Q tel que A = B Q et l’unicité de la division euclidienne prouve que Q et 0 sont respectivement les quotient et reste de la division euclidienne de A par B , puisque deg 0 = −∞ < deg B ∈ IN .
Proposition 12 On effectue la division euclidienne de A par X − α : on trouve ainsi (Q, R) ∈ IK[X]2 tel que A = (X − α) Q + R et deg R < deg(X − α) = 1 .
Autrement dit, le polynôme R est constant, et on obtient R(α) = A(α) en évaluant en α . Ainsi, le reste de la division euclidienne de A par X − α est A(α) . D’après la proposition 11 de la page 748, on en déduit que (X − α) divise A si, et seulement si, A(α) = 0 .
772
Démonstrations Démontrons par récurrence sur p ∈ IN∗ qu’un polynôme admettant p racines
Proposition 13
distinctes, notées α1 , . . . , αp , est divisible par
p
(X − αi ) .
i=1
• •
C’est vrai pour p = 1 d’après la proposition 12 de la page 749. Supposons le résultat vrai pour p ∈ IN∗ et démontrons-le pour p + 1 . Soit un polynôme A admettant p + 1 racines distinctes que l’on note α0 , α1 , . . . , αp . D’après l’hypothèse de récurrence, il existe un polynôme B1 ∈ IK[X] tel que : A = B1
p i=1
Comme α0 est racine de A , on a B1 (α0 )
(X − αi ).
p
(α0 − αi ) = 0 , ce qui prouve B1 (α0 ) = 0
i=1
puisque
p
(α0 − αi ) est un élément non nul de IK .
i=1
Il existe donc un polynôme B2 tel que : B1 = (X − α0 ) B2 . On obtient alors : A = B2
p i=0
(X − αi ),
ce qui termine la démonstration par récurrence. Théorème 18 Unicité. Soit P et Q deux polynômes de IKn−1 [X] tels que : ∀i ∈ [[1, n]]
P (xi ) = yi
et
Q(xi ) = yi .
Alors le polynôme P − Q est un polynôme de degré au plus n − 1 qui admet pour racines les n éléments x1 , . . . , xn de IK . D’après le corollaire 15 de la page 750, la différence P − Q est donc nulle. D’où l’unicité. Existence. Notons L1 , . . . , Ln les polynômes de Lagrange associés à (x1 , . . . , xn ) , et posons P =
n
yj Lj .
j=1
• •
En tant que somme de polynômes de IKn−1 [X] , le polynôme P appartient à IKn−1 [X] . Soit i ∈ [[1, n]] . On a : P (xi ) =
n j=1
Donc P convient.
yj Lj (xi ) =
n
yj δi,j = yi .
j=1
Proposition 19 • Le premier point est immédiat à partir de la définition. • Avant de montrer le deuxième, fixons B ∈ IK[X] . On va montrer que α est racine d’ordre au moins p + 1 de (X − α)p B si, et seulement si, B(α) = 0 . ∗
∗
Supposons que α soit racine d’ordre au moins p + 1 de (X − α)p B . On peut donc trouver un polynôme B1 ∈ IK[X] tel que (X − α)p+1 B1 = A = (X − α)p B . Le polynôme (X − α)p n’étant pas nul, en appliquant le corollaire 6 de la page 745, on en déduit que (X − α)B1 = B et donc B(α) = 0 . Réciproquement, si B(α) = 0 , on peut trouver B1 ∈ IK[X] tel que B = (X − α)B1 , d’où l’on tire (X − α)p B = (X − α)p+1 B1 .
773
Chapitre 20. Polynômes •
On montre alors le deuxième point. Supposons que α soit racine d’ordre p de A . D’après le premier point, on peut trouver B ∈ IK[X] tel que A = (X − α)p B , et ce qui précède montre alors B(α) �= 0 . Réciproquement, s’il existe B ∈ IK[X] tel que A = (X − α)p B et B(α) �= 0 , la racine α est d’ordre au moins p , mais pas d’ordre au moins p + 1 , donc elle est d’ordre p .
Proposition 20 • Si p = 1 , la propriété est vraie par définition de l’ordre d’une racine. • Supposons la propriété vraie au rang p ∈ IN∗ et considérons α0 , α1 , . . . , αp des racines distinctes de A d’ordre respectivement au moins égal à r0 , r1 , . . . , rp . D’après l’hypothèse de récurrence, il existe un polynôme B1 ∈ IK[X] tel que : A = B1
p i=1
(X − αi )ri .
Soit r l’unique entier (éventuellement nul) tel qu’il existe B ∈ IK[X] vérifiant : B1 = (X − α0 )r B
p
En posant B2 = B
i=1
et
B(α0 ) �= 0.
(X − αi )ri , on a : A = (X − α0 )r B2
avec
B2 (α0 ) �= 0.
Donc α0 est racine de A d’ordre r . Cela prouve r r0 . Par suite, le polynôme
p
i=0
divise (X −α0 )r
p i=1
(X −αi )ri
(X −αi )ri et donc aussi A . On a ainsi montré la propriété au rang p+1 ,
ce qui termine la démonstration par récurrence. Proposition 25 •
Supposons deg A = n , avec n 1 . On écrit alors A =
k=0
Comme A′ =
n
k=1
•
n
ak X k avec an �= 0 .
k ak X k−1 avec n an �= 0 , on en déduit que deg A = n − 1 .
Si A est un polynôme constant, alors A′ = 0 . Réciproquement, si deg A > 0 , on a deg(A′ ) 0 d’après le premier point, d’où A′ �= 0 .
Proposition 27
On note A =
+∞
ak X k et B =
k=0
•
λA +µB =
•
A=
+∞
k=1
bk X k . On a alors :
k=0
(λak + µbk ) X k donc (λ A + µ B)′ =
k=0 +∞
+∞
+∞
k (λak + µbk ) X k−1 ;
k=1
k ak X k−1 et B =
+∞ k=1
k bk X k−1 , d’où λ A′ + µ B ′ =
+∞
k (λak + µbk ) X k−1 .
k=1
Proposition 28 • Soit (p, q) ∈ IN2 . Vérifions la formule dans le cas A = X p et B = X q . ∗
∗
774
Si p = 0 , on a (A B)′ = B ′ et A′ B + A B ′ = 0 B + 1 B ′ = B ′ , donc la formule est correcte. Il en va de même si q = 0 . Supposons (p, q) ∈ (IN∗ )2 . On a alors AB = (X p+q )′ = (p + q)X p+q−1 et : A′ B + A B ′ = p X p−1 X q + X p q X q−1 = (p + q)X p+q−1 .
Démonstrations •
Notons A =
n
ak X k et B =
k=0
m
ℓ=0
bℓ X ℓ , avec (n, m) ∈ IN2 .
On a, par linéarité de la dérivation (proposition 27 de la page 756) : ′
(AB) =
m n
k
a k bℓ X X
ℓ
k=0 ℓ=0
′
=
m n
a k bℓ X k X ℓ
k=0 ℓ=0
′
.
En appliquant le premier point de la démonstration, il vient : (AB ′ ) =
m n
a k bℓ
k=0 ℓ=0
=
n
k ′
ak (X )
k=0
=
n
ak X
k=0
k
(X k )′ X ℓ + X k X ℓ
m
′
bℓ X
ℓ=0
m
bℓ X
ℓ
ℓ=0
ℓ
+
+
′
n
ak X
k=0
n
ak X
k=0
k
k
m
ℓ ′
bℓ (X )
ℓ=0
m
bℓ X
ℓ=0
ℓ
′
= A′ B + A B ′ .
Proposition 30
•
Supposons A =
n
k=0
ak X k avec deg A = n r . On a donc an �= 0 .
La proposition 29 de la page 756 et le calcul de (X k )(r) montrent qu’alors : A(r) =
n k=r
k(k − 1) · · · (k − r + 1) ak X k−r ,
avec n(n − 1) · · · (n − r + 1) an �= 0 , d’où l’on déduit deg A = n − r . •
Si deg A < r , tous les X k apparaissant dans la somme définissant A ont un polynôme dérivé d’ordre r nul donc, d’après la proposition 29 de la page 756, A(r) = 0 . Réciproquement, si deg A r , le premier point montre notamment A(r) �= 0 .
Proposition 33 •
Soit p ∈ IN . Montrons la formule de Taylor pour X p . On a, notamment grâce à la formule du binôme : +∞ (X p )(k) (α) k=0
k!
(X − α)k = =
p p(p − 1) · · · (p − k + 1) αp−k
k!
k=0
p p k=0
k
(X − α)k
(X − α)k αp−k
= ((X − α) + α)p = X p .
775
Chapitre 20. Polynômes •
Soit maintenant A ∈ IK[X] , que l’on écrit A = +∞ A(k) (α)
k!
k=0
(X − α)k = =
p=0
+∞ n
ap X p , avec n ∈ IN . On a alors :
ap
k=0 p=0
n
ap
p=0
=
n
n
(X p )(k) (α) (X − α)k k!
+∞ (X p )(k) (α)
k!
k=0
(X − α)k
ap X p ,
p=0
en utilisant le premier point, et en n’oubliant pas que la somme portant sur k est, malgré les apparences, une somme finie. Proposition 34
Soit α une racine d’ordre r de A ∈ IK[X] . On peut écrire : A = (X − α)r B
B(α) �= 0.
avec
Alors, en dérivant la relation précédente, on obtient :
A′ = (X − α)r−1 r B + (X − α) B ′ = (X − α)r−1 B1 , avec B1 (α) = r B(α) �= 0 puisque r 1 et B(α) �= 0 . Cela prouve le résultat. Proposition 35 (i) ⇒ (ii) Soit α une racine d’ordre r de A . À l’aide de la proposition 34 de la page 758 et par une récurrence finie, on obtient que, pour tout k ∈ [[0, r]] , le scalaire α est racine d’ordre r − k de A(k) .
Donc α est racine des polynômes A, A′ , . . . , A(r−1) et α est racine d’ordre 0 de A(r) , c’est-à-dire n’est pas racine de A(r) . (ii) ⇒ (i)
On suppose l’assertion (ii) . En utilisant la formule de Taylor, on peut écrire : A=
+∞ A(k) (α)
k!
k=0
où l’on a posé B =
(X − α)k =
A(k) (α)
+∞
k=r
k!
+∞ A(k) (α) k=r
k!
(X − α)k = (X − α)r B,
(X − α)k−r . On a donc B(α) =
A(r) (α) �= 0 . r!
On en déduit que α est racine d’ordre r de A . Proposition 36
Pour tout polynôme B ∈ IR[X] , on a, d’après les propriétés de la conjugaison des
nombres complexes, que B(α) = B(α) . En particulier, α est racine de B si, et seulement si, son conjugué α l’est. En appliquant cette propriété aux différents polynômes dérivés de A , on a :
α racine d’ordre r de A ⇔ A(α) = A′ (α) = · · · = A(r−1) (α) = 0
et
A(r) (α) �= 0
⇔ A(α) = A′ (α) = · · · = A(r−1) (α) = 0
et
A(r) (α) �= 0
⇔ α racine d’ordre r de A.
776
Démonstrations Théorème 37 Soit A un polynôme à coefficients complexes de degré p 1 . Pour montrer que A possède une racine complexe, considérons la borne inférieure α = inf |A(z)| , qui existe
z∈C
puisque |A(z)| | z ∈ C est une partie non vide de IR+ , et montrons que cette borne inférieure est atteinte, puis qu’elle est nulle. •
Notons A =
p k=0
ak X k , avec ap �= 0 . Pour |z| = r , on a, par inégalité triangulaire :
p−1 p−1 k ak z |ap | r p − |ak | r k . |A(z)| |ap z | − k=0 k=0 p
Ce minorant définit une fonction réelle polynomiale de r équivalente à r �→ |ap |r p et qui tend donc vers +∞ quand r tend vers +∞ . Elle est donc plus grande que α + 1 au voisinage de +∞ , ce qui prouve qu’il existe un disque D centré en 0 en dehors duquel on a |A(z)| α + 1 . Puisque α = inf |A(z)|, on peut trouver une suite de nombres complexes (un )n∈IN telle z∈C
que
lim |A(un )| = α. D’après ce qui précède, cette suite est dans le disque D à partir
n→+∞
d’un certain rang et est donc bornée. D’après le théorème 48 de la page 334, on peut donc en extraire une sous-suite uϕ(n) n∈IN convergeant vers un complexe z0 .
Comme :
A uϕ(n) = on en déduit
ak ukϕ(n) ,
k=0
lim A uϕ(n) = A(z0 ) , ce qui donne :
n→+∞
ak X k
avec
α = lim A uϕ(n) = |A(z0 )| . n→+∞
•
p
Montrons par l’absurde que A(z0 ) = 0 . On suppose A(z0 ) �= 0 . Quitte à considérer le A(z0 + X) , on peut supposer z0 = 0 et A(z0 ) = A(0) = 1 . polynôme A(z0 ) Le polynôme non constant A s’écrit donc : A = 1 − aq X q +
p
k=q+1
aq �= 0
et
1 q p.
Posons aq = ρe−iθ avec ρ ∈ IR∗+ et θ ∈ IR . Pour z = r eiθ/q , avec r > 0 , on a : A(z) = 1 − ρ r q +
p
ak r k eikθ/q
|A(z)| |1 − ρ r q | +
et donc
k=q+1
Si l’on suppose r (1/ρ)
1/q
q
q
p
k=q+1
|ak | r k .
, on a |1 − ρ r | = 1 − ρ r et alors :
|A(z)| − 1 −ρ r q +
p
k=q+1
|ak | r k .
Ce majorant définissant une fonction polynomiale de r , équivalente en 0 à r �→ −ρ r q , il est strictement négatif au voisinage de 0+ . Par conséquent, pour r > 0 assez petit et z = r eiθ/q , on a |A(z)| < 1 = α , ce qui est contradictoire.
777
Chapitre 20. Polynômes Proposition 38 Notons α1 , . . . , αp les racines (complexes) distinctes de A et r1 , . . . , rp leurs ordres respectifs. D’après la proposition 20 de la page 753, il existe un polynôme Q tel que A = Q
p
(X − αk )rk .
k=1
Si Q est de degré non nul, il admet au moins une racine complexe qui est alors aussi une racine de A ; il existe donc j ∈ [[1, p]] tel que αj soit aussi racine de Q . On a alors (X − αj )rj +1 divise A , ce qui contredit la définition de rj . Par suite, Q est une constante λ et l’on a alors : A=λ
p
(X − αk )rk ,
k=1
où λ est évidemment le coefficient dominant de A . Proposition 40 • •
On a A =
µ
p
(X − αk )
sk
p λ µ
k=1
(X − αk )
k=1
rk −sk
, ce qui montre déjà que les poly-
nômes de l’énoncé sont des diviseurs de A . Réciproquement, soit B un diviseur (nécessairement non nul) de A . On peut donc trouver Q ∈ C[X] tel que A = BQ . On voit en particulier que toutes les racines de B sont racines de A . Si l’on note I l’ensemble des i ∈ [[1, p]] tels que αi soit une racine de B , et que l’on note si l’ordre de multiplicité correspondant, le corollaire 39 de la page 759 donne une factorisation B = µ (X − αi )si . i∈I
Pour tout i ∈ I , le polynôme (X − αi )si divise B , qui divise à son tour A , donc on doit avoir si ri . On obtient alors l’expression voulue en posant si = 0 pour tout i ∈ [[1, p]] \ I .
Proposition 41 Puisque A est à coefficients réels, on sait d’après la proposition 36 de la page 758 que, si ω est une racine complexe non réelle de A d’ordre s , alors ω est aussi racine d’ordre s , nécessairement distincte de ω . Comme A est scindé sur C , il s’écrit donc : A=λ
p j=1
(X − αj )rj
q
k=1
(X − ωk )sk (X − ω k )sk ,
où λ est le coefficient dominant de A (donc λ ∈ IR∗ ), les αj sont les racines réelles de A , et les ωk et ω k sont ses racines non réelles. Le résultat s’ensuit, puisque : (X − ωk ) (X − ω k ) = (X 2 + βk X + γk ) ∈ IR[X],
avec βk = −ωk − ω k = −2 Re(ωk ) ∈ IR et γk = ωk ω k = |ωk |2 ∈ IR .
Le polynôme X 2 + βk X + γk n’ayant pas de racine réelle, son discriminant βk2 − 4γk est strictement négatif.
Proposition 43
Montrons par récurrence sur n ∈ IN , l’assertion Hn :
« si A et B sont deux polynômes non tous les deux nuls vérifiant min(deg A, deg B) < n et si D en est un PGCD, alors D(A) ∩ D(B) = D(D). » •
Soit A et B deux polynômes non tous les deux nuls tels que min(deg A, deg B) < 0 . Alors l’un d’eux est nul. Supposant, par exemple, A = 0 , on a D(A) ∩ D(B) = D(B) . Comme on l’a vu à la dernière remarque de la section précédente, les PGCD de A et B sont dans ce cas les polynômes associés à B , et on en déduit H0 .
778
Démonstrations •
Soit n ∈ IN tel que Hn soit vraie. Montrons Hn+1 . Prenons deux polynômes A et B tels que min(deg A, deg B) < n + 1 . Supposons, par exemple deg B deg A . Si deg B < n , le résultat est immédiat d’après Hn . Supposons donc deg B = n , et en particulier B �= 0 . Soit D un PGCD de A et B . La division euclidienne de A par B donne : A = BQ+R
avec
deg R < deg B.
D’après le lemme 42 de la page 761, on a D(A) ∩ D(B) = D(B) ∩ D(R) et, en particulier, D est également un PGCD de B et R . Comme deg R < deg B , l’hypothèse Hn nous donne l’égalité D(B) ∩ D(R) = D(D) , soit D(A) ∩ D(B) = D(D) d’après ce qui précède. On en déduit Hn+1 . Théorème 44 •
•
Montrons successivement les deux points.
Le degré de tout PGCD de deux polynômes non tous les deux nuls est un entier naturel, donc D1 et D2 sont non nuls. Par ailleurs, on a D(D1 ) = D(D2 ) = D(A) ∩ D(B) , donc D1 et D2 ont exactement les mêmes diviseurs. On en déduit qu’ils sont associés d’après la remarque 1 de la page 747. L’unicité est une conséquence immédiate du point précédent, car deux polynômes unitaires et associés sont égaux. Pour l’existence, on a vu que tout PGCD D de A et B est non nul. En divisant par le coefficient dominant de D , on trouve un polynôme unitaire ayant les mêmes diviseurs que D , et qui est donc lui-même un PGCD de A et B .
Proposition 45
Montrons par récurrence sur n ∈ IN , l’assertion Hn :
« si A et B sont des polynômes non tous les deux nuls vérifiant min(deg A, deg B) < n , alors il existe des polynômes U et V tels que A U + B V = A ∧ B . » •
•
Soit A et B des polynômes non tous les deux nuls tels que min(deg A, deg B) < 0 . Alors l’un d’eux est nul. Supposant, par exemple, A = 0 , on a B �= 0 et A ∧ B = B/λ , où λ est le coefficient dominant de B . Il suffit alors de prendre U = 0 et V = 1/λ , ce qui donne H0 . Soit n ∈ IN tel que Hn soit vraie. Montrons Hn+1 . Prenons deux polynômes A et B tels que min(deg A, deg B) = n (le cas où min(deg A, deg B) < n est directement réglé par Hn ). Supposons, par exemple deg B deg A , donc deg B = n , et en particulier B �= 0 . Soit D = A ∧ B . Effectuons la division euclidienne de A par B : A = BQ+R
avec
deg R < deg B.
D’après le lemme 42 de la page 761, D est également le PGCD de B et R . Comme deg R < deg B , l’hypothèse Hn nous donne l’existence de polynômes U1 et V1 tels que B U1 + R V1 = D . Il reste à remplacer R par A − BQ pour obtenir D = A U + B V , avec U = V1 et V = U1 − Q V1 . Proposition 46 • •
Si A et B sont premiers entre eux, alors A ∧ B = 1 et, d’après la proposition 45 de la page 763, il existe (U, V ) ∈ IK[X]2 tel que A U + B V = A ∧ B = 1 .
Réciproquement, s’il existe deux polynômes U et V tels que A U + B V = 1 , alors tout diviseur commun à A et B divisant A U + B V divise 1 ; il est donc de degré 0 . On en déduit que A et B sont premiers entre eux.
779
Chapitre 20. Polynômes Proposition 47 On suppose B �= 0 . Comme D divise A et B , on peut trouver A1 et B1 tels que A = D A1 et B = D B1 . Comme D = A ∧ B , il existe deux polynômes U et V tels que D = AU + BV , c’est-à-dire D = (A1 U + B1 V ) D . Comme D est unitaire, D est non nul et l’on peut simplifier par D . On a alors 1 = A1 U + B1 V . Cela prouve que A1 et B1 sont premiers entre eux. Proposition 48
Supposons A ∧ B = 1 et A ∧ C = 1 .
D’après l’identité de Bézout, il existe (U1 , V1 , U2 , V2 ) ∈ IK[X]4 tel que : A U1 + B V1 = 1
et
A U2 + C V2 = 1.
En multipliant membre à membre ces deux égalités on obtient A U + B C V = 1 , après avoir posé U = A U1 U2 + B V1 U2 + C V2 U1 et V = V1 V2 . Cela prouve que A et B C sont premiers entre eux. Proposition 51 • Si A et B possèdent une racine commune z ∈ C , ils sont tous les deux divisibles par X − z et donc non premiers entre eux. Cela démontre le sens direct, par contraposée. • Réciproquement, supposons que A et B n’aient aucune racine commune et montrons qu’ils sont premiers entre eux. Soit D un diviseur commun à A et B (on a donc D �= 0 , car A et B ne sont pas tous les deux nuls). Si deg D 1 , le polynôme D est non constant. D’après le théorème 37 de la page 759, il admet alors une racine z ∈ C , et est donc divisible par X − z . On en déduit que A et B sont tous deux divisibles par X − z , et donc que A et B possèdent z comme racine commune, ce qui contredit l’hypothèse. On en déduit donc deg D = 0 , ce qui montre que A et B sont premiers entre eux. Proposition 54 Considérons un PPCM M de A et B . • Comme M est un multiple de A et B , ses multiples sont aussi multiples de A et B . • Réciproquement, si P est un multiple commun à A et B , en effectuant la division euclidienne de P par M , on obtient P = M Q + R , avec deg R < deg M . Alors, R = P − M Q est un multiple de A et de B . Comme il est de degré strictement plus petit que celui de M , et que M a été choisi de degré minimal par définition d’un PPCM, on en déduit R = 0 . Donc P = M Q est un multiple de M . Théorème 56 Supposons A ∧ B = 1 et A | BC . D’après l’identité de Bézout, il existe des polynômes U et V tels que A U + B V = 1 , ce qui implique A C U + B C V = C . Comme A divise A C U et B C V , on a A | A C U + B C V et donc A | C . Proposition 57 1. Il est évident que les multiples de A B sont des multiples communs à A et B . Réciproquement, supposons que A | P et B | P ; il existe donc un polynôme Q tel que P = B Q . Comme A divise P et qu’il est premier avec B , le lemme de Gauss nous dit que A divise Q . Il existe donc un polynôme R tel que Q = A R , et par suite, P = A B R . Les multiples communs à A et à B sont donc les multiples de A B , ce qui prouve le résultat. 2. On peut supposer A et B unitaires quitte à les diviser par leurs coefficients dominants (ils sont non nuls par hypothèse). On va alors montrer que AB = (A ∧ B)(A ∨ B) dans ce cas. Soit D = A ∧ B . Prenons A1 et B1 tels que A = D A1 et B = D B1 . Alors A1 ∧ B1 = 1 . On va montrer que A ∨ B = D A1 B1 . D’après la proposition 54 de la page 767, il suffit de montrer que les multiples communs à A et B sont exactement les multiples du polynôme unitaire D A1 B1 . • Déja, tout multiple de D A1 B1 est un multiple de D A1 = A et D B1 = B .
780
Démonstrations •
Réciproquement, soit P un multiple commun à A et B . Un tel polynôme est donc nécessairement multiple de D , donc on peut trouver P1 ∈ IK[X] tel que P = D P1 . Les relations de divisibilité A | P et B | P entraînent alors l’existence de (U, V ) ∈ IK[X]2 tel que D P1 = U D A1 = V D B1 . Puisque D est unitaire, il est non nul, et on en déduit que P1 = U A1 = V B1 . Les polynômes premiers entre eux A1 et B1 divisent donc P1 , et, comme au point précédent, le lemme de Gauss entraîne A1 B1 | P1 , d’où D A1 B1 | P .
On a ainsi montré A ∨ B = D A1 B1 , d’où (A ∧ B)(A ∨ B) = D2 A1 B1 = A B .
Proposition 58 Soit P un polynôme irréductible. Les diviseurs communs à P et à un polynôme A sont des diviseurs de P , donc sont soit constants, soit associés à P . Ainsi, si P ne divise pas A , les seuls diviseurs communs à P et A sont les constantes. Par suite, A ∧ P = 1 . Proposition 60 • On vient de voir que tout polynôme de degré 1 est irréductible. • Un polynôme de degré 2 étant irréductible si, et seulement s’il ne possède pas de racine, les polynômes de degré 2 de IR[X] sont irréductibles si, et seulement si, leur discriminant est strictement négatif. • Enfin, la factorisation d’un polynôme dans IR[X] (cf.proposition 41 de la page 760) montre qu’un polynôme de degré strictement supérieur à 2 ne peut pas être irréductible puisqu’une telle factorisation sera constituée d’au moins deux polynômes non constants. Théorème 61 •
•
Soit A = λ
p
(X − ak )αk un polynôme A non constant, où les ak sont des nombres
k=1
complexes distincts, les αk des entiers naturels non nuls et λ ∈ C∗ . Il y a unicité d’une telle factorisation, à l’ordre près des facteurs, puisque λ est le coefficient dominant de A , les ak sont ses racines et les αk leurs ordres de multiplicité. De même, dans une factorisation dans IR[X] : A=λ
p j=1
(X − αj )rj
q
(X 2 + βk X + γk )sk ,
k=1
où les αj d’une part et les (βk , γk ) vérifiant βk2 − 4γk < 0 d’autre part sont distincts, les rj et sk des entiers naturels non nuls et λ un réel non nul : ∗ les racines réelles de A sont les αj avec l’ordre de multiplicité rj , ∗ les racines non réelles sont, pour chaque k ∈ [[1, q]] , les deux racines complexes du polynôme X 2 + βk X + γk à l’ordre de multiplicité sk , ∗ λ est le coefficient dominant de A , ce qui donne l’unicité, à l’ordre près des facteurs, de la factorisation.
781
Chapitre 20. Polynômes
S’entraîner et approfondir Opérations, degré, divisibilité 20.1 Soit n ∈ IN∗ . Déterminer le degré et le coefficient dominant de : →745
P = (X − 2)n − (X + 5)n .
20.2 Soit (A, P ) ∈ IK[X]2 , avec P non constant. Montrer que deg(A ◦ P ) = deg(A) deg(P ) . →746
20.3 Soit A = 2X 5 − 4X 4 + 6X 3 + 3X 2 − 5X + 8 et B = X 2 − 2X + 3 . →749
Effectuer la division euclidienne de A par B et en déduire la valeur de A 1 + i
√ 2 .
20.4 On dit qu’un polynôme A est pair si A (−X) = A (X) et impair si A (−X) = −A (X) .
Comment caractériser la parité (respectivement l’imparité) d’un polynôme à l’aide de ses coefficients ?
20.5 Soit P un polynôme de IK[X] . Déterminer, en fonction de deg P , le degré du polynôme : P (X + 1) − P (X).
⋆ 20.6 Soit P un polynôme de IK[X] . Montrer que P P (X) − X est divisible par P (X) − X .
Racines
20.7 Soit n ∈ IN∗ . Montrer que le polynôme (X −2)2n +(X −1)n −1 est divisible par X 2 −3X +2 . →750
20.8 Montrer que la fonction sin n’est pas une fonction polynomiale. →750
20.9 Soit I une partie infinie de IK . →750 1. Montrer que si f et g sont deux fonctions polynomiales de I dans IK telles que f g = 0 , alors f = 0 ou g = 0 . 2. Ce résultat reste-t-il vrai pour des fonctions non polynomiales ? 20.10 Soit n ∈ IN∗ . Décomposer X n + 1 dans C[X] en un produit de polynômes du premier degré. →750
20.11 Soit n ∈ IN∗ , y1 , . . . , yn des éléments de IK et x1 , . . . , xn des éléments de IK distincts. →752 Montrer qu’il existe un polynôme P ∈ IK[X] tel que :
Q ∈ IK[X] : ∀i ∈ [[1, n]]
Q(xi ) = yi
=
P +A
n
(X − xj ) A ∈ IK[X] .
j=1
20.12 Quelles sont les relations liant les coefficients et les racines d’un polynôme scindé de degré 3 ? →755
20.13 Soit n 2 . Appliquer les relations de Viète au polynôme complexe X n − 1 pour calculer la →755 somme et le produit des racines n -ièmes de l’unité.
782
Exercices 20.14 En utilisant un résultat sur les fonctions d’une variable réelle, montrer qu’un polynôme de degré 3 de IR[X] possède au moins une racine réelle. 20.15 Montrer qu’il n’existe pas de polynôme P ∈ C[X] tel que : ∀z ∈ C
P (z) = z.
20.16 Soit T ∈ C∗ . Déterminer tous les polynômes de C[X] dont la fonction polynomiale associée est T -périodique. ⋆ 20.17 Trouver les racines complexes du polynôme X 4 + 12X − 5 sachant que deux de ces racines ont une somme égale à 2 .
Dérivation 20.18 Déterminer tous les polynômes P tels que : →757
P (1) = 1
,
P ′ (1) = 3
,
P ′′ (1) = 8
et
P (n) (1) = 0 si n > 2.
20.19 Soit n ∈ IN∗ . Montrer que P = nX n+2 −(n+2)X n+1 +(n+2)X −n est divisible par (X −1)3 . →758
20.20 Soit n 2 . Trouver le reste de la division euclidienne du polynôme : →758
X n + nX n−1 + X 2 + 1
par
(X + 1)2 .
20.21 Montrer que le polynôme P = X 4 − 9X 3 + 30X 2 − 44X + 24 admet 2 pour racine. Donner son ordre de multiplicité. Déterminer les autres racines de P et leurs ordres de multiplicité. 20.22 Soit A et B deux polynômes de IK[X] . Montrer (A ◦ B)′ = (A′ ◦ B) B ′ . ⋆ 20.23 Soit P un polynôme non constant de IR[X] scindé sur IR . En utilisant notamment le théorème de Rolle, montrer que le polynôme P ′ est également scindé sur IR .
Factorisation et arithmétique des polynômes 20.24 Montrer que X 2 + X + 1 divise X 8 + X 4 + 1 . →759
20.25 Montrer que le polynôme B = (X 2 + 1)2 divise le polynôme : →759
A = 5 X 13 + 10 X 11 + 5 X 9 − 3 X 5 + X 4 − 6 X 3 + 2 X 2 − 3 X + 1. 20.26 Factoriser X 8 − 1 dans IR[X] . →760
20.27 Factoriser X 5 + 1 dans IR[X] . →760
20.28 Déterminer le PGCD de A = X 2 + X − 6 et B = X 2 − 4 . →762
783
Chapitre 20. Polynômes 20.29 1. Calculer le PGCD des deux polynômes : →763
A = X 5 + 3X 4 − 4X 3 − 12X 2 − 7X + 14
et
B = X 4 + 4X 3 − X 2 − 13X − 18.
2. Calculer des coefficients de Bézout pour les polynômes A et B . 20.30 Soit A et B des polynômes non nuls tels que : →767
α
où • • • •
A = λ P1α1 · · · Pk k
et
β
B = µ P1β1 · · · Pk k ,
k ∈ IN∗ ; λ et µ sont des scalaires non nuls ; P1 , . . . , Pk sont des polynômes irréductibles unitaires distincts ; α1 , . . . , αk , et β1 , . . . , βk des entiers naturels éventuellement nuls.
1. Montrer que A | B ⇐⇒ ∀i ∈ [[1, k]]
αi βi ;
k
2. Montrer que A ∧ B =
min(αi ,βi )
Pi
i=1
et A ∨ B =
3. Qu’en déduit-on sur (A ∧ B)(A ∨ B) ?
k
max(αi ,βi )
Pi
.
i=1
20.31 Soit (a1 , . . . , ap ) ∈ IKp . →767 Montrer que le polynôme A = (X − a1 ) · · · (X − ap ) est premier avec tout polynôme n’admettant aucun ai pour racine. ⋆ 20.32 Soit P un polynôme de IR[X] . Montrer que les deux propriétés suivantes sont équivalentes : (i) ∀x ∈ IR P (x) 0 ; (ii) ∃(A, B) ∈ IR[X]2
A2 + B 2 = P .
20.33 Montrer que les polynômes P et Q sont premiers entre eux si, et seulement si, P + Q et P Q le sont. 20.34 Soit A, B, C trois polynômes non nuls, avec C unitaire. Montrer (A C) ∧ (B C) = (A ∧ B) C
et
(A C) ∨ (B C) = (A ∨ B) C.
⋆ 20.35 Soit n et p deux entiers naturels non nuls tels que n p . 1. Effectuer la division euclidienne de X n −1 par X p −1 (on donnera l’expression du quotient et du reste). 2. Donner une condition nécessaire et suffisante pour que X n − 1 soit divisible par X p − 1 . 3. Calculer le PGCD de X n − 1 et de X p − 1 . 20.36 Étant donné des polynômes non constants A et B premiers entre eux, montrer qu’il existe un unique couple de polynômes (U0 , V0 ) tel que : A U0 + B V0 = 1
avec
deg U0 < deg B
et
deg V0 < deg A.
20.37 1. Soit P un polynôme de C[X] de degré n ∈ IN∗ et k ∈ IN∗ .
Montrer que si P a exactement k racines dans C , alors P ∧ P ′ est de degré n − k . 2. Le résultat précédent est-il vrai si P ∈ IR[X] et que k est le nombre de racines dans IR ?
3. Trouver tous les polynômes P de C[X] de degré n tel que P ′ divise P , P (1) = 0 et P (0) = 1 .
784
Solutions des exercices
Solutions des exercices 20.1 Le polynôme P est la différence de deux polynômes de IKn [X] , donc P ∈ IKn [X] .
Le coefficient en X n de chacun de ces deux polynômes vaut 1 , donc le coefficient en X n de P est nul et P est de degré au plus n − 1 .
Le coefficient en X n−1 de P est −2n−5n = −7n d’après la formule du binôme. Ce coefficient étant non nul, on obtient deg P = n − 1 .
20.2 Montrons le résultat par récurrence forte sur le degré de A . • Le résultat est immédiat si deg(A) < 0 , puisqu’alors deg(A ◦ P ) = −∞ .
• Soit n ∈ IN . Supposons deg(B ◦ P ) = deg(B) deg(P ) pour tout B de degré strictement inférieur à n . Si A est de degré n , on peut écrire A = α X n + B , avec : α �= 0
et
deg B < n.
On a alors A ◦ P = α P n + B ◦ P avec : deg(α P n ) = n deg(P )
et
deg(B ◦ P ) = deg(B) deg(P ) < n deg(P )
(on a supposé P non constant, donc deg(P ) > 0 ). Ainsi, deg(A ◦ P ) = deg(A) deg(P ) .
20.3 Après calcul, on obtient A = (2X 3 + 3) B + (X − 1) . √ √ √ √ On vérifie que B(1 + i 2) = 0 , et on en déduit que A(1 + i 2) = 1 + i 2 − 1 = i 2 .
20.4 Si A =
+∞
+∞
an X n , on a A (−X) =
n=0
(−1)n an X n .
n=0
Donc par unicité de l’écriture d’un polynôme, on obtient : • A(−X) = A(X) ⇐⇒ ∀n ∈ IN
• A(−X) = −A(X) ⇐⇒ ∀n ∈ IN
20.5 Notons n le degré de P où P =
(−1)n an = an ⇐⇒ ∀k ∈ IN n
a2k+1 = 0 ;
(−1) an = −an ⇐⇒ ∀k ∈ IN
+∞
a2k = 0 .
ak X k .
k=0
• Si n 0 , alors P est un polynôme constant et P (X + 1) − P (X) est nul donc de degré −∞ . • Sinon, an �= 0 et on a alors :
deg P (X + 1) − P (X) max deg(P (X + 1)), deg(P (X)) = deg P. Or, le coefficient en X n du polynôme P (X + 1) − P (X) est nul et le coefficient en X n−1 est nan + an−1 − an−1 = nan �= 0 . Cela prouve que P (X + 1) − P (X) est exactement de degré n − 1 .
785
Chapitre 20. Polynômes
20.6 D’après l’égalité P P (X) − X = P P (X) − P (X) + P (X) − X , il suffit de montrer
que P (X) − X divise P P (X) − P (X) . Notons P =
n
ak X k . On a alors :
k=0
P P (X) − P (X) =
n k=0
ak P (X)k − X k =
n k=1
Or, pour tout k ∈ [[1, n]] , on a P (X)k − X k = (P (X) − X)
k−1
X j P (x)k−1−j , ce qui montre
j=0
que ce polynôme est multiple de P (X) − X .
ak P (X)k − X k .
Ainsi, P P (X) − X est divisible par P (X) − X . 20.7 Notons P = (X − 2)2n + (X − 1)n − 1 . On vérifie par le calcul que P (1) = P (2) = 0 . La proposition 13 de la page 750 assure alors que P est divisible par (X −1)(X −2) = X 2 −3X +2 . π = 1 �= 0 , et néanmoins elle admet une infinité 2 de points d’annulation : les réels de la forme kπ pour tout k ∈ ZZ . Ce ne peut donc pas être une fonction polynomiale.
20.8 La fonction sin n’est pas nulle, puisque sin
20.9 1. Soit f et g deux fonctions polynomiales de I dans IK , associées à des polynômes P et Q . Supposons f g = 0 . Pour tout x ∈ I , on a f (x) g(x) = 0 , donc f (x) = 0 ou g(x) = 0 . Autrement dit :
I = x ∈ I : f (x) = 0 ∪ x ∈ I : g(x) = 0 .
Les deux ensembles intervenant dans l’union ne peuvent pas être tous les deux finis, sans quoi I le serait également. L’un des deux au moins est donc infini. Quitte à intervertir f et g , on va supposer que x ∈ I : f (x) = 0 est infini.
Cela entraîne que le polynôme P possède une infinité de racines : il est donc nul, et l’on a alors f = 0 . 2. Non. On peut par exemple prendre un élément x0 ∈ I et poser : f: I
−→
x
�−→
IR 1 0
et
si x = x0 sinon
g = 1 − f.
(2k+1)iπ
20.10 Notons P = X n + 1 et, pour tout k ∈ [[0, n − 1]] , αk = e n . • Chaque complexe αk est une racine n -ième de −1 , et donc une racine de P : (αk )n = e(2k+1)iπ = −1.
(2n − 1)π 3π π < < ··· < < 2π , ces n complexes sont distincts. n n n Comme deg P = n , il s’agit de toutes les racines de P . • D’après le corollaire 16 de la page 750, comme P est unitaire, on en déduit :
• Comme 0
0 . Alors : deg(B V0 ) = deg(1 − A U0 ) = deg(A U0 ), ce qui donne deg V0 = deg A + deg U0 − deg B < deg A .
793
Chapitre 20. Polynômes 20.37 1. En notant λ ∈ C∗ le coefficient dominant de P , α1 , . . . , αk ses racines et r1 , . . . , rk leurs ordres de multiplicité, on a : P (X) = λ(X − α1 )r1 · · · (X − αk )rk . On sait alors que α1 , . . . , αk sont racines de P ′ , d’ordres de multiplicité r1 −1, . . . , rk −1 . On peut alors écrire : P ′ (X) = (X − α1 )r1 −1 · · · (X − αk )rk −1 Q,
où Q est un polynôme n’admettant pas α1 , . . . , αk pour racines. Les polynômes Q et (X − α1 ) · · · (X − αk ) sont alors premiers entre eux, d’où : P ∧ P ′ = (X − α1 )r1 −1 · · · (X − αk )rk −1 ,
polynôme qui est de degré r1 + · · · rk − k = n − k .
2. Le résultat est faux dans ce cas. Par exemple, le polynôme X 2 + 1 n’a pas de racine réelle, mais (X 2 + 1) ∧ (2X) = 1 n’est pas de degré 2 . On peut d’ailleurs remarquer que le résultat serait faux pour tout polynôme sans racine réelle, car on doit avoir deg(P ∧ P ′ ) deg P ′ n − 1 . 3. Soit P un polynôme vérifiant les conditions de l’énoncé. On note D = P ∧ P ′ et k le nombre de racines distinctes de P , de telle sorte que deg D = n − k , d’après la première question.
Comme P ′ divise P , on doit donc avoir D associé à P ′ , donc deg D = n − 1 , ce qui entraîne k = 1 . Ainsi, P a une seule racine. L’hypothèse P (1) = 0 entraîne que cette unique racine est 1 donc, en notant λ le coefficient dominant de P , on a P = λ(X − 1)n . La condition P (0) = 1 impose λ = (−1)n .
Le polynôme (−1)n (X −1)n = (1−X)n convenant clairement, il est ainsi le seul à vérifier les conditions de l’énoncé.
794
Chapitre 21 : Fractions rationnelles I
Corps des fractions rationnelles . . . . . . . . . . . . Définition, règles de calcul . . . . . . . . . . . . . . . . Représentant irréductible d’une fraction rationnelle . Degré d’une fraction rationnelle . . . . . . . . . . . . Racines, pôles . . . . . . . . . . . . . . . . . . . . . . . II Décomposition en éléments simples . . . . . . . . . . 1 Partie entière . . . . . . . . . . . . . . . . . . . . . . . 2 Décomposition en éléments simples et parties polaires 3 Décomposition en éléments simples sur C . . . . . . . 4 Décomposition en éléments simples sur IR . . . . . . . 5 Méthodes pratiques de décomposition . . . . . . . . . III Primitives d’une fonction rationnelle . . . . . . . . . . 1 Cas des éléments simples de première espèce . . . . . 2 Cas des éléments simples de deuxième espèce . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3 4
. . . . . . . . . . . . . . . .
. . . . . . . . . . .
796 796 797 798 798 800 800 801 804 805 808 810 810 811 814 816
Fractions rationnelles
21
Dans tout ce chapitre, IK désigne IR ou C.
I
Corps des fractions rationnelles
1
Définition, règles de calcul
On admet que l’on peut définir le corps des fractions de l’anneau commutatif IK[X], c’est-à-dire un ensemble, noté IK(X), vérifiant les propriétés suivantes. • Tout élément F ∈ IK(X) s’écrit sous la forme : F =
P Q
avec
(P, Q) ∈ IK[X]2
et Q �= 0.
• Si P1 , Q1 , P2 et Q2 sont des polynômes avec Q1 et Q2 non nuls, alors : P1 P2 = ⇐⇒ P1 Q2 = P2 Q1 . Q1 Q2 • L’ensemble IK(X) contient IK[X], en identifiant tout polynôme P à la fraction P rationnelle · 1 • Muni des règles de calcul suivantes : P1 P2 P1 Q2 + P2 Q1 + = , Q1 Q2 Q1 Q2 P1 P2 P1 P2 ∗ × = , Q1 Q2 Q1 Q2 ∗
où P1 , Q1 , P2 et Q2 sont des polynômes tels que Q1 et Q2 soient non nuls, l’ensemble (IK(X), +, ×) est un corps commutatif, appelé corps des fractions rationnelles à coefficients dans IK ; les éléments de IK(X) sont appelés fractions rationnelles à coefficients dans IK .
I Corps des fractions rationnelles Remarques • En utilisant les règles mises en place ci-dessus, lorsque P , Q et R sont des polynômes avec Q et R non nuls, on a alors les propriétés suivantes : −1 P Q PR R = et = · QR Q Q R • Plus formellement, les propriétés ci-dessus reviennent à considérer la relation d’équivalence ∼ définie sur IK[X] × (IK[X] \ {0}) par : (P1 , Q1 ) ∼ (P2 , Q2 ) ⇔ P1 Q2 = P2 Q1 ,
et à vérifier que l’ensemble des classes de cette relation d’équivalence peut être muni de lois d’addition et de multiplication possédant les propriétés habituelles. P est Q un représentant de la fraction rationnelle F ; ce couple n’est pas unique. Les polynômes P et Q sont appelés numérateur et dénominateur, respectivement. Terminologie
2
Soit F ∈ IK(X). Un couple (P, Q) ∈ IK[X]2 tel que F =
Représentant irréductible d’une fraction rationnelle
Définition 1 • On appelle représentant irréductible d’une fraction rationnelle F tout représentant (P, Q) de F où P et Q sont premiers entre eux. • On appelle représentant irréductible unitaire d’une fraction rationnelle F tout représentant irréductible (P, Q) de F tel que Q soit un polynôme unitaire. Terminologie
On dit aussi que
P est une forme irréductible (unitaire) de F . Q
Proposition 1 • Toute fraction rationnelle admet une unique forme irréductible unitaire.
P1 la forme irréductible unitaire d’une fraction rationnelle F . Les repréQ1 sentants de F sont les couples (A P1 , A Q1 ), pour A ∈ IK[X] non nul.
• Soit Exo 21.1
Démonstration page 814 On peut trouver une forme irréductible en simplifiant numérateur et dénominateur par leur PGCD. L’unicité et le deuxième point de la proposition proviennent du théorème 56 de la page 767 (lemme de Gauss).
Principe de démonstration.
Remarques • Un polynôme P admet (P, 1) pour représentant irréductible unitaire. En parti0 est la forme irréductible unitaire de la fraction rationnelle nulle. culier, 1 • Avec les notations de la proposition, le polynôme A est un PGCD de A P1 et A Q1 , qui ne sont donc premiers entre eux que si A est constant (non nul). On en déduit que les représentants irréductibles de F sont les couples (λ P1 , λ Q1 ), avec λ ∈ IK∗ . 797
Chapitre 21. Fractions rationnelles
3
Degré d’une fraction rationnelle
Définition 2 Si F est une fraction rationnelle, la quantité deg P − deg Q ∈ ZZ ∪ {−∞} ne dépend pas du représentant (P, Q) choisi pour F . On l’appelle degré de F et on le note deg F . P1 , la proposition 1 de la page Q1 précédente montre que tout représentant de F est (A P1 , A Q1 ) , où A est un polynôme non nul. On a alors bien deg(A P1 ) − deg(A Q1 ) = deg P1 − deg Q1 , après simplification de deg A (qui est un entier, et pas −∞ ).
Démonstration.
Si la forme irréductible unitaire de F est
Remarques P , son degré en tant que fraction ra1 tionnelle est deg P . Donc la définition du degré sur IK(X) prolonge celle du degré défini sur IK[X].
• Un polynôme P étant égal à la fraction
• En particulier, on a deg 0 = −∞. Attention
Une fraction rationnelle peut avoir un degré positif sans être un polyX3 + 1 1 , de degré 2 . On a F = X 2 + · nôme. Considérons par exemple F = X X 1 , ce qui est absurde, Ainsi, si F était un polynôme, il en irait de même de F −X 2 = X 1 = −1 . car deg X Proposition 2 Étant donné deux fractions rationnelles F1 et F2 de IK(X), on a : • deg(F1 + F2 ) max(deg F1 , deg F2 ) ;
Exo 21.2
• deg(F1 F2 ) = deg F1 + deg F2 .
Principe de démonstration.
4
Démonstration page 814 On revient aux règles de calcul du degré pour les polynômes.
Racines, pôles
Définition 3 Soit F une fraction rationnelle non nulle de forme irréductible unitaire
P ; Q
• on appelle racine ou zéro de F toute racine de P ; l’ordre de multiplicité d’une telle racine est son ordre de multiplicité en tant que racine de P ; • on appelle pôle de F toute racine de Q ; l’ordre de multiplicité d’un tel pôle est son ordre de multiplicité en tant que racine de Q . 798
I Corps des fractions rationnelles Remarques • Un élément α de IK ne peut pas être à la fois racine et pôle d’une fraction raP est la forme irréductible unitaire de F , les égalitionnelle F . En effet, si Q tés P (α) = Q(α) = 0 entraîneraient que P et Q sont divisibles par X − α , ce qui contredit le fait qu’ils soient premiers entre eux. • Dans une remarque de la page 797, on a vu que les autres formes irréductibles λP , pour λ ∈ IK∗ . Comme deux polynômes associés ont les mêmes de F sont les λQ racines (avec les mêmes ordres de multiplicité), on peut en fait utiliser n’importe quelle forme irréductible de F dans la définition ci-dessus. Attention
Les racines et pôles d’une fraction rationnelle F ne se lisent pas facileP de F . ment sur une forme non irréductible Q X3 − 1 n’admet 1 ni comme racine ni comme pôle, car sa forme Par exemple, F = 2 X −1 X2 + X + 1 · irréductible unitaire est F = X +1 On peut simplement dire que les racines (respectivement les pôles) de F sont des racines de P (respectivement Q). Définition 4 (Évaluation en un point) Soit F une fraction rationnelle, de forme irréductible unitaire
P , dont on désigne Q
par A l’ensemble des pôles. • Pour α ∈ IK \ A, on définit l’élément de IK , noté F (α), par F (α) =
P (α) · Q(α)
• La fonction x �→ F (x) définie sur IK \ A est appelée fonction rationnelle associée à la fraction rationnelle F . Remarques P1 non nécessairement irréductible, et Q1 P1 (α) · si Q1 (α) �= 0 , alors α n’est pas pôle de F et l’on a F (α) = Q1 (α)
• Si F ∈ IK(X) s’écrit sous une forme F =
• Soit (F, G) ∈ IK(X)2 et (λ, µ) ∈ IK2 . Si α ∈ IK n’est pôle ni de F ni de G, alors α n’est pôle ni de λ F + µ G ni de F G, et l’on a : (λ F + µ G)(α) = λ F (α) + µ G(α)
et (F G)(α) = F (α) G(α).
De même qu’un polynôme est caractérisé par sa fonction polynomiale (cf. proposition 17 de la page 751), une fraction rationnelle est caractérisée par sa fonction rationnelle associée. 799
Chapitre 21. Fractions rationnelles Proposition 3 Soit (F, G) ∈ IK(X)2 et I une partie infinie de IK ne contenant aucun pôle de F ou de G. Si ∀x ∈ I F (x) = G(x), alors F = G. Démonstration.
En réduisant au même dénominateur la fraction F − G à partir de représentants irréductibles de F et G , on voit que F − G n’a pas de pôle dans I .
Si ∀x ∈ I F (x) = G(x) , le numérateur de F − G est un polynôme admettant tous les éléments de I comme racines. Le caractère infini de I montre alors que ce numérateur est nul, donc que F − G = 0 , ce qui donne F = G .
II 1
Exo 21.3
Décomposition en éléments simples Partie entière
Proposition 4 Toute fraction rationnelle F s’écrit, de façon unique, comme la somme d’un polynôme, appelé partie entière de F , et d’une fraction rationnelle de degré strictement négatif. Démonstration page 815
Principe de démonstration.
L’unicité se montre par considération des degrés, l’existence s’obtient en effectuant la division euclidienne du numérateur de F par son dénominateur.
Point méthode D’après la démonstration précédente, pour trouver la partie entière P d’une fraction rationnelle , il suffit de trouver le quotient de la division euclidienne Q du numérateur P par le dénominateur Q .
X5 , on effectue la division eucli+ X + 1)2 dienne de son numérateur par son dénominateur (X 2 + X + 1)2 = X 4 + 2X 3 + 3X 2 + 2X + 1 : Ex. 1. Pour déterminer la partie entière de F =
(X 2
X 5 = (X − 2)(X 2 + X + 1)2 + X 3 + 4X 2 + 3X + 2. La partie entière de F = X − 2 +
X 3 + 4X 2 + 3X + 2 est donc X − 2 . (X 2 + X + 1)2
Ex. 2. Si F est un polynôme, on a F = F + 0 et la fraction rationnelle nulle est bien de degré strictement négatif. Dans ce cas, la partie entière de F est F . P est une fraction rationnelle de degré nul, sous forme irréductible unitaire et Q P − λQ P =λ+ , avec deg(P − λQ) < deg Q . si P a pour coefficient dominant λ , alors Q Q Ex. 3. Si F =
On en déduit que la partie entière de F est le polynôme constant λ .
800
II Décomposition en éléments simples
2
Décomposition en éléments simples et parties polaires
On admet le résultat suivant. Toute la fin du chapitre est consacrée à mieux comprendre son énoncé, expliquer comment l’appliquer en pratique, et l’utiliser pour calculer des primitives de fonctions rationnelles. Théorème 5 A · B On écrit la décomposition en produit de facteurs irréductibles de B dans IK[X] : Soit F ∈ IK(X) s’écrivant sous forme irréductible unitaire F =
B=
n �
Qri i ,
i=1
où n ∈ IN, les polynômes Q1 , . . . , Qn sont des polynômes irréductibles, unitaires, deux à deux distincts et les entiers naturels r1 , . . . , rn sont non nuls. Alors, il existe un unique polynôme E et une unique famille de polynômes (Pi,j ) 1in tels que : 1jri
ri � P i,j F =E+ j Q i i=1 j=1 n �
et
deg Pi,j < deg Qi .
Cette écriture s’appelle la décomposition en éléments simples sur IK de la fraction rationnelle F . Remarques Pi,j • On voit facilement que chaque fraction est de degré strictement négatif, Qji ri n � � Pi,j donc leur somme également. Par unicité, on en déduit que le j j=1 Qi i=1 polynôme E est la partie entière de F .
• Si Qi est de la forme X − αi avec αi ∈ IK , alors les polynômes (Pi,j )1jri sont ri � Pi,j des constantes et l’on dit que est la partie polaire de F associée (X − αi )j j=1 au pôle αi .
• Dans le cas particulier où F est un polynôme, on a alors B = 1 =
0 �
i=1
Qri i en
conformité avec la convention prise pour les produits lorsque n = 0 ; la décomposition en éléments simples de F est alors F = F , c’est-à-dire que l’on a E = F et la famille des Pi,j est vide.
801
Chapitre 21. Fractions rationnelles Détermination de la partie polaire associée à un pôle simple Proposition 6 Soit F une fraction rationnelle admettant α pour pôle simple. On écrit F sous la forme F =
P P = , où Q0 (α) �= 0 . Q (X − α) Q0
La partie polaire associée au pôle α est alors : λ X −α
avec λ =
P (α) P (α) = ′ · Q0 (α) Q (α)
Démonstration. λ + F0 , où F0 est une X −α fraction rationnelle qui n’admet pas α pour pôle. Il s’agit de déterminer λ . P En multipliant notre égalité par X − α , on obtient = λ + (X − α) F0 , qui est une égalité Q0 entre fractions rationnelles n’admettant pas α comme pôle. En évaluant en α , on obtient P (α) l’égalité = λ. Q0 (α)
• D’après le théorème, on peut trouver λ ∈ IK tel que F =
• En dérivant la relation Q = (X − α)Q0 , on obtient Q′ = (X − α) Q′0 + Q0 , puis en évaluant cette égalité en α , on trouve la dernière relation.
Point méthode • La formule λ = ment.
Exo 21.4
P (α) est utilisée lorsque le dénominateur se factorise simpleQ0 (α)
• En revanche, on utilise λ = facile à dériver.
P (α) lorsque le dénominateur est développé, donc Q′ (α)
X2 + 5 · +X −2 On a X 2 + X − 2 = (X − 1)(X + 2) ; on en déduit que F admet deux pôles simples 1 et −2 , et que l’on peut trouver deux scalaires λ et µ tels que les parties polaires associées à ces deux µ λ et , respectivement. pôles soient X −1 X +2 6 • En appliquant la proposition 6, on obtient λ = = 2 , le dénominateur 3 étant obtenu au 3 choix en évaluant X + 2 ou (X 2 + X − 2)′ = 2X + 1 en 1 . La partie polaire associée à 1 2 · est donc X −1 −3 • De même, la partie polaire associée au pôle −2 est · X +2
Ex. 4. Considérons la fraction rationnelle F =
802
X2
II Décomposition en éléments simples Détermination de la partie polaire associée à un pôle double Proposition 7 Soit F une fraction rationnelle admettant α pour pôle double. On écrit F sous la forme F =
P où Q0 (α) �= 0 . (X − α)2 Q0
La partie polaire associée au pôle α est alors : λ2 P (α) λ1 + avec λ2 = 2 X − α (X − α) Q0 (α)
et
λ1 ∈ IK. Démonstration page 815
Principe de démonstration.
On applique la même méthode que pour les parties polaires associées à des pôles simples, en multipliant cette fois par (X − α)2 .
λ2 pour obtenir une fraction dont α (X − α)2 n’est pas pôle ou est pôle simple, ce qui ramène au cas précédent. Pour trouver λ1 , on peut alors retrancher
X5 + 1 · X(X − 1)2 • En appliquant la proposition 6 de la page précédente, on obtient que la partie polaire associée 1 · au pôle simple 0 est X • La proposition précédente montre que la partie polaire associée au pôle 1 λ2 λ1 + avec λ2 = 2 . On a alors : est X −1 (X − 1)2
Ex. 5. Considérons la fraction rationnelle F =
F−
X4 + X3 + X2 + X − 1 2 , = (X − 1)2 (X − 1) X
et on applique à nouveau la proposition 6 pour obtenir λ1 = 3 .
Remarque Cette technique se généralise facilement. Si α est pôle d’ordre n, alors P on écrit F = avec Q0 (α) �= 0 , et la partie polaire associée au pôle α (X − α)n Q0 est de la forme : n P (α) λp , avec λn = p (X − α) Q0 (α) p=1 comme on le voit en multipliant l’égalité F =
n p=1
λp + F0 par (X − α)n et en (X − α)p
évaluant en α . Cependant, appliquer cet argument pour obtenir de proche en proche les différents coefficients n’est en général pas très commode ; on verra à la section II.5 des manières d’accélérer le calcul. 803
Chapitre 21. Fractions rationnelles
3
Décomposition en éléments simples sur C
Dans cette section, on suppose IK = C . Tout polynôme non nul est scindé dans C ; en reprenant les notations du théorème 5 de la page 801, les facteurs Qi sont tous de la forme Qi = X − αi et les polynômes Pi,j sont alors des constantes. Le théorème prend alors la forme suivante. Théorème 8 Soit F ∈ C(X) dont les pôles sont les nombres complexes α1 , . . . , αn , deux à deux distincts et d’ordres de multiplicité respectifs r1 , . . . , rn . Alors, il existe un unique polynôme E ∈ C[X] et une unique famille de nombres complexes (λk,ℓ ) 1kn tels que : 1ℓrk
F =E+
Exo 21.5
r n k
k=1
ℓ=1
λk,ℓ (X − αk )ℓ
·
Autrement dit, toute fraction rationnelle de C(X) est la somme de sa partie entière et des parties polaires associées à chacun de ses pôles. Cette écriture s’appelle la décomposition en éléments simples sur C de F . X2 + 5 +X −2 est 1 . L’exemple 4 de la page 802 donne donc la décomposition en éléments simples : Ex. 6. Comme X 2 + 5 = X 2 + X − 2 + (−X + 7) , la partie entière de F =
X2
3 2 − · X −1 X +2
F =1+
X5 + 1 est X 2 + 2X + 3 . L’exemple 5 de la X(X − 1)2 page précédente donne donc la décomposition en éléments simples :
Ex. 7. De même, la partie entière de F =
F = X 2 + 2X + 3 +
2 3 1 + · + X X −1 (X − 1)2
La détermination de la partie polaire est parfois possible d’un point de vue plus théorique. L’exemple suivant est important et à connaître. P′ , où P est un polynôme P dont les racines complexes sont α1 , . . . , αn , d’ordres de multiplicité respectifs r1 , . . . , rn . Les
Ex. 8. Déterminons la décomposition en éléments simples de
hypothèses permettent d’écrire P = λ
n
(X − αk )rk avec λ ∈ C∗ . En utilisant la règle de
k=1
dérivée d’un produit, on obtient : ′
P =λ
n k=1
rk (X − αk )
rk −1
ℓ�=k
(X − αℓ )
rℓ
. n
La décomposition de
rk P′ P′ s’obtient alors directement en écrivant = · P P X − αk k=1
804
II Décomposition en éléments simples
4
Décomposition en éléments simples sur IR
Dans cette partie, on suppose IK = IR. Les polynômes irréductibles sont alors, d’une part, les polynômes de degré 1 et, d’autre part, les polynômes de degré 2 sans racine réelle. Les éléments simples réels sont donc aussi de deux types : • les éléments simples de première espèce dont les numérateurs sont des réels, et les dénominateurs des polynômes (nécessairement irréductibles) de degré 1 ; • les éléments simples de deuxième espèce dont les numérateurs sont des polynômes de degré au plus 1 , et les dénominateurs des polynômes irréductibles de degré 2 . Le théorème 5 de la page 801 prend alors la forme suivante. Théorème 9 A · On écrit la B décomposition en produit de facteurs irréductibles de B dans IR[X] : n m rk B= (X − αk ) (X 2 + pℓ X + qℓ )tℓ ,
Soit F ∈ IR(X) s’écrivant sous forme irréductible unitaire F =
k=1
ℓ=1
où
• les nombres α1 , . . . , αn sont les racines réelles distinctes deux à deux de B , d’ordres de multiplicité respectifs r1 , . . . , rn ; • X 2 + p1 X + q1 , . . . , X 2 + pm X + qm sont les facteurs irréductibles de degré 2 de B , et t1 , . . . , tm sont des entiers naturels non nuls. Alors, il existe un unique polynôme E réels (λk,u ) 1kn 1urk
tels que : F =E+
∈ IR[X], une unique famille de et une unique famille de couples de réels (µℓ,v , νℓ,v ) 1ℓm 1vtℓ
r n k k=1
λk,u (X − αk )u u=1
+
t m ℓ ℓ=1
v=1
µℓ,v X + νℓ,v (X 2 + pℓ X + qℓ )v
·
Cette écriture s’appelle la décomposition en éléments simples sur IR de la fraction rationnelle F ∈ IR(X). En pratique, on dispose de deux méthodes pour déterminer la décomposition en éléments simples sur IR d’une fraction rationnelle : on peut passer par la décomposition en éléments simples sur C, ou directement déterminer les termes de la décomposition du théorème précédent. En passant par la décomposition sur C Soit F ∈ IR(X). L’unicité de la décomposition en éléments simples montre que les termes non réels de la décomposition en éléments simples de F sur C peuvent être rassemblés en paires conjuguées. En faisant cette opération, on obtient la décomposition en éléments simples sur IR. 805
Chapitre 21. Fractions rationnelles 1 sur C puis IR . (X 2 + 1)(X 2 + X + 1) Le théorème 8 de la page 804 garantit l’existence de (λ, µ, ν, ξ) ∈ C4 tel que :
Ex. 9. Calculons la décomposition de F =
F =
λ ν µ ξ 1 = + + + · (X − i)(X + i)(X − j)(X − j 2 ) X −i X +i X −j X − j2
ν µ ξ λ + + + et comme F est dans IR(X) , on x−i x+i x−j x − j2 a F (x) = F (x), ce qui donne :
Soi x ∈ IR ; on a F (x) =
ν µ ξ λ ν µ ξ λ + + + + + · = + x−i x+i x−j x − j2 x+i x−i x − j2 x−j L’égalité ayant lieu pour tout x ∈ IR , par le caractère infini de IR et la proposition 3 de la page 800, on en déduit l’égalité : λ ν µ ξ λ ν µ ξ + + + + + ·, = + X −i X +i X −j X − j2 X +i X −i X − j2 X −j ce qui, par unicité de la décomposition en éléments simples, donne λ = ν et ξ = µ . Donc la décomposition est bien constituée de paires de termes conjugués : F =
µ λ µ λ + + + X −i X +i X −j X − j2
et il reste à déterminer λ et µ , c’est-à-dire les différentes parties polaires. • On a (X 2 + 1)(X 2 + X + 1) = (X − i) (X + i)(X 2 + X + 1) .
1 L’évaluation de (X + i)(X 2 + X + 1) en i valant 2i × i = −2 , on obtient λ = − · 2 • De même, l’évaluation de (X −j 2 )(X 2 +1) en j valant (j−j 2 )(j 2 +1) = −j(j−j 2 ) = 1−j 2 , 1 1−j · on obtient µ = = 1 − j2 3 On obtient ainsi la décomposition sur C : F =−
1 1−j 1 − j2 1 − + + · 2(X − i) 2(X + i) 3(X − j) 3(X − j 2 )
En regroupant les termes conjugués, on obtient après calcul la décomposition sur IR : F =−
Exo 21.6
X X +1 + 2 · X2 + 1 X +X +1
Remarque L’argument d’unicité de cet exemple montre plus généralement que si α ∈ C est un pôle complexe d’une fraction rationnelle réelle, les parties polaires associées à α et α sont conjuguées, c’est-à-dire que si la partie polaire associée à α r r λk λk , celle associée à · est α est (X − α)k (X − α)k k=1
806
k=1
II Décomposition en éléments simples Sans passer par la décomposition sur C Il est également possible de déterminer directement les éléments simples de deuxième espèce en généralisant la méthode vue plus haut pour les parties polaires. Ex. 10. Reprenons l’exemple précédent, et calculons la décomposition en éléments simples de F =
1 sur IR . Il existe (µ1 , µ2 , ν1 , ν2 ) ∈ IR4 tel que : (X 2 + 1)(X 2 + X + 1) F =
µ1 X + ν1 µ2 X + ν2 + 2 · X2 + 1 X +X +1
• En multipliant par X 2 + 1 , on obtient : 1 µ2 X + ν2 = µ1 X + ν1 + (X 2 + 1) 2 · X2 + X + 1 X +X +1 Ces fractions rationnelles n’ont pas i comme pôle, ce qui permet d’évaluer en i . On obtient 1 alors µ1 i + ν1 = = −i , d’où µ1 = −1 et ν1 = 0 puisque µ1 et ν1 sont réels. i • De même, en multipliant par X 2 + X + 1 , on obtient : 1 µ1 X + ν1 = µ2 X + ν2 + (X 2 + X + 1) , X2 + 1 X2 + 1 puis µ2 j + ν2 =
1 1 = = −j 2 = j + 1 en évaluant en j . j2 + 1 −j
Comme j n’est pas réel, l’égalité µ2 j + ν2 = j + 1 (avec µ2 et ν2 réels) entraîne µ2 = 1 et ν2 = 1 . En effet, on peut la réécrire sous la forme (µ2 − 1)j = 1 − ν2 , d’où µ2 = 1 par examen de la partie imaginaire, puis ν2 = 1 . On a ainsi obtenu : F =−
X X +1 + 2 · X2 + 1 X +X +1
P admet un + p X + q) Q facteur irréductible simple X 2 + p X + q au dénominateur, on peut écrire a priori la aX + b décomposition en éléments simples de F sous la forme F = E + · · · + 2 X +pX +q et multiplier cette égalité par X 2 + p X + q . Point méthode Lorsqu’une fraction rationnelle F =
Exo 21.7
(X 2
En évaluant en un nombre complexe ω vérifiant ω 2 + p ω + q = 0 , on obtient une P (ω) , avec a et b réels et ω non réel. On peut alors égalité de la forme a ω + b = Q(ω) P (ω) sous la forme a′ ω + b′ , avec a′ et b′ réels. Comme ω n’est pas réel, écrire Q(ω) on en déduit alors facilement a = a′ et b = b′ . 807
Chapitre 21. Fractions rationnelles
5
Méthodes pratiques de décomposition en éléments simples
Nous allons voir dans cette section des méthodes annexes de calcul qui permettent d’accélérer la détermination des coefficients apparaissant dans les décompositions en éléments simples. Exo 21.8
Utilisation des symétries Dans le cas d’une fraction rationnelle réelle F , on a déjà utilisé que la décomposition en éléments simples ne devait pas changer, par unicité, quand on remplaçait chaque terme par son conjugué. On peut également utiliser cet argument d’invariance dans le cas de fractions rationnelles F paires , c’est-à-dire telles que F (−x) = ±F (x), pour tout x ∈ IK qui n’est pas un pôle de F (et de même pour les fractions rationnelles impaires). 4 · La décomposition en facteurs irréductibles du dénomi(X 2 − 1)2 2 2 nateur est (X − 1) (X + 1) , ce qui donne naissance à (λ, µ, ν, ξ) ∈ IR4 tels que :
Ex. 11. Considérons F =
F =
µ ξ ν λ + + + · X −1 (X − 1)2 X +1 (X + 1)2
On constate alors que F est paire, c’est-à-dire que, pour tout x ∈ IR \ {−1, 1} , on a l’égalité F (−x) = F (x) , ce qui donne : −
µ ξ µ ξ λ ν λ ν + + + + − = + . x+1 (x + 1)2 x−1 (x − 1)2 x−1 (x − 1)2 x+1 (x + 1)2
On en déduit alors, par la proposition 3 de la page 800 : −
µ ξ µ ξ ν λ ν λ + + + + − = + , X +1 (X + 1)2 X −1 (X − 1)2 X −1 (X − 1)2 X +1 (X + 1)2
ce qui donne ν = −λ et ξ = µ , par unicité. La décomposition en éléments simples devient alors : F = •
µ µ λ λ + + − · X −1 (X − 1)2 X +1 (X + 1)2
La proposition 7 de la page 803 permet d’obtenir µ = 1 , donc la décomposition devient : F =
1 1 λ λ + + − · X −1 (X − 1)2 X +1 (X + 1)2
• En évaluant en 0 , par exemple, on obtient 4 = 2 − 2λ , d’où l’on tire λ = −1 . La décomposition en éléments simples est donc : F =−
808
1 1 1 1 + · + + X −1 (X − 1)2 X +1 (X + 1)2
II Décomposition en éléments simples Exo 21.9
Arguments de limite Soit F une fraction rationnelle de degré strictement négatif, dont on note A l’ensemble des pôles. On considère la fonction rationnelle associée f : IR \ A −→ C x �−→ F (x).
La fonction x �→ x− deg F f (x) a alors une limite finie en +∞ ; on peut ainsi trouver une relation entre les coefficients des termes de degré deg F intervenant dans la décomposition en éléments simples de F . Ex. 12. Calculons la décomposition en éléments simples de F = On peut trouver (λ1 , λ2 , µ) ∈ IR3 tel que : F =
X2 · (X − 1)2 (X − 2)
λ2 µ λ1 + · + X −1 (X − 1)2 X −2
• En utilisant la proposition 6 de la page 802 et la proposition 7 de la page 803, on obtient après calcul λ2 = −1 et µ = 4 . Il reste à déterminer λ1 . • On a : ∀x ∈ IR \ {1, 2}
x F (x) =
x x 4x x3 = λ1 − · + (x − 1)2 (x − 2) x−1 (x − 1)2 x−2
En passant à la limite quand x tend vers +∞ , on a par unicité de la limite 1 = λ1 − 0 + 4 , d’où λ1 = −3 .
Ainsi, on obtient la décomposition en éléments simples : F =
Exo 21.10
−3 4 −1 + + · X −1 (X − 1)2 X −2
Pour déterminer les derniers coefficients Lorsqu’il ne reste plus qu’un ou deux coefficients à déterminer, on peut substituer à X une ou deux valeurs simples, comme on l’a déjà fait à l’exemple 11 de la page ci-contre. Ex. 13. Déterminons la décomposition en éléments simples de F = utilisant une bonne partie des techniques déjà rencontrées. On peut trouver (λ, α1 , β1 , α2 , β2 ) ∈ IR5 tel que :
X +3 , en (X 2 + 1)2 (X − 1)
X +3 λ α1 X + β1 α2 X + β2 = + + · (X 2 + 1)2 (X − 1) X −1 X2 + 1 (X 2 + 1)2 • En calculant la partie polaire associée à 1 , on obtient λ = 1 .
• En multipliant par (X 2 + 1)2 et en évaluant les fractions rationnelles obtenues en i , on i+3 obtient α2 i + β2 = = −2i − 1 , d’où l’on tire α2 = −2 et β2 = −1 . i−1 • En observant que lim x F (x) = 0 , on obtient α1 + λ = 0 , d’où α1 = −1 . x→+∞
809
Chapitre 21. Fractions rationnelles À ce stade, on a obtenu l’égalité : X +3 1 −X + β1 2X + 1 · = + − (X 2 + 1)2 (X − 1) X −1 X2 + 1 (X 2 + 1)2 Il reste à déterminer β1 . En évaluant en 0 , il vient alors −3 = −1 + β1 − 1 , d’où β1 = −1 , ce qui fournit la décomposition en éléments simples : X +3 1 X +1 2X + 1 = − 2 − · (X 2 + 1)2 (X − 1) X −1 X +1 (X 2 + 1)2
Remarque Cette méthode est en fait applicable dans tous les cas, mais elle fournit un système linéaire à résoudre qui aura autant d’équations que l’on aura effectué d’évaluations. Dans un calcul à la main, on l’utilise donc en général une fois les autres techniques épuisées.
III
Primitives d’une fonction rationnelle
Une fonction rationnelle est continue sur tout intervalle de son domaine de définition ; elle admet alors sur tout intervalle de ce type des primitives. Pour en déterminer une, on peut décomposer la fonction rationnelle en éléments simples puis trouver une primitive de chacun de ces éléments.
1
Cas des éléments simples de première espèce
Les éléments simples de première espèce possèdent des primitives élémentaires : 1 sur tout • si a ∈ IR, la fonction x �→ ln|x − a| est une primitive de x �→ x−a intervalle de IR \ {a} ; Exo 21.16
1 −1 1 (x − a)1−n = est 1−n (n − 1) (x − a)n−1 1 sur tout intervalle de IR \ {a} . = (x − a)n
• si a ∈ IR et n 2 , la fonction x �→ une primitive de x �→ (x − a)−n
Ex. 14. Trouvons une primitive de la fonction f : x �→ ne contenant pas −1 , 1 et 2 . Après calcul de la décomposition en éléments simples de
∀x ∈ I
f (x) =
1 sur un intervalle I (x2 − 1)(x − 2)2 1 , on obtient : (X 2 − 1)(X − 2)2
1 1 1 4 − + · − 2(x − 1) 18(x + 1) 3(x − 2)2 9(x − 2)
Une primitive de f est alors donnée par : x �→
810
ln |x + 1| 4 ln |x − 2| ln |x − 1| 1 − − − · 2 18 3(x − 2) 9
III Primitives d’une fonction rationnelle Remarques • On peut ainsi trouver des primitives à toutes les fractions rationnelles réelles à dénominateur scindé. • Il est parfois possible de trouver des primitives à une fonction rationnelle sans passer par une décomposition en éléments simples. Par exemple, dans tout interx2 valle ne contenant pas 1 , une primitive de x �→ 3 est simplement donnée x −1 1 par x �→ ln x3 − 1 . 3 • Dans le cas de fractions rationnelles complexes, on se ramène en fait aux méthodes de la section suivante, grâce à des égalités comme : 1 x+1−i x+1−i ∀x ∈ IR = = · x+1+i (x + 1 + i)(x + 1 − i) (x + 1)2 + 1
2
Cas des éléments simples de deuxième espèce
Un certain nombre d’éléments simples de deuxième espèce possèdent des primitives élémentaires : 1 • une primitive de x �→ 2 est la fonction Arctan ; on a vu à la page 256 que l’on x +1 peut se ramener à ce cas pour trouver des primitives à toute fonction rationnelle 1 dont le dénominateur est irréductible ; de la forme x �→ 2 x + bx + c αx + β • parmi toutes les fonctions x �→ 2 , on sait déjà trouver une primitive à x + bx + c 2x + b la fonction x �→ 2 , à savoir x �→ ln x2 + bx + c ; x + bx + c u′ 2x + b est de la forme , • de même, pour tout n 2 , la fonction x �→ 2 (x + bx + c)n un 1 1 donc possède pour primitive x �→ − · 2 n − 1 (x + bx + c)n−1 Exo 21.17 Exo 21.18
Point méthode Soit (α, β) ∈ IR2 et (b, c) ∈ IR2 vérifiant b2 − 4c < 0 . Pour trouver αx + β : une primitive sur IR à la fonction f : x �→ 2 x + bx + c µ α 2x + b + ; 2 x2 + bx + c x2 + bx + c α • on reconnaît dans le premier terme la dérivée de x �→ ln(x2 + bx + c) ; 2 • on utilise la mise sous forme canonique pour mettre le deuxième terme sous la forme : ν x �→ ; 2 (mx + p) + 1 • on l’écrit sous la forme f (x) =
• on reconnaît dans cette dernière fonction la dérivée de x �→ Arctan(mx + p), à une constante multiplicative près, que l’on détermine. 811
Chapitre 21. Fractions rationnelles
Ex. 15. Commençons par un exemple où les calculs sont relativement simples : déterminons une x3 primitive de f : x �→ 2 sur IR . x + 2x + 2 • On effectue la division euclidienne X 3 = (X 2 + 2X + 2)(X − 2) + 2X + 4 , ce qui permet 2x + 4 · de réécrire f : x �→ x − 2 + 2 x + 2x + 2 • On cherche alors à se débarrasser des termes en x au numérateur à l’aide 2x + 2 de x �→ 2 , qui est la dérivée de x �→ ln(x2 + 2x + 2) . Cela donne une nouvelle x + 2x + 2 écriture de f (qui n’est pas la décomposition en éléments simples de la fraction rationnelle correspondante) : f : x �→ x − 2 +
2 2x + 2 + 2 · x2 + 2x + 2 x + 2x + 2
• Il reste simplement à utiliser la fonction Arctan pour trouver une primitive du dernier terme. La mise sous forme canonique donne X 2 + 2X + 2 = (X + 1)2 + 1 , donc on obtient enfin : f : x �→ x − 2 +
2 2x + 2 + , x2 + 2x + 2 (x + 1)2 + 1
dont une primitive est alors : f : x �→
x2 − 2x + ln(x2 + 2x + 2) + 2 Arctan(x + 1). 2
Ex. 16. Déterminons une primitive de f : x �→
1 sur ]1, +∞[ . x3 − 1
• On a X 3 − 1 = (X − 1)(X 2 + X + 1) , donc la décomposition en éléments simples est : 1 λ αX + β = + 2 X3 − 1 X −1 X +X +1
avec
(λ, α, β) ∈ IR3 .
En appliquant les méthodes usuelles : ∗ la partie polaire associée à 1 donne facilement λ =
1 ; 3
∗ la considération de la limite en +∞ de x f (x) donne λ + α = 0 , d’où α = −
2 ∗ enfin, en évaluant en 0 , on obtient −1 = −λ + β , d’où β = λ − 1 = − · 3 1 1 1 x+2 On a donc f : x �→ − · 3x−1 3 x2 + x + 1 1 3 • Grâce à l’écriture X + 2 = (2X + 1) + , on a : 2 2 f : x �→
1 2x + 1 1 1 1 1 − − · 3x−1 6 x2 + x + 1 2 x2 + x + 1
Les deux premiers termes ont pour primitives x �→
812
1 ; 3
1 1 ln(x − 1) et x �→ − ln(x2 + x + 1) . 3 6
III Primitives d’une fonction rationnelle
• La mise sous forme canonique donne X 2 +X +1 = X + 1 = x2 + x + 1
1 2
2
1 1 1 4 4 , = = 3 4 3 2x+1 2 1 2 3 1 2 √ + 1 x+ + x+ +1 3 2 4 3 2
2 1 est x �→ √ Arctan donc une primitive de x �→ 2 x +x+1 3 Une primitive de f sur ]1, +∞[ est alors : x �→
3 + . Ainsi, pour tout x ∈ IR : 4
2x + 1 √ 3
1 1 1 ln(x − 1) − ln(x2 + x + 1) − √ Arctan 3 6 3
.
2x + 1 √ 3
.
Remarques • La liste précédente possède une lacune : elle ne donne pas de primitive aux éléments 1 simples de la forme x �→ , avec n 2 . Pour trouver une telle (x2 + bx + c)n primitive, on peut fixer x ∈ IR et trouver une relation de récurrence vérifiée par la x dt suite d’intégrales , comme cela a été fait à l’exercice 7.10 2 n 0 (t + bt + c) n1 dans le cas b = 0 et c = 1 . Exo 21.19
• La méthode vue ici permet également de trouver des primitives aux fonctions de 1 , où α ∈ C \ IR, en passant par la quantité conjuguée. la forme x �→ x−α Par exemple, pour tout x ∈ IR, on a : x+i x+i 1 2x 1 1 = = 2 = +i 2 , 2 x−i (x + i)(x − i) x +1 2x +1 x +1
donc une primitive de x �→ Exo 21.20 Exo 21.21
1 1 est x �→ ln(x2 + 1) + i Arctan(x). x−i 2
Remarque La décomposition en éléments simples peut également être utilisée pour calculer rapidement les dérivées successives d’une fonction rationnelle. x x = · x2 − 3x + 2 (x − 1)(x − 2) 1 , qui L’idée est de se ramener au calcul de la dérivée d’ordre n de x �→ x−α n (−1) n! est x �→ · La décomposition en éléments simples est : (x − α)n+1
Ex. 17. Soit n ∈ IN . Calculons la dérivée d’ordre n de f : x �→
f : x �→
2 1 − x−2 x−1
donc
f (n) : x �→ (−1)n n!
1 2 − (x − 2)n+1 (x − 1)n+1
.
813
Chapitre 21. Fractions rationnelles
Démonstrations Proposition 1
On va procéder en trois étapes. P une fraction rationnelle. On a donc Q �= 0 , ce qui permet de Existence. Soit F = Q considérer le PGCD D = P ∧ Q . On peut alors trouver deux polynômes P0 et Q0 tels que P = D P0 et Q = D Q0 . D’après la proposition 47 de la page 764, ces deux polynômes sont premiers entre eux. Comme D est unitaire, le coefficient dominant de Q est égal à celui de Q0 . Notons-le λ et posons P1 = λ−1 P0 et Q1 = λ−1 Q0 . Puisque ces polynômes sont associés à P0 et Q0 , respectivement, ils sont encore premiers entre eux. Par construction, Q1 est unitaire. λ D P1 P P1 P1 = On a alors F = = , donc est une forme irréductible unitaire de F . Q λ D Q1 Q1 Q1 P2 Deuxième point. Soit P2 et Q2 deux polynômes, avec Q2 non nul, tels que F = . On Q2 a donc P1 Q2 = P2 Q1 . Ainsi, Q1 divise P1 Q2 , tout en étant premier avec P1 . D’après le lemme de Gauss, Q1 divise Q2 , et l’on peut trouver A ∈ IK[X] tel que Q2 = A Q1 . On a alors P2 Q1 = P1 Q2 = A P1 Q1 , donc Q1 (P2 − A P1 ) = 0 . Comme Q1 �= 0 , on en déduit que P2 = A P1 par intégrité de IK[X] .
On a donc montré que (P2 , Q2 ) était de la forme (A P1 , A Q1 ) , pour un certain polynôme A �= 0 . La réciproque étant claire, cela montre le deuxième point de la proposition. Unicité. Soit (P2 , Q2 ) un représentant irréductible unitaire de F . D’après le point précédent, on peut trouver un polynôme A non nul tel que P2 = A P1 et Q2 = A Q1 . Puisque A divise à la fois P2 et Q2 et qu’ils sont premiers entre eux, A est constant non nul. Comme Q1 et Q2 sont unitaires, on a A = 1 . On en déduit (P2 , Q2 ) = (P1 , Q1 ) , ce qui montre l’unicité. Proposition 2 •
Posons F1 =
On a alors F1 + F2 =
P2 P1 et F2 = · Q1 Q2 P1 Q2 + P2 Q1 , ce qui donne : Q1 Q2
deg(F1 + F2 ) = deg(P1 Q2 + P2 Q1 ) − deg(Q1 Q2 ). Supposons, par exemple, deg F1 deg F2 et montrons deg(F1 + F2 ) deg F1 . On a : deg P1 − deg Q1 deg P2 − deg Q2 ,
et, puisque deg Q1 et deg Q2 sont des entiers (car Q1 et Q2 sont non nuls) : deg(P1 Q2 ) = deg P1 + deg Q2 deg P2 + deg Q1 = deg(P2 Q1 ). Les résultats sur le degré d’une somme de polynômes impliquent :
deg(P1 Q2 + P2 Q1 ) max deg(P1 Q2 ), deg(P2 Q1 ) deg(P1 Q2 ), ce qui donne :
deg(F1 + F2 ) = deg(P1 Q2 + P2 Q1 ) − deg(Q1 Q2 ) deg(P1 Q2 ) − deg(Q1 Q2 ) = deg P1 − deg Q1 = deg F1 . •
On a F1 F2 =
P1 P2 , ce qui donne : Q1 Q2
deg(F1 F2 ) = deg(P1 P2 ) − deg(Q1 Q2 ) = deg P1 + deg P2 − deg Q1 − deg Q2 = deg F1 + deg F2 .
814
Démonstrations Proposition 4 Unicité. Supposons que F = E1 + F1 = E2 + F2 , avec (E1 , E2 ) ∈ IK[X]2 et (F1 , F2 ) ∈ IK(X)2 tels que deg F1 < 0 et deg F2 < 0 . Alors E1 − E2 est un polynôme, et comme il est égal à F2 − F1 , son degré est strictement négatif. Donc E1 − E2 = 0 , c’est-à-dire E1 = E2 et par suite F1 = F2 . P avec Q �= 0 . Si l’on appelle E le quotient et R le reste de la division Existence. Soit F = Q R euclidienne de P par Q , on obtient F = E + , avec deg R < deg Q , ce qui constitue Q l’écriture cherchée. Proposition 7
D’après le théorème 5 de la page 801, on peut trouver (λ1 , λ2 ) ∈ IK2 tel que : F =
λ2 λ1 + + F0 , (X − α) (X − α)2
où F0 est une fraction rationnelle qui n’admet pas α comme pôle. Déterminons λ2 . En multipliant notre égalité par (X − α)2 , on obtient : P = λ1 (X − α) + λ2 + (X − α)2 F0 . Q0 Les fractions rationnelles intervenant maintenant n’ont plus α comme pôle. En évaluant en α , P (α) · on obtient λ2 = Q0 (α)
815
Chapitre 21. Fractions rationnelles
S’entraîner et approfondir Généralités 21.1 Les fractions rationnelles suivantes sont-elles irréductibles ? Si ce n’est pas le cas, donner la →797 forme irréductible unitaire. 1.
F1 =
X2 − X − 2 ; X 3 − 7X + 6
2.
F2 =
X 3 + 2X 2 − 5X − 6 · X 2 + X − 20
21.2 Montrer que, si deg F1 �= deg F2 , on a deg(F1 + F2 ) = max(deg F1 , deg F2 ) . →798
Décompositions en éléments simples 21.3 Déterminer la partie entière de F1 = →800
21.4 Déterminer les pôles de →802
X3
X6 − 2 X4 + 1 et F2 = · 2 + X − 2X + 1 X −i
1 , puis les parties polaires associées. X5 − 1
21.5 Déterminer la décomposition en éléments simples sur →804 X5 · nelle F = 5 X −1
C
de la fraction ration-
21.6 Déterminer la décomposition en éléments simples des fractions rationnelles suivantes, sur C →806 puis sur IR . • F1 =
X2 + X + 1 ; + X2 + X + 1
• F2 =
X3
2 − 3X · (X 2 − X + 1)(X 2 + 1)
21.7 Déterminer la décomposition en éléments simples des fractions rationnelles suivantes sur IR →807 (sans passer par la décomposition sur C ). • F1 = 21.8 Soit F = →808
X2 + X + 1 ; X3 + X2 + X + 1
• F2 =
2 − 3X · (X 2 − X + 1)(X 2 + 1)
1 ∈ IR(X) et ω = eiπ/4 . X4 + 1
λ λ λ λ − + − · X −ω X +ω X −ω X +ω 2. Décomposer F en éléments simples, sur C puis sur IR . 1. Montrer qu’il existe λ ∈ C tel que F =
21.9 Soit la fraction rationnelle F = →809
1. Montrer que : F =
4X 3 · (X 2 − 1)2
λ µ λ µ + + − X −1 X +1 (X − 1)2 (X + 1)2
2. Déterminer les valeurs de λ et µ .
816
avec
(λ, µ) ∈ IR2 .
Exercices 21.10 Soit F = →809
X4 + 1 · (X + 1)2 (X 2 + 1)
1. Montrer que sa décomposition en éléments simples sur C est : F =1+
ν ν λ µ + + + (X + 1)2 X +1 X −i X +i
avec
(λ, µ, ν) ∈ C3 .
2. Calculer ν et λ . 3. En déduire µ à l’aide d’une évaluation. 4. Quelle est la décomposition en éléments simples de F sur IR ? 21.11 Décomposer en éléments simples sur C[X] les fractions rationnelles suivantes : 1. F = 2. F =
(X 2
10X 3 ; + 1)(X 2 − 4)
3. F =
X4 + 1 ; + X2 + 1
4. F =
X4
X3 − 1 ; (X − 1)(X − 2)(X − 3) (X 2
X2 · + X + 1)2
21.12 Décomposer en éléments simples sur IR[X] les fractions rationnelles suivantes : 1. F1 =
X4 + 1 ; X4 + X2 + 1
2. F2 =
X2 · (X 2 + X + 1)2
21.13 Soit n ∈ IN∗ . Décomposer en éléments simples sur C[X] les fractions rationnelles suivantes : 1.
1 ; −1
2.
Xn
X n−1 ; Xn − 1
3.
1 · (X − 1)(X n − 1)
⋆ 21.14 Soit n ∈ IN . Décomposer en éléments simples la fraction rationnelle suivante : F (X) =
⋆ 21.15 Réduire sous la forme
1! n! 1 + + ··· + · X X(X + 1) X(X + 1) · · · (X + n)
n P (X) ωi2 , la fraction rationnelle , où les ωi sont les racines Q(X) X − ωi i=1
n -ièmes de l’unité ( n 2 ).
Applications de la décomposition en éléments simples 21.16 Calculer →810
1
3
x−1 dx . x2 + 2x + 1
21.17 Déterminer une primitive de f : x �→ →811
21.18 Soit a ∈ IR . Calculer →811
0
a
1 sur ]−1, 1[ . 1 − x4
x dx . x2 − x + 1
817
Chapitre 21. Fractions rationnelles 21.19 Calculer une primitive de la fonction f : x �→ →813
5 · x2 + x + 1 + i
21.20 Soit (a, b) ∈ IR2 . Pour tout n ∈ IN , calculer la dérivée d’ordre n de f : x �→ →813
1 · (x − a)(x − b)
21.21 Pour tout n ∈ IN∗ , calculer la dérivée d’ordre n de la fonction Arctan . →813 Indication. On pourra décomposer en éléments simples sa dérivée et se contenter d’une expression pour la dérivée d’ordre n faisant intervenir des nombres complexes. 21.22 Calculer les sommes suivantes, après avoir justifié leurs existences : 1.
+∞ k=1
3 ; k(k + 3)
2.
+∞
2 · k3 − k
1
8 dx ; (x + 1)3 (x2 + 1)
1
dx . (x + 2)(x2 + 2x + 5)
k=2
21.23 Calculer : 1.
1
0
2.
1
2
x4 dx ; 3 x − 3x − 2
3.
dx ; x(x2 + 1)
4.
0
−1
⋆ 21.24 Soit P un polynôme de IR[X] de degré n ∈ IN∗ possédant n racines simples réelles : ′
a1 < a2 < · · · < an−1 < an .
On sait que P a n − 1 racines réelles b1 , b2 , . . . , bn−1 vérifiant : ∀i ∈ [[1, n − 1]]
ai < bi < ai+1
(voir l’exercice 11.8 de la page 455).
1. En calculant de deux façons la décomposition en éléments simples de n−1
∀i ∈ [[1, n]]
n
j=1
(ai − bj ) =
k∈[[1,n]] k�=i
P′ , montrer : P
(ai − ak ).
2. En déduire : ∀i ∈ [[1, n − 1]]
818
ai +
ai+1 − ai ai+1 − ai bi ai+1 − · n n
Solutions des exercices
Solutions des exercices 21.1 1. Numérateur et dénominateur admettent 2 pour racine, donc sont divisibles par X − 2 : la fraction rationnelle n’est pas irréductible. Après simplification, la forme irréductible X +1 unitaire de F1 est · (X + 3)(X − 1) 2. La fraction F2 est sous forme irréductible unitaire, puisque : X 3 + 2X 2 − 5X − 6 = (X − 2)(X + 3)(X + 1)
et
X 2 + X − 20 = (X − 4)(X + 5)
sont premiers entre eux (car ils n’ont pas de racine complexe commune) et que le dénominateur est unitaire. Remarque On pouvait également montrer que X 3 +2X 2 −5X −6 et X 2 +X −20 étaient premiers entre eux, sans factorisation, en calculant leur PGCD à l’aide de l’algorithme d’Euclide. 21.2 Notons F1 = P1 /Q1 et F2 = P2 /Q2 , et supposons, par exemple, deg F1 > deg F2 c’est-àdire deg P1 − deg Q1 > deg P2 − deg Q2 . Cela donne : deg(P1 Q2 ) = deg P1 + deg Q2 > deg P2 + deg Q1 = deg(P2 Q1 )
et donc deg(P1 Q2 + P2 Q1 ) = deg(P1 Q2 ) . Or : deg(F1 + F2 ) = deg
P1 Q2 + P2 Q1 Q1 Q2
= deg(P1 Q2 + P2 Q1 ) − deg(Q1 Q2 ),
donc deg(F1 +F2 ) = deg(P1 Q2 )−deg(Q1 Q2 ) = deg
P1 Q2 = deg F1 ce qui donne le résultat Q1 Q2
puisque deg F1 = max(deg F1 , deg F2 ) . 21.3 • En effectuant la division euclidienne, on obtient :
X 6 − 2 = (X 3 + X 2 − 2X + 1)(X 3 − X 2 + 3X − 6) + 13X 2 − 15X + 4,
donc la partie entière de F1 est X 3 − X 2 + 3X − 6 . • Soit en effectuant la division euclidienne, soit en tâtonnant : X4 − 1 2 X4 + 1 = + X −i X −i X −i
(X − 1)(X + 1)(X − i)(X + i) 2 + X −i X −i 2 · = (X − 1)(X + 1)(X + i) + X −i =
La partie entière de F2 est donc (X −1)(X +1)(X +i) = X 3 +iX 2 −X −i , puisque est de degré −1 .
2 X −i
P avec P = 1 et Q = X 5 − 1 . Si ω est un pôle de F , c’est-à-dire une racine Q λ cinquième de l’unité, alors la partie polaire associée à ω est avec : X −ω
21.4 On écrit F =
λ=
P (ω) 1 ω ω = = = · Q′ (ω) 5ω 4 5ω 5 5
819
Chapitre 21. Fractions rationnelles 1 , donc sa partie entière est 1 . X5 − 1 L’exercice 21.4 de la page 816 a montré que la partie polaire associée à un pôle ω ω · Ces pôles étant les racines cinquièmes de l’unité : était 5(X − ω)
21.5 On a F = 1 +
1,
ω1 = e2iπ/5 ,
ω2 = e4iπ/5 = ω12 ,
ω1
et
ω2 = ω1 2 ,
on obtient la décomposition en éléments simples : F =1+
1 ω1 ω12 ω1 ω1 2 + + + + · 2 5(X − 1) 5(X − ω1 ) 5(X − ω1 ) 5(X − ω1 ) 5(X − ω1 2 )
21.6 • On a la factorisation X 3 + X 2 + X + 1 = (X + 1)(X 2 + 1) = (X + 1)(X − i)(X + i) , d’où l’existence de (λ, µ, ν) ∈ C3 tel que : F1 =
µ ν λ + + · X +1 X −i X +i
La fraction F1 étant réelle, on a par conjugaison :
µ ν λ µ ν λ + + = + + x+1 x−i x+i x+1 x+i x−i
∀x ∈ IR \ {−1}
µ ν λ µ ν λ + + = + + · X +1 X −i X +i X +1 X +i X −i Par unicité de la décomposition en éléments simples, on en déduit que λ est réel, et que µ et ν sont conjugués.
ce qui prouve l’égalité de fractions
(−1)2 + (−1) + 1 1 = · (−1)2 + 1 2 1−i i2 + i + 1 = , ∗ La partie polaire associée au pôle simple i est µ = (i + 1)(i + i) 4 1+i · d’où ν = 4 On obtient ainsi la décomposition de F1 sur C : ∗ La partie polaire associée au pôle simple −1 est λ =
F1 =
1 1−i 1 1+i 1 + + · 2(X + 1) 4 X −i 4 X +i
En rassemblant les éléments simples conjugués, on obtient la décomposition de F1 sur IR : F1 =
X +1 1 + · 2(X + 1) 2(X 2 + 1)
π
, de telle sorte que X 2 − X + 1 = (X − α)(X − α) . Comme dans 3 le cas de F1 , on a alors l’existence de (λ, µ) ∈ C2 tel que :
• Notons α = exp i
F2 =
µ λ µ λ + + + · X −i X +i X −α X −α
3 2 − 3i = 1 − i. (1 − i + i2 ) 2i 2 2 − 3α 2 ∗ La partie polaire associée au pôle simple α est µ = = −1 + √ i . (α − α)(α2 + 1) 3
∗ La partie polaire associée au pôle simple i est λ =
820
Solutions des exercices On obtient ainsi la décomposition de F2 sur C :
F2 = 1 −
1 1 3 3 i + 1+ i + 2 X −i 2 X +i
2 −1 + √ i 3
1 − X −α
2 1+ √ i 3
1 · X −α
En rassemblant les éléments simples conjugués, on obtient la décomposition de F2 sur IR : F2 =
2X + 1 2X + 3 − 2 · X2 + 1 X −X +1
21.7 • On a la factorisation X 3 +X 2 +X +1 = (X +1)(X 2 +1) , d’où l’existence de (λ, µ, ν) ∈ IR3 tel que : F1 =
µX + ν λ + 2 · X +1 X +1
(−1)2 + (−1) + 1 1 = · (−1)2 + 1 2 2 + X + 1 X λ = (X 2 + X + 1) + µX + ν , ∗ En multipliant par X 2 + 1 , on obtient X +1 X +1 i 1 i 1 i = µi+ν en évaluant en i . Comme = + , on en déduit λ = µ = · puis i+1 i+1 2 2 2 On a donc : 1 X +1 F1 = + · 2(X + 1) 2(X 2 + 1) ∗ La partie polaire associée au pôle simple −1 est λ =
• On a l’existence de (λ, µ, ν, ξ) ∈ IR4 tel que : F1 =
νX + ξ λX + µ + 2 · X2 + 1 X −X +1
∗ En multipliant par X 2 + 1 puis en évaluant en i , on obtient la rela2 − 3i tion λ i + µ = 2 = 3 + 2i , d’où λ = 2 et µ = 3 . i −i+1 π ∗ En multipliant par X 2 − X + 1 puis en évaluant en α = exp i , on obtient : 3 2 − 3α 2 − 3α να + ξ = 2 = = 2α5 − 3 = −2α2 − 3 = −2(α − 1) − 3 = −2α − 1. α +1 α On a donc (ν +2)α = −ξ −1 , ce qui donne ν = −2 en examinant la partie imaginaire, puis ξ = −1 . Ainsi, la décomposition en éléments simples de F2 sur IR est : F2 =
2X + 1 2X + 3 − 2 · X2 + 1 X −X +1
21.8 1. On remarque que X 4 + 1 = (X − ω)(X + ω)(X − ω)(X + ω) .
Comme F est une fraction rationnelle réelle, il existe (λ, µ) ∈ C2 tels que : F =
µ λ µ λ + + + · X −ω X −ω X +ω X +ω
On constate par ailleurs que F (x) = F (−x) , pour tout x ∈ IR , ce qui donne, par utilisation de la proposition 3 de la page 800 : λ µ λ µ λ µ λ µ + + + =− − − − , X −ω X −ω X +ω X +ω X +ω X +ω X −ω X −ω d’où l’on tire λ = −µ par unicité. Cela montre que F a la forme voulue.
821
Chapitre 21. Fractions rationnelles 2. On peut maintenant déterminer λ , par exemple en calculant la partie polaire associée au pôle ω . On a : λ=
1 ω 1 =− · = (X 4 + 1)′ (ω) 4ω 3 4
On en déduit que la décomposition en éléments simples de F sur C est : 1 4
F =
ω ω ω ω − + − X +ω X −ω X +ω X −ω
.
En regroupant les termes conjugués, on trouve ainsi la décomposition en éléments simples sur IR : 1 F = 4
−(ω + ω)X + 2ω ω (ω + ω)X + 2ω ω + (X + ω)(X + ω) (X − ω)(X − ω) √ √ 1 2X + 2 − 2X + 2 √ √ = . + 4 X 2 + 2X + 1 X 2 − 2X + 1
21.9 1. La fraction rationnelle F est de degré strictement négatif, donc sa partie entière est nulle. Ses pôles sont 1 et −1 , d’ordre de multiplicité 2 . Le dénominateur de F étant scindé dans IR , on en déduit l’existence de (λ, µ, ν, ξ) ∈ IR4 tels que : F =
ν µ λ ξ + + + · X −1 X +1 (X − 1)2 (X + 1)2
Puisque F est impaire, on a : ∀x ∈ IR \ {−1, 1}
F (x) = −F (−x) =
ν µ ξ λ + − − · x+1 x−1 (x + 1)2 (x − 1)2
Ave l’argument habituel d’identification de fractions rationnelles par leurs fonctions rationnelles associées, on obtient alors, par unicité de la décomposition en éléments simples, ν = λ et ξ = −µ , ce qui conclut. 2. On obtient alors µ = 1 en évaluant (X − 1)2 F (X) =
4X 3 en 1 . (X + 1)2
On a alors : ∀x ∈ IR \ {−1, 1}
x F (x) =
x x x x 4x4 +λ + =λ − · − 1)2 x−1 x+1 (x − 1)2 (x + 1)2
(x2
En passant à la limite quand x tend vers +∞ , on obtient 4 = 2λ par unicité de la limite, d’où λ = 2 . Ainsi : F =
822
2 1 2 1 + + − · X −1 X +1 (X − 1)2 (X + 1)2
Solutions des exercices 21.10 1. Comme le degré du numérateur est égal au degré du dénominateur, la partie entière est le quotient des coefficients des termes de plus haut degré du numérateur et du dénominateur, c’est-à-dire 1 . Les pôles de F sont −1 , i et −i . Comme F est à coefficients réels, les parties polaires associées aux pôles i et −i sont conjuguées. On peut donc trouver (λ, µ, ν) ∈ C3 tels que : λ ν ν X4 + 1 µ =1+ + + · F = + (X + 1)2 (X 2 + 1) (X + 1)2 X +1 X −i X +i 2. En calculant les parties polaires associées au pôle simple i et au pôle double −1 , on a : ν=
i4 + 1 2 1 = =− (i + 1)2 (i + i) 2 (2i)2
et
λ=
1+1 = 1. 1+1
3. En évaluant en 0 , il vient : 1 = 1+λ+µ−
ν ν + = 2 + µ, i i
et donc µ = −1 . 4. La décomposition en éléments simples de F sur C est alors : F =
X4 + 1 1 1 1 1 − =1+ − − · (X + 1)2 (X 2 + 1) (X + 1)2 X +1 2(X − i) 2(X + i)
En regroupant les termes conjugués, on trouve : F =1+
1 1 X − − 2 · (X + 1)2 X +1 X +1
21.11 1. Il y a quatre pôles simples : i , −i , 2 et −2 . On trouve : 1 4 4 1 + + + · F = X −i X +i X −2 X +2
2. La partie entière est 1 , il y a quatre pôles simples : j , −j , j 2 et −j 2 . Parce que la fraction rationnelle est réelle et paire, on montre qu’il existe λ ∈ C tel que : F =
λ λ λ λ − + − · X −j X +j X − j2 X + j2
j+2 j2 + 2 1−j , dont le conjugué est = , d’où : 6 6 6 1 2+j 1 j −1 1 2+j 1 j−1 − − F =1+ + · 6X −j 6X +j 6 X − j2 6 X + j2
On trouve alors λ =
13 7 − · X −3 X −2 4. La fraction rationnelle a deux pôles j et j 2 d’ordre 2 . Comme elle est en outre réelle, on peut trouver (λ, µ) ∈ C2 tel que : 3. On obtient F = 1 +
F = On a :
(X 2
µ λ µ X2 λ + = + + · + X + 1)2 X −j (X − j)2 X − j2 (X − j 2 )2 µ=
j2 j2 1 1 =− · = =− 2 2 2 (j − j ) (1 − j) 3j 3
823
Chapitre 21. Fractions rationnelles En multipliant par X et en prenant la limite en +∞ , on a λ + λ = 0 . 2 2 Puis, en prenant la valeur en 0 , on trouve λ = (j 2 − j) = − (1 + 2j) , qui est bien un 9 9 √ 2 3 imaginaire valant − i , ce qui donne : 9 F =−
21.12 1. F1 = 1 + 2. F2 = −
2 1 + 2j 1 1 j2 j 2 1 + 2j + − · − 9 X −j 3 (X − j)2 9 X − j2 3 (X − j 2 )2
X 1 X 1 − · 2 X2 + X + 1 2 X2 − X + 1
1 X +1 · + 2 (X 2 + X + 1)2 X +X +1
21.13 1. Pour tout k ∈ [[0, n − 1]] , on note ωk = exp racines n -ièmes de l’unité. On a alors :
2iπ k n
n−1
ak 1 = n X −1 X − ωk
avec
ak =
k=0
. Ainsi, ω0 , . . . , ωn−1 sont les
1 ωk · = n nωkn−1
2. Avec les mêmes notations que précédemment, on trouve : ak =
ωkn−1 1 = · n−1 n nωk
3. La fraction rationnelle admet 1 comme pôle double et ω1 , . . . , ωn−1 comme pôles simples. Or, on peut écrire : F = ∗ Le coefficient de
1 · (X − 1)2 (1 + X + X 2 + · · · + X n−1 )
1 1 est donc · (X − 1)2 n
∗ Pour k ∈ [[1, n − 1]] , le coefficient de 1 Q′ (ωk )
avec
1 est : X − ωk Q = (X − 1)(X n − 1).
Or, Q′ = (n + 1)X n − nX n−1 − 1 et Q′ (ωk ) = n + 1 − nωkn−1 − 1 = n(1 − ωkn−1 ) . Le 1 vaut donc : coefficient de X − ωk ωk 1 = · n(ωk − 1) n(1 − ωkn−1 )
824
Solutions des exercices 1 ; pour cela, calculons : X −1
∗ Déterminons le coefficient de
1 1 1 − (X − 1)2 (1 + X + X 2 + · · · + X n−1 ) n (X − 1)2 n − (1 + X + X 2 + · · · + X n−1 ) n(X − 1)2 (1 + X + X 2 + · · · + X n−1 )
=
=− =−
X − 1 + X 2 − 1 + · · · + X n−1 − 1 n(X − 1)2 (1 + X + X 2 + · · · + X n−1 )
1 + (1 + X) + (1 + X + X 2 ) + · · · + (1 + X + X 2 + · · · + X n−2 ) · n(X − 1)(1 + X + X 2 + · · · + X n−1 )
En multipliant par X − 1 et en prenant la valeur en 1 , on trouve que le coefficient cherché est : 1−n 1 + 2 +··· + n − 1 · = − n2 2n Finalement, on obtient : F =
n−1 1 1 ωk 1−n 1 1 + + · 2n X − 1 n(X − 1)2 n (ωk − 1) X − ωk k=1
21.14 Notons : p! · X(X + 1) · · · (X + p) Tous les pôles de Fp sont simples. On a donc : Fp =
Fp =
p ak,p k=0
X +k
avec
ak,p
(−1)k p! p = (−1)k = . k!(p − k)! k
La décomposition en éléments simples de F est donc : F (X) =
n k=0
avec : bk =
n
ak,p =
p=k
Remarque
L’égalité
n p p=k
k
n
(−1)
p=k
=
n+1 k+1
k
bk , X +k
p k
= (−1)
k
n+1 . k+1
peut facilement se prouver par récurrence sur n .
On en trouvera aussi une preuve à l’exercice 4.4 de la page 141.
21.15 La fraction rationnelle admet ω1 , . . . , ωn comme pôles simples. Le dénominateur Q peut donc se mettre sous la forme : Q(X) =
n i=1
(X − ωi ) = X n − 1.
La partie entière de la fraction étant nulle puisque n 2 , le degré de P est strictement inférieur à n .
825
Chapitre 21. Fractions rationnelles De plus, la forme de la décomposition en éléments simples de
P assure que : Q
P (ωi ) ; nωin−1
ωi2 = donc :
P (ωi ) = nωi . Le polynôme P (X) − nX admettant alors n racines et étant de degré inférieur ou égal nX · à n − 1 , il est nul et P = nX . On en déduit que F = n X −1 21.16 On a, par décomposition en éléments simples :
1
3
x−1 dx = x2 + 2x + 1 =
3
1
2 1 − + (x + 1)2 x+1
3
2 + ln |x + 1| (x + 1)
1
dx 1 + ln 2. 2
=−
21.17 La décomposition en éléments simples sur IR nous donne : 1 λ µ αX + β = + + 2 1 − X4 X −1 X +1 X +1
avec
(λ, µ, α, β) ∈ IR4 .
Par les méthodes habituelles pour les pôles simples, on obtient : λ=
−1 4
et
µ=
1 · 4
1 ; puis, en multipliant par X et en prenant la limite 2 en +∞ , on obtient α = 0 . On a finalement : En évaluant en 0 , on trouve β =
−1 1 1 1 = + + · 1 − X4 4(X − 1) 4(X + 1) 2(X 2 + 1) Une primitive de f sur ]−1, 1[ est donc : x �→ −
21.18 On a :
0
a
1 x dx = x2 − x + 1 2 = =
826
ln(1 + x) ln(1 − x) Arctan x + + · 4 4 2
0
a
1 2x − 1 + 2 x2 − x + 1 x −x+1
1 1 ln(x2 − x + 1) + √ Arctan 2 3
1 1 ln(a2 − a + 1) + √ Arctan 2 3
dx
2x − 1 √ 3
2a − 1 √ 3
a
0
π + √ · 6 3
Solutions des exercices 21.19 On commence par calculer une décomposition en éléments simples de la fraction rationnelle complexe : 5 1 + 2i 1 + 2i = − · X2 + X + 1 + i X +i X +1−i
Pour tout x ∈ IR , on a :
1 x−i 1 2x 1 = 2 = −i 2 , x+i x +1 2 x2 + 1 x +1 1 1 donc une primitive de x �→ est x �→ ln(x2 + 1) − i Arctan(x) . x+i 2 De même, pour tout x ∈ IR , on a :
1 x+1+i 1 2x + 2 1 = = +i , x+1−i (x + 1)2 + 1 2 x2 + 2x + 2 (x + 1)2 + 1
1 1 est x �→ ln(x2 + 2x + 2) + i Arctan(x + 1) . x+1−i 2 In fine, une primitive de f est :
donc une primitive de x �→
x �→
1 + 2i ln 2
x2 + 1 2 x + 2x + 2
+ (2 − i) (Arctan(x) + Arctan(x + 1)) .
21.20 Soit n ∈ IN et x ∈ IR \ {a, b} .
• Si a �= b , alors la décomposition en éléments simples de f est : f (x) = avec :
β α + x−a x−b
1 1 et β= = −α. a−b b−a La dérivée d’ordre n de f est alors donnée par : α=
f
(n)
(−1)n n! (x) = a−b
• Si a = b , alors : f (x) =
1 (x − a)2
1 1 − (x − a)n+1 (x − b)n+1 f (n) (x) =
et
21.21 Soit n ∈ IN∗ et x ∈ IR .
La décomposition en éléments simples de Arctan′ (x) = 1 2i
1
x−i
−
1 x+i
donc la dérivée d’ordre n de Arctan est : Arctan(n) (x) =
(−1)n−1 (n − 1)! 2i
(−1)n−1 (n − 1)! = 2i
·
(−1)n (n + 1)! · (x − a)n+2
1 sur C est : 1 + x2 ;
1 1 − (x − i)n (x + i)n
(x + i)n − (x − i)n · (x2 + 1)n
827
Chapitre 21. Fractions rationnelles 21.22 1. La série de terme général un = puisque un ∼
3 est une série à termes positifs, convergente n(n + 3)
1 3 et que est une série convergente. 2 n n2 n1
Pour calculer la somme de cette série, on utilise la décomposition en éléments simples : F =
1 1 3 = − X(X + 3) X X +3
et l’on trouve : n k=1
1 1 1 11 3 =− − − + · k(k + 3) n+1 n+2 n+3 6
Donc, on obtient en prenant la limite lorsque n tend vers +∞ : +∞ k=1
2. La série de terme général vn = vn ∼
11 3 = · k(k + 3) 6
2 est une série à termes positifs, convergente puisque n3 − n
1 2 et que est une série convergente. n3 n3 n1
Pour calculer la somme de cette série, on utilise la décomposition en éléments simples : F = On trouve : n k=2
n
2 1 2 1 = − + 3 k −k k−1 k k+1 k=2
= Donc :
2 1 1 2 =− + + · X(X − 1)(X + 1) X X −1 X +1
n 1 k=2
1 − k−1 k
+∞ k=2
828
−
n 1 k=2
1 − k k+1
1 2 = · k3 − k 2
=
1 1 − · 2 n(n + 1)
Solutions des exercices 21.23 1. Le dénominateur a −1 comme racine évidente.
On en déduit la factorisation X 3 − 3X − 2 = (X + 1)2 (X − 2) , puis la décomposition en 16 11 1 X4 =X+ + − · éléments simples X 3 − 3X − 2 9(X − 2) 9(X + 1) 3(X + 1)2 On a donc :
1
0
x4 = 3 x − 3x − 2
16 11 1 x2 + ln(2 − x) + ln(x + 1) + 2 9 9 3(x + 1)
2. On obtient la décomposition en éléments simples
1
2
1 dx = ln x − ln(x2 + 1) x(x2 + 1) 2
On pouvait aussi écrire
2
dx = x(x2 + 1)
1
1
2
2 1
1 0
=
1 5 − ln 2. 3 9
1 X 1 = − 2 , d’où : X(X 2 + 1) X X +1
= ln 2 −
1 1 1 8 ln 5 + ln 2 = ln · 2 2 2 5
x dx , puis poser u = x2 . x2 (x2 + 1)
3. En commençant par une décomposition en éléments simples, on a : 2(X + 1) 8 2 4 4 = + + − (X + 1)3 (X 2 + 1) X +1 (X + 1)2 (X + 1)3 X2 + 1 =
4 2 2 4 2X + − · + − 2 X +1 (X + 1)2 (X + 1)3 X +1 (X 2 + 1)
Ainsi :
1 0
2 8 dx 4 = 2 ln(x + 1) − − − ln(x2 + 1) − 2 Arctan(x) (x + 1)3 (x2 + 1) (x + 1) (x + 1)2 7 π = + ln 2 − · 2 2
1 0
4. En commençant par une décomposition en éléments simples, on a : 1 1 1 1 X = − (X + 2)(X 2 + 2X + 5) 5X +2 5 X 2 + 2X + 5 1 2X + 2 1 1 1 1 − + 5X +2 10 X 2 + 2X + 5 5 X 2 + 2X + 5 1 2X + 2 1 1 1 1 − + = 5X +2 10 X 2 + 2X + 5 5 (X + 1)2 + 4
=
=
Ainsi :
1
−1
1 2X + 2 1 1 1 1 − + · 5X +2 10 X 2 + 2X + 5 20 X + 1 2 +1 2
1 1 dx 1 x+1 = ln(x + 2) − ln(x2 + 2x + 5) + Arctan (x + 2)(x2 + 2x + 5) 5 10 10 2 =
1
−1
1 1 1 π π 1 1 ln 3 − ln 8 + ln 4 + = + ln 3 − ln 2. 5 10 10 40 40 5 10
829
Chapitre 21. Fractions rationnelles 21.24 1. Soit i ∈ [[1, n]] . • D’après l’exemple 8 de la page 804, on a déjà
n 1 P′ = donc le coefficient P X − aj j=1
1 P′ est 1 . devant dans la décomposition en éléments simples de X − ai P • Déterminons d’une autre façon ce coefficient. On écrit : P (X) = λ
n j=1
(X − aj ) = (X − ai )Qi (X).
Connaissant les racines de P ′ , de coefficient dominant n λ , on a également : n−1
P ′ (X) = n λ
j=1
donc le coefficient cherché vaut :
n−1 ′
P (ai ) = Qi (ai )
n
j=1
j�=i
ce qui conclut.
(X − bj )
(ai − bj )
(ai − aj )
,
2. Soit i ∈ [[1, n − 1]] . Montrons la première inégalité, la deuxième se montrant de façon complètement analogue. ai − aj • Pour tout 1 j i − 1 , on a aj < bj < aj+1 ai donc 1; a i − bj • pour tout i + 1 j n − 1 , on a ai < ai+1 aj < bj < aj+1 donc ai − aj+1 aj+1 − ai = 1. a i − bj bj − a i On peut réécrire l’égalité de la première question sous la forme : n
i−1 j=1
d’où
n−1
(ai − bj ) (ai − bi )
(ai − bj ) =
j=i+1
i−1
j=1
i−1 bi − a i a i − bi 1 ai − aj = = ai+1 − ai ai − ai+1 n a i − bj j=1
ce qui équivaut à ai +
830
ai+1 − ai bi . n
n−1
(ai − aj ) (ai − ai+1 )
j=i+1
(ai − aj+1 ),
j=i+1
n ai − aj+1
a i − bj
1 , n
Chapitre 22 : Espaces vectoriels I
Espaces vectoriels . . . . . . . . . . . . . . . Définition et premières propriétés . . . . . . Espaces vectoriels fondamentaux . . . . . . Combinaison linéaire . . . . . . . . . . . . . II Sous-espaces vectoriels . . . . . . . . . . . . 1 Définition et exemples . . . . . . . . . . . . 2 Opérations sur les sous-espaces vectoriels . 3 Sous-espaces engendrés . . . . . . . . . . . III Familles de vecteurs . . . . . . . . . . . . . . 1 Parties et familles génératrices . . . . . . . 2 Propriétés des familles génératrices . . . . . 3 Familles et parties libres . . . . . . . . . . . 4 Bases . . . . . . . . . . . . . . . . . . . . . IV Sous-espaces affines . . . . . . . . . . . . . . 1 Translation . . . . . . . . . . . . . . . . . . 2 Sous-espace affine . . . . . . . . . . . . . . 3 Intersection de deux sous-espaces affines . . Démonstrations . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
832 . 832 . 833 . 834 836 . 836 . 837 . 842 844 . 844 . 845 . 846 . 851 853 . 853 . 854 . 855 856 860
Espaces vectoriels
22
Dans tout ce chapitre, IK désigne IR ou C.
I
Espaces vectoriels
1
Définition et premières propriétés
Définition 1 Soit E un ensemble muni d’une loi de composition interne notée + et d’une application, appelée loi externe : IK × E (λ, x)
−→ E �−→ λ · x.
On dit que (E, +, ·) est un espace vectoriel sur IK , ou un IK -espace vectoriel, si : • (E, +) est un groupe commutatif ;
• pour tout (x, y) ∈ E 2 , et pour tout (λ, µ) ∈ IK2 , on a : (1) 1 · x = x
(2) λ · (µ · x) = (λµ) · x
(3) (λ + µ) · x = λ · x + µ · x
(4) λ · (x + y) = λ · x + λ · y.
On appelle alors vecteurs les éléments de E et scalaires les éléments de IK . Remarques • Un espace vectoriel E étant en particulier un groupe, il n’est pas vide : il contient toujours un élément neutre pour la loi +, que l’on appelle le vecteur nul noté 0E . • Les propriétés (3) et (4) signifient qu’étant donné x0 ∈ E et λ0 ∈ IK , les applications : IK −→ E et E −→ E λ �−→ λ · x0 x �−→ λ0 · x sont des morphismes de groupes.
• Lorsque la loi interne et la loi externe sont évidentes, ou données par l’usage, on parle plus simplement du IK -espace vectoriel E plutôt que du IK-espace vectoriel (E, +, ·).
I Espaces vectoriels Dans toute la suite de ce chapitre, on considère un IK-espace vectoriel (E, +, ·). Proposition 1 Pour λ ∈ IK et x ∈ E , on a : (i) 0IK · x = 0E
et λ · 0E = 0E ;
(ii) λ · (−x) = −(λ · x) = (−λ) · x. Démonstration.
Conséquence du fait qu’étant donné x0 ∈ E et λ0 ∈ IK , les applications : IK λ
−→ �−→
E λ · x0
et
E x
−→ �−→
E λ0 · x
sont des morphismes de groupes.
Proposition 2 Pour λ ∈ IK et x ∈ E , on a :
λ · x = 0E ⇐⇒ (λ = 0IK ou x = 0E ).
Démonstration.
Le sens réciproque est assuré par le point (i) de la proposition précédente. Montrons le sens direct. Supposons λ · x = 0E et λ �= 0IK . Comme IK est un corps, le scalaire λ est inversible et l’on a : x = 1 · x = (λ−1 λ) · x = λ−1 · (λ · x) = λ−1 · 0E = 0E .
Notations • Pour λ ∈ IK et x ∈ E , on écrit souvent plus simplement λ x au lieu de λ · x.
• S’il n’y a pas d’ambiguïté, le vecteur nul de E et le scalaire nul sont tous deux notés plus simplement 0 plutôt que 0E et 0IK .
Nous adopterons ces notations simplifiées dans la suite.
2
Espaces vectoriels fondamentaux
Les exemples de cette section ne sont pas uniquement illustratifs ; ils font partie intégrante du cours et l’on pourra y faire référence. • Le corps IK muni de son addition et de sa multiplication, vue comme une loi externe, est un IK-espace vectoriel. Ainsi, IR est un IR-espace vectoriel, et C est un C-espace vectoriel. • L’ensemble C est aussi un IR-espace vectoriel si on le munit de son addition et de la loi externe : IR × C −→ C (λ, x) �−→ λx. • Pour n ∈ IN∗ , l’ensemble IKn muni des lois :
(x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ) λ · (x1 , . . . , xn ) = (λ x1 , . . . , λ xn )
est un IK -espace vectoriel. Pour le montrer, on peut vérifier les axiomes de la définition ou bien utiliser la proposition suivante, plus générale. 833
Chapitre 22. Espaces vectoriels Espace vectoriel produit Proposition 3 Soit n ∈ IN∗ et E1 , . . . , En des IK -espaces vectoriels. Alors l’ensemble produit E1 × · · · × En muni des lois suivantes : • l’addition définie par (x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ), • la loi externe définie par λ · (x1 , . . . , xn ) = (λx1 , . . . , λxn ),
est un IK-espace vectoriel appelé espace vectoriel produit E1 × · · · × En . Démonstration page 856
Remarque En particulier, si E est un IK -espace vectoriel, alors E n muni des lois produits est un IK-espace vectoriel. Espaces de fonctions Proposition 4 Étant donné un IK -espace vectoriel E et un ensemble Ω, l’ensemble E Ω des applications de Ω dans E est un IK -espace vectoriel pour les lois + et · définies par : f + g : Ω −→ t �−→
et
E f (t) + g(t)
λ · f : Ω −→ t �−→
E λ · f (t).
Démonstration page 856
À l’aide de ce résultat, nous obtenons de nouveaux espaces vectoriels de référence. • Étant donné un ensemble Ω, l’ensemble IKΩ des applications de Ω dans IK , muni de ses lois usuelles, est un IK -espace vectoriel. C’est le cas, en particulier, de l’ensemble IKIN des suites à valeurs dans IK. • L’ensemble Mn,p (IK) des matrices de taille (n, p) muni de l’addition et de la multiplication par un scalaire définies au chapitre 19 est un IK -espace vectoriel. En effet, il s’agit de l’espace vectoriel IK[[1,n]]×[[1,p]] . • Pour n ∈ IN∗ , on retrouve que E [[1,n]] = E n est un IK -espace vectoriel. Enfin, citons les deux espaces vectoriels suivants, pour lesquels il est aisé de vérifier les axiomes de la définition. • L’ensemble IK[X] des polynômes à coefficients dans IK, muni de la somme et de la multiplication par un scalaire, est un IK -espace vectoriel. • L’ensemble IK(X) des fractions rationnelles à coefficients dans IK, muni de la somme et de la multiplication par un scalaire, est un IK-espace vectoriel.
3
Combinaison linéaire
Définition 2 Soit n ∈ IN et (x1 , . . . , xn ) une famille finie de vecteurs de E . On dit qu’un vecteur x ∈ E est une combinaison linéaire de la famille (x1 , . . . , xn ) s’il existe (λ1 , . . . , λn ) ∈ IKn tel que : x=
Exo 22.1
n
k=1
834
λk xk .
I Espaces vectoriels Terminologie
On dit aussi que x est combinaison linéaire des vecteurs x1 , . . . , xn .
Remarque Si n = 0 alors la famille est vide ; toute combinaison linéaire de la famille vide est égale au vecteur nul. Ex. 1. Dans le IR -espace vectoriel IR3 , le vecteur x = (2, −3, −4) est une combinaison linéaire des vecteurs x1 = (1, 0, 1) et x2 = (0, 1, 2) . En effet, on a x = 2x1 − 3x2 .
Ex. 2. Dans IK[X] , un polynôme de degré au plus n est une combinaison linéaire de la famille (1, X, X 2 , . . . , X n ) . Ex. 3. Les fonctions ch et sh sont des combinaisons linéaires des fonctions x �→ ex et x �→ e−x .
Plus généralement, si A est une famille quelconque d’éléments de E , éventuellement infinie, on peut définir la notion de combinaison linéaire d’éléments de A. Néanmoins, en algèbre linéaire, on ne considérera que des sommes finies. Ainsi, il est nécessaire de définir au préalable la notion de famille presque nulle. Définition 3 Soit (λi )i∈I une famille de scalaires indexée par un ensemble I . • On appelle support de la famille (λi )i∈I l’ensemble {j ∈ I : λj �= 0} . • La famille (λi )i∈I est presque nulle ou à support fini si son support est fini. Notation
On note IK(I) l’ensemble des familles presque nulles de IKI .
Ex. 4. La suite des coefficients d’un polynôme de IK[X] est une famille presque nulle, c’est donc un élément de IK(IN) .
Ex. 5. La suite 1 + (−1)n )n∈IN n’est pas élément de IK(IN) car son support est 2IN . Ex. 6. Une famille indexée par IN est presque nulle si, et seulement si, elle est nulle à partir d’un certain rang, car les parties finies de IN sont les parties majorées de IN .
Remarque Une famille indexée par un ensemble fini est évidemment à support fini. Définition 4 Soit A = (ai )i∈I une famille d’éléments de E . On dit que x ∈ E est une combinaison linéaire de la famille A s’il existe une famille presque nulle (λi )i∈I ∈ IK(I) telle que : λi ai = λj aj x= i∈I
i∈J
où J désigne le support de (λi )i∈I (ou n’importe quelle partie finie de I contenant le support). Remarques λi ai est bien une somme finie puisque la fa• Dans cette définition, la somme i∈I
mille (λi )i∈I ∈ IK(I) est à support fini.
• On rappelle qu’une somme indexée par l’ensemble vide est égale au vecteur nul.
Ex. 7. Un polynôme est une combinaison linéaire de la famille (X n )n∈IN .
835
Chapitre 22. Espaces vectoriels
II
Sous-espaces vectoriels
1 Exo 22.2 Exo 22.3 Exo 22.4
Définition et exemples
Définition 5 On dit qu’une partie F de E est un sous-espace vectoriel de E si : • 0E ∈ F ;
• F est stable par addition : ∀(x, y) ∈ F 2
x+y ∈F ;
• F est stable par multiplication par un scalaire : ∀λ ∈ IK ∀x ∈ F
λx ∈ F .
Remarques • Ces conditions sont équivalentes à chacune des deux formes suivantes : 0E ∈ F
0E ∈ F
∀λ ∈ IK ∀(x, y) ∈ F 2
et
2
et
∀(λ, µ) ∈ IK
∀(x, y) ∈ F 2
λx + y ∈ F.
λx + µy ∈ F.
• Une récurrence immédiate montre qu’un sous-espace vectoriel est stable par combinaison linéaire. • Les parties E et {0E } sont des sous-espaces vectoriels de E appelés sous-espaces vectoriels triviaux de E . • On obtient une définition équivalente en remplaçant l’axiome «0E ∈ F » par l’axiome «F �= ∅ », mais le moyen le plus simple de montrer que F est non vide reste de vérifier qu’il contient le vecteur nul. Attention Pour montrer que F est un sous-espace vectoriel de E , il ne faut pas oublier de vérifier F ⊂ E . Ex. 8. Étant donné (a, b) ∈ IK2 , l’ensemble Fa,b = {(x, y) ∈ IK2 : ax + by = 0} est un sous-espace vectoriel de IK2 . En effet, Fa,b est une partie de IK2 et : • le vecteur nul (0, 0) appartient à Fa,b ;
2 • étant donné (x1 , y1 ), (x2 , y2 ) ∈ Fa,b et λ un scalaire, le vecteur λ(x1 , y1 ) + (x2 , y2 ) s’écrit (λx1 + x2 , λy1 + y2 ) et l’on a :
a(λx1 + x2 ) + b(λy1 + y2 ) = λ (ax1 + by1 ) + (ax2 + by2 ) = 0 donc λ(x1 , y1 ) + (x2 , y2 ) appartient à Fa,b .
=0
=0
Ex. 9. L’ensemble des fonctions paires est un sous-espace vectoriel de IRIR . Ex. 10. L’ensemble des fonctions nulles en 0 est un sous-espace vectoriel de IKIR . Ex. 11. Soit a une fonction continue sur IR . On a montré au chapitre 8 que l’ensemble des fonctions solutions de l’équation différentielle homogène y ′ + a(x)y = 0 est un sous-espace vectoriel de l’espace vectoriel des fonctions de classe C 1 sur IR . Ex. 12. L’ensemble IR des nombres réels et l’ensemble iIR des imaginaires purs sont deux sous-espaces vectoriels du IR -espace vectoriel C . Ex. 13. En revanche, IR n’est pas un sous-espace vectoriel du C -espace vectoriel C puisque l’on a 1 ∈ IR mais i = i 1 ∈ / IR .
836
II Sous-espaces vectoriels Proposition 5 Soit F un sous-espace vectoriel de E . Par définition, les lois de E induisent sur F une loi de composition interne et une loi externe : F2 (x, y)
−→ F �−→ x + y
et
IK × F (λ, x)
−→ F �−→ λ x.
Muni de ces lois induites, le sous-espace vectoriel F est un IK-espace vectoriel. Démonstration. • L’ensemble F est un sous-groupe de E car il contient 0 , il est stable par addition et, pour tout x ∈ F , on a −x = (−1) · x donc −x ∈ F . • Les quatre propriétés concernant la loi externe, qui sont vraies pour les éléments de E le sont a fortiori pour les éléments de F .
Les exemples de sous-espaces vectoriels suivants fournissent de nouveaux IK-espaces vectoriels de référence. Ex. 14. Si I est un intervalle de IR d’intérieur non vide et si n ∈ IN , alors les théorèmes d’analyse montrent que C n I, IR est un sous-espace vectoriel de IRI .
Ex. 15. Étant donné un segment [a, b] , l’ensemble E ([a, b], IR) des fonctions en escalier sur [a, b] et l’ensemble CM [a, b], IR des fonctions continues par morceaux sur [a, b] sont des sous-espaces vectoriels de IR[a,b] .
Ex. 16. L’ensemble IKn [X] est un sous-espace vectoriel de IK[X] .
Ex. 17. Les ensembles Sn (IK) (respectivement An (IK) , Tn+ (IK) et Tn− (IK) ) des matrices carrées symétriques (respectivement antisymétriques, triangulaires supérieures, triangulaires inférieures) de taille n sont des sous-espaces vectoriels de Mn (IK) .
Point méthode Dans la très grande majorité des cas, pour montrer qu’un ensemble est muni d’une structure d’espace vectoriel, on montre que c’est un sous-espace vectoriel d’un des espaces vectoriels fondamentaux décrits dans la section I.2 de la page 833.
Exo 22.5
2
Opérations sur les sous-espaces vectoriels
Intersection de sous-espaces vectoriels Proposition 6 Si F1 et F2 sont deux sous-espaces vectoriels de E , alors F1 ∩F2 est un sous-espace vectoriel de E . Démonstration. • Comme 0 ∈ F1 et 0 ∈ F2 , on a 0 ∈ F1 ∩ F2 . • Soit x et y appartenant à F1 ∩ F2 et λ un scalaire. Les vecteurs x et y appartiennent à F1 et F1 est un sous-espace vectoriel de E , donc λx + y appartient à F1 . De même, λx + y appartient à F2 . Ainsi λx + y appartient à F1 ∩ F2 .
Par suite, l’intersection F1 ∩ F2 est un sous-espace vectoriel de E .
837
Chapitre 22. Espaces vectoriels Plus généralement, l’intersection d’une famille quelconque (finie ou non) de sousespaces vectoriels de E est un sous-espace vectoriel de E . Proposition 7 Si (Fi )i∈I est une famille de sous-espaces vectoriels de E , alors Fi est un sousi∈I
espace vectoriel de E .
Démonstration page 856
Remarque Si I est l’ensemble vide, alors on a
i∈I
Fi =
Fi = E .
i∈∅
Attention La réunion de deux sous-espaces vectoriels n’est pas un sous-espace vectoriel en général ! Plus précisément, étant donné F et G deux sous-espaces vectoriels de E , montrons que F ∪ G est un sous-espace vectoriel de E si, et seulement si, F ⊂ G ou G ⊂ F . • Si F ⊂ G alors F ∪ G = G est évidemment un sous-espace vectoriel. De même, si G ⊂ F alors F ∪ G = F est un sous-espace vectoriel. • Supposons maintenant que F �⊂ G et G �⊂ F , et montrons que F ∪ G n’est pas un sous-espace vectoriel. Comme F �⊂ G, il existe x ∈ F \ G. De même, il existe y ∈ G \ F . Si le vecteur x + y appartenait à G alors en écrivant x = (x + y) − y , on aurait x ∈ G, ce qui est faux. Donc x + y �∈ G. On montre de manière symétrique que x + y �∈ F . Ainsi x + y �∈ F ∪ G. On en déduit que F ∪ G n’est pas stable par somme et n’est donc pas un sous-espace vectoriel.
G x+y
y
F x
Attention Le complémentaire d’un sous-espace vectoriel n’est jamais un sous-espace vectoriel car il ne contient pas le vecteur nul. Somme de deux sous-espaces vectoriels Définition 6 Étant donné F1 et F2 deux sous-espaces vectoriels de E , on appelle somme de F1 et F2 , et l’on note F1 + F2 , l’ensemble des vecteurs de E qui s’écrivent comme la somme d’un élément de F1 et d’un élément de F2 : F1 + F2 = {x1 + x2 | (x1 , x2 ) ∈ F1 × F2 }. Proposition 8 La somme de deux sous-espaces vectoriels de E est un sous-espace vectoriel de E . De plus, F1 + F2 est le plus petit sous-espace vectoriel (au sens de l’inclusion) contenant F1 et F2 .
Démonstration page 857
Ex. 18. Dans IR3 , considérons les deux sous-espaces vectoriels : 3 F1 = (x, y, z) ∈ IR : x + y + z = 0
et montrons que F1 + F2 = IR3 .
838
et
F2 = (x, y, z) ∈ IR3 : x = y = z
II Sous-espaces vectoriels Comme, par définition, on a F1 + F2 ⊂ IR3 , démontrons IR3 ⊂ F1 + F2 . Pour cela, raisonnons par analyse-synthèse. Soit u = (x, y, z) ∈ IR3 . • Soit u1 = (x1 , y1 , z1 ) ∈ F1 et u2 = (x2 , y2 , z2 ) ∈ F2 . Supposons u = u1 + u2 . On a alors : x + y + z = (x1 + x2 ) + (y1 + y2 ) + (z1 + z2 ) = (x1 + y1 + z1 ) + (x2 + y2 + z2 ) = 0 + 3x2 . 1 (x + y + z) , on a u2 = (s, s, s) et u1 = u − u2 = (x − s, y − s, z − s) . 3 1 • On vérifie immédiatement qu’en posant s = (x + y + z) , puis u1 = (x − s, y − s, z − s) 3 et u2 = (s, s, s) on a bien u1 ∈ F1 , u2 ∈ F2 et u = u1 + u2 . Par suite, on a F1 + F2 = IR3 . Ainsi, en posant s =
Remarques • Par commutativité de a F1 + F2 = F2 + F1 . Exo 22.6
l’addition
dans
un
IK-espace
vectoriel,
on
• Étant donné un sous-espace vectoriel F d’un espace vectoriel E , on vérifie aisément que l’on a F + {0} = F , F + E = E et F + F = F . Somme directe de deux sous-espaces vectoriels Définition 7 On dit que les sous-espaces vectoriels F1 et F2 sont en somme directe si, pour tout x ∈ F1 + F2 , la décomposition x = x1 + x2 , avec x1 ∈ F1 et x2 ∈ F2 , est unique. Notation
Lorsque F1 et F2 sont en somme directe, leur somme se note F1 ⊕ F2 .
Proposition 9 Soit F1 et F2 deux sous-espaces vectoriels de E . Les assertions suivantes sont équivalentes : (i) les sous-espaces vectoriels F1 et F2 sont en somme directe ; (ii) ∀(x1 , x2 ) ∈ F1 × F2
x1 + x2 = 0 =⇒ (x1 , x2 ) = (0, 0) ;
(iii) F1 ∩ F2 = {0}.
Démonstration page 857
Principe de démonstration.
Montrer la «chaîne d’implications» : (i) ⇒ (ii) ⇒ (iii) ⇒ (i).
Point méthode Pour démontrer que F1 et F2 sont en somme directe, on prouve souvent la propriété F1 ∩ F2 = {0}. Mais, étant donné que F1 ∩ F2 , comme tout sous-espace vectoriel, contient 0 , il suffit de montrer F1 ∩ F2 ⊂ {0} , i.e. : ∀x ∈ E
x ∈ F1 ∩ F2 =⇒ x = 0.
839
Chapitre 22. Espaces vectoriels
Ex. 19. Dans IR3 , considérons les deux sous-espaces vectoriels :
F1 = (x, y, z) ∈ IR3 : x + y + z = 0
et
F2 = (x, y, z) ∈ IR3 : x = y = z
et montrons que F1 et F2 sont en somme directe. Soit u ∈ F1 ∩ F2 . Comme u ∈ F2 , il existe x ∈ IR tel que u = (x, x, x) . Comme u ∈ F1 , on a alors 3x = 0 et donc x = 0 ; par suite, on a u = 0 , ce qui prouve que la somme F1 + F2 est directe. Ex. 20. Dans IKIR , le sous-espace vectoriel des fonctions constantes et le sous-espace vectoriel des fonctions nulles en 0 sont en somme directe puisqu’une fonction constante et nulle en 0 est nécessairement la fonction nulle. Ex. 21. Dans Mn (IK) , les sous-espaces vectoriels Sn (IK) et An (IK) sont en somme directe. En effet, si M ∈ Sn (IK) ∩ An (IK) , alors on a M T = −M et M T = M donc M = −M et M = 0 .
Sous-espaces vectoriels supplémentaires Dans cette partie, F1 et F2 désignent deux sous-espaces vectoriels de E . Définition 8 On dit que F1 et F2 sont deux sous-espaces vectoriels supplémentaires de E si E = F1 ⊕ F2 . Proposition 10 La propriété E = F1 ⊕ F2 se traduit par l’un des énoncés équivalents suivants :
(i) pour tout x ∈ E , il existe un unique (x1 , x2 ) ∈ F1 × F2 tel que x = x1 + x2 ;
(ii) la somme F1 + F2 est directe et est égale à E ; (iii) on a E = F1 + F2 et F1 ∩ F2 = {0}.
Démonstration. L’équivalence de (i) et (ii) est évidente avec les définitions. L’équivalence de (iii) avec les autres est une conséquence de la proposition 9 de la page précédente. Ex. 22. Dans IR3 , les sous-espaces vectoriels :
F1 = (x, y, z) ∈ IR3 : x + y + z = 0
et
F2 = (x, y, z) ∈ IR3 : x = y = z
sont supplémentaires. En effet, on a montré que IR3 = F1 + F2 (exemple 18 de la page 838) et F1 ∩ F2 = {0} (exemple 19).
Ex. 23. Dans E = IRIR , l’ensemble des fonctions paires et l’ensemble des fonctions impaires sont deux sous-espaces vectoriels, et ils sont supplémentaires puisque toute fonction f ∈ E se décompose de manière unique en la somme d’une fonction paire et d’une fonction impaire (cf. exercice 1.3 de la page 26). Ex. 24. Dans E = Mn (IK) , le sous-espace vectoriel des matrices symétriques Sn (IK) et celui des matrices antisymétriques An (IK) sont deux sous-espaces vectoriels supplémentaires puisque toute matrice s’écrit de manière unique comme la somme d’une matrice symétrique et d’une matrice antisymétrique (cf. exemple 19 de la page 718).
840
II Sous-espaces vectoriels Ex. 25. Soit P ∈ IK[X] \ {0} . Dans E = IK[X] , les sous-espaces vectoriels : F1 = {P Q | Q ∈ IK[X]}
et
F2 = {R ∈ IK[X] : deg(R) < deg(P )}
sont deux sous-espaces vectoriels supplémentaires de IK[X] . En effet, le théorème 10 de la page 748 de division euclidienne affirme que tout élément de E s’écrit de manière unique comme la somme d’un élément de F1 et d’un élément de F2 .
Terminologie Lorsque F1 et F2 sont deux sous-espaces vectoriels supplémentaires de E , on dit que F2 est un supplémentaire de F1 dans E . Attention En général, il n’y a pas unicité d’un supplémentaire. Ainsi, on ne parlera jamais « du » supplémentaire de F1 mais uniquement « d’un » supplémentaire de F1 . Ex. 26. Dans IK2 , considérons le sous-espace vectoriel F = (x, y) ∈ IK2 : y = 0 et les
sous-espaces vectoriels :
G1 = (x, y) ∈ IK2 : x = 0
et
G2 = (x, y) ∈ IK2 : x = y .
• D’une part, les sous-espaces vectoriels F et G1 sont évidemment supplémentaires dans IK2 puisque tout élément (x, y) ∈ IK2 s’écrit de manière unique sous la forme (x, 0) + (0, y) avec (x, 0) ∈ F et (0, y) ∈ G1 .
• D’autre part :
∗ tout élément (x, y) ∈ IK2 s’écrit (x − y, 0) + (y, y) avec (x − y, 0) ∈ F et (y, y) ∈ G2 donc F + G2 = IK2 ; ∗ si (x, y) ∈ F ∩ G2 alors on a x = y = 0 donc F et G2 sont en somme directe.
Par conséquent, G1 et G2 sont tous deux des sous-espaces vectoriels supplémentaires de F .
Attention Ne pas confondre cette notion de supplémentaire avec celle de complémentaire : le complémentaire d’un sous-espace vectoriel de E n’est jamais un sousespace vectoriel de E puisqu’il ne contient pas 0 . Point méthode Pour démontrer E = F1 ⊕ F2 , on peut raisonner par analysesynthèse pour montrer que tout vecteur de E s’écrit de manière unique comme la somme d’un élément de F1 et d’un élément de F2 . La phase d’analyse fournit l’unicité d’une telle écriture (ce qui prouve que la somme est directe) et celle de synthèse son existence (ce qui montre F1 + F2 = E ). Remarque Nous verrons dans le chapitre 24 une autre méthode utilisant la notion de dimension. 841
Chapitre 22. Espaces vectoriels
3
Sous-espaces engendrés
Sous-espace vectoriel engendré par une partie Proposition 11 Soit A une partie de E . Il existe un plus petit (au sens de l’inclusion) sous-espace vectoriel contenant A, que l’on appelle le sous-espace vectoriel engendré par A et que l’on note Vect A. Principe de démonstration.
Démonstration page 857 Considérer l’intersection de tous les sous-espaces vectoriels
de E contenant A .
Remarques • Par définition, on a A ⊂ Vect A et tout sous-espace vectoriel de E contenant A contient Vect A. • Le sous-espace vectoriel engendré par ∅ est {0} . Proposition 12 (Description du sous-espace engendré par une partie) Si A est une partie de E , alors le sous-espace vectoriel Vect A est l’ensemble des vecteurs qui sont combinaisons linéaires d’éléments de A. Démonstration page 858 Montrer que l’ensemble F des combinaisons linéaires d’éléments de A est un sous-espace vectoriel de E contenant A et que tout sous-espace vectoriel de E contenant A contient F .
Principe de démonstration.
Remarque Si A est non vide, on a : n Vect A = λk ak n ∈ IN∗ , (λ1 , . . . , λn ) ∈ IKn , (a1 , . . . , an ) ∈ An . k=1
Ex. 27. Dans le IR -espace vectoriel C : • le sous-espace vectoriel engendré par {1} est IR ,
• le sous-espace vectoriel engendré par {i} est l’ensemble iIR des imaginaires purs, • le sous-espace vectoriel engendré par {1, i} est égal à C .
Ex. 28. Si a est un vecteur d’un espace vectoriel E , alors le sous-espace vectoriel engendré par la partie {a} est Vect{a} = {λ a | λ ∈ IK} . Dans le cas où a = 0 , on a Vect{a} = Vect{0} = {0} .
Définition 9 (Droite vectorielle) Si a est un vecteur non nul de E , alors le sous-espace vectoriel Vect{a} est appelé droite vectorielle engendrée par a. Notation
842
On note aussi IKa la droite vectorielle engendrée par a.
II Sous-espaces vectoriels Sous-espace vectoriel engendré par une famille Définition 10 Étant donné une famille A = (ai )i∈I de vecteurs de E , on appelle sousespace vectoriel engendré par A le sous-espace vectoriel engendré par la partie A = {ai | i ∈ I} . On le note Vect A. On déduit immédiatement de la proposition 12 le corollaire suivant. Corollaire 13 (Description du sous-espace engendré par une famille) Si A = (ai )i∈I est une famille de vecteurs de E , alors le sous-espace vectoriel Vect A est l’ensemble des combinaisons linéaires de la famille A : (I) . λi ai (λi )i∈I ∈ IK Vect A = i∈I
Remarques • Les sommes qui apparaissent dans cette dernière description sont bien finies puisqu’il s’agit de familles de scalaires presque nulles. • Ainsi, dans le cas particulier d’une famille finie (x1 , . . . , xn ) ∈ E n , on a : Vect(x1 , . . . , xn ) =
n i=1
λi xi (λ1 , . . . , λn ) ∈ IKn
.
Ex. 29. Le sous-espace vectoriel de IK[X] engendré par (1, X, . . . , X n ) est IKn [X] , puisque : n n+1 IKn [X] = λ0 + λ1 X + · · · + λn X | (λ0 , λ1 , . . . , λn ) ∈ IK
.
Point méthode Pour montrer qu’une partie de E en est un sous-espace vectoriel, il peut être efficace de mettre en évidence que c’est le sous-espace vectoriel engendré par une certaine famille. Ex. 30. Dans IR3 , considérons F = (x − 2y, 2x + y, 3x − 2y) | (x, y) ∈ IR2 . Comme on peut écrire :
F = x (1, 2, 3) + y (−2, 1, −2) | (x, y) ∈ IR2 , il est immédiat que F = Vect(u, v) où u = (1, 2, 3) et v = (−2, 1, −2) . En particulier, F est un sous-espace vectoriel de IR3 .
843
Chapitre 22. Espaces vectoriels
III
Familles de vecteurs
1
Parties et familles génératrices
Définition 11 • On dit que A est une partie génératrice de E si A est une partie de E telle que E = Vect(A). • On dit que G est une famille génératrice de E si G est une famille d’éléments de E telle que E = Vect(G). Terminologie Lorsqu’une partie ou une famille est génératrice de E , on dit aussi qu’elle engendre l’espace vectoriel E . Parties et familles génératrices finies Soit n ∈ IN∗ . D’après le paragraphe précédent, nous pouvons énoncer les résultats suivants. • Une partie A = {g1 , . . . , gn } de E est génératrice de E si, et seulement si : ∃(λ1 , . . . , λn ) ∈ IKn
∀x ∈ E
x=
n
λi gi .
i=1
• Une famille G = (g1 , . . . , gn ) de vecteurs de E est une famille génératrice de E si, et seulement si : ∃(λ1 , . . . , λn ) ∈ IKn
∀x ∈ E
x=
n
λi gi .
i=1
Remarque Le caractère générateur d’une famille finie de vecteurs ne dépend pas de l’ordre dans lequel sont donnés les vecteurs de cette famille. Ex. 31. Soit n ∈ IN∗ . Dans l’espace vectoriel IKn , la famille (ei )1in définie par : e1 = (1, 0, 0, . . . , 0) ,
e2 = (0, 1, 0, . . . , 0) ,
est une famille génératrice de IK a x=
n
n
...
,
en = (0, 0, . . . , 0, 1)
puisque, pour tout vecteur x = (x1 , . . . , xn ) ∈ IKn , on
x i ei .
i=1
Ex. 32. La famille (1, i) est une famille génératrice de C en tant que IR -espace vectoriel. Ex. 33. Si n ∈ IN , alors (1, X, . . . , X n ) est une famille génératrice de IKn [X] puisque, pour tout polynôme P de degré au plus n , il existe (a0 , a1 , . . . , an ) ∈ IKn+1 tel que : P =
n
ak X k .
k=0
Ex. 34. La famille (Ei,j ) 1in est une famille génératrice de Mn,p (IK) puisque toute ma1jp
trice A = (ai,j ) 1in ∈ Mn,p (IK) s’écrit A = 1jp
844
1in 1jp
ai,j Ei,j .
III Familles de vecteurs
Attention Par définition, une famille G génératrice de E est une famille de vecteurs de E . Même si tout vecteur de E est combinaison linéaire de la famille G , on n’oubliera pas de s’assurer que les vecteurs de G appartiennent à bien à E avant de conclure que G est génératrice de E . Ex. 35. L’ensemble E = {(x, y) ∈ IK2 : x = y} est un IK -espace vectoriel en tant que sous-
espace vectoriel de IK2 . Si l’on pose e1 = (1, 0) et e2 = (0, 1) , il est clair que tout vecteur de E est combinaison linéaire de la famille (e1 , e2 ) car tout vecteur de IK2 l’est. Néanmoins, (e1 , e2 ) n’est pas une famille génératrice de E car e1 �∈ E (et e2 �∈ E ).
Familles et parties génératrices quelconques On généralise ce qui précède dans le cas des familles et parties quelconques. • Une partie non vide A de l’espace vectoriel E est une partie génératrice de E si, et seulement si : n λi gi . ∀x ∈ E ∃n ∈ IN∗ ∃(gi )i∈[[1,n]] ∈ An ∃(λi )i∈[[1,n]] ∈ IKn x = i=1
Contrairement au cas fini, ici le « n » dépend de x.
• Dans le cas d’une famille quelconque, on utilise la notion de famille à support fini. Ainsi, une famille G = (gi )i∈I de vecteurs de E est une famille génératrice de E si, et seulement si : λi gi . ∀x ∈ E ∃(λi )i∈I ∈ IK(I) x = i∈I
Ex. 36. La famille (X k )k∈IN est génératrice de IK[X] puisque tout polynôme est combinaison linéaire (finie) de monômes de la forme X k avec k ∈ IN .
Ex. 37. Le sous-espace vectoriel de IRIR engendré par l’ensemble {1{a} | a ∈ IR} , des fonctions
indicatrices de chaque singleton de IR , est l’ensemble des f ∈ IRIR vérifiant : ∃n ∈ IN∗
∃(a1 , . . . , an ) ∈ IRn
∃(λ1 , . . . , λn ) ∈ IRn
f=
n
λk 1{ak } .
k=1
Il ne s’agit donc pas de l’espace vectoriel IRIR , mais du sous-espace vectoriel des fonctions nulles sauf en un nombre fini de points.
2
Propriétés des familles génératrices
Proposition 14 • Soit A et B deux parties de E . Si A est une partie génératrice de E et si A ⊂ B , alors B est une partie génératrice de E . • Soit G et G ′ deux familles de vecteurs de E . Si G est génératrice de E et si G est une sous-famille de G ′ , alors G ′ engendre aussi E . 845
Chapitre 22. Espaces vectoriels Démonstration. • On a A ⊂ B ⊂ Vect B . Étant donné que Vect B est un sous-espace vectoriel de E et que Vect A est le plus petit sous-espace vectoriel de E contenant A , on en déduit que l’on a E = Vect A ⊂ Vect B . Ainsi B est une partie génératrice de E . • Conséquence du premier point puisque si l’on note A (respectivement B ) l’ensemble des vecteurs de la famille G (respectivement G ′ ), alors Vect G = Vect A et Vect G ′ = Vect B .
Ex. 38. Comme la famille (1, X, X 2 ) est une famille génératrice de l’espace vectoriel IK2 [X] , la sur-famille (1, X, X 2 , X 2 − 3X + 1) est aussi une famille génératrice de IK2 [X] .
Ex. 39. Dans le IR -espace vectoriel C , la partie {1, i, 1 + i} est génératrice de C puisqu’elle contient {1, i} qui est déjà génératrice.
Proposition 15 Soit G une famille génératrice de E et F une famille de vecteurs de E . Alors, la famille F est génératrice de E si, et seulement si, tout vecteur de G est combinaison linéaire de F .
Démonstration page 858 Dans le sens non trivial, utiliser que Vect(G) est le plus petit sous-espace vectoriel contenant tous les vecteurs de G .
Principe de démonstration.
Ex. 40. Dans IR3 , posons e1 = (1, 0, 0) , e2 = (0, 1, 0) , e3 = (0, 0, 1) puis : u1 = e2 + e3 ,
u2 = e1 + e3
u3 = e1 + e2 .
et
Montrons que la famille F = (u1 , u2 , u3 ) est génératrice de IR3 . La famille G = (e1 , e2 , e3 ) étant génératrice de IR3 , il suffit de montrer que chacun des vecteurs de G est combinaison linéaire de F . C’est bien le cas, puisque l’on a : e1 =
1 (u2 + u3 − u1 ), 2
e2 =
1 (u1 + u3 − u2 ) 2
et
e3 =
1 (u1 + u2 − u3 ). 2
Ex. 41. Si j = e2iπ/3 , alors F = (1, j) engendre le IR -espace vectoriel C . En effet : • F est une famille de vecteurs de C ; • les éléments de la famille génératrice (1, i) sont combinaisons linéaires des vecteurs de F c’est évident pour 1 et l’on a i = √23 · j + √13 · 1 .
3
Familles et parties libres
Si G est une famille d’éléments de E , nous avons vu que tout vecteur de Vect(G) s’écrit comme une combinaison linéaire des éléments de G . Dans cette partie nous allons étudier dans quelle mesure la famille des coefficients intervenant dans une telle décomposition est unique.
846
III Familles de vecteurs Familles libres finies Définition 12 Soit n ∈ IN et (x1 , . . . , xn ) une famille (finie) de vecteurs de E . • On dit que la famille (x1 , . . . , xn ) est libre si : ∀(λ1 , . . . , λn ) ∈ IKn
n i=1
λi xi = 0 =⇒ ∀i ∈ [[1, n]] λi = 0 .
• Dans le cas contraire, on dit que la famille (x1 , . . . , xn ) est liée.
Cela signifie alors qu’il existe une famille (λ1 , . . . , λn ) de scalaires non tous nuls n vérifiant λi xi = 0 . i=1
Terminologie Si la famille (x1 , . . . , xn ) est libre, on dit que les vecteurs x1 , . . . , xn sont linéairement indépendants. Si (x1 , . . . , xn ) est liée, on dit qu’ils sont linéairement dépendants. Remarques • Dans le cas où n = 0 , la condition de liberté est vérifiée : la famille vide est libre. • Si (x1 , . . . , xn ) est une famille libre (respectivement liée) de E , alors il en est de même pour tout n-uplet obtenu en permutant les éléments.
Ex. 42. Dans IK3 , montrons que les vecteurs e1 = (1, 0, 0) , e2 = (0, 1, 0) et e3 = (0, 0, 1) forment une famille libre. Soit (λ1 , λ2 , λ3 ) ∈ IK3 tel que λ1 e1 + λ2 e2 + λ3 e3 = 0 . On a alors (λ1 , λ2 , λ3 ) = (0, 0, 0) donc λ1 = λ2 = λ3 = 0 . Ex. 43. Plus généralement, dans IKn , où n est un entier naturel non nul, les vecteurs : e1 = (1, 0, 0, . . . , 0) , e2 = (0, 1, 0, . . . , 0) , . . . , en = (0, 0, . . . , 0, 1) forment une famille libre. Ex. 44. Dans le IR -espace vectoriel C , la famille (1, i) est libre, puisque pour tout (a, b) ∈ IR2 on a a + i b = 0 =⇒ a = b = 0 . Ex. 45. En revanche, dans le C -espace vectoriel C , la famille (1, i) est liée, puisque l’on a la relation i · 1 + (−1) · i = 0 . Ex. 46. Dans le IR -espace vectoriel C , la famille (1, j) est libre. En effet, si (a, b) ∈ IR2 vérifie a + b j = 0 , alors l’égalité des parties imaginaires donne b Im j = 0 et donc b = 0 ; il est alors immédiat que a = 0 . Ex. 47. Dans IK3 , les vecteurs x1 = (−1, 1, 0) , x2 = (0, −1, 1) et x3 = (1, 0 − 1) sont linéairement dépendants puisque l’on a x1 + x2 + x3 = 0 . Ex. 48. Pour tout n ∈ IN , la famille (1, X, . . . , X n ) est une famille libre de IKn [X] puisque si λ0 , . . . , λn sont des scalaires vérifiant
n
λp X p = 0 , alors ils sont tous nuls.
p=0
847
Chapitre 22. Espaces vectoriels Ex. 49. La famille (Ei,j ) 1in est une famille libre de Mn,p (IK) , puisqu’étant donné une 1jp
famille de scalaires (λi,j ) 1in , l’égalité 1jp
λi,j Ei,j = 0 implique immédiatement :
1in 1jp
∀(i, j) ∈ [[1, n]] × [[1, p]]
Exo 22.7
λi,j = 0.
Remarque Toute famille (x1 , . . . , xn ) contenant le vecteur nul est liée : en effet, n si xj = 0 , alors, en posant λj = 1 et λi = 0 pour i �= j , on a λi xi = 0 . i=1
Exo 22.8 Exo 22.9
Point méthode Pour montrer qu’une famille finie est libre, on se donne une combinaison linéaire quelconque de ses éléments que l’on suppose nulle. Il faut alors prouver que tous les scalaires utilisés sont nuls.
Cas particulier des familles à un vecteur Une famille (x) à un vecteur est libre si, et seulement si, x �= 0 . En effet : • si x = 0 , alors 1 · x = 0 , et comme 1 �= 0 , la famille (x) est liée ;
• si x �= 0 , alors pour λ ∈ IK, on a λ x = 0 =⇒ λ = 0 (cf. page 833), et (x) est donc une famille libre. Cas particulier des familles à deux vecteurs Définition 13 Deux vecteurs x ∈ E et y ∈ E sont dits proportionnels, ou colinéaires, si : ∃λ ∈ IK x = λ y
ou y = λ x.
Attention Pour traduire que deux vecteurs x et y sont colinéaires, on ne peut pas, a priori, simplement écrire x = λ y , avec λ ∈ IK . En effet, si y est nul et que x ne l’est pas, alors x et y sont colinéaires puisque y = 0 · x, mais il est clair que l’on ne peut pas trouver de scalaire λ tel que x = λ y . Remarque En revanche, si y est non nul, la colinéarité de x et y peut effectivement se traduire par l’existence de λ ∈ IK tel que x = λ y . En effet, si l’on a y = µx avec µ ∈ IK , alors la non-nullité de y implique que µ est non nul, ce qui permet d’écrire x = µ1 y . Proposition 16 Une famille de deux vecteurs (x, y) est liée si, et seulement si, les vecteurs x et y sont colinéaires.
Démonstration page 858
Ex. 50. Dans IR3 , on considère u = (1, −1, 3) , v = (2, −2, 6) et w = (1, 1, 1) .
• Il est évident que l’on a v = 2 u . La famille (u, v) est donc liée. • En revanche, les vecteurs u et w ne sont pas colinéaires donc la famille (u, w) est libre.
848
III Familles de vecteurs
Attention Pour une famille de plus de trois vecteurs, le fait que les vecteurs soient deux à deux non colinéaires n’implique pas que la famille soit libre. Ex. 51. Les vecteurs u = (1, 0) , v = (0, 1) et w = (1, 1) de IR2 sont deux à deux non colinéaires mais la famille (u, v, w) est liée puisque u + v − w = 0 .
Propriétés des familles libres finies Exo 22.10
Proposition 17 • Toute sous-famille d’une famille finie libre est libre. • Toute sur-famille d’une famille finie liée est liée.
Principe de démonstration.
Démonstration page 858
• Montrer que si (x1 , . . . , xn ) est libre et p n , alors (x1 , . . . , xp ) est libre. • Le second point découle du premier.
Remarques • On retrouve qu’une famille est liée dès qu’elle contient le vecteur nul, puisque la famille réduite au vecteur nul est liée. • Une famille contenant deux vecteurs colinéaires (en particulier, deux vecteurs égaux) est liée puisque deux vecteurs colinéaires forment une famille liée. Proposition 18 Soit n ∈ IN, (x1 , . . . , xn ) une famille libre d’éléments de E et x un vecteur de E . Alors la famille (x1 , . . . , xn , x) est liée si, et seulement si : x ∈ Vect(x1 , . . . , xn ),
c’est-à-dire si, et seulement si, x est combinaison linéaire de x1 , . . . , xn . Principe de démonstration. n Si α x +
i=1
λi xi = 0 avec α non nul, alors x = −
Démonstration page 859 n 1 λi x i . α i=1
Corollaire 19 Une famille finie de polynômes non nuls (à coefficients dans IK ) de degrés deux à deux distincts est libre. Terminologie
Une telle famille est dite échelonnée en degré.
Démonstration. Quitte à modifier l’ordre des éléments, on peut supposer qu’une telle famille s’écrit (P0 , P1 , . . . , Pn ) avec : 0 deg P0 < deg P1 < · · · < deg Pn .
On montre alors par récurrence que pour tout k ∈ [[0, n]] , la famille (P0 , . . . , Pk ) est libre.
• Comme P0 �= 0 , la famille (P0 ) est libre. • Soit k ∈ [[1, n]] tel que (P0 , . . . , Pk−1 ) soit libre. Une considération élémentaire de degré / Vect(P0 , . . . , Pk−1 ) . On déduit alors de la proposition précédente que la prouve que Pk ∈ famille (P0 , P1 , . . . , Pk ) est libre, ce qui achève la récurrence.
849
Chapitre 22. Espaces vectoriels Théorème 20 (Unicité de la décomposition) Soit n ∈ IN∗ et (x1 , . . . , xn ) une famille libre d’éléments de E . Pour tout (λi )i∈[[1,n]] ∈ IKn et tout (µi )i∈[[1,n]] ∈ IKn , on a : n
λi xi =
i=1
Démonstration.
Si
n i=1
n
λi x i =
i=1
µi xi =⇒ ∀i ∈ [[1, n]] λi = µi .
n
µi xi
i=1
la famille (x1 , . . . , xn ) , implique ∀i ∈ [[1, n]]
alors
n
(λi − µi ) xi = 0 , ce qui, par liberté de
i=1
λi = µi .
Familles libres quelconques Définition 14 Une famille d’éléments de E est dite libre si toutes ses sous-familles finies sont libres. Elle est dite liée dans le cas contraire, c’est-à-dire si elle possède une sousfamille finie liée. Remarque Il est immédiat de vérifier que la proposition 17 de la page précédente se généralise aux familles quelconques. Point méthode Pour montrer qu’une famille (xi )i∈IN indexée par IN est libre, il suffit de vérifier que toutes les familles de la forme (xi )i∈[[0,n]] sont libres car toute partie finie de IN est contenue dans une partie de la forme [[0, n]] avec n ∈ IN. Ex. 52. La famille (X k )k∈IN est une famille libre de IK[X] puisque, pour tout n 0 , la famille finie (X k )k∈[[0,n]] est libre, comme on l’a déjà montré précédemment. Ex. 53. La famille des fonctions indicatrices (1{a} )a∈IR est libre. En effet, étant donné n ∈ IN∗ et a1 , . . . , an des réels distincts, si (λ1 , . . . , λn ) ∈ IRn vérifie ∀j ∈ [[1, n]] donc (1{a1 } , . . . , 1{an } ) est libre.
λj =
n
n
i=1
λi 1{ai } = 0 , alors on a :
λi 1{ai } (aj ) = 0
i=1
Dans le cas d’une famille quelconque, on peut énoncer le théorème d’unicité de décomposition à l’aide de familles à support fini. Théorème 21 Étant donné une famille libre (xi )i∈I de vecteurs de E et deux familles de scalaires presque nulles (λi )i∈I et (µi )i∈I , on a : λi xi = µi xi =⇒ (∀i ∈ I λi = µi ) . i∈I
Démonstration.
i∈I
Conséquence immédiate du théorème 20 puisque toutes les sommes intervenant dans cette propriété sont en fait finies.
850
III Familles de vecteurs Parties libres Définition 15 Une partie A non vide de E est libre si la famille (a)a∈A est libre. Dans le cas contraire, elle est liée. Remarque Comme la famille vide est libre, l’ensemble vide ∅ est une partie libre de E . Point méthode Pour montrer qu’une partie A est libre, il suffit de vérifier que, pour tout n ∈ IN∗ et pour toute partie {a1 , . . . , an } de A à n éléments (donc deux à deux distincts), la famille (a1 , . . . , an ) est libre. Remarques • Lorsque A est une partie finie non vide de E , on peut noter a1 , . . . , an ses éléments (supposés distincts deux à deux). La partie A est alors libre si, et seulement si, la famille (a1 , . . . , an ) est libre. • En revanche, si a1 , . . . , an sont des éléments quelconques de E , il se peut que la famille (a1 , . . . , an ) soit liée tandis que la partie {a1 , . . . , an } est libre. Par exemple, si a est un vecteur non nul de E , alors la famille (a, a) est liée alors que {a, a} = {a} est libre. Propriétés Les propriétés des familles libres se traduisent naturellement en termes de parties libres. En particulier : • toute partie d’une partie libre de E est une partie libre ; • toute partie de E contenant une partie liée est liée.
Point méthode Pour montrer qu’une partie A est liée, il suffit de montrer qu’il existe un entier n ∈ IN∗ et des éléments a1 , . . . , an de A deux à deux distincts tels que la famille (a1 , . . . , an ) soit liée.
4
Bases
Définition Soit B = (ei )i∈I une famille d’éléments de E . On a vu que : • tout élément du sous-espace vectoriel Vect(B) s’écrit sous la forme d’une combinaison linéaire des ei ; • si la famille B est libre, alors cette décomposition est unique. Nous allons relier ces deux propriétés grâce à la notion de base. Définition 16 Une base de E est une famille libre et génératrice de E . Remarque La famille vide est une base de {0} , puisqu’elle est libre et que le sousespace vectoriel qu’elle engendre est {0}. 851
Chapitre 22. Espaces vectoriels Décomposition dans une base finie
Exo 22.11
Théorème 22 (Décomposition d’un vecteur dans une base finie) Soit n ∈ IN∗ et (e1 , . . . , en ) une base de E . Alors, pour tout x ∈ E , il existe un n unique n-uplet (λ1 , . . . , λn ) ∈ IKn tel que x = λi ei . i=1
Démonstration. L’existence de la décomposition provient de ce que la famille (e1 , . . . , en ) engendre E . L’unicité est conséquence du fait que cette famille est libre.
Définition 17 Avec les notations précédentes : • la famille (λi )1in est appelée famille des coordonnées (ou composantes) de x dans la base (e1 , . . . , en ) ; Exo 22.12
• pour tout i ∈ [[1, n]], le scalaire λi est appelé la i -ème coordonnée (ou composante) de x dans la base (e1 , . . . , en ). Terminologie
Lorsque, pour x ∈ E , on écrit l’égalité x =
que l’on décompose le vecteur x dans la base (e1 , . . . , en ).
n
λi ei , on dit aussi
i=1
Ex. 54. La famille B = (e1 , . . . , en ) définie par :
e1 = (1, 0, 0, . . . , 0) , e2 = (0, 1, 0, . . . , 0) , . . . , en = (0, 0, . . . , 0, 1)
est une base de IKn appelée base canonique de IKn . L’égalité : (x1 , . . . , xn ) =
n
x i ei
i=1
montre que les coordonnées du vecteur x = (x1 , . . . , xn ) dans cette base canonique B sont les coefficients du n -uplet (x1 , . . . , xn ) . Ex. 55. La famille (1, X, . . . , X n ) est une base de IKn [X] appelée base canonique de IKn [X] . Ici aussi, les coordonnées dans cette base d’un polynôme de IKn [X] sont les coefficients de ce polynôme. Ex. 56. La famille des matrices élémentaires (Ei,j ) 1in est une base de Mn,p (IK) , appelée 1jp
base canonique de Mn,p (IK) .
Ex. 57. La famille (1, i) est une base du IR -espace vectoriel C , puisqu’elle est libre et qu’elle est génératrice de C comme on l’a vu précédemment. Les coordonnées d’un nombre complexe dans la base (1, i) sont ses parties réelle et imaginaire. Ex. 58. Soit n ∈ IN∗ et x1 , . . . , xn des scalaires deux à deux distincts. Montrons que la famille (L1 , . . . , Ln ) des polynômes de Lagrange (cf.751) est une base de IKn−1 [X] . • Liberté. Soit (λ1 , . . . , λn ) ∈ IKn tel que 0=
n
k=1
n k=1
donc la famille (L1 , . . . , Ln ) est libre.
852
λk Lk = 0 . Alors, pour tout i ∈ [[1, n]] , on a :
λk Lk (xi ) = λi
IV Sous-espaces affines • Caractère générateur. Soit P ∈ IKn−1 [X] . D’après le théorème d’interpolation, le polynôme P˜ =
n
P (xk )Lk est l’unique polynôme de IKn−1 [X] tel que
k=1
∀i ∈ [[1, n]]
P˜ (xi ) = P (xi ).
On en déduit que P = P˜ et par conséquent P est une combinaison linéaire de (L1 , . . . , Ln ) . De plus, pour tout k ∈ [[1, n]] , on a deg(Lk ) = n − 1 donc Lk ∈ IKn−1 [X] . On en déduit que la famille (L1 , . . . , Ln ) est génératrice de IKn−1 [X] . Finalement, on a montré que (L1 , . . . , Ln ) est une base de IKn−1 [X] et la famille des coordon nées dans cette base d’un polynôme P de IKn−1 [X] est P (x1 ), . . . , P (xn ) .
Décomposition dans une base quelconque Dans le cas d’une famille quelconque, on peut énoncer le théorème de décomposition (analogue au théorème 22 de la page ci-contre) à l’aide de familles à support fini.
Théorème 23 (Décomposition dans une base quelconque) Si (ei )i∈I est une base de E , alors, pour tout vecteur x ∈ E , il existe une unique famille presque nulle (λi )i∈I ∈ IK(I) telle que : λi ei . x= i∈I
Terminologie La famille à support fini (λi )i∈I ci-dessus est aussi appelée famille des coordonnées (ou composantes) de x dans la base (ei )i∈I . Ex. 59. La famille (X k )k∈IN est une base de IK[X] , appelée base canonique de IK[X] . Les coefficients d’un polynôme P ∈ IK[X] sont les coordonnées de ce polynôme dans la base canonique de IK[X] .
IV 1
Sous-espaces affines Translation
Définition 18 Si a est un élément d’un espace vectoriel E , l’application de E dans E définie par x �→ a + x est appelée translation de vecteur a. On la note ta . Proposition 24 • Pour tout a ∈ E et b ∈ E , on a ta ◦ tb = ta+b = tb ◦ ta .
• Pour tout a ∈ E , la translation ta est bijective et t−1 a = t−a .
Démonstration. • On constate que, pour x ∈ E , on a (ta ◦ tb )(x) = a + (b + x) , ta+b (x) = (a + b) + x et (tb ◦ ta )(x) = b + (a + x) . On conclut par associativité et commutativité de la loi + . • La translation ta est bijective et admet pour réciproque la translation t−a , puisque : ta ◦ t−a = t−a ◦ ta = t0 = IdE .
853
Chapitre 22. Espaces vectoriels
2
Sous-espace affine
F
x a
Notation Pour a ∈ E , et pour F sousespace vectoriel de E , on note :
x−a
F
O
a + F = {a + f | f ∈ F } = ta (F ). Remarque Pour x ∈ E , on a x ∈ F = a+F si, et seulement si, x − a ∈ F .
Lemme 25 Soit a ∈ E et F un sous-espace vectoriel de E . L’ensemble a + F est un sous-espace vectoriel de E si, et seulement si, a ∈ F ; dans ce cas on a a + F = F . Démonstration page 859 Lemme 26 Soit a ∈ E et a′ ∈ E ainsi que F et F ′ deux sous-espaces vectoriels de E . Alors, on a a + F = a′ + F ′ si, et seulement si, F = F ′ et a′ − a ∈ F . Démonstration page 859 Définition 19 On dit qu’une partie F de E est un sous-espace affine de E s’il existe un vecteur a ∈ E et un sous-espace vectoriel F de E tels que F = a + F . Exo 22.13
Terminologie Une telle partie F est alors appelée sous-espace affine de E passant par a et dirigé par F . D’après le lemme précédent, le sous-espace vectoriel F est unique ; il est appelé la direction du sous-espace affine F . Remarques • Un sous-espace affine F = a + F est non vide puisqu’il contient le vecteur a . • Un singleton est un sous-espace affine dont la direction est le sous-espace trivial {0} . Proposition 27 Si F est le sous-espace affine de E passant par a ∈ E et dirigé par un sous-espace vectoriel F de E , alors pour tout a′ ∈ F , on a F = a′ + F . Démonstration.
Conséquence du lemme précédent puisque si a′ ∈ F alors a′ − a ∈ F .
Droite affine Lorsque la direction F de F est une droite vectorielle, c’est-à-dire lorsqu’il existe un vecteur u non nul tel que F = Vect{u} , le sous-espace affine F est appelé droite affine. Ex. 60. Tout sous-espace vectoriel F de E est un sous-espace affine de E , et il est sa propre direction, comme le prouve l’égalité F = 0 + F . Inversement, un sous-espace affine F est un sous-espace vectoriel si, et seulement si, 0 ∈ F .
Ex. 61. L’ensemble F = (1 + t, −4 − 2t, 3t) | t ∈ IR est un sous-espace affine de IR3 : c’est le sous-espace affine passant par le point (1, −4, 0) et dirigé par la droite vecto rielle Vect (1, −2, 3) . Ici, F est donc une droite affine.
854
IV Sous-espaces affines
3
Intersection de deux sous-espaces affines
Proposition 28 Soit F et G deux sous-espaces affines de E , de directions respectives F et G . Alors : • soit F ∩ G est vide ; • soit F ∩ G est un sous-espace affine de direction F ∩ G .
Démonstration page 859
Interprétation graphique dans l’espace IR3 F
F a G
G
F
a G
• Dans le premier cas, F ∩ G est vide. • Dans le deuxième, on a F ⊂ G . L’intersection est le sous-espace affine F , qui est dirigé par une droite vectorielle. C’est donc une droite affine. • Dans le troisième cas, F ∩ G est réduit à un point. Le sous-espace affine F ∩ G est donc dirigé par le sous-espace vectoriel {0}.
855
Chapitre 22. Espaces vectoriels
Démonstrations Proposition 3 • Muni de l’addition, l’ensemble E1 × · · · × En est un groupe commutatif en tant que groupe produit (cf.page 683). • Les quatre propriétés portant sur la loi externe se déduisent des propriétés correspondantes sur chacun des IK -espaces vectoriels E1 , . . . , En . Par exemple, si (x1 , . . . , xn ) ∈ E1 × · · · × En et (λ, µ) ∈ IK2 , alors on a :
λ · µ · (x1 , . . . , xn ) = λ · (µ x1 , . . . , µ xn )
= λ (µ x1 ), . . . , λ (µ xn )
= (λµ) x1 , . . . , (λµ) xn = (λµ) · (x1 , . . . , xn ) Proposition 4 •
•
multiplication par µ multiplication par λ propriété de chacune des lois externes mise en facteur de λµ.
Considérons l’ensemble E Ω muni de la loi interne + et la loi externe · .
Comme (E, +) est un groupe commutatif, l’ensemble E Ω est un groupe commutatif pour la loi + (cf. page 681) ; de plus : ∗ l’élément neutre de ce groupe est alors la fonction nulle 0 : t �→ 0 ; ∗ une fonction f a pour opposée la fonction −f : Ω −→ E t �−→ −f (t). Montrons les quatre propriétés portant sur la loi externe.
Soit f et g deux éléments de E Ω et λ et µ deux scalaires. ∗ On a 1 · f = f car, pour tout t ∈ Ω :
1 · f (t) = 1 · f (t) = f (t).
On a λ · (µ · f ) = (λµ) · f car, pour tout t ∈ Ω :
∗
λ · (µ · f )(t) = λ · µ · f (t) = (λµ) · f (t) = (λµ) · f (t). De plus, on a (λ + µ) · f = λ · f + µ · f car, pour tout t ∈ Ω :
∗
(λ + µ) · f (t) = (λ + µ) · f (t) = λ · f (t) + µ · f (t) = (λ · f + µ · f )(t).
∗
Enfin, on a λ · (f + g) = λ · f + λ · g car, pour tout t ∈ Ω :
λ · (f + g) (t) = λ · (f + g)(t) = λ · f (t) + g(t) = λ · f (t) + λ · g(t) = λ · f + λ · g (t).
Proposition 7
Posons F =
Fi .
i∈I
•
Chaque sous-espace vectoriel Fi contient 0 , donc leur intersection F aussi.
Soit (x, y) ∈ F 2 et λ ∈ IK . Pour tout i ∈ I , on a x ∈ Fi et y ∈ Fi donc, comme Fi est un sous-espace vectoriel, λx + y ∈ Fi . Par suite, λx + y appartient à F . Ainsi, F est un sous-espace vectoriel.
•
856
Démonstrations Proposition 8 • Par définition, on a F1 + F2 ⊂ E . De plus : ∗ le vecteur nul de E appartient à F1 et à F2 et l’on a 0 = 0 + 0 donc 0 ∈ F1 + F2 ; ∗ soit (x, y) ∈ (F1 + F2 )2 et λ un scalaire. Par définition, il existe (x1 , x2 ) ∈ F1 × F2 et (y1 , y2 ) ∈ F1 × F2 tels que x = x1 + x2 et y = y1 + y2 . On peut donc écrire : λx + y = λ(x1 + x2 ) + (y1 + y2 ) = (λx1 + y1 ) + (λx2 + y2 ).
•
Or x1 et y1 appartiennent à F1 qui est un sous-espace vectoriel donc λx1 +y1 appartient à F1 . De même λx2 + y2 appartient à F2 . Ainsi, λx + y appartient à F1 + F2 . Par suite, F1 + F2 est un sous-espace vectoriel de E . De plus, on a F1 ⊂ F1 + F2 . x + 0 donc x ∈ F1 + F2 . En effet, si x ∈ F1 alors on peut écrire x = ∈F1
•
∈F2
On montre de même F2 ⊂ F1 + F2 . Enfin, étant donné un sous-espace vectoriel G contenant F1 et F2 , montrons F1 + F2 ⊂ G . Soit x ∈ F1 + F2 ; il existe (x1 , x2 ) ∈ F1 × F2 tel que x = x1 + x2 . Par hypothèse, on a x1 ∈ G et x2 ∈ G donc x1 + x2 ∈ G , c’est-à-dire x ∈ G et l’inclusion est démontrée.
Proposition 9 • Montrons (i) ⇒ (ii) . Supposons donc que F1 et F2 sont en somme directe. Soit (x1 , x2 ) ∈ F1 × F2 tel que x1 + x2 = 0 . On a alors : x
1 ∈F1
•
+ x2 = 0 = 0 + 0 .
∈F1
∈F2
∈F2
L’unicité de la décomposition de 0 comme somme d’un élément de F1 et d’un élément de F2 implique (x1 , x2 ) = (0, 0) . Montrons (ii) ⇒ (iii) . Supposons : ∀(x1 , x2 ) ∈ F1 ×F2 x1 +x2 = 0 ⇒ (x1 , x2 ) = (0, 0) . Soit x ∈ F1 ∩ F2 . On a alors −x ∈ F1 ∩ F2 et l’on peut écrire : x + (−x) = 0,
∈F1
•
∈F2
ce qui implique x = 0 et ainsi F1 ∩ F2 ⊂ {0} . L’inclusion réciproque étant immédiate, on a donc l’égalité F1 ∩ F2 = {0} . Montrons (iii) ⇒ (i) . Supposons F1 ∩ F2 = {0} . Soit x ∈ F1 + F2 ayant deux décompositions : x = x1 + x2
et
x = y1 + y2
avec
(x1 , y1 ) ∈ F12
Comme F1 et F2 sont des sous-espaces vectoriels de E , on a : x1 − y1 ∈ F1
et
et
(x2 , y2 ) ∈ F22 .
y2 − x2 ∈ F2 .
Par suite, x1 − y1 = y2 − x2 ∈ F1 ∩ F2 donc x1 − y1 = y2 − x2 = 0 ; on en déduit x1 = y1 et y2 = x2 , ce qui prouve l’unicité de la décomposition. Proposition 11 Soit (Fi )i∈I la famille de tous les sous-espaces vectoriels de E contenant A . Posons G = Fi . i∈I
• • •
L’ensemble G contient A , puisque chaque ensemble Fi contient A . D’après la proposition 7 de la page 838, G est un sous-espace vectoriel de E . Soit H un sous-espace vectoriel de E contenant A . Alors, par définition de (Fi )i∈I , il Fi est inclus dans H . existe i0 ∈ I tel que H = Fi0 . Par suite, G = i∈I
Ainsi, G est bien le plus petit sous-espace vectoriel contenant A .
857
Chapitre 22. Espaces vectoriels Proposition 12 •
• •
Notons F l’ensemble des combinaisons linéaires d’éléments de A .
On a évidemment F ⊂ E . ∗ Le vecteur nul appartient à F (il suffit de prendre une combinaison linéaire de la famille vide ou d’une famille quelconque de vecteurs de A avec des scalaires tous nuls). ∗ La somme de deux éléments de F est encore une combinaison linéaire d’éléments de A donc appartient à F . ∗ La multiplication par un scalaire λ d’un élément de F est encore une combinaison linéaire d’éléments de A (on multiplie tous les scalaires de la combinaison linéaire par λ ) donc appartient à F . Ainsi F est un sous-espace vectoriel de E . De plus, pour tout a ∈ A , on peut écrire a = 1 · a donc A ⊂ F . Enfin, soit G un sous-espace vectoriel de E contenant A . Puisque G est stable par combinaison linéaire, on a immédiatement F ⊂ G .
Ainsi, F est bien le plus petit sous-espace vectoriel de E contenant tous les éléments de A , c’est-à-dire le sous-espace vectoriel Vect A . Proposition 15 • •
Supposons la famille F génératrice de E . Tout vecteur de E est alors combinaison linéaire de F , et a fortiori tout vecteur de G . Réciproquement, supposons que tout vecteur de G est combinaison linéaire de F . Ainsi tout vecteur de G appartient à Vect(F) donc Vect(G) ⊂ Vect(F) puisque Vect(G) est le plus petit sous-espace contenant tous les vecteurs de G . Comme on a Vect(G) = E , on en déduit E ⊂ Vect(F) et ainsi E = Vect(F) .
Proposition 16 •
•
Supposons d’abord les vecteurs x et y colinéaires.
Si y = 0 alors la famille (x, y) est liée. Sinon, d’après la remarque précédente, il existe λ ∈ IK tel que x = λ y et l’on a 1 x−λ y = 0 donc la famille (x, y) est liée.
Réciproquement, si la famille (x, y) est liée, alors il existe deux scalaires α et β , non tous deux nuls, tels que α x + β y = 0 . • •
Si α �= 0 , alors on a x = (−β/α) y .
Sinon, on a β �= 0 et alors y = (−α/β) x .
Donc les vecteurs x et y sont colinéaires.
Proposition 17 •
L’énoncé est trivial dans le cas de la famille vide. Soit n ∈ IN∗ et (x1 , . . . , xn ) une famille libre d’éléments de E . On se donne alors une sous-famille de (x1 , . . . , xn ) . S’il s’agit de la famille vide alors elle est libre. Sinon, puisque la liberté d’un n -uplet ne dépend pas de l’ordre de ses éléments, on peut supposer que la sous-famille qui nous intéresse est (x1 , . . . , xp ) avec p ∈ [[1, n]] . Soit (λ1 , . . . , λp ) ∈ IKp une famille telle que
p
λi x i = 0 .
i=1
Pour tout i ∈ [[p + 1, n]] , posons λi = 0 . On obtient alors
•
n
λi x i = 0 .
i=1
Puisque (x1 , . . . , xn ) est libre, on en déduit que pour tout i ∈ [[1, n]] , et en particulier pour tout i ∈ [[1, p]] , on a λi = 0 . Par suite, (x1 , . . . , xp ) est libre. Le second point est la contraposée du premier.
858
Démonstrations Proposition 18 • Supposons que x soit combinaison linéaire des vecteurs x1 , . . . , xn . Il existe alors des scalaires λ1 , . . . , λn tels que x =
n
λi xi . On a alors 1 x +
i=1
famille (x1 , . . . , xn , x) est liée. •
n
(−λi ) xi = 0 ; par suite, la
i=1
Supposons la famille (x1 , . . . , xn , x) liée. Alors il existe des scalaires α , λ1 , . . . , λn non tous nuls tels que : αx +
n
λi xi = 0.
i=1
∗ ∗
Si α = 0 , alors on a
n
λi xi = 0 avec les λi non tous nuls, ce qui est impossible puisque
i=1
la famille (x1 , . . . , xn ) est libre. Par suite, α est non nul et l’on peut alors écrire : x=− ce qui prouve x ∈ Vect(x1 , . . . , xn ) .
n λi i=1
α
xi ,
Lemme 25 Supposons que a + F soit un sous-espace vectoriel. Alors il contient 0 et il existe alors f ∈ F tel que a + f = 0 donc a = −f ; on en déduit a ∈ F . Réciproquement, supposons a ∈ F . Alors : • tout a + f avec f ∈ F est élément de F puisque F est un sous-espace vectoriel ; • si f ∈ F , alors l’écriture f = a + (f − a) montre que f ∈ a + F . On en déduit que a + F = F , ce qui prouve la réciproque ainsi que la dernière affirmation. Lemme 26 • Supposons a + F = a′ + F ′ . ∗
∗
•
Comme a′ ∈ a′ + F ′ = a + F , on a a′ ∈ a + F et donc a′ − a ∈ F . Par symétrie, on a aussi a − a′ ∈ F ′ . Montrons que F ′ ⊂ F . Soit x′ ∈ F ′ . On a alors a′ +x′ ∈ a′ +F ′ et donc a′ +x′ ∈ a+F . Par suite, il existe x ∈ F tel que a′ + x′ = a + x et donc x′ = a − a′ + x . Comme a − a′ et x sont éléments du sous-espace vectoriel F , on en déduit x′ ∈ F . Par symétrie, on obtient F ⊂ F ′ , ce qui entraîne F = F ′ .
Réciproquement, supposons F = F ′ et a′ − a ∈ F . On a alors a′ − a ∈ F ′ .
∗
∗
Montrons a + F ⊂ a′ + F ′ . Soit x ∈ a + F . Il existe alors y ∈ F tel que x = a + y et donc x = a′ + (a − a′ + y) . Comme a′ − a et y sont deux éléments du sous-espace vectoriel F = F ′ , on en déduit a − a′ + y ∈ F ′ et donc x ∈ a′ + F ′ . Par symétrie, on obtient a′ + F ′ ⊂ a + F , ce qui entraîne a′ + F ′ = a + F .
Proposition 28
Supposons F ∩ G �= ∅ ; soit donc a ∈ F ∩ G . Pour tout x de E , on a : x ∈ F ⇔ x−a ∈F
et
x ∈ G ⇔ x − a ∈ G.
Ainsi, x ∈ F ∩ G ⇔ x − a ∈ F ∩ G . On en déduit que F ∩ G = a + F ∩ G .
859
Chapitre 22. Espaces vectoriels
S’entraîner et approfondir 22.1 Soit a ∈ IR . Montrer que la fonction fa : x �→ cos(x + a) est combinaison linéaire des →834 fonctions sin et cos .
22.2 1. Montrer que l’ensemble F = (x1 , x2 , x3 ) ∈ IR3 : x1 + x2 + x3 = 0 →836
est un sous-espace
vectoriel de IR3 . 2. En est-il de même pour G = (x1 , x2 , x3 ) ∈ IR3 : x1 + x2 + x3 = 1 ?
22.3 Soit (a, b) ∈ IK2 . On note Ea,b l’ensemble des suites u ∈ IKIN vérifiant : →836
∀n ∈ IN
un+2 = aun+1 + bun .
Montrer que Ea,b est un sous-espace vectoriel de IKIN .
22.4 L’ensemble D = z ∈ C : |z| 1 →836
est-il un sous-espace vectoriel de C ?
22.5 Soit A un élément de IK[X] . Montrer que l’ensemble FA = →837 lois usuelles est un IK -espace vectoriel.
22.6 Soit F et G deux sous-espaces vectoriels de E . Montrer que :
→839
AP | P ∈ IK[X]
muni des
F + G = F ∪ G ⇐⇒ F ⊂ G ou G ⊂ F . 22.7 Soit x1 = (1, 1, 1) , x2 = (−1, 1, −1) et x3 = (1, −1, −1) . →848 Montrer que (x1 , x2 , x3 ) est une famille libre de IR3 .
22.8 Soit ω ∈ C . Montrer que (1, ω) est libre dans le IR -espace vectoriel C si, et seulement →848 si, Im ω �= 0 . 22.9 Montrer que (cos, sin) est une famille libre de IRIR . →848
22.10 La famille (1, sin, cos, sin2 , cos2 ) est-elle libre dans IRIR ? →849
22.11 Montrer que (1, X + 1, X 2 + X + 1) est une base de IK2 [X] . →852
22.12 Dans le IK -espace vectoriel IKn [X] des polynômes de degré au plus n , on considère la famille :
→852
(X − a)2 (X − a)3 (X − a)n 1, (X − a), , ,..., 2 3! n!
.
1. Montrer que cette famille est libre. 2. Montrer que cette famille est une base de IKn [X] ; si P est un polynôme de degré au plus n , donner ses coordonnées dans cette base. Indication. Utiliser la formule de Taylor polynomiale.
22.13 Montrer que F = (x, y, z) ∈ IR3 : x + y + z = 1 →854
est le sous-espace affine de IR3 passant
par (1, 0, 0) et dirigé par F = (α, β, γ) ∈ IR3 : α + β + γ = 0 .
860
Exercices 22.14 Soit (E, +, ·) un C -espace vectoriel non réduit à {0} . On définit une autre loi externe sur E , notée ⋆ , par : ∀λ ∈ C ∀x ∈ E λ ⋆ x = Re(λ) · x. Montrer que (E, +, ⋆) n’est pas un C -espace vectoriel. 22.15 On note E le IR -espace vectoriel IRIR muni des lois usuelles. Les ensembles suivants sont-ils des sous-espaces vectoriels de E ? 1. L’ensemble des fonctions dérivables sur IR . 2. L’ensemble des fonctions croissantes sur IR . 3. L’ensemble des fonctions monotones sur IR . 4. L’ensemble des fonctions prenant une valeur non nulle en 0 . ⋆ 22.16 Dans l’espace vectoriel IK3 , on considère l’ensemble : F = {(x, y, z) ∈ IK3 : x2 + y 2 + 2z 2 − 2xy − 2yz + 2xz = 0}.
Est-ce un sous-espace vectoriel : 1. si IK = IR ? 2. si IK = C ? Indication. Écrire l’expression x2 + y 2 + 2z 2 − 2xy − 2yz + 2xz comme une somme de deux carrés. 22.17 1. Soit (x1 , x2 , x3 ) une famille libre d’un IK -espace vectoriel E . Montrer que la famille (x2 + x3 , x3 + x1 , x1 + x2 ) est libre. 2. Soit (x1 , x2 , x3 , x4 ) une famille libre d’un IK -espace vectoriel E . La famille (x1 + x2 , x2 + x3 , x3 + x4 , x4 + x1 ) est-elle libre ? 22.18 Soit F , G et H trois sous-espaces vectoriels d’un IK -espace vectoriel E . Montrer que (F ∩ G) + (F ∩ H) ⊂ F ∩ (G + H) . Peut-on faire mieux que cette inclusion et prouver une égalité ? 22.19 Soit F l’ensemble des vecteurs (x, y, z) de IR3 vérifiant le système :
x+y+z =0 2x − y + z = 0.
Montrer que F est une droite vectorielle. ⋆ 22.20 Pour tout a ∈ IR on pose fa : IR x
−→ �−→
IR |x − a|.
−→ �−→
IR eax .
Montrer que (fa )a∈IR est une famille libre de IRIR . Indication. On pourra s’intéresser à la dérivabilité d’une combinaison linéaire de cette famille. 22.21 Pour tout réel a on pose ϕa : IR x
1. Montrer que la famille (ϕk )k∈IN est libre. Indication. Introduire un polynôme possédant une infinité de racines. 2. Montrer que la famille (ϕa )a∈IR est libre. Indication. Utiliser une limite en ±∞ .
861
Chapitre 22. Espaces vectoriels
22.22 Soit a et b deux complexes distincts. Montrer que l’ensemble des polynômes de degré inférieur ou égal à 4 , et dont a et b sont des racines, est un sous-espace vectoriel de l’espace vectoriel C4 [X] et en donner une base. 22.23 Pour tout n ∈ IN , on pose un : x �→ cosn x et vn : x �→ cos nx . On note, pour N ∈ IN : AN = Vect(u0 , . . . , uN )
et
BN = Vect(v0 , . . . , vN ).
Montrer que les sous-espaces vectoriels AN et BN sont égaux. 22.24 Pour tout n ∈ IN∗ on définit fn : IR x
−→ �−→
IR sin nx.
Montrer que la famille (fn )n∈IN∗ est une famille libre de IRIR . Indication. Dériver deux fois.
⋆ 22.25 Soit (a, b) ∈ IR2 tel que a < b . Quel est le sous-espace vectoriel de IR[a,b] engendré par l’ensemble des fonctions indicatrices des intervalles inclus dans [a, b] ? 22.26 Soit F et G deux sous-espaces affines de directions respectives F et G , et contenant respectivement les points a et b . Montrer que : F ∩ G �= ∅ ⇐⇒ b − a ∈ F + G.
862
Solutions des exercices
Solutions des exercices 22.1 L’identité : ∀x ∈ IR
fa (x) = cos(x + a) = cos a cos x − sin a sin x
qui s’écrit aussi fa = (cos a) cos −(sin a) sin , montre que la fonction fa est combinaison linéaire des fonctions sin et cos . 22.2 1. L’ensemble F est une partie de IR3 . • Le vecteur nul (0, 0, 0) appartient à F . • Soit λ ∈ IR et x = (x1 , x2 , x3 ) et y = (y1 , y2 , y3 ) deux éléments de F . On a alors : λ x + y = (λx1 + y1 , λx2 + y2 , λx3 + y3 ).
Comme : 3
(λxi + yi ) = λ
i=1
on en déduit λ x + y ∈ F .
3
xi +
i=1
3
yi = λ 0 + 0 = 0,
i=1
Par suite F est un sous-espace vectoriel de IR3 . 2. L’ensemble G n’est pas un sous-espace vectoriel de IR3 puisqu’il ne contient pas le vecteur nul de IR3 . 22.3 L’ensemble Ea,b est inclus dans IKIN . • La suite nulle appartient à Ea,b .
2 et λ ∈ IK . Alors, on a, pour tout n ∈ IN : • Soit (u, v) ∈ Ea,b
(λ u + v)n+2 = λ un+2 + vn+2 = λ (aun+1 + bun ) + (avn+1 + bvn ) = a(λ un+1 + vn+1 ) + b(λ un + vn ), donc λ u + v ∈ Ea,b .
Ainsi Ea,b est un sous-espace vectoriel de IKIN .
22.4 La partie D (c’est un disque) n’est pas stable par multiplication par un scalaire : par exemple, 1 appartient à D mais 2 = 2.1 n’appartient pas à D . Par suite, D n’est ni un sous-espace vectoriel du C -espace vectoriel C , ni un sous-espace vectoriel du IR -espace vectoriel C . 22.5 Montrons que FA est un sous-espace vectoriel de IK[X] . • Le polynôme nul appartient à FA , puisque 0 = A × 0 .
• Soit λ ∈ IK et (P1 , P2 ) ∈ FA2 . Il existe donc (Q1 , Q2 ) ∈ IK[X]2 tel que P1 = AQ1 et P2 = AQ2 , et alors : λP1 + P2 = λ(AQ1 ) + (AQ2 ) = A(λQ1 + Q2 ). Comme λQ1 + Q2 ∈ IK[X] , on en déduit que λP1 + P2 appartient à FA .
Ainsi FA est bien un sous-espace vectoriel de IK[X] , et donc un IK -espace vectoriel.
863
Chapitre 22. Espaces vectoriels 22.6 • Supposons F + G = F ∪ G . Alors F ∪ G est un sous-espace vectoriel de E ; donc, d’après la remarque de la page 838, on a F ⊂ G ou G ⊂ F . • Réciproquement, supposons l’un des deux sous-espaces vectoriels inclus dans l’autre, par exemple F ⊂ G . Alors on a évidemment : G=F ∪G
et
F + G ⊂ G.
Comme on sait que G ⊂ F + G , on en déduit F + G = G = F ∪ G . 22.7 Soit (λ1 , λ2 , λ3 ) ∈ IR3 tel que λ1 x1 + λ2 x2 + λ3 x3 = 0. On a alors :
(λ1 − λ2 + λ3 , λ1 + λ2 − λ3 , λ1 − λ2 − λ3 ) = (0, 0, 0).
On en déduit :
λ1 − λ2 + λ3 = 0 λ1 + λ 2 − λ 3 = 0 λ1 − λ2 − λ3 = 0.
En sommant les deux premières lignes, on obtient λ1 = 0 . La somme des deux dernières lignes donne alors λ3 = 0 , et l’on en déduit λ2 = 0 ; la famille est donc libre. 22.8 • Supposons Im ω �= 0 et montrons que (1, ω) est libre. Soit (a, b) ∈ IR2 tel que a + b ω = 0 . On a alors 0 = Im(a + b ω) = b Im ω donc b = 0 car Im ω �= 0 . On en déduit alors a = 0 , et la famille est donc libre. • Supposons Im ω = 0 et donc ω ∈ IR . Alors, la combinaison linéaire non triviale (à coefficients réels) ω · 1 − 1 · ω = 0 montre que la famille est liée. Par suite, on a démontré l’équivalence demandée. 22.9 Soit a et b deux réels tels que a cos +b sin = 0 . On a alors : ∀x ∈ IR
a cos x + b sin x = 0.
• En évaluant cette égalité en 0 , on en déduit a = 0 . • En évaluant cette égalité en π2 , on en déduit b = 0 .
Ainsi, on a (a, b) = (0, 0) et la famille (cos, sin) est donc libre. 22.10 Étant donné que : ∀x ∈ IR
cos2 x + sin2 x = 1,
on a (−1) · 1 + 1 · cos2 +1 · sin2 = 0 , ce qui entraîne que la famille (1, sin2 , cos2 ) est liée. On en déduit que la famille donnée est liée puisque c’en est une sur-famille. 22.11 Montrons tout d’abord que cette famille est génératrice de IK2 [X] . • Chaque vecteur de cette famille appartient bien à IK2 [X] .
• Les égalités X = (X+1)−1 et X 2 = (X 2 +X+1)−(X+1) montrent que tout vecteur de la famille (1, X, X 2 ) est combinaison linéaire des vecteurs de la famille (1, X+1, X 2 +X+1) .
• Comme (1, X, X 2 ) engendre IK2 [X] , il en est de même de (1, X + 1, X 2 + X + 1) .
De plus, la famille (1, X + 1, X 2 + X + 1) est échelonnée en degré donc libre. Par suite (1, X + 1, X 2 + X + 1) est une base de IK2 [X] .
864
Solutions des exercices
(X − a)n (X − a)2 (X − a)3 , ,..., 22.12 1. La famille 1, (X − a), 2 3! n! lonnée en degré.
est libre car elle est éche-
2. La formule de Taylor appliquée au polynôme P donne : P (X) =
+∞ P (k) (a) k=0
k!
(X − a)k =
n
P (k) (a)
k=0
(X − a)k · k!
(X − a)2 (X − a)3 (X − a)n est une famille d’élé, ,..., 2 3! n! ments de IKn [X] . La formule précédente montre que tout polynôme de IKn [X] est combinaison linéaire de cette famille ; ainsi cette famille est génératrice de IKn [X] . Comme elle est de plus libre, c’est une base de cet espace vectoriel. Or, la famille
1, (X − a),
De plus, la famille des coordonnées de P dans cette base est :
P (a), P ′ (a), P ′′ (a), . . . , P n (a) .
22.13 On a déjà vu que F est un sous-espace vectoriel de IR3 . Soit (x, y, z) ∈ IR3 . On a : (x, y, z) ∈ F ⇐⇒ x + y + z = 1
⇐⇒ (x − 1) + y + z = 0
⇐⇒ (x, y, z) − (1, 0, 0) ∈ F, ce que l’on voulait démontrer.
22.14 Puique E n’est pas réduit à {0} , il existe un vecteur x non nul de E , que l’on fixe. On a alors i ⋆ x = Re(i) · x = 0 , donc i ⋆ (i ⋆ x) = 0 . Par ailleurs, on a (i2 ) ⋆ x = −x . Ainsi, i ⋆ (i ⋆ x) �= (i2 ) ⋆ x . Donc l’ensemble (E, +, ⋆) n’est donc pas un C -espace vectoriel.
22.15 1. La fonction nulle est dérivable, et toute combinaison linéaire de fonctions dérivables est aussi dérivable. Ainsi l’ensemble des fonctions dérivables sur IR est un sous-espace vectoriel de E . 2. L’ensemble des fonctions croissantes sur IR n’est pas un sous-espace vectoriel de E . En effet, la fonction x �→ x est croissante mais son opposé x �→ −x n’est pas croissante. 3. L’ensemble des fonctions monotones sur IR n’est pas un sous-espace vectoriel de E . En effet, les fonctions x �→ x et x �→ x3 sont monotones sur IR mais leur différence f : x �→ x − x3 vérifie f (0) = 0 , f (1/2) = 3/8 et f (1) = 0 donc n’est pas monotone sur IR . 4. L’ensemble des fonctions prenant une valeur non nulle en 0 n’est pas un sous-espace vectoriel de E , puisqu’il ne contient pas la fonction nulle.
865
Chapitre 22. Espaces vectoriels 22.16 1. Supposons IK = IR . On écrit : x2 + y 2 + 2z 2 − 2xy − 2yz + 2xz = (x − y + z)2 + z 2 .
On a donc, si IK = IR :
2
2
(x − y + z) + z = 0 ⇐⇒
⇐⇒
x−y+z = 0 z=0 x−y =0 z=0
L’ensemble F est donc l’ensemble des vecteurs (x, x, 0) , avec x ∈ IR . Autrement dit, on a F = Vect{(1, 1, 0)} . Il s’agit donc un sous-espace vectoriel de IR3 . 2. Si IK = C , alors on a : 2
2
(x − y + z) + z = 0 ⇐⇒
x − y + z = iz ou x − y + z = −iz.
Ce n’est donc pas un sous-espace vectoriel, car il contient les deux vecteurs (1, i, i) et (1, −i, −i) mais pas leur somme (2, 0, 0) . 22.17 1. Soit (λ1 , λ2 , λ3 ) ∈ IK3 tel que :
λ1 (x2 + x3 ) + λ2 ( x3 + x1 ) + λ3 (x1 + x2 ) = 0,
ce qui s’écrit encore : (λ2 + λ3 ) x1 + (λ1 + λ3 ) x2 + (λ1 + λ2 ) x3 = 0. Comme (x1 , x2 , x3 ) est libre on en déduit : λ2 + λ3 = 0,
λ1 + λ3 = 0
et
λ1 + λ2 = 0.
Par somme de ces trois égalités, on obtient : λ1 + λ2 + λ3 = 0. Par différence avec chacune des premières égalités, on en déduit : λ1 = λ2 = λ3 = 0. Par suite, (x2 + x3 , x3 + x1 , x1 + x2 ) est une famille libre. 2. Si l’on pose y1 = x1 + x2 , y2 = x2 + x3 , y3 = x3 + x4 et y4 = x4 + x1 , alors on a : y1 + y3 = y2 + y4
ou encore
y1 − y2 + y3 − y4 = 0
donc la famille donnée n’est pas libre. 22.18 Puisque G et H sont inclus dans G + H , on a : F ∩ G ⊂ F ∩ (G + H)
et
F ∩ H ⊂ F ∩ (G + H).
Comme (F ∩ G) + (F ∩ H) est le plus petit sous-espace vectoriel contenant les sous-espaces vectoriels (F ∩ G) et (F ∩ H) , on en déduit : (F ∩ G) + (F ∩ H) ⊂ F ∩ (G + H).
Pour montrer que l’on ne peut pas faire mieux (égalité) donnons un contre-exemple. Il suffit de considérer dans IR2 les sous-espaces vectoriels :
F = Vect (1, 1) ,
G = Vect (1, 0)
et
H = Vect (0, 1) .
On a G + H = Vect (0, 1), (1, 0) = IR2 et donc F ∩ (G + H) = F .
En revanche, on a F ∩ G = F ∩ H = {0} et donc (F ∩ G) + (F ∩ H) = {0} .
866
Solutions des exercices 22.19 Soit (x, y, z) ∈ IR3 . On a :
x+y+z = 0 2x − y + z = 0
⇐⇒
2 x=− z 3
et
1 y=− z 3
⇐⇒ (x, y, z) =
z (−2, −1, 3). 3
Par conséquent, on a F = Vect (−2, −1, 3) , ce qui prouve que F est un sous-espace vectoriel de E ; comme le vecteur (−2, −1, 3) est non nul, F est la droite vectorielle engendrée par le vecteur (−2, −1, 3) . 22.20 Pour montrer que la famille (fa )a∈IR est libre, montrons que toutes ses sous-familles finies sont libres. Soit donc n ∈ IN∗ et a1 , . . . , an des réels distincts ; montrons que la famille (faj )j∈[[1,n]] est libre. Soit (λj )j∈[[1,n]] ∈ IRn tel que
n
λj faj = 0 .
j=1
Soit k ∈ [[1, n]] . Supposons λk �= 0 . • Alors en divisant la relation précédente par λk , on en déduit que fak est combinaison linéaire des n − 1 autres fonctions. • Or, pour tout j ∈ [[1, n]] \ {k} , la fonction faj est dérivable en ak . Donc par combinaison linéaire, fak est aussi dérivable en ak , ce qui est faux. Par suite, on a λk = 0 et, comme k est quelconque, cela prouve que la famille (fak )k∈[[1,n]] est libre. D’où la liberté de la famille (fa )a∈IR . 22.21 1. Pour prouver que (ϕk )k∈IN est une famille libre du IR -espace vectoriel IRIR , il suffit de montrer que, pour tout n ∈ IN , la famille (ϕk )k∈[[0,n]] est libre. Soit donc (λ0 , . . . , λn ) ∈ IRn+1 tel que ∀x ∈ IR Posons alors P (X) =
n
k=0
n
n
λk ϕk = 0 et donc tel que :
k=0
λk ekx =
k=0
n
λk (ex )k = 0.
(∗)
k=0
λk X k . La relation (∗) s’écrit alors ∀x ∈ IR
P (ex ) = 0 .
Comme l’image de la fonction exp est IR∗+ , on en déduit ∀y ∈ IR∗+ P (y) = 0 . Ainsi P a une infinité de racines, et donc P = 0 . Par suite, ses coefficients sont tous nuls, ce qui prouve que la famille (ϕk )k∈[[0,n]] est libre. 2. Pour prouver que (ϕa )a∈IR est une famille libre du IR -espace vectoriel IRIR , il suffit de montrer que chacune de ses sous-familles finies est libre. Soit donc n ∈ IN∗ ainsi que n réels a1 , . . . , an distincts, que l’on suppose rangés par ordre strictement croissant a1 < · · · < an . Montrons, par l’absurde, que la famille (ϕak )k∈[[1,n]] est libre. Supposons donc qu’il existe une famille (λ1 , . . . , λn ) ∈ IRn , non tous nuls, tels que :
n
λk ϕak = 0
k=1
et posons p = max k ∈ [[1, n]] : λk �= 0 . La relation précédente devient alors : p k=1
λk ϕak = 0
et ainsi
p−1 k=1
λk ϕak = −λp ϕap .
867
Chapitre 22. Espaces vectoriels En multipliant par la fonction ϕ−ap , on obtient : p−1 k=1
λk ϕ(ak −ap ) = −λp .
Pour tout k ∈ [[1, p − 1]] , on a ak − ap < 0 , et donc le membre de gauche tend vers 0 en +∞ . Ainsi, en passant à la limite, on obtient λp = 0 , ce qui est impossible. Par suite, la famille (ϕak )k∈[[1,n]] est libre. Ainsi, (ϕa )a∈IR est une famille libre.
22.22 Soit F l’ensemble des polynômes P ∈ C4 [X] tels que P (a) = P (b) = 0 . Les complexes a et b étant distincts, F est l’ensemble des polynômes de C4 [X] divisibles par (X − a)(X − b) . Comme le degré d’un tel polynôme est au plus 4 , on a :
F = (X − a)(X − b)(α + βX + γX 2 ) | (α, β, γ) ∈ C3 . donc :
F = α(X − a)(X − b) + β(X − a)(X − b)X + γ(X − a)(X − b)X 2 | (α, β, γ) ∈ C3 ou encore :
F = Vect (X − a)(X − b), (X − a)(X − b)X, (X − a)(X − b)X 2 . Par conséquent :
• l’ensemble F est un sous-espace vectoriel de C4 [X] ;
• comme la famille (X − a)(X − b), (X − a)(X − b)X, (X − a)(X − b)X 2 échelonnée en degré, c’est une base de F .
est libre, car
22.23 Montrons l’égalité des sous-espaces vectoriels AN et BN par double inclusion. • Soit n ∈ [[0, N ]] ; montrons un ∈ BN .
Soit x ∈ IR . En utilisant les formules d’Euler et du binôme, on a : un (x) =
eix + e−ix 2
n
n n 1 n ikx −i(n−k)x 1 n i(2k−n)x = n e e = n e . 2 2 k k k=0
k=0
Or la fonction un est à valeurs réelles donc on a :
un (x) = Re un (x) =
n n i(2k−n)x 1 n 1 n Re e = cos (2k − n)x . n n 2 2 k k k=0
k=0
Finalement, la fonction cos étant paire, on a :
n 1 n un (x) = n cos |2k − n|x . 2 k k=0
Or, pour k ∈ [[0, n]] , on a |2k − n| ∈ [[0, n]] , ce qui prouve que un est une combinaison linéaire de (v0 , . . . , vn ) . Ainsi, pour tout n ∈ [[0, N ]] , on a un ∈ Bn donc un ∈ BN , ce qui prouve AN ⊂ BN .
868
Solutions des exercices • Soit n ∈ [[0, N ]] ; montrons vn ∈ AN . En utilisant les formules de Moivre et du binôme, on a : vn = Re = Re
=
(cos +i sin)n
n n
k
n
k∈[[0,n]] kpair
k
k
i sin cos
k
k=0
n−k
k
(−1) 2 sink cosn−k .
En effectuant le changement d’indice [k = 2p] , on obtient :
⌊2⌋ n n
vn =
p=0
2p
⌊2⌋ n
(−1)p sin2p cosn−2p
n
=
p=0
2p
⌊2⌋ n
(−1)p (1 − cos2 )p cosn−2p
n
=
p=0
2p
(−1)p cosn−2p
k=0
p p n ⌋ ⌊n 2
=
p=0 k=0
k
p p
2p
k
(−1)p−k cos2(p−k)
(−1)k cosn−2k ,
ce qui montre que vn est une combinaison linéaire de (u0 , . . . , un ) . Ainsi, pour tout n ∈ [[0, N ]] , on a vn ∈ An donc vn ∈ AN , ce qui prouve BN ⊂ AN . 22.24 Pour montrer que la famille (fn )n∈IN∗ est libre, il suffit de montrer que pour tout n ∈ IN∗ , la famille (f1 , . . . , fn ) est libre. Prouvons-le par récurrence. • Le résultat est vrai si n = 1 , puisque la fonction sin est non nulle. • Soit n 2 ; supposons (f1 , . . . , fn−1 ) libre et montrons que (f1 , . . . , fn ) est libre. Considérons n réels λ1 , . . . , λn tels que : n
λk fk = 0.
(i)
k=1
En dérivant deux fois cette égalité de fonctions, on obtient : −
n
λk k2 fk = 0.
(ii)
k=1
En multipliant (i) par n2 et en l’additionnant à (ii) , on obtient : n−1 k=1
(n2 − k2 ) λk fk = 0.
Or, par hypothèse la famille (f1 , . . . , fn−1 ) est libre donc : ∀k ∈ [[1, n − 1]]
(n2 − k2 )λk = 0.
869
Chapitre 22. Espaces vectoriels Comme n2 − k2 �= 0 pour k ∈ [[1, n − 1]] , on en déduit :
λk = 0.
∀k ∈ [[1, n − 1]]
En reportant dans la relation (i) , on a alors λn fn = 0 , ce qui conduit à λn = 0 puisque fn n’est pas la fonction nulle. Ainsi (f1 , . . . , fn ) est libre, ce qui termine la démonstration par récurrence. 22.25 • Toute fonction indicatrice d’intervalle est une fonction en escalier. Or on a vu à la pro position 4 de la page 494 que l’ensemble E [a, b], IR des fonctions en escalier était stable par combinaison linéaire. Comme il contient évidemment la fonction nulle, c’est un sousespace vectoriel de IR[a,b] . Donc toute combinaison linéaire de fonctions indicatrices d’in tervalle est dans E [a, b], IR .
• Réciproquement, si f est dans E [a, b], IR , il existe une subdivision (xi )i∈[[0,n]] de [a, b] adaptée à f . En notant vi la valeur constante de f sur ]xi−1 , xi [ , pour tout i ∈ [[1, n]] , on a : f=
n
vi 1]xi−1 ,xi [ +
n
f (xi ) 1[xi ,xi ]
i=0
i=1
ce qui prouve que f est combinaison linéaire de fonctions indicatrices d’intervalles.
Le sous-espace vectoriel recherché est donc E [a, b], IR . 22.26 Supposons que F ∩ G �= ∅ . Soit c un élément de F ∩ G . On a alors : b − a = (c − a) + (b − c) ∈ F + G.
Réciproquement, si b − a ∈ F + G , alors il existe u et v respectivement dans F et G tels que b − a = u − v d’où : a+u = b+v. Ainsi F ∩ G �= ∅ .
870
∈F
∈G
Chapitre 23 : Applications linéaires I
Définition et propriétés . . . . . . . . . . . . . Définition et caractérisation . . . . . . . . . . Opérations sur les applications linéaires . . . Noyau et image d’une application linéaire . . II Endomorphismes . . . . . . . . . . . . . . . . . 1 L’anneau des endomorphismes . . . . . . . . 2 Endomorphismes remarquables . . . . . . . . III Applications linéaires et familles de vecteurs 1 Image d’une famille de vecteurs . . . . . . . . 2 Liens avec l’injectivité et la surjectivité . . . IV Caractérisation d’une application linéaire . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
872 . 872 . 875 . 876 878 . 878 . 879 883 . 883 . 883 884
À l’aide d’une base . . . . . . . . . . . . . . . . . . À l’aide de sous-espaces vectoriels supplémentaires V Formes linéaires et hyperplans . . . . . . . . . . . 1 Formes linéaires . . . . . . . . . . . . . . . . . . . 2 Hyperplans vectoriels . . . . . . . . . . . . . . . . 3 Hyperplans affines . . . . . . . . . . . . . . . . . . VI Équations linéaires . . . . . . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. 884 . 885 886 . 886 . 887 . 888 888 890 895
1 2 3
1 2
. . . . . . . . . . .
. . . . . . . . . . .
Applications linéaires
23
On étudie dans ce chapitre les applications entre espaces vectoriels qui respectent la structure d’espace vectoriel, c’est-à-dire qui sont « compatibles » avec les lois interne et externe. Dans tout le chapitre, IK désigne le corps IR ou C et E , F et G sont des IK-espaces vectoriels.
I
Définition et propriétés
1
Définition et caractérisation
Définition 1 Une application u : E −→ F est une application linéaire si : ∀(x, y) ∈ E 2 u(x + y) = u(x) + u(y) ∀λ ∈ IK ∀x ∈ E
u(λx) = λu(x).
Une telle application u est aussi appelée morphisme d’espaces vectoriels, et l’on parle : • d’endomorphisme si E = F ,
• d’isomorphisme si u est bijective,
• d’automorphisme si u est un endomorphisme bijectif. Notation On note : • L(E, F ) l’ensemble des applications linéaires de E dans F ; • L(E) = L(E, E) l’ensemble des endomorphismes de E .
Remarque Une application linéaire est en particulier un morphisme de groupe entre (E, +) et (F, +). Cela donne en particulier : Proposition 1 Si u est une application linéaire de E dans F , alors u(0E ) = 0F . Remarque La plupart du temps, on note de la même façon les vecteurs nuls 0E et 0F , et le résultat précédent s’écrit alors simplement u(0) = 0 .
I Définition et propriétés Proposition 2 Une application u : E −→ F est une application linéaire si, et seulement si : ∀(x, y) ∈ E 2
Démonstration.
∀λ ∈ IK
u(λx + y) = λu(x) + u(y).
Le sens direct est immédiat. Prouvons le sens réciproque. Supposons : ∀(x, y) ∈ E 2
u(λx + y) = λu(x) + u(y).
∀λ ∈ IK
• En prenant le scalaire λ = 1 , on obtient ∀(x, y) ∈ E 2 • De plus, pour x ∈ E et λ ∈ IK , on a :
u(x + y) = u(x) + u(y) .
u(λx) = u (λ − 1)x + x = (λ − 1)u(x) + u(x) = λu(x). Ainsi, u est linéaire.
Remarque On utilise également la caractérisation suivante, plus symétrique : Exo 23.1 Exo 23.2 Exo 23.3
∀(x, y) ∈ E 2
∀(λ, µ) ∈ IK2
u(λx + µy) = λu(x) + µu(y).
Point méthode Dans la très grande majorité des cas, pour montrer qu’une application est linéaire, on utilisera la caractérisation de la proposition 2 ou celle de la remarque ci-dessus. Remarques • L’image, par une application linéaire, d’une combinaison linéaire est la combinaison linéaire des images. Plus précisément, si u ∈ L(E, F ), alors une récurrence immédiate montre que, pour tout n ∈ IN∗ , pour tout (x1 , . . . , xn ) ∈ E n et pour tout (λ1 , . . . , λn ) ∈ IKn , on a : n n λi u(xi ). λi xi = u i=1
i=1
• La restriction d’une application linéaire à un sous-espace vectoriel est une application linéaire.
Ex. 1. L’application nulle de E dans F est une application linéaire. Ex. 2. L’application identité IdE est une application linéaire, qui, de plus, est bijective : IdE est donc un automorphisme de E . Ex. 3. Déterminons les applications linéaires de IK dans IK . Si u ∈ L(IK) alors : ∀x ∈ IK
u(x) = u(x 1) = x u(1).
Par conséquent, si l’on pose λ = u(1) , on a : ∀x ∈ E u(x) = λx . Réciproquement, on vérifie aisément que pour tout λ ∈ IK , l’application s : IK −→ IK est linéaire. x �−→ λx
873
Chapitre 23. Applications linéaires IK2 (x, y)
Ex. 4. L’application s :
IK2 (y, x)
−→ �−→
est linéaire.
En effet, étant donné λ ∈ IK et (x1 , y1 ), (x2 , y2 ) ∈ IK2
2
, on a :
s λ(x1 , y1 ) + (x2 , y2 ) = s λx1 + x2 , λy1 + y2
= λy1 + y2 , λx1 + x2 = λ(y1 , x1 ) + (y2 , x2 )
= λs(x1 , y1 ) + s(x2 , y2 ).
Bon nombre de propriétés établies dans les chapitres précédents peuvent se traduire en termes de linéarité. Ex. 5. La dérivation f �→ f ′ permet de définir :
• une application linéaire de C 1 (IR, IK) dans C 0 (IR, IK) , • un endomorphisme de C ∞ (IR, IK) .
Ex. 6. L’intégration sur un segment a, b : CM([a, b], IK)
−→
f
�−→
est une application linéaire de CM([a, b], IK) dans IK . Ex. 7. La dérivation polynomiale
IK[X] P
−→ �−→
IK
b
f (t) dt
a
est un endomorphisme de IK[X] .
IK[X] P′
Ex. 8. Linéarité de l’évaluation en un point. • Pour a ∈ IK , l’application
IK[X] P
−→ �−→
IK est linéaire. P (a)
• Étant donné Ω un ensemble, E un IK -espace vectoriel et a un élément de Ω , l’application : EΩ f
−→ �−→
E f (a)
est linéaire. Ex. 9. La transposition
1084
Mn,p (IK) M
−→ �−→
Mp,n (IK) MT
est linéaire.
Ex. 10. Par théorème d’opérations sur les suites, l’ensemble F des suites convergentes est sous-espace vectoriel de IKIN et l’application F −→ IK est linéaire. u �−→ lim u Ex. 11. On verra au chapitre 29 que l’ensemble des variables aléatoires réelles définies sur un univers fini est un IR -espace vectoriel. L’espérance est alors une application linéaire de cet espace vectoriel vers IR .
874
I Définition et propriétés
2
Opérations sur les applications linéaires
Proposition 3 L’ensemble L(E, F ) muni des lois usuelles est un IK-espace vectoriel.
Démonstration page 890
Principe de démonstration.
E
C’est un sous-espace vectoriel de F .
On en déduit immédiatement le corollaire suivant. Corollaire 4 Toute combinaison linéaire d’applications linéaires est linéaire. Proposition 5 Si u ∈ L(E, F ) et v ∈ L(F, G), alors v ◦ u ∈ L(E, G).
Démonstration page 890
Proposition 6 (Bilinéarité de la composition) Étant donné u ∈ L(E, F ) et v ∈ L(F, G), les applications : L(F, G) w sont linéaires. Démonstration.
−→ �−→
L(E, G) w◦u
et
L(E, F ) w
−→ L(E, G) �−→ v ◦ w
La linéarité de la première est immédiate, celle de la seconde découle de la
linéarité de v : • pour (w1 , w2 ) ∈ L(F, G)2 et λ ∈ IK , on a, par définition de λw1 + w2 : (λw1 + w2 ) ◦ u = λw1 ◦ u + w2 ◦ u ; • pour (w1 , w2 ) ∈ L(E, F )2 et λ ∈ IK , on a, par linéarité de v : v ◦ (λw1 + w2 ) = λv ◦ w1 + v ◦ w2 .
Terminologie On dit que l’application L(F, G) × L(E, F ) (v, u)
−→ �−→
L(E, G) est bilinéaire. v◦u
Proposition 7 (Inverse d’un isomorphisme) Si u est un isomorphisme d’espaces vectoriels de E dans F , alors sa bijection réciproque u−1 est linéaire. Démonstration page 890
Terminologie Lorsqu’il existe un isomorphisme de E dans F , on dit que les sousespaces vectoriels E et F sont isomorphes. Le caractère symétrique de cette terminologie est justifié par la proposition précédente. 875
Chapitre 23. Applications linéaires
3
Noyau et image d’une application linéaire
Proposition 8 Soit u une application linéaire de E dans F . • Si E ′ est un sous-espace vectoriel de E , alors u(E ′ ) est un sous-espace vectoriel de F . • Si F ′ est un sous-espace vectoriel de F , alors u−1 (F ′ ) est un sous-espace vectoriel de E . Principe de démonstration.
Démonstration page 890 Utiliser la caractérisation d’un sous-espace vectoriel.
Définition 2 Soit u ∈ L(E, F ). On appelle :
• noyau de u , et l’on note Ker u , le sous-espace vectoriel de E défini par : Ker u = u−1 ({0}) = x ∈ E : u(x) = 0 ;
• image de u , et l’on note Im u , le sous-espace vectoriel de F défini par : Im u = u(E) = {u(x) | x ∈ E}.
Remarque D’après la proposition précédente, le noyau et l’image de u sont bien des sous-espaces vectoriels en tant qu’image réciproque du sous-espace vectoriel {0} et image directe du sous-espace vectoriel E . Ex. 12. Considérons l’application linéaire u :
IR3 (x, y, z)
−→ �−→
• Déterminons le noyau de u . Soit (x, y, z) ∈ IR3 . On a : u(x, y, z) = 0 ⇐⇒ Par conséquent :
x − y + z = 0 et z = 0
IR2 (x − y + z, z).
⇐⇒ (x = y et z = 0 .
Ker u = (x, y, z) ∈ IR3 : x = y, z = 0 = (x, x, 0) ∈ IR3 | x ∈ IR = Vect (1, 1, 0) . • Déterminons l’image de u . Pour (a, b) ∈ IR2 , on a u(a, b, b) = (a, b) , donc tout vecteur de IR2 appartient à l’image de u et ainsi Im u = IR2 . Ex. 13. Considérons l’endomorphisme ϕ : IK[X] P
−→ �−→
IK[X] XP.
• Déterminons le noyau de ϕ . Soit P ∈ IK[X] . Par intégrité de IK[X] , on a ϕ(P ) = 0 si, et seulement si, P = 0 . Ainsi Ker ϕ = {0} . • Déterminons l’image de ϕ . Soit Q ∈ IK[X] . ∗ Si Q ∈ Im ϕ alors il existe P ∈ IK[X] tel que Q = XP et ainsi Q(0) = 0 , ce qui signifie que 0 est racine de Q . ∗ Réciproquement, si 0 est racine de Q alors Q est divisible par X , donc il existe P ∈ IK[X] tel que Q = XP = ϕ(P ) ; ainsi, Q ∈ Im ϕ .
On en déduit Im ϕ = Q ∈ IK[X] : Q(0) = 0 .
876
I Définition et propriétés Point méthode Pour montrer qu’une partie est un sous-espace vectoriel, il peut être efficace de montrer que c’est le noyau ou l’image d’une application linéaire. Ex. 14. L’ensemble {(x, y, z) ∈ IK3 : x+2y+3z = 0 et x+y = 0} est un sous-espace vectoriel de IK3 puisque c’est le noyau de l’application linéaire
IK3 (x, y, z)
Remarques Soit u ∈ L(E, F ) et v ∈ L(F, G). • On dispose des deux inclusions suivantes : En effet,
Ker(u) ⊂ Ker(v ◦ u)
et
−→ �−→
IK2 (x + 2y + 3z, x + y).
Im(v ◦ u) ⊂ Im v.
∗ si x ∈ Ker u , on a u(x) = 0 donc v u(x) = 0 , par linéarité de v , c’est-àdire x ∈ Ker(v ◦ u) ; ∗ si y ∈ Im(v◦u), il existe x ∈ E tel que y = (v◦u)(x) = v(u(x)), donc y ∈ Im v .
• De plus, l’application v ◦ u est nulle si, et seulement si, Im u ⊂ Ker v . En effet, on a : v ◦ u = 0 ⇐⇒ ∀x ∈ E v u(x) = 0 ⇐⇒ ∀x ∈ E
u(x) ∈ Ker v
⇐⇒ Im(u) ⊂ Ker v.
Remarque Une application u ∈ L(E, F ) est surjective si, et seulement si, Im u = F . Théorème 9 Une application u ∈ L(E, F ) est injective si, et seulement si, Ker u = {0} . Démonstration. C’est une conséquence du fait que u est en particulier un morphisme de groupe (théorème 12 de la page 685). Ex. 15. La dérivation D :
C 1 (IR, IR) −→ C 0 (IR, IR) est une application linéaire non f �−→ f ′ injective puisque son noyau, l’ensemble des applications constantes, est non nul.
Point méthode Pour démontrer qu’une application linéaire est injective, on utilisera systématiquement cette dernière caractérisation à l’aide du noyau. Puisque {0} ⊂ Ker u , il s’agira essentiellement de montrer l’inclusion Ker u ⊂ {0} , c’est-à-dire : ∀x ∈ E u(x) = 0 =⇒ x = 0.
877
Chapitre 23. Applications linéaires
Ex. 16. Soit (a, b, c) ∈ C3 tel que a �= 0 . On pose ϕ : C 2 (IR, C) f
−→ �−→
C 0 (IR, C) af ′′ + bf ′ + cf.
L’application ϕ est linéaire en tant que combinaison linéaire d’applications linéaires et par linéarité de la dérivation. D’après les résultats du chapitre 8, l’équation différentielle linéaire à coefficients constants ay ′′ + by ′ + cy = 0 admet (au moins) une solution non nulle. Ainsi le noyau de ϕ n’est pas réduit au vecteur nul et ϕ n’est pas injective. Ex. 17. Soit n ∈ IN∗ et x1 , . . . , xn des éléments deux à deux distincts de IK . On pose : ϕ : IK[X] P
−→ �−→
n IK P (x1 ), . . . , P (xn ) .
et l’on note ϕn sa restriction à IKn−1 [X] . Étant donné a ∈ IK , l’application P �→ P (a) est linéaire ; par conséquent, les applications ϕ et ϕn sont linéaires. Déterminons leurs noyaux. • Soit P ∈ IKn−1 [X] un élément de Ker ϕn . Chacun des xi est donc racine de P ; ces nombres étant deux à deux distincts, le polynôme P possède (au moins) n racines. Or deg P n − 1 donc P = 0 et ainsi Ker ϕn = {0} . Donc ϕn est injective. • Un polynôme P appartient au noyau de ϕ si, et seulement s’il admet chaque xi pour racine. Comme ce sont des scalaires distincts deux à deux, cela revient à dire que P est divisible par A =
n
i=1
II 1
(X − xi ) . Ainsi Ker ϕ = A Q | Q ∈ IK[X] .
Endomorphismes L’anneau des endomorphismes
Proposition 10 (Anneau L(E) des endomorphismes) L’ensemble (L(E), +, ◦) est un anneau. Démonstration. • L’ensemble L(E) est un espace vectoriel (proposition 3 de la page 875) donc un groupe commutatif pour l’addition. • Il est stable pour la composition des applications (proposition 5 de la page 875).
• Il contient l’application IdE qui est élément neutre pour la loi ◦ . • La composition des applications est associative, donc celle des applications linéaires l’est a fortiori. • La distributivité de ◦ par rapport à + provient de la bilinéarité de la composition dans L(E) (proposition 6 de la page 875).
Remarque Cet anneau est en général non commutatif comme le montre l’exemple 18. Ex. 18. Soit r et s les deux applications de IR2 dans IR2 définies par : ∀(x, y) ∈ IR2
s(x, y) = (y, x)
et
r(x, y) = (−y, x).
On a montré dans l’exemple 4 de la page 874 que s appartient à L(IR2 ) . On montre de même que r appartient à L(IR2 ) .
878
II Endomorphismes De plus, pour tout (x, y) ∈ IR2 , on a : (r ◦ s)(x, y) = r (s(x, y)) = r(y, x) = (−x, y), (s ◦ r)(x, y) = s (r(x, y)) = s(−y, x) = (x, −y). Les applications r ◦ s et s ◦ r sont donc différentes puisque (r ◦ s)(1, 1) �= (s ◦ r)(1, 1) .
Itérés d’un endomorphisme Soit u ∈ L(E). Comme dans tout anneau, pour tout k ∈ IN, on note uk l’itéré k -ième de u pour la composition. Lorsque u est bijectif, donc inversible pour la composition, alors pour tout k ∈ IN, l’endomorphisme uk est inversible et son inverse se note u−k . Groupe linéaire Proposition 11 (Groupe GL(E) des automorphismes) L’ensemble des automorphismes de E , que l’on note GL(E), muni de la composition, est un groupe. On l’appelle le groupe linéaire de E . Démonstration.
2
C’est le groupe des unités de l’anneau L(E) .
Endomorphismes remarquables
Homothéties Définition 3 Soit λ ∈ IK. L’endomorphisme λ IdE est appelée homothétie de rapport λ . Remarques • Une homothétie commute avec tout endomorphisme.
• Si λ �= 0 alors l’homothétie de rapport λ est un automorphisme dont la réciproque est l’homothétie de rapport λ1 ·
Projecteurs ou projections Définition 4 Étant donné F1 et F2 deux sous-espaces vectoriels supplémentaires de E , l’application : E = F1 ⊕ F2 −→ E x = x1 + x2 �−→ x1 est appelée projection (ou projecteur) sur F1 parallèlement à F2 . Remarque Une telle application est bien définie car tout vecteur x s’écrit de manière unique x = x1 + x2 avec (x1 , x2 ) ∈ F1 × F2 .
F2 x
x2
F1 x1 = p(x)
879
Chapitre 23. Applications linéaires
Ex. 19. Dans IR3 , les sous-espaces vectoriels :
F1 = Vect (1, 0, 0)
et
F2 = Vect (0, 1, 0), (0, 0, 1)
sont supplémentaires et tout vecteur (x, y, z) ∈ IR3 s’écrit de manière unique : (x, y, z) = (x, 0, 0) + (0, y, z) .
∈F1
∈F2
Ainsi, la projection sur F1 parallèlement à F2 est l’application
IR3 (x, y, z)
Ex. 20. Dans le IR -espace vectoriel C , l’application Re : C z sur le sous-espace IR parallèlement au sous-espace iIR .
−→ �−→
−→ �−→
C Re z
IR3 (x, 0, 0).
est la projection
Ex. 21. Dans E = IRIR , l’ensemble P des fonctions paires et l’ensemble I des fonctions impaires sont deux sous-espaces vectoriels supplémentaires (cf. exercice 1.3). Alors : • la projection p de E sur P parallèlement à I , • la projection q de E sur I parallèlement à P , sont respectivement données par : p: E f
−→ �−→
E x �→
f (x)+f (−x) 2
et
q: E f
−→ �−→
E x �→
f (x)−f (−x) 2
·
Remarques • La projection sur E parallèlement à {0} est l’identité.
• La projection sur {0} parallèlement à E est l’endomorphisme nul.
Proposition 12 Soit F1 et F2 deux sous-espaces vectoriels supplémentaires dans E et p le projecteur sur F1 parallèlement à F2 . Alors : • p est linéaire (autrement dit, p est un endomorphisme de E ) ;
• F1 = Im p = Ker(p − IdE ) = {x ∈ E : p(x) = x} ; • F2 = Ker p.
Démonstration page 891
Remarque Si p est le projecteur sur F1 parallèlement à F2 , alors q = IdE −p est le projecteur sur F2 parallèlement à F1 . Les deux projecteurs p et q sont dits associés et l’on a : F1 = Im p = Ker q et F2 = Ker p = Im q. Définition 5 Une application p : E → E est appelée projection ou projecteur s’il existe F1 et F2 deux sous-espaces vectoriels supplémentaires dans E tels que p soit la projection sur F1 parallèlement à F2 . 880
II Endomorphismes Proposition 13 (Caractérisation des projecteurs) Soit p : E → E une application. Alors les assertions suivantes sont équivalentes : (i) p est un projecteur ;
(ii) p est linéaire et p ◦ p = p.
Démonstration page 891
Principe de démonstration. Pour l’implication (ii) ⇒ (i) , il faut essentiellement prouver que E = Im p ⊕ Ker p .
Remarque Si p est linéaire et vérifie p ◦ p = p, alors on a E = Im p ⊕ Ker p et p est le projecteur sur Im p parallèlement à Ker p. De plus, la décomposition de tout vecteur x ∈ E selon cette somme directe est : x = p(x) + x − p(x) . ∈Im p
∈Ker p
Symétries
Définition 6 Étant donné F1 et F2 deux sous-espaces vectoriels supplémentaires de E , l’application : E = F1 ⊕ F2 −→ E x = x1 + x2 �−→ x1 − x2 est appelée symétrie par rapport à F1 parallèlement à F2 .
Remarques • Comme pour les projecteurs, une telle application est bien définie car tout vecteur x s’écrit de manière unique x = x1 + x2 avec (x1 , x2 ) ∈ F1 × F2 .
F2 x
x2
• Si p est la projection sur F1 parallèlement à F2 alors on a, pour x ∈ E : x1 − x2 = 2x1 − (x1 + x2 ) = 2p(x) − x.
Ainsi, une application s : E → E est la symétrie par rapport F1 parallèlement à F2 si, et seulement si, s = 2p − IdE , c’est-à-dire si, et seulement si, l’application 12 (s + IdE ) est la projection sur F1 parallèlement à F2 .
F1 x1 = p(x)
s(x) = x1 − x2
−x2
Reprenons les exemples de sous-espaces vectoriels supplémentaires de la page 880 pour donner quelques exemples de symétries. Ex. 22. Dans IR3 , la symétrie par rapport au sous-espace vectoriel F1 = Vect (1, 0, 0) paral-
lèlement à F2 = Vect (0, 1, 0), (0, 0, 1) est l’application
IR3 (x, y, z)
−→ �−→
IR3 (x, −y, −z).
881
Chapitre 23. Applications linéaires Ex. 23. Dans le IR -espace vectoriel C , la conjugaison est la symétrie par rapport à IR parallèlement à iIR . Ex. 24. Dans E = IRIR , la symétrie s par rapport à P , le sous-espace vectoriel des fonctions paires, parallèlement à I , le sous-espace vectoriel des fonctions impaires, est donnée par : s: E f
−→ �−→
E x �→ f (−x) .
Proposition 14 Soit F1 et F2 deux sous-espaces vectoriels supplémentaires dans E et s la symétrie par rapport à F1 parallèlement à F2 . Alors : • s est linéaire ;
• F1 = Ker(s − IdE ) = {x ∈ E : s(x) = x} ;
• F2 = Ker(s + IdE ) = {x ∈ E : s(x) = −x} .
Démonstration page 892
Principe de démonstration. Utiliser la relation s = 2p − IdE entre s et le projecteur p sur F1 parallèlement à F2 .
Définition 7 Une application s : E → E est appelée symétrie s’il existe F1 et F2 deux sousespaces vectoriels supplémentaires dans E tels que s soit la symétrie par rapport à F1 parallèlement à F2 . Proposition 15 (Caractérisation des symétries) Soit s : E → E une application. Alors les assertions suivantes sont équivalentes : (i) s est une symétrie ;
(ii) s est linéaire et s ◦ s = IdE .
Démonstration page 892
Principe de démonstration. Se déduit de la caractérisation des projecteurs, en utilisant le lien entre projecteur et symétrie.
Ex. 25. L’endomorphisme s : symétrie de IK2 .
IK2 (x, y)
−→ �−→
IK2 (y, x)
vérifie s ◦ s = IdIK2 donc s est une
Remarque Si s est linéaire et vérifie s ◦ s = IdE , alors :
E = Ker(s − IdE ) ⊕ Ker(s + IdE )
et s est la symétrie par rapport à Ker(s − IdE ) parallèlement à Ker(s + IdE ). Point méthode Pour montrer que deux sous-espaces vectoriels sont supplémentaires, il peut être efficace de montrer que ce sont les noyau et image d’un projecteur ou bien les noyaux de s − Id et s + Id où s est une symétrie. 882
III Applications linéaires et familles de vecteurs
Ex. 26. La transposition τ : Mn (IK) −→ Mn (IK) est linéaire et vérifie τ ◦ τ = IdMn (IK) M �−→ M T donc τ est une symétrie de Mn (IK) . De plus, on a : • Ker(τ − Id) = {M ∈ Mn (IK) : M T = M } = Sn (IK) ;
• Ker(τ + Id) = {M ∈ Mn (IK) : M T = −M } = An (IK) . On retrouve ainsi que Sn (IK) et An (IK) sont supplémentaires dans Mn (IK) .
Corollaire 16 Une symétrie s est un automorphisme et s−1 = s. Démonstration.
III 1
Immédiat puisqu’une symétrie est linéaire et l’on a s ◦ s = IdE .
Applications linéaires et familles de vecteurs Image d’une famille de vecteurs
Proposition 17 Soit (ei )i∈I une famille d’éléments de E et u ∈ L(E, F ). Alors l’image par u de Vect (ei )i∈I est le sous-espace vectoriel de F engendré par u(ei ) i∈I . Démonstration.
Soit E ′ le sous-espace vectoriel engendré par la famille (ei )i∈I . C’est l’ensemble des combinaisons linéaires de la famille (ei )i∈I . Ainsi, par linéarité de u , u(E ′ ) est l’ensemble des combinaisons linéaires de la famille u(ei ) i∈I c’est-à-dire le sous-espace vectoriel
engendré par la famille u(ei )
i∈I
.
Terminologie On appelle image par u de la famille (ei )i∈I la famille u(ei ) i∈I .
2
Liens avec l’injectivité et la surjectivité
Corollaire 18 Soit u ∈ L(E, F ). Alors l’image par u de toute famille génératrice de E est génératrice de l’image de u . Démonstration. Il s’agit d’une conséquence immédiate de la proposition précédente puisque
si E = Vect (ei )i∈I
alors Im u = u(E) = u Vect (ei )i∈I
= Vect (u(ei ))i∈I .
On en déduit le corollaire suivant. Corollaire 19 Soit u ∈ L(E, F ).
• Si l’image d’une famille génératrice de E est génératrice de F , alors u est surjective.
• Si u est surjective, alors l’image de toute famille génératrice de E est génératrice de F . Démonstration.
Immédiat puisque la surjectivité de u se traduit par Im u = F .
883
Chapitre 23. Applications linéaires Proposition 20 Soit u ∈ L(E, F ). Si u est injective alors l’image par u de toute famille libre est libre.
Démonstration page 892
Exo 23.4
Corollaire 21 Soit (ei )i∈I une base de E et u ∈ L(E, F ). Alors : (i) u est injective si, et seulement si, la famille u(ei ) i∈I est libre ; (ii) u est surjective si, et seulement si, la famille u(ei ) i∈I est génératrice de F ; (iii) u est bijective si, et seulement si, la famille u(ei ) i∈I est une base de F .
Démonstration page 892
Ex. 27. Soit n ∈ IN∗ et x1 , . . . , xn des éléments deux à deux distincts de IK . Considérons l’application linéaire :
ϕn : IKn−1 [X] P
−→ �−→
n IK P (x1 ), P (x2 ), . . . , P (xn ) .
Notons (L1 , . . . , Ln ) la famille des polynômes de Lagrange associés à la famille (x1 , . . . , xn ) (cf. page 752). On a montré dans l’exemple 58 de la page 852 que la famille (L1 , . . . , Ln ) est une base de IKn−1 [X] . En remarquant que l’image de la base (L1 , . . . , Ln ) par ϕn est la base canonique de IKn , on déduit de la proposition précédente que ϕn est un isomorphisme.
IV 1
Caractérisation d’une application linéaire À l’aide d’une base
Théorème 22 Étant donné une base B = (ei )i∈I de E et une famille quelconque (fi )i∈I de vecteurs de F , il existe une unique application linéaire u de E dans F telle que : ∀i ∈ I Principe de démonstration.
u(ei ) = fi . Démonstration page 893
Travailler par analyse-synthèse.
Remarque On fait souvent référence au résultat précédent en disant qu’une application linéaire est caractérisée par l’image d’une base. Point méthode • Pour définir une application linéaire partant d’un espace vectoriel E possédant une base, il suffit de donner les images des vecteurs de cette base.
Exo 23.5
• Pour prouver que u ∈ L(E, F ) et v ∈ L(E, F ) sont égales, il suffit de montrer qu’elles coïncident sur une base B = (ei )i∈I de E . En particulier, on a u = 0 si, et seulement si, ∀i ∈ I
884
u(ei ) = 0 .
IV Caractérisation d’une application linéaire Ex. 28. Soit a ∈ IK . Démontrons à nouveau la formule de Taylor polynomiale : P (a + X) =
∀P ∈ IK[X]
+∞ P (k) (a) k=0
Xk
k!
(∗)
en utilisant les applications : u : IK[X]
−→
IK[X]
P
�−→
P (a + X)
et
v : IK[X]
−→
P
�−→
IK[X] +∞ P (k) (a) k=0
k!
Xk.
• L’application u est linéaire par linéarité à gauche de la composition.
• L’application v est bien définie puisque, pour tout P ∈ IK[X] , il n’y a qu’un nombre fini
de P (k) non nuls, et elle est linéaire par linéarité de la dérivation. La formule du binôme permet de vérifier que, pour tout n ∈ IN : n
n
u(X ) = (a + X) =
n n k=0
k
a
n−k
k
X =
n n(n − 1) · · · (n − k + 1)
k!
k=0
=
+∞ (X n )(k) (a) k=0
k!
an−k X k
X k = v(X n ).
Ainsi u et v coïncident sur la base canonique (X n )n∈IN de IK[X] donc sont égales, ce qui prouve (∗) .
2
À l’aide de sous-espaces vectoriels supplémentaires
De même que l’on peut définir une application linéaire par l’image d’une base de l’espace de départ, il est possible de la définir par sa restriction à deux sous-espaces vectoriels supplémentaires. Théorème 23 Soit E1 et E2 deux sous-espaces vectoriels supplémentaires de E . Alors, pour tout v ∈ L(E1 , F ) et tout w ∈ L(E2 , F ), il existe une unique application linéaire u ∈ L(E, F ) telle que : u | E1 = v et u|E2 = w.
Démonstration page 893
Principe de démonstration.
Raisonner par analyse-synthèse à partir de la décomposition d’un vecteur x = x1 + x2 avec (x1 , x2 ) ∈ E1 × E2 .
Exo 23.6
Point méthode • Pour définir une application linéaire sur E , il suffit de la définir sur deux sousespaces vectoriels supplémentaires de E . • Deux applications linéaires, définies sur E , sont égales dès qu’elles coïncident sur deux sous-espaces vectoriels supplémentaires de E .
885
Chapitre 23. Applications linéaires Ex. 29. La proposition précédente permet de donner une caractérisation des projecteurs et symétries (qui aurait pu en être la définition). En effet, étant donné deux F1 et F2 deux sousespaces vectoriels supplémentaires de E , le projecteur sur F1 parallèlement à F2 est l’unique endomorphisme p de E tel que : ∀x ∈ F1
p(x) = x
et
∀x ∈ F2
p(x) = 0,
et la symétrie par rapport à F1 parallèlement à F2 est l’unique endomorphisme s de E tel que : ∀x ∈ F1
V 1
s(x) = x
et
∀x ∈ F2
s(x) = −x.
Formes linéaires et hyperplans Formes linéaires
Définition 8 On appelle forme linéaire sur E toute application linéaire de E dans IK .
1. Si (a, b) ∈ IK2 , l’application
IK2 (x, y)
−→ �−→
est une forme linéaire sur IK2 .
IK ax + by
2. L’intégrale sur le segment [a, b] est une forme linéaire sur CM([a, b], IR) : CM([a, b], IR)
−→
f
�−→
IR
b
f (t) dt. a
3. Pour α ∈ IK , l’application P �→ P (α) est une forme linéaire sur IK[X] .
Notation
L’ensemble L(E, IK) des formes linéaires sur E se note aussi E ∗ .
Remarque Une forme linéaire ϕ est nulle ou surjective. En effet, si ϕ �= 0 , on peut trouver x ∈ E tel que ϕ(x) �= 0 . Si l’on pose alors a = ϕ(x), alors pour tout λ ∈ IK , on a λ = ϕ λa x , ce qui prouve que ϕ est surjective.
Définition 9 Soit B = (ej )j∈I une base de E . Pour tout i ∈ I , on appelle forme linéaire coordonnée d’indice i relative à la base (ej )j∈I , et l’on note e∗i , l’unique forme linéaire sur E telle que : e∗i (ei ) = 1
et
∀j ∈ I \ {i} e∗i (ej ) = 0.
Remarque Pour chaque i ∈ I , il y a bien existence et unicité de l’application linéaire e∗i (qui est définie par les images des vecteurs de la base B ). 886
V Formes linéaires et hyperplans Proposition 24 Soit B = (ei )i∈I une base de E . Pour tout i ∈ I , la forme linéaire e∗i associe à tout vecteur de E sa coordonnée d’indice i dans la base B . Démonstration.
Soit x un vecteur de E et (λi )i∈I la famille (presque nulle) de ses coordonnées dans la base B . Alors, pour tout i ∈ I , on a : e∗i (x)
=
e∗i
λj e j
j∈I
e∗i (ej )
e∗i (ei )
=
λj e∗i (ej ) = λi
j∈I
puisque = 0 si j �= i , et = 1 . Ainsi, l’application linéaire e∗i associe au vecteur x sa coordonnée d’indice i dans la base B .
Ex. 30. Si l’on munit l’espace vectoriel IK[X] de sa base canonique B = (X k )k∈IN , alors, pour n k i ∗ tout i ∈ IN et pour tout polynôme P =
2
λk X , on a (X ) (P ) = λi .
k=0
Hyperplans vectoriels
Définition 10 On appelle hyperplan (vectoriel) de E tout sous-espace vectoriel qui est le noyau d’une forme linéaire non nulle.
Ex. 31. Dans IR3 , le noyau de la forme linéaire non nulle (x, y, z) �→ x + y + z est l’hyper plan H = (x, y, z) ∈ IR3 : x + y + z = 0 . Ex. 32. Soit α ∈ IK . L’ensemble des polynômes dont α est racine est un hyperplan de IK[X] puisque c’est le noyau de la forme linéaire non nulle ϕ : P �→ P (α) .
Proposition 25 (Caractérisation des hyperplans) Soit H un sous-espace vectoriel de E . Alors H est un hyperplan de E si, et seulement s’il existe une droite vectorielle D telle que E = H ⊕ D .
Démonstration page 894 Pour le sens direct, montrer que si a �∈ H , alors la droite engendrée par a convient. Pour le sens réciproque, construire une forme linéaire ϕ adéquate par sa restriction sur les sous-espaces vectoriels supplémentaires H et D .
Principe de démonstration.
Ex. 33. L’ensemble IR est un hyperplan du IR -espace vectoriel C , puisque IR ⊕ iIR = C . On aurait pu aussi le justifier en remarquant que c’est le noyau de la forme linéaire Im .
Exo 23.7
Proposition 26 Si H est un hyperplan de E , et si D est une droite vectorielle qui n’est pas incluse dans H , alors E = H ⊕ D . Démonstration. C’est une conséquence immédiate de la démonstration de la proposition précédente puisque (en utilisant les mêmes notations) D ⊂ H équivaut à a ∈ H . 887
Chapitre 23. Applications linéaires
Ex. 34. Dans IR3 , considérons à nouveau l’hyperplan H = (x, y, z) ∈ IR3 : x + y + z = 0 .
On a alors H ⊕ Vect (1, 0, 0) = IR3 puisque (1, 0, 0) n’appartient pas à H .
Ex. 35. L’ensemble IR est un hyperplan du IR -espace vectoriel C ; pour tout complexe non réel ω , on a donc IR ⊕ ωIR = C .
Ex. 36. Soit α ∈ IK . Dans IK[X] , l’hyperplan H = {P ∈ IK[X] : P (α) = 0} a pour supplémentaire Vect(1) et, plus généralement, tout sous-espace vectoriel de la forme Vect(A) où A est un polynôme dont α n’est pas racine.
Proposition 27 Soit ϕ et ψ deux formes linéaires non nulles. Si Ker ϕ = Ker ψ , alors il existe λ ∈ IK∗ tel que ψ = λ ϕ.
Démonstration page 894 Fixer x0 tel que ϕ(x0 ) �= 0 , puis poser D = Vect(x0 )
Principe de démonstration.
ψ(x0 ) · Montrer alors que ψ et λϕ coïncident sur les deux sous-espaces vectoriels ϕ(x0 ) supplémentaires Ker ϕ et D . et λ =
Conséquence Si H est un hyperplan de E , alors les formes linéaires (non nulles) dont H est le noyau sont toutes colinéaires.
3 Exo 23.8
Hyperplans affines
Définition 11 Un sous-espace affine de direction F est appelé hyperplan affine si sa direction F est un hyperplan vectoriel. Ex. 37. Dans IR3 , considérons l’ensemble H = (x, y, z) ∈ IR3 : x + y + z = 1 . C’est un
sous-espace affine de IR3 dirigé par l’hyperplan vectoriel :
H = (x, y, z) ∈ IR3 : x + y + z = 0
et passant par le point (1, 0, 0) . L’ensemble H est donc un hyperplan affine de IR3 .
VI
Équations linéaires
Proposition 28 Soit u ∈ L(E, F ) et b ∈ F . Si l’ensemble Fb des solutions de l’équation u(x) = b est non vide, alors c’est un sous-espace affine de E de direction Ker u . Démonstration page 894 Lorsque Fb est non vide, on considère un élément a de F et l’on montre que Fb = a + Ker u .
Principe de démonstration.
On a déjà rencontré le résultat précédent dans divers contextes ; il était alors énoncé sous la forme : « pour obtenir toutes les solutions de l’équation linéaire u(x) = b , il suffit d’en connaître une (alors appelée solution particulière) et de lui ajouter 888
VI Équations linéaires toutes les solutions (ou encore la solution générale) de l’équation homogène associée, u(x) = 0 ». Les exemples suivants donnent une reformulation de tels résultats en termes de sous-espaces affines. Ex. 38. Soit deux fonctions a et b continues sur un intervalle d’intérieur non vide I de IR , ainsi que l’équation différentielle linéaire du premier ordre : y ′ + a(x)y = b(x).
(∗)
On sait, d’après le chapitre 8, que l’équation (∗) possède (au moins) une solution f0 , et que f0 est de classe C 1 puisque f0′ = b − af0 est continue, par continuité de a et b . En utilisant l’application linéaire : u : C 1 (I, IR) f
−→
�−→
0 C � (I, IR)
�
x �→ f ′ (x) + a(x)f (x) ,
le théorème précédent nous dit que l’ensemble des fonctions solutions est un sous-espace affine de l’espace vectoriel des fonctions de classe C 1 , passant par f0 et de direction Ker u = S0 , ensemble des solutions de l’équation homogène associée. Comme le sous-espace vectoriel des solutions de l’équation homogène est engendré par une solution non nulle, l’ensemble des solutions de (∗) est une droite affine. Ex. 39. On dispose d’un résultat analogue pour les solutions d’une équation différentielle linéaire du second ordre à coefficients constants, sauf que le sous-espace vectoriel des solutions de l’équation homogène est, cette fois, engendré par un ensemble de deux fonctions. Ex. 40. Soit un système linéaire tel que ceux rencontrés au chapitre 19 :
(S) :
a1,1 x1 + · · · + a1,j xj + · · · + a1,p xp = b1 .. .
ai,1 x1 + · · · + ai,j xj + · · · + ai,p xp = bi .. . an,1 x1 + · · · + an,j xj + · · · + an,p xp = bn
où n ∈ IN∗ , p ∈ IN∗ , (ai,j )1in est une famille d’éléments de IK indexée par [[1, n]] × [[1, p]] 1jp
et (b1 , . . . , bn ) ∈ IKn . En utilisant l’application linéaire : p IK
x1 .. . xp
−→ �−→
n IK
a1,1 x1 + · · · + a1,p xp .. . an,1 x1 + · · · + an,p xp
le théorème précédent nous dit que, si le système est compatible, alors l’ensemble de ses solutions est un sous-espace affine de IKp passant par une solution particulière et dirigé par l’ensemble des solutions du système homogène associé.
889
Chapitre 23. Applications linéaires
Démonstrations Proposition 3 • • •
Montrons que L(E, F ) est un sous-espace vectoriel de F E .
On a bien évidemment L(E, F ) ⊂ F E . L’application nulle est linéaire ;
Soit (u, v) ∈ L(E, F )2 et λ ∈ IK . Alors, pour (x, y) ∈ E 2 et α ∈ IK , on a : (λ u + v)(α x + y) = λ u(α x + y) + v(α x + y)
= λ α u(x) + u(y) + α v(x) + v(y) = α (λ u + v)(x) + (λ u + v)(y).
(1) (2) (3)
Les égalités (1) et (3) proviennent de la définition de λ u + v ; quant à l’égalité (2) , elle provient de la linéarité de u et de v . Ainsi, L(E, F ) est un sous-espace vectoriel du IK -espace vectoriel F E . Proposition 5
Pour (x, y) ∈ E 2 et α ∈ IK , on a :
(v ◦ u)(α x + y) = v u(α x + y)
= v α u(x) + u(y)
= α v u(x) + v u(y)
(par linéarité de u) (par linéarité de v)
= α (v ◦ u)(x) + (v ◦ u)(y), ce qui prouve que v ◦ u est linéaire. Proposition 7 Soit u un isomorphisme de E dans F . Montrons que u−1 est linéaire. Soit λ ∈ IK et (y1 , y2 ) ∈ F 2 . Posons x1 = u−1 (y1 ) et x2 = u−1 (y2 ) . Alors :
u−1 (λ y1 + y2 ) = u−1 λ u(x1 ) + u(x2 )
= u−1 u(λ x1 + x2 ) −1
= (u
(par linéarité de u)
◦ u)(λ x1 + x2 )
= λ x1 + x2
(car u−1 ◦ u = IdE )
= λ u−1 (y1 ) + u−1 (y2 ), ce qui termine la démonstration. Proposition 8 •
Soit E ′ un sous-espace vectoriel de E ; par définition, on a u(E ′ ) = {u(x) | x ∈ E ′ } .
∗ ∗ ∗
On a bien u(E ′ ) ⊂ F . Puisque 0 ∈ E ′ , on a 0 = u(0) ∈ u(E ′ ) . Soit λ ∈ IK et (y1 , y2 ) ∈ u(E ′ )2 . Il existe donc (x1 , x2 ) ∈ E ′
2
tel que y1 = u(x1 ) et y2 = u(x2 ) et alors :
λy1 + y2 = λu(x1 ) + u(x2 ) = u(λx1 + x2 ).
′
Comme E est un sous-espace vectoriel de E , on a λx1 +x2 ∈ E ′ donc λy1 +y2 ∈ u(E ′ ) .
Par suite, u(E ′ ) est un sous-espace vectoriel de F . •
Soit F ′ un sous-espace vectoriel de F ; par définition, on a u−1 (F ′ ) = {x ∈ E : u(x) ∈ F ′ } .
∗
890
On a bien u−1 (F ′ ) ⊂ E .
Démonstrations ∗ ∗
Comme u est linéaire, on a u(0) = 0 ∈ F ′ donc 0 ∈ u−1 (F ′ ) . Soit (x1 , x2 ) ∈ u−1 (F ′ )2 et λ ∈ IK . On a alors : u(λx1 + x2 ) = λu(x1 ) + u(x2 ).
′
Étant donné que u(x1 ) ∈ F et u(x2 ) ∈ F ′ , et que F ′ est un sous-espace vectoriel, on en déduit que u(λx1 + x2 ) ∈ F ′ donc λx1 + x2 ∈ u−1 (F ′ ) .
Par suite, u−1 (F ′ ) est un sous-espace vectoriel de E . Proposition 12 •
Soit (x, y) ∈ E 2 et λ ∈ IK . Écrivons x = x1 + x2 et y = y1 + y2 avec (x1 , x2 ), (y1 , y2 ) ∈ (F1 × F2 )2 . On a alors λx + y = λx1 + y1 + λx2 + y2 donc :
∈F1
∈F2
p(λx + y) = λx1 + y1 = λp(x) + p(y)
et ainsi p est linéaire. •
Soit x ∈ F1 . Alors la décomposition x = x + 0 avec (x, 0) ∈ F1 × F2 montre que x = p(x) ; on en déduit F1 ⊂ {x ∈ E : p(x) = x} . L’inclusion {x ∈ E : p(x) = x} ⊂ Im p étant évidente, on a : F1 ⊂ {x ∈ E : p(x) = x} ⊂ Im p.
Or, par définition, on a Im p ⊂ F1 , donc :
F1 = Im p = {x ∈ E : p(x) = x}.
•
Remarquons enfin que, par définition d’un noyau, on a Ker(p − IdE ) = {x ∈ E : p(x) = x} .
Soit x ∈ F2 ; on a x = 0 + x avec (0, x) ∈ F1 × F2 donc p(x) = 0 et ainsi x ∈ Ker p . Réciproquement, soit x ∈ Ker p . Écrivons x = x1 + x2 avec (x1 , x2 ) ∈ F1 × F2 . On a p(x) = 0 ; or p(x) = x1 , donc x1 = 0 et ainsi x = x2 , ce qui montre x ∈ F2 . Par suite, on a prouvé F2 = Ker p .
Proposition 13 •
•
Supposons que p soit un projecteur. On a déjà prouvé que p était linéaire. De plus, pour x ∈ E , on a p(x) ∈ Im p = {y ∈ E : p(y) = y} donc p p(x) = p(x) et ainsi p ◦ p = p . Supposons que p soit linéaire et vérifie p ◦ p = p . ∗ Les ensembles Im p et Ker p sont des sous-espaces vectoriels de E . ∗ Soit y ∈ Ker p ∩ Im p . Comme y ∈ Im p , il existe x ∈ E tel que y = p(x) . De plus, comme p ◦ p = p et y ∈ Ker p , on a : y = p(x) = (p ◦ p)(x) = p(y) = 0 ∗
donc Ker p ∩ Im p = {0} . Soit x ∈ E . On a alors :
x = p(x) + x − p(x) .
(∗)
Or p(x) ∈ Im p et l’on a p x − p(x) = p(x) − (p ◦ p)(x) = 0 donc x − p(x) ∈ Ker p . Ainsi, on a x ∈ Im p + Ker p donc E = Im p + Ker p .
On en déduit que E = Im p⊕Ker p , et la relation (∗) montre alors que l’application x �→ p(x) est la projection sur Im p parallèlement à Ker p . Donc p est un projecteur.
891
Chapitre 23. Applications linéaires Proposition 14 Notons p le projecteur sur F1 parallèlement à F2 . D’après la remarque de la page 881, on a s = 2p − IdE . Par conséquent : • s est linéaire en tant que combinaison linéaire d’applications linéaires ; 1 • on a p = (s + IdE ) , et ainsi, en utilisant la proposition 12 de la page 880 : 2 1 (s − IdE ) = Ker(s − IdE ) ; F1 = Ker(p − IdE ) = Ker 2 • de même : 1 (s + IdE ) = Ker (s + IdE ) . F2 = Ker p = Ker 2 Proposition 15 • Supposons que s soit une symétrie. On a déjà prouvé que s était linéaire. Montrons que l’on 1 a s ◦ s = IdE . Pour cela, considérons l’application p = (s + IdE ) . D’après la remarque de 2 la page 881, p est un projecteur, donc p ◦ p = p et ainsi : s ◦ s = (2p − IdE ) ◦ (2p − IdE ) = 4(p ◦ p) − 4p + IdE = IdE .
•
1 (s+IdE ) . 2 Alors p est une application linéaire en tant que combinaison linéaire d’applications linéaires. De plus, on a : 1 1 1 1 p ◦ p = (s + IdE ) ◦ (s + IdE ) = (s ◦ s + 2s + IdE ) = (s + IdE ) = p 2 2 4 2 donc p est un projecteur. Or s = 2p−IdE donc, toujours d’après la remarque de la page 881, s est une symétrie. Réciproquement, supposons que s soit linéaire et vérifie s◦s = IdE . Posons p =
Proposition 20
Supposons u injective. Soit (ei )i∈I une famille libre ; montrons que
est libre. Soit (λi )i∈I ∈ IK(I) tel que
u
λi e i
i∈I
λi u(ei ) = 0 . Puisque u est linéaire, on a :
i∈I
=0
donc
i∈I
u(ei )
i∈I
λi ei ∈ Ker u.
L’application u étant injective, on a Ker u = {0} , ce qui entraîne
λi ei = 0 . La famille (ei )i∈I
i∈I
étant libre, on en déduit que la famille (λi )i∈I est nulle, ce qui prouve que la famille u(ei ) est libre.
i∈I
Corollaire 21 (i) • Une base étant une famille libre, la proposition 20 de la page 884 assure le sens direct. • Réciproquement, supposons que la famille u(ei ) i∈I soit libre et montrons que u est injective. Soit x ∈ Ker u . La famille (ei )i∈I étant une base, il existe (λi )i∈I ∈ IK(I) telle que x = λi ei . On a alors : i∈I
0 = u(x) =
Comme la famille u(ei )
i∈I
n
λi u(ei ).
i=1
est libre, on en déduit que la famille (λi )i∈I est nulle, et
ainsi x = 0 . Par suite, l’application linéaire u est injective. (ii) Une base étant une famille génératrice, le corollaire 18 de la page 883 assure que la famille u(ei ) i∈I est génératrice de Im u et l’équivalence est alors immédiate.
(iii) Ce dernier point est une conséquence immédiate des deux premiers.
892
Démonstrations Théorème 22 Procédons par analyse-synthèse. Unicité-Analyse Soit u une telle application linéaire. Considérons x ∈ E dont la décomposition dans la base B est x = λi e i . La linéarité de u nous donne u(x) =
λi u(ei ) =
i∈I
i∈I
λi fi .
i∈I
On en déduit l’unicité d’une telle application linéaire u . Synthèse-Existence Soit x ∈ E . En utilisant sa décomposition (unique) dans la base B que λi ei , posons u(x) = λi fi . nous notons x = i∈I
i∈I
On définit ainsi une application u de E dans F .
•
Montrons qu’elle est linéaire. Soit donc (x, y) ∈ E 2 et α ∈ IK . λi ei et y = µi ei , on En décomposant x et y dans la base B sous la forme x = a alors la décomposition α x + y =
i∈I
i∈I
(α λi + µi ) ei et ainsi :
i∈I
u(α x + y) =
(α λi + µi ) fi
i∈I
=α
λi fi +
i∈I
µi fi
i∈I
= α u(x) + u(y),
ce qui prouve la linéarité de u . De plus, pour tout i ∈ I , on a u(ei ) = fi puisque les composantes de ei dans la base B sont toutes nulles, hormis celle d’indice i , qui vaut 1 . On en déduit l’existence d’une telle application linéaire u . Théorème 23 Analyse - Unicité. Soit u une application linéaire telle que : •
u|E1 = v
u|E2 = w.
et
Pour tout x ∈ E , il existe x1 ∈ E1 et x2 ∈ E2 tels que x = x1 + x2 et alors : u(x) = u(x1 + x2 ) = u(x1 ) + u(x2 ) = v(x1 ) + w(x2 ).
Cela prouve l’unicité d’une telle application linéaire u . Synthèse - Existence. Pour tout x ∈ E , désignons par (x1 , x2 ) l’unique couple de E1 ×E2 tel que x = x1 + x2 ; on peut alors poser : u(x) = v(x1 ) + w(x2 ), ce qui définit une application u de E dans F . •
Montrons que u est linéaire. Soit (x, y) ∈ E 2 . Prenons (x1 , x2 ) ∈ E1 × E2 que (y1 , y2 ) ∈ E1 × E2 tels que : x = x1 + x2
et
ainsi
y = y1 + y2 .
Pour tout λ ∈ IK , on a alors :
λ x + y = (λ x1 + y1 ) + (λ x2 + y2 ),
et, comme λ x1 + y1 ∈ E1 et λ x2 + y2 ∈ E2 , on a : u(λ x + y) = v(λ x1 + y1 ) + w(λ x2 + y2 )
= λ v(x1 ) + v(y1 ) + λ w(x2 ) + w(y2 )
= λ v(x1 ) + w(x2 ) + v(y1 ) + w(y2 ) = λ u(x) + u(y).
893
Chapitre 23. Applications linéaires •
Pour x ∈ E1 , la décomposition x = x + 0 , avec 0 ∈ E2 , montre que u(x) = v(x) . Par suite, on a u|E1 = v . On montre de même u|E2 = w .
Ainsi, l’application u répond bien au problème, ce qui prouve l’existence. Proposition 25 • Supposons que H soit un hyperplan de E . Soit ϕ une forme linéaire non nulle telle que H = Ker ϕ . Comme ϕ n’est pas l’application nulle, on peut trouver un vecteur a de E tel que ϕ(a) �= 0 . Posons D = Vect(a) . Le sousespace vectoriel D est bien une droite vectorielle puisque a �= 0 (car ϕ(a) �= 0 ). Montrons que E = H ⊕ D . ∗ Montrons H ∩ D = {0} ou, en fait, H ∩ D ⊂ {0} . Soit donc x ∈ H ∩ D . ⋆ Étant donné que x ∈ H , on a ϕ(x) = 0 . ⋆ Vu que x ∈ Vect(a) , il existe λ ∈ IK tel que x = λ a et alors ϕ(x) = λ ϕ(a) . Comme ϕ(a) �= 0 , l’égalité ϕ(x) = 0 entraîne λ = 0 et donc x = 0 . ∗ Montrons E = H + D ou, en fait, E ⊂ H + D . Soit donc x ∈ E . Posons λ = ϕ(x) et h = x − λ a . On a alors x = h + λ a , et la linéarité de ϕ ϕ(a) •
donne ϕ(h) = 0 , ce qui termine la démonstration. Réciproquement, supposons qu’il existe une droite vectorielle D telle que E = H ⊕ D . Puisque D est une droite vectorielle, il existe a ∈ E \ {0} tel que D = Vect(a) . ∗ Soit v l’application nulle de H dans IK , ∗ Soit w l’application linéaire de D dans IK telle que w(a) = 1 ; cette application est bien définie puisque la famille (a) est une base du sous-espace vectoriel D . Comme D et H sont supplémentaires, il existe une unique application ϕ ∈ L(E, IK) telle que : ϕ|H = v et ϕ|D = w.
∗ ∗
Par construction, on a H ⊂ Ker ϕ . Réciproquement, soit x ∈ Ker ϕ . Comme E = H ⊕ Vect(a) , il existe h ∈ H et λ ∈ IK tels que x = h + λ a . On a alors : 0 = ϕ(x) = ϕ(h) + λϕ(a) = λ. Ainsi x = h donc x ∈ H , ce qui prouve l’inclusion réciproque.
Proposition 27 Comme ϕ = � 0 , le sous-espace vectoriel H = Ker ϕ est un hyperplan et, si l’on prend x0 ∈ E \ H , alors D = Vect(x0 ) est un supplémentaire de H . / Ker ϕ et Ker ϕ = Ker ψ , on a aussi ψ(x0 ) �= 0 . Posons alors λ = Puisque x0 ∈
ψ(x0 ) ϕ(x0 )
�= 0 .
Par suite, les applications linéaires ψ et λϕ : • coïncident sur H , puisque leurs restrictions à H sont nulles ; • coïncident sur D , par définition de λ ; en effet, pour tout x ∈ D , il existe µ ∈ IK tel que x = µx0 et l’on a : λϕ(x) = λϕ(µx0 ) = µλϕ(x0 ) = µψ(x0 ) = ψ(µx0 ) = ψ(x). Par conséquent, les applications linéaires ψ et λϕ , qui coïncident sur deux sous-espaces vectoriels supplémentaires de E , sont égales. Proposition 28 Supposons l’ensemble Fb non vide ; soit alors a une solution de l’équation u(x) = b . Pour x ∈ E , on a, par linéarité de u : x ∈ Fb ⇐⇒ u(x) = b ⇐⇒ u(x) = u(a) ⇐⇒ u(x − a) = 0 ⇐⇒ x − a ∈ Ker u.
On a donc Fb = a + Ker u .
894
Exercices
S’entraîner et approfondir 23.1 1. Soit (a, b) ∈ IK2 . Montrer que u :
IK2 (x, y)
→873
−→ �−→
est linéaire.
IK ax + by
2. Montrer que toute application linéaire de IK2 dans IK est de cette forme. Indication. Utiliser la décomposition (x, y) = x(1, 0) + y(0, 1) . 23.2 Montrer que les endomorphismes de IK2 sont les applications : →873
IK2 (x, y)
−→ �−→
IK2 (ax + by, cx + dy)
avec
(a, b, c, d) ∈ IK4 .
23.3 Soit f : E → F et g : F → G deux applications telles que f est linéaire et surjective et g ◦ f →873 est linéaire. Montrer que g est linéaire. ce qui prouve que g est linéaire. 23.4 Soit (x1 , . . . , xn ) une famille d’éléments de E ainsi que : →884
IKn
−→
(λ1 , . . . , λn )
�−→
u:
E n
λi x i .
i=1
1. Montrer que l’application u est linéaire. 2. Montrer que u est injective si, et seulement si, la famille (x1 , . . . , xn ) est libre. 3. Montrer que u est surjective si, et seulement si, (x1 , . . . , xn ) engendre E . 4. En déduire que u est bijective si, et seulement si, (x1 , . . . , xn ) est une base de E . 23.5 Soit (e1 , e2 , e3 ) la base canonique de l’espace vectoriel IK3 . Considérons l’unique endomor→884 phisme u de IK3 tel que u(e1 ) = e3 , u(e2 ) = −e2 et u(e3 ) = e1 . Montrer que u est une symétrie et déterminer les espaces F1 et F2 tels que u soit la symétrie par rapport à F1 parallèlement à F2 . 23.6 Dans le IK -espace vectoriel E = IK3 , on considère les sous-espaces vectoriels :
→885
F1 = Vect (1, 0, 0), (0, 1, 0)
et
F2 = Vect (1, 1, 1) .
1. Montrer que F1 et F2 sont deux sous-espaces vectoriels supplémentaires de E . 2. Vérifier qu’il existe un endomorphisme u de E tel que : ∀(a, b) ∈ IK2
3. Prouver que u4 = IdE .
23.7 Montrer que F = →887
u (a, b, 0) = (−b, a, 0)
f ∈ C 0 (IR, IR) :
et en donner un supplémentaire.
0
1
et
f (t)dt = 0
∀c ∈ IK
u (c, c, c) = −(c, c, c).
est un sous-espace vectoriel de C 0 (IR, IR)
23.8 Soit α ∈ IK . Montrer que l’ensemble : →888 H = {P ∈ IK[X] : P (α) = 1} est un hyperplan affine dont on donnera la direction et un point.
895
Chapitre 23. Applications linéaires 23.9 Soit B ∈ IK[X] \ {0} . Montrer que les applications : ϕ : IK[X] A
−→ �−→
IK[X] QA
et
ψ : IK[X] A
−→ �−→
IK[X] RA
où QA et RA désignent respectivement le quotient et le reste de la division euclidienne de A par B , sont linéaires. 23.10 Soit E un IK -espace vectoriel et f et g deux endomorphismes de E . Montrer que, si f ◦ g = g ◦ f , alors Ker f et Im f sont stables par g . 23.11 Soit E un IK -espace vectoriel et f un endomorphisme de E . 1. Quelle relation existe-t-il entre Ker f et Ker f 2 ? Entre Im f et Im f 2 ? 2. Montrer l’équivalence : Ker f = Ker f 2 ⇐⇒ Ker f ∩ Im f = {0}. 3. Montrer l’équivalence : Im f 2 = Im f ⇐⇒ E = Ker f + Im f.
4. En déduire :
Ker f = Ker f 2 et Im f 2 = Im f
⇐⇒ E = Ker f ⊕ Im f .
23.12 Soit f un endomorphisme d’un IK -espace vectoriel E tel que f 2 − 3f + 2 IdE = 0 .
1. Montrer que f est un automorphisme et exprimer f −1 en fonction de f et IdE . 2. Montrer que Ker(f − IdE ) et Ker(f − 2 IdE ) sont supplémentaires dans E .
23.13 Soit f et g deux endomorphismes d’un IK -espace vectoriel E tels que f ◦ g = IdE . 1. Montrer que Ker f et Im g sont supplémentaires dans E . 2. (a) Montrer que l’on a Ker f = Ker(g ◦ f ) et Im g = Im(g ◦ f ) . (b) Calculer (g ◦ f )2 et retrouver que Ker f et Im g sont supplémentaires dans E . 23.14 Sur le IR -espace vectoriel E = C(IR, IR) , on définit l’application ϕ qui, à toute fonction f ∈ E , associe la fonction : ϕ(f ) : IR
−→
x
�−→
IR
x
tf (t)dt.
0
Montrer que ϕ est un endomorphisme de E . Est-il surjectif, injectif ? ⋆ 23.15 Soit f un endomorphisme d’un IK -espace vectoriel E tel que, pour tout vecteur x ∈ E , les vecteurs x et f (x) soient colinéaires. Montrer que l’application f est une homothétie. 23.16 Soit E un IK -espace vectoriel et p un projecteur de E . On note C(p) le commutant de p , c’est-à-dire l’ensemble des endomorphismes de E qui commutent avec p : C(p) = {f ∈ L(E) : p ◦ f = f ◦ p}. 1. Montrer que C(p) est un sous-espace vectoriel de L(E) .
2. Pour f ∈ L(E) , montrer que f ∈ C(p) si, et seulement si, les sous-espaces vectoriels Im p et Ker p sont stables par f . 3. En déduire que C(p) est isomorphe à L(Ker p) × L(Im p) .
896
Exercices 23.17 Soit p et q deux endomorphismes d’un IK -espace vectoriel E . Montrer que les assertions suivantes sont équivalentes : (i) p et q sont deux projecteurs ayant même noyau ; (ii) p ◦ q = p et q ◦ p = q . 23.18 Soit E un IK -espace vectoriel et f et g deux formes linéaires sur E , telles que : Montrer que f = 0 ou g = 0 .
∀x ∈ E
f (x)g(x) = 0.
897
Chapitre 23. Applications linéaires
Solutions des exercices 23.1 1. Soit (x, y) ∈ IK2 , (x′ , y ′ ) ∈ IK2 et λ ∈ IK . On a alors :
u λ (x, y) + (x′ , y ′ ) = u (λ x + x′ , λ y + y ′ )
= a(λ x + x′ ) + b(λ y + y ′ ) = λ (ax + by) + (ax′ + by ′ )
= λ u (x, y) + u (x′ , y ′ )
donc u est linéaire. 2. Soit v une application linéaire de IK2 dans IK . Posons a = v (1, 0) et b = v (0, 1) . Alors, pour tout (x, y) ∈ IK2 , on a :
v (x, y) = v x (1, 0) + y (0, 1) = x v (1, 0) + y v (0, 1) = a x + b y, ce qui prouve que v est bien de la forme souhaitée. 23.2 • Soit (a, b, c, d) ∈ IK4 . Considérons l’application u : Pour (x, y) ∈ IK2 , (x′ , y ′ ) ∈ IK2 et λ ∈ IK , on a :
u λ (x, y) + (x′ , y ′ ) = u (λ x + x′ , λ y + y ′ )
IK2 (x, y)
−→ �−→
IK2 (ax + by, cx + dy).
= a(λ x + x′ ) + b(λ y + y ′ ), c(λ x + x′ ) + d(λ y + y ′ )
= λ (ax + by) + (ax′ + by ′ ), λ (cx + dy) + (cx′ + dy ′ ) = λ (ax + by, cx + dy) + (ax′ + by ′ , cx′ + dy ′ )
= λ u (x, y) + u (x′ , y ′ ) . L’application u est donc linéaire de IK2 dans IK2 : c’est un endomorphisme de IK2 . • Réciproquement, soit u ∈ L(IK2 ) . Alors, pour tout vecteur (x, y) ∈ IK2 , on a :
u (x, y) = u x(1, 0) + y(0, 1) = xu (1, 0) + yu (0, 1) .
Ainsi, en posant (a, c) = u (1, 0) ∀(x, y) ∈ IK2
et (b, d) = u (0, 1) , on a alors :
u (x, y) = x(a, c) + y(b, d) = (ax + by, cx + dy),
ce qui prouve que u est bien de la forme souhaitée. 23.3 Soit (y1 , y2 ) ∈ F 2 et λ ∈ IK . Puisque f est surjective, il existe un couple (x1 , x2 ) ∈ E 2 tel que y1 = f (x1 ) et y2 = f (x2 ) ; fixons un tel couple. On a alors :
g(λy1 + y2 ) = g λf (x1 ) + f (x2 )
= g f (λx1 + x2 )
par linéarité de f
= (g ◦ f )(λx1 + x2 ) = λ(g ◦ f )(x1 ) + (g ◦ f )(x2 ) = λg(y1 ) + g(y2 ),
898
par linéarité de g ◦ f
Solutions des exercices 23.4 1. Montrons que l’application u est linéaire. Pour (λ1 , . . . , λn ) ∈ IKn , (µ1 , . . . , µn ) ∈ IKn et α ∈ IK , on a :
u α (λ1 , . . . , λn ) + (µ1 , . . . , µn ) =
n
(α λi + µi ) xi
i=1
=α
n
λi x i +
i=1
n
µi xi
i=1
= α u(λ1 , . . . , λn ) + u(µ1 , . . . , µn ). L’application u est donc linéaire. 2. La famille (x1 , . . . , xn ) est libre si, et seulement si : n
∀(λ1 , . . . , λn ) ∈ IKn
λi xi = 0 =⇒ (λ1 , . . . , λn ) = 0.
i=1
La relation précédente traduit aussi que Ker u est inclus dans {0} , c’est-à-dire que l’application linéaire u est injective. D’où le résultat. 3. Par définition de u , on a : n
Im u =
i=1
λi xi (λ1 . . . , λn ) ∈ IKn
= Vect(x1 , . . . , xn ).
Ainsi l’application linéaire u est surjective si, et seulement si, Im u = E , c’est-à-dire si, et seulement si, la famille (x1 , . . . , xn ) est génératrice de E . 4. Conséquence immédiate des deux questions précédentes.
23.5 On a u2 (e1 ) = u(e3 ) = e1 , u2 (e2 ) = u(−e2 ) = e2 et u2 (e3 ) = u(e1 ) = e3 . Ainsi u2 coïncide avec l’identité de IK3 sur la base (e1 , e2 , e3 ) donc u2 = IdIK3 ; on en déduit que u est une symétrie. Posons F1 = Ker(u − IdIK3 ) et F2 = Ker(u + IdIK3 ) . D’après le cours, u est la symétrie par rapport à F1 parallèlement à F2 . Déterminons ces deux noyaux. Pour (x1 , x2 , x3 ) ∈ IK3 , on a :
u (x1 , x2 , x3 ) = u (x1 e1 + x2 e2 + x3 e3 ) = x1 u(e1 ) + x2 u(e2 ) + x3 u(e3 ) = x1 e3 + x2 (−e2 ) + x3 e1 = (x3 , −x2 , x1 ). On a ainsi : (x1 , x2 , x3 ) ∈ F1 ⇐⇒ (x1 , x2 , x3 ) = (x3 , −x2 , x1 ) ⇐⇒ et :
(x1 , x2 , x3 ) ∈ F2 ⇐⇒ (x1 , x2 , x3 ) = −(x3 , −x2 , x1 ) ⇐⇒ x1 = −x3
x1 = x3 et x2 = 0
donc F1 = Vect (1, 0, 1) et F2 = Vect (1, 0, −1), (0, 1, 0) .
899
Chapitre 23. Applications linéaires 23.6 1. • Par définition, F1 et F2 sont des sous-espaces vectorielsde E . • On a F1 ∩ F2 = {0} . En effet, si x ∈ F1 ∩ F2 , alors il existe (a, b, c) ∈ IK3 tel que x = (a, b, 0) = (c, c, c) et l’on a donc c = 0 , puis a = b = 0 et, par suite, x = 0 . • Enfin, pour (a, b, c) ∈ E , l’égalité : (a, b, c) = (a − c, b − c, 0) + (c, c, c)
montre que E = F1 + F2 .
∈F1
∈F2
Par suite, on a E = F1 ⊕ F2 .
2. Étant donné que F1 et F2 sont deux sous-espaces supplémentaires de E et que : v:
F1 (a, b, 0)
−→ �−→
et
E (−b, a, 0)
w:
F2 (c, c, c)
−→ �−→
E −(c, c, c)
sont deux applications linéaires (ce que l’on vérifie aisément), il existe un unique endomorphisme u ∈ L(E) dont les restrictions à F1 et F2 sont respectivement v et w .
3. Comme pour tout (a, b) ∈ IK2 , on a :
u2 (a, b, 0) = u (b, −a, 0) = (−a, −b, 0), on en déduit :
∀x ∈ F1
u2 (x) = −x
donc
∀x ∈ F1
u4 (x) = x.
On a d’autre part : ∀x ∈ F2
u2 (x) = x
donc
∀x ∈ F2
u4 (x) = x.
Ainsi, l’application linéaire u4 coïncide avec l’identité sur deux sous-espaces vectoriels supplémentaires de E ; par suite on a u4 = IdE .
23.7 En notant E le IR -espace vectoriel C 0 (IR, IR) , l’application : ϕ : E −→ IR f est une forme linéaire sur E .
�−→
1
f (t)dt
0
• Elle est non nulle puisque ϕ(1) = 1 ; par suite, son noyau F est un hyperplan.
• Soit g la fonction constante 1 et D = Vect(g) . Puisque g appartient à E \ F , et que F est un hyperplan, on a F ⊕ D = E . Ainsi, l’ensemble D des fonctions constantes sur IR est un sous-espace vectoriel supplémentaire de F .
23.8 Le polynôme 1 appartient à H , et l’on constate que : P ∈ H ⇐⇒ P − 1 ∈ H où H est l’hyperplan vectoriel {P ∈ IK[X] : P (α) = 0} .
Ainsi, H est l’hyperplan affine dirigé par H et passant par le point 1 .
900
Solutions des exercices 23.9 Soit (A1 , A2 ) ∈ IK[X]2 et λ ∈ IK . Notons Q1 et R1 (respectivement Q2 et R2 ) les quotient et reste de la division euclidienne de A1 (respectivement A2 ) par B . On a alors : A1 = BQ1 + R1
et
deg(R1 ) < deg(B)
A2 = BQ2 + R2
et
deg(R2 ) < deg(B).
On en déduit : λA1 + A2 = B(λQ1 + Q2 ) + (λR1 + R2 ),
et, par propriété sur les degrés, on a deg(λR1 + R2 ) max deg(R1 ), deg(R2 ) < deg(B) . Par unicité du quotient et du reste de la division euclidienne de deux polynômes, les polynômes λQ1 + Q2 et λR1 + R2 sont donc respectivement le quotient et le reste de la division euclidienne de λA1 + A2 par B , c’est-à-dire : ϕ(λA1 + A2 ) = λQ1 + Q2 = λϕ(A1 ) + ϕ(A2 ) et
ψ(λA1 + A2 ) = λR1 + R2 = λψ(A1 ) + ψ(A2 ),
ce qui prouve la linéarité de ϕ et ψ . 23.10 Supposons que f ◦ g = g ◦ f . • Soit x ∈ Ker f . On a alors :
f g(x) = g f (x) = g(0) = 0.
Par conséquent, g(x) ∈ Ker f , ce qui montre que Ker f est stable par g .
• Soit y ∈ Im f . Fixons x ∈ E tel que y = f (x) . On a alors :
g(y) = (g ◦ f )(x) = (f ◦ g)(x) = f g(x) , donc g(y) ∈ Im f , ce qui prouve que Im f est stable par g .
23.11 1. • On a toujours Ker f ⊂ Ker f 2 . En effet, si x ∈ Ker f , alors f (x) = 0 , donc, par linéarité de f , on a f f (x) = 0 et ainsi x ∈ Ker f 2 . • On a toujours Im f 2 ⊂ Im f . En effet, si y ∈ Im f 2 , alors il existe x ∈ E tel que y = f 2 (x) = f f (x) , donc y ∈ Im f .
2. • Supposons Ker f 2 = Ker f et montrons Im f ∩ Ker f = {0}. Soit y ∈ Im f ∩ Ker f . Puisque y ∈ Im f , il existe x ∈ E tel que y = f (x) . Ainsi, puisque y ∈ Ker f , on a : 0 = f (y) = f 2 (x). Donc x ∈ Ker f 2 . Or, par hypothèse, Ker f 2 = Ker f , donc x ∈ Ker f . Finalement : y = f (x) = 0.
Par conséquent, on a Im f ∩ Ker f ⊂ {0} et l’inclusion réciproque étant immédiate, on en déduit Im f ∩ Ker f = {0}. • Supposons Im f ∩ Ker f = {0} et montrons Ker f 2 = Ker f. Étant donné qu’on a toujours Ker f ⊂ Ker f 2 , il suffit de montrer Ker f 2 ⊂ Ker f . Soit x ∈ Ker f 2 . Alors, puisque f f (x) = 0 , on a f (x) ∈ Ker f . De plus, on a par définition f (x) ∈ Im f. On a donc : f (x) ∈ Im f ∩ Ker f,
d’où f (x) = 0 . Ainsi x ∈ Ker f , ce qui achève la démonstration.
901
Chapitre 23. Applications linéaires 3. • Supposons Im f 2 = Im f et montrons E = Ker f + Im f . Soit x ∈ E . Par définition, on a f (x) ∈ Im f ; or, par hypothèse, on a Im f 2 = Im f donc f (x) ∈ Im f 2 . Par conséquent, il existe a ∈ E tel que f (x) = f 2 (a) . Par linéarité de f , on a alors f x − f (a) = 0 , c’est-à-dire x − f (a) ∈ Ker f . On peut alors écrire : x = x − f (a) + f (a) ,
∈Ker f
∈Im f
ce qui prouve E ⊂ Ker f + Im f . L’inclusion réciproque étant immédiate, on a donc E = Ker f + Im f . • Supposons E = Ker f + Im f et montrons Im f 2 = Im f . Puisque l’on a toujours Im f 2 ⊂ Im f , il suffit de prouver Im f ⊂ Im f 2 . Soit y ∈ Im f . Il existe x ∈ E tel que y = f (x) . Or on a E = Ker f + Im f , donc il existe (xK , xI ) ∈ Ker f × Im f tel que x = xK + xI . Comme xI ∈ Im f , on peut trouver a ∈ E tel que xI = f (a) . On a alors, par linéarité de f :
y = f (x) = f (xK + xI ) = f (xK ) + f (xI ) = 0 + f f (a) = f 2 (a),
ce qui prouve que y ∈ Im f 2 et achève la démonstration. 4. Cette dernière équivalence est une conséquence immédiate des deux précédentes, puisque l’on a : E = Ker f ⊕ Im f ⇐⇒
E = Ker f + Im f
23.12 1. Remarquons que l’on a f 2 − 3f = −2 IdE et ainsi : f◦
−
1 (f − 3 IdE ) = IdE 2
et
et
−
Ker f ∩ Im f = {0} .
1 (f − 3 IdE ) ◦ f = IdE , 2
ce qui prouve que f est bijectif, donc est un automorphisme de E , et que l’on a : 1 f −1 = − (f − 3 IdE ). 2 2. Procédons par analyse-synthèse pour montrer que Ker(f − IdE ) et Ker(f − 2 IdE ) sont supplémentaires dans E . Soit x ∈ E . Analyse Soit (x1 , x2 ) ∈ Ker(f − IdE ) × Ker(f − 2 IdE ) tel que x = x1 + x2 . Par linéarité de f , on a alors : f (x) = f (x1 + x2 ) = f (x1 ) + f (x2 ) = x1 + 2x2 . On en déduit x1 = 2x − f (x) et x2 = f (x) − x , ce qui prouve qu’une telle écriture est unique et que les sous-espaces vectoriels Ker(f − IdE ) et Ker(f − 2 IdE ) sont en somme directe. Synthèse Posons x1 = 2x − f (x) et x2 = f (x) − x . • Par linéarité de f et en utilisant la relation f 2 = 3f − 2 IdE , on a :
f (x1 ) = f 2x − f (x) = 2f (x) − f 2 (x) = 2f (x) − 3f (x) − 2x = 2x − f (x) = x1 , donc x1 ∈ Ker(f − IdE ) . • De même, on a :
f (x2 ) = f f (x) − x = f 2 (x) − f (x) = 3f (x) − 2x − f (x) = 2 f (x) − x = 2x2 , donc x2 ∈ Ker(f − 2 IdE ) . • Enfin, on vérifie aisément que l’on a x1 + x2 = x .
902
Solutions des exercices Ainsi, tout vecteur de E s’écrit comme la somme d’un vecteur de Ker(f −IdE ) et d’un vecteur de Ker(f −2 IdE ) , c’est-à-dire E ⊂ Ker(f −IdE )+Ker(f −2 IdE ) . L’inclusion réciproque étant immédiate, on a donc E = Ker(f − IdE ) + Ker(f − 2 IdE ) .
Finalement, on a montré E = Ker(f − IdE ) ⊕ Ker(f − 2 IdE ) .
23.13 1. Procédons par analyse-synthèse pour montrer que E = Ker f ⊕ Im g . Soit x ∈ E .
Analyse Soit (y, z) ∈ Ker f × Im g tel que x = y + z . Par définition, il existe a ∈ E tel que z = g(a) . Ainsi, par linéarité de f , on a :
f (x) = f (y + z) = f (y) + f (z) = 0 + f g(a) . Or f ◦ g = IdE donc f (x) = a . On en déduit : z = g(a) = (g ◦ f )(x)
et
y = x − z = x − (g ◦ f )(x),
ce qui prouve qu’une telle écriture est unique et que Ker f et Im g sont en somme directe. Synthèse Posons y = x − (g ◦ f )(x) et z = (g ◦ f )(x) . On a alors x = y + z et : • z = g f (x) donc z ∈ Im g ; • par linéarité de f et en utilisant l’hypothèse f ◦ g = IdE , on a :
f (y) = f (x) − f (g ◦ f )(x) = f (x) − (f ◦ g) f (x) = f (x) − f (x) = 0, donc y ∈ Ker f . Ainsi, tout vecteur de E s’écrit comme la somme d’un vecteur de Ker f et d’un vecteur de Im g , c’est-à-dire E ⊂ Ker f + Im g . L’inclusion réciproque étant immédiate, on a donc E = Ker f + Im g . Finalement, on a montré E = Ker f ⊕ Im g .
2. (a) • L’inclusion Ker f ⊂ Ker(g ◦ f ) est immédiate. Montrons l’inclusion réciproque. Soit x ∈ Ker(g ◦ f ) . On a alors (g ◦ f )(x) = 0 et ainsi :
f (g ◦ f )(x) = f (0) = 0. Or, par hypothèse f ◦ g = IdE donc f ◦ g ◦ f = f , ce qui montre f (x) = 0 , c’est-à-dire x ∈ Ker f . D’où l’inclusion Ker(g ◦ f ) ⊂ Ker f . • De même, l’inclusion Im(g ◦ f ) ⊂ Im g est immédiate. Montrons l’inclusion réciproque. Soit x ∈ Im g . Il existe alors a ∈ E tel que x = g(a) et on a f (x) = f g(a) = a . On en déduit : x = g(a) = (g ◦ f )(x),
ce qui prouve que x ∈ Im(g ◦ f ) et ainsi Im g ⊂ Im(g ◦ f ) . (b) Calculons :
(g ◦ f )2 = (g ◦ f ) ◦ (g ◦ f ) = g ◦ (f ◦ g) ◦ f = g ◦ IdE ◦f = g ◦ f. De plus, g ◦ f est linéaire, donc g ◦ f est un projecteur. On en déduit que : E = Ker(g ◦ f ) ⊕ Im(g ◦ f ), donc, d’après la question précédente, E = Ker f ⊕ Im g .
903
Chapitre 23. Applications linéaires 23.14 • Pour toute fonction continue f , la fonction ϕ(f ) est dérivable (c’est l’unique primitive de t �→ tf (t) qui s’annule en 0 ), donc en particulier continue. Ainsi, ϕ est bien une application de E vers E . C’est aussi une application linéaire : la linéarité de ϕ résulte de la linéarité de l’intégrale. • Remarquons, que pour pour toute fonction continue f , on a ϕ(f )(0) = 0 . Or il existe des fonctions continues qui ne sont pas nulles en 0 (comme par exemple la fonction constante 1 ) donc ϕ n’est pas surjective. • Soit f ∈ Ker ϕ . Alors, pour tout x ∈ IR , on a ϕ(f )(x) = on trouve : ∀x ∈ IR
x
tf (t) dt = 0 . En dérivant,
0
xf (x) = 0.
Cela entraîne que f (x) = 0 pour tout x non nul. Par continuité de f en 0 , on a aussi f (0) = 0 . Ainsi f est la fonction nulle. Le noyau de ϕ est donc réduit à {0} et ϕ est injective. 23.15 Si E = {0} , le résultat est évident. Supposons donc E �= {0} .
Fixons un vecteur non nul x0 de E . Par hypothèse, x0 et f (x0 ) sont colinéaires et, � 0 , on peut trouver λ0 ∈ IK tel que f (x0 ) = λ0 x0 . comme x0 = Montrons que, pour tout x ∈ E , on a f (x) = λ0 x . Soit donc x un vecteur de E . • Si la famille (x, x0 ) est liée, alors il existe µ ∈ IK tel que x = µ x0 et : f (x) = µ f (x0 ) = µ λ0 x0 = λ0 x.
• Sinon, la famille (x0 , x) est libre et l’on a x �= 0 ainsi que x + x0 �= 0 .
Étant donné que x �= 0 et que x et f (x) sont supposés colinéaires, il existe donc λ ∈ IK tel que f (x) = λ x . Il existe de même µ ∈ IK tel que f (x0 + x) = µ (x0 + x) . On a alors : f (x0 + x) = f (x0 ) + f (x) = λ0 x0 + λ x,
ainsi que : f (x0 + x) = µ (x0 + x) = µ x0 + µ x, ce qui entraîne : λ0 x0 + λ x = µ x0 + µ x. Comme la famille (x0 , x) est libre, on en déduit λ0 = µ = λ et ainsi f (x) = λ0 x . Finalement, f est une homothétie de rapport λ0 . 23.16 1. Par bilinéarité de la composition dans L(E) , l’application : L(E) f
−→ �−→
L(E) p◦f −f ◦p
est linéaire et C(p) est son noyau donc est un sous-espace vectoriel de L(E) .
2. Soit f ∈ L(E) .
• Supposons f ∈ C(p) , c’est-à-dire p ◦ f = f ◦ p . ∗ Soit x ∈ Im p . On a alors p(x) = x et ainsi :
p f (x) = (p ◦ f )(x) = (f ◦ p)(x) = f p(x) = f (x), ce qui prouve que f (x) ∈ Im p . ∗ Soit x ∈ Ker p . On a alors : p f (x) = f p(x) = f (0) = 0 et donc f (x) ∈ Ker p . Ainsi les sous-espaces vectoriels Im p et Ker p sont stables par f .
904
Solutions des exercices • Réciproquement, supposons Im p et Ker p stables par f . L’endomorphisme p est un projecteur donc E = Ker p ⊕ Im p . Montrons que p ◦ f et f ◦ p coïncident sur Ker p et Im p . ∗ Soit x ∈ Ker p . On a alors f (x) ∈ Ker p et ainsi :
p f (x) = 0 = f (0) = f p(x) . ∗ Soit x ∈ Im p . Puisque f (x) est dans Im p , on a :
p f (x) = f (x)
donc
f p(x) = f (x) = p f (x) .
Ainsi, les applications linéaires f ◦p et p◦f coïncident sur deux sous-espaces vectoriels supplémentaires de E , donc sont égales, ce qui prouve que f ∈ C(p) .
3. D’après la question précédente, tout endomorphisme f qui commute avec p induit un endomorphisme fK de Ker p et un endomorphisme fI de Im p : fK : Ker p x
−→ �−→
Ker p f (x)
et
fI : Im p x
−→ �−→
Im p f (x).
Considérons alors l’application : ϕ : C(p) f
−→ �−→
L(Ker p) × L(Im p) (fK , fI ).
On vérifie aisément que l’application ϕ est linéaire. De plus, les sous-espaces vectoriels Ker p et Im p sont supplémentaires dans E . Donc, par théorème, étant donné un couple (g, h) ∈ L(Ker p) × L(Im p) , il existe une unique application f ∈ L(E) telle que : ∀x ∈ Ker p
f (x) = g(x)
et
∀x ∈ Im p
f (x) = h(x).
Par construction, les sous-espaces vectoriels Ker p et Im p sont stables par f , ce qui prouve (d’après la question précédente) que f appartient à C(p) . Par conséquent, l’application ϕ est bijective. On en déduit que ϕ est un isomorphisme et par suite, C(p) et L(Ker p) × L(Im p) sont isomorphes. 23.17 • Supposons que p et q soient deux projecteurs ayant même noyau. Soit x ∈ E . Comme q est un projecteur, on a E = Ker q ⊕ Im q , donc il existe (xK , xI ) ∈ Ker q × Im q tel que x = xK + xI . On a alors q(xK ) = 0 et q(xI ) = xI donc :
(p ◦ q)(x) = (p ◦ q)(xK + xI ) = p q(xK ) + p q(xI ) = p(0) + p(xI ) = p(xI ). De plus, comme Ker q = Ker p , on a aussi p(xK ) = 0 et ainsi : p(x) = p(xI + xK ) = p(xI ) + 0 = p(xI ). On en déduit que (p ◦ q)(x) = p(x) et ainsi p ◦ q = p . Par symétrie, on montre de même q ◦ p = q . • Réciproquement, supposons que p ◦ q = p et q ◦ p = q . ∗ Tout d’abord, p est un projecteur puisque :
p ◦ p = (p ◦ q) ◦ p = p ◦ (q ◦ p) = p ◦ q = p.
Par symétrie, q est aussi un projecteur. ∗ Il est clair que Ker q ⊂ Ker(p ◦ q) et Ker p ⊂ Ker(q ◦ p) . Donc les égalités p ◦ q = p et q ◦ p = q montrent que Ker p et Ker q sont inclus l’un dans l’autre, donc égaux. Ainsi, p et q sont deux projecteurs ayant même noyau.
905
Chapitre 23. Applications linéaires 23.18 Raisonnons par l’absurde en supposant les formes linéaires f et g non nulles. Soit (x, y) ∈ E 2 tels que f (x) �= 0 et g(y) �= 0 . Puisque f (x)g(x) = f (y)g(y) = 0 , on a f (y) = 0 et g(x) = 0 . Or, par linéarité de f , on a f (x + y) = f (x) + f (y) donc f (x + y) = f (x) �= 0 . De même, g(x + y) �= 0 . Ainsi f (x + y)g(x + y) �= 0 , ce qui contredit l’hypothèse. Ainsi f est nulle ou g est nulle.
906
Chapitre 24 : Dimension finie I
Dimension d’un espace vectoriel . . . . . . . . . . . . Espace vectoriel de dimension finie . . . . . . . . . . . Définition de la dimension . . . . . . . . . . . . . . . . Caractérisation des bases en dimension finie . . . . . . Sous-espace vectoriel d’un espace de dimension finie . Rang d’une famille finie de vecteurs . . . . . . . . . . II Relations entre les dimensions . . . . . . . . . . . . . . 1 Produit d’espaces vectoriels . . . . . . . . . . . . . . . 2 Sommes de sous-espaces vectoriels, base adaptée . . . III Applications linéaires et dimension finie . . . . . . . . 1 Dimension finie et isomorphismes . . . . . . . . . . . . 2 Rang d’une application linéaire, théorème du rang . . 3 Isomorphismes et endomorphismes en dimension finie 4 Dimension de L(E, F ) . . . . . . . . . . . . . . . . . . 1 2 3 4 5
IV
Formes linéaires et hyperplans en dimension finie 1 Expression d’une forme linéaire dans une base . . . 2 Hyperplans vectoriels et dimension finie . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . .
908 908 909 912 913 913 914 914 915 917 917 918 920 921
. 922 . . 922 . . 922 . 925 . 931
Dimension finie
24
Dans tout le chapitre, IK désigne IR ou C, et n et p des entiers naturels, et E désigne un IK -espace vectoriel. Terminologie Étant donné une famille finie (ai )i∈I , le nombre d’éléments de I est appelé le cardinal de la famille, ou encore sa longueur ou sa taille.
I
Dimension d’un espace vectoriel
1
Espace vectoriel de dimension finie
Définition 1 Le IK-espace vectoriel E est dit de dimension finie s’il admet une famille génératrice finie. Dans le cas contraire, on dit que E est de dimension infinie. Remarque Une base étant en particulier une famille génératrice, si E possède une base finie, alors il est de dimension finie. Ex. 1. Les IK -espaces vectoriels de référence suivants possèdent une base finie, donc sont de dimension finie : IKn , IKn [X] , Mn,p (IK) . Ex. 2. Le IR -espace vectoriel C est de dimension finie, puisqu’une base en est (1, i) .
Ex. 3. Le IK -espace vectoriel réduit au vecteur nul est de dimension finie, car admet comme famille génératrice la famille vide. Ex. 4. Pour tout (e1 , . . . , ep ) ∈ E p , l’espace vectoriel Vect(e1 , . . . , ep ) est de dimension finie.
Ex. 5. Le IK -espace vectoriel IK[X] est de dimension infinie. En effet, si (P1 , . . . , Pn ) est une famille finie de polynômes, alors en notant d = max{0, deg P1 , . . . , deg Pn } , on a : X d+1 ∈ / Vect(P1 , . . . , Pn ), donc la famille (P1 , . . . , Pn ) n’est pas génératrice de IK[X] .
Proposition 1 Soit G une famille génératrice finie de E . Toute sous-famille libre de G peut, à l’aide d’éléments de G , être complétée en une base de E .
Démonstration page 925 Si F est une sous-famille libre de G , considérer une sousfamille libre de G contenant F et de cardinal maximal, et montrer qu’elle est génératrice de E .
Principe de démonstration.
I Dimension d’un espace vectoriel Théorème 2 (Théorème de la base incomplète) Supposons E de dimension finie. Toute famille libre finie de E peut être complétée en une base de E . Démonstration. Soit F une famille libre finie. Puisque E est de dimension finie, on dispose d’une famille génératrice finie G . En adjoignant les éléments de F à ceux de G , on obtient une sur-famille finie G , donc génératrice de E , et contenant F . D’après la proposition précédente, la famille F peut être complétée en une base de E (à l’aide d’éléments de G ′ ). Théorème 3 (Théorème de la base extraite) De toute famille génératrice finie de E on peut extraire une base de E . Démonstration. Soit G une famille génératrice finie de E . En utilisant la proposition 1, on peut compléter la famille vide (qui est une sous-famille libre de G ) en une base de E à l’aide d’éléments de G ; on obtient ainsi une base de E constituée d’éléments de G . Corollaire 4 Si E est de dimension finie, alors E admet une base finie. Démonstration. Par définition, tout IK -espace vectoriel de dimension finie possède une famille génératrice finie ; le théorème de la base extraite nous assure alors qu’on peut en extraire une base finie.
2
Définition de la dimension
Lemme 5 Soit n ∈ IN. Dans un IK-espace vectoriel engendré par n vecteurs, toute famille de cardinal n + 1 est liée.
Démonstration page 925
Principe de démonstration.
Exo 24.1 Exo 24.2
Par récurrence sur n .
Avant d’énoncer le résultat suivant, rappelons que, par le théorème de la base incomplète, tout espace vectoriel de dimension finie possède au moins une base finie. Théorème 6 Si E est de dimension finie, alors toutes les bases de E sont finies et ont même cardinal. Ce cardinal commun est appelé dimension de E . Démonstration.
Supposons E de dimension finie.
• Prouvons que toute base de E est finie. L’espace E est de dimension finie, il possède une famille génératrice G finie. Si F est une famille infinie d’éléments de E , alors on peut en extraire une sous-famille finie de cardinal card G + 1 . D’après le lemme précédent, cette sous-famille est liée ; la famille F est donc liée aussi, donc n’est pas une base de E . • Prouvons maintenant que toutes les bases de E ont même cardinal. Soit B1 et B2 deux bases de E . Puisque B2 est génératrice de E , tout élément de B1 en est combinaison linéaire. Comme B1 est libre, le lemme 5 assure que card B1 card B2 . Vu les rôles symétriques joués par ces deux bases, on a l’inégalité inverse et donc l’égalité.
909
Chapitre 24. Dimension finie Notation La dimension du IK -espace vectoriel E se note dimIK E , ou plus simplement dim E s’il n’y a pas d’ambiguïté sur ce qu’est le corps IK . Ex. 6. Le IK -espace vectoriel IK est de dimension 1 . Il admet pour base la famille (1) , et plus généralement toute famille formée d’un unique élément non nul. Ex. 7. Le IR -espace vectoriel C est de dimension 2 ; il admet pour base (1, i) . Mais, C est aussi un C -espace vectoriel de dimension 1 d’après l’exemple qui précède. Ex. 8. Le IK -espace vectoriel IKn est de dimension n , puisqu’il admet pour base sa base canonique, constituée de n vecteurs. Ex. 9. Le IK -espace vectoriel IKn [X] est de dimension n + 1 , puisqu’il admet pour base sa base canonique (X k )0kn , de cardinal n + 1 . Ex. 10. Le IK -espace vectoriel Mn,p (IK) est de dimension np , puisqu’il admet pour base sa base canonique Ei,j (i,j)∈[[1,n]]×[[1,p]] , de cardinal np . En particulier, on a dim Mn (IK) = n2 . Ex. 11. Dans Mn (IK) , les sous-espaces vectoriels Sn (IK) et An (IK) admettent respectivement
pour bases les familles Ei,j + Ej,i dim Sn (IK) =
1in ijn
n(n + 1) 2
et Ei,j − Ej,i et
1in . i n, la famille (x1 , . . . , xp ) est liée.
Ex. 13. La famille (X + 1, 2X 2 − 1, X 3 + X + 1) n’est pas génératrice de IK3 [X] puisqu’elle ne comporte que 3 éléments, alors que dim IK3 [X] = 4 . Ex. 14. Trois vecteurs d’un même plan vectoriel forment une famille liée.
Point méthode Si E est de dimension finie et si (x1 , . . . , xp ) une famille de p éléments de E , alors : • si la famille (x1 , . . . , xp ) est génératrice de E , alors on a dim E p ;
• si la famille (x1 , . . . , xp ) est libre, alors on a dim E p. Espaces vectoriels de dimension infinie
Exo 24.4
Proposition 8 Les propositions suivantes sont équivalentes : (i) E est de dimension infinie, (ii) il existe une suite (xn )n∈IN d’éléments de E qui est libre, (iii) pour tout n ∈ IN∗ , il existe une famille de n éléments de E qui est libre.
Démonstration page 926
Principe de démonstration.
Si E est de dimension infinie, on peut construire par récurrence une suite (xn )n∈IN répondant au problème.
Ex. 15. On retrouve que IK[X] est de dimension infinie (cf. exemple 5 de la page 908) puisque la famille (X k )k∈IN est libre.
911
Chapitre 24. Dimension finie
3
Exo 24.5 Exo 24.6
Caractérisation des bases en dimension finie
Théorème 9 Supposons E de dimension n. Soit B une famille d’éléments de E . Les assertions suivantes sont équivalentes : (i) la famille B est une base de E , (ii) la famille B est libre et possède n éléments, (iii) la famille B est génératrice de E et possède n éléments. Principe de démonstration.
Démonstration page 926 Conséquence du théorème de la base incomplète et du théo-
rème de la base extraite.
Ex. 16. Si E est un plan vectoriel, alors toute famille libre formée de deux vecteurs non colinéaires est une base de E . Ex. 17. Dans le IK -espace vectoriel IKn [X] , considérons une famille (P0 , . . . , Pn ) de n + 1 polynômes tels que, pour tout k ∈ [[0, n]] , on ait deg Pk = k . • Cette famille est échelonnée en degré, donc libre (cf. page 849).
• Comme dim IKn [X] = n+1 , on en déduit immédiatement que cette famille de n+1 éléments de IKn [X] en est une base.
Reformulation de certains résultats d’analyse en termes de dimension Ex. 18. Soit a une application continue sur un intervalle non trivial I . Si l’on désigne par A une primitive de la fonction continue a sur l’intervalle I et si l’on pose y0 : x �→ exp A(x) , alors l’équation différentielle homogène : y ′ − a(x)y = 0 a pour ensemble de solutions S = {k y0 | k ∈ IR} = Vect(y0 ) (cf. page 278). Autrement dit, l’ensemble des solutions de cette équation différentielle est la droite vectorielle engendrée par la fonction non nulle y0 . Ex. 19. Pour (a, b, c) ∈ IK3 avec a �= 0 , l’équation différentielle homogène : ay ′′ + by ′ + cy = 0 admet pour ensemble de solutions un plan vectoriel, car engendré par deux fonctions non colinéaires (cf. page 286). Ex. 20. Pour (a, b) ∈ IR2 , l’ensemble des suites (un )n∈IN vérifiant une relation de récurrence d’ordre 2 de la forme : ∀n ∈ IN un+2 = aun+1 + bun est un plan vectoriel, car engendré par deux suites non colinéaires (cf. page 339).
912
I Dimension d’un espace vectoriel
4
Sous-espace vectoriel d’un espace de dimension finie
Théorème 10 Si E est de dimension n, alors tout sous-espace vectoriel F de E est de dimension finie p n. De plus, F est égal à E si, et seulement si, p = n. Démonstration page 926
Principe de démonstration. Parmi les familles libres de F , en considérer une de cardinal maximal.
Attention Si F est un sous-espace vectoriel de E , alors toute base de F peut être complétée en une base de E . En revanche, il n’est pas toujours possible, d’une base de E , d’extraire une base de F . Par exemple, dans IR2 , si l’on note u = (1, 1), alors la droite vectorielle F = Vect(u) ne contient aucun des deux vecteurs de la base canonique. Point méthode Pour prouver que deux espaces vectoriels de dimension finie sont égaux, il suffit de montrer une inclusion et l’égalité des dimensions.
Ex. 21. Si E est une droite vectorielle, alors E ne possède que deux sous-espaces vectoriels : l’espace nul et lui-même. En effet, si F est un sous-espace vectoriel de E , et comme dim E = 1 , on a dim F ∈ {0, 1} . Si dim F = 0 , alors F = {0} , et si dim F = 1 , alors F = E . Ex. 22. Dans l’espace vectoriel IR3 , montrons l’égalité des sous-espaces vectoriels :
F = Vect (1, 1, −2), (−2, 1, 1)
et
G = {(x, y, z) ∈ IR3 : x + y + z = 0}.
• On voit facilement que les vecteurs (1, 1, −2) et (−2, 1, 1) appartiennent à G ; le sous-espace vectoriel F qu’ils engendrent est donc inclus dans G . • Comme les vecteurs (1, 1, −2) et (−2, 1, 1) ne sont pas proportionnels, ils forment une base du sous-espace vectoriel F qu’ils engendrent, et donc dim F = 2 . • Comme F ⊂ G ⊂ IR3 , on a dim F dim G dim IR3 et donc 2 dim G 3 . Ainsi, le nombre entier dim G vaut 2 ou 3 . Si l’on avait dim G = 3 , alors on aurait dim G = dim IR3 donc G = IR3 , ce qui est absurde puisque (1, 1, 1) ∈ / G . Par suite, on a dim F = dim G = 2 , et donc F = G puisque F ⊂ G .
5
Rang d’une famille finie de vecteurs
Définition 2 Soit F une famille finie de vecteurs de E . On appelle rang de F , et l’on note rg F , la dimension du sous-espace vectoriel de E engendré par F . Remarques Soit F une famille de vecteurs de E . • Comme la famille F est génératrice de l’espace vectoriel Vect(F ), on a : dim Vect(F ) n
i.e.
rg F n,
avec égalité si, et seulement si, la famille F est libre.
913
Chapitre 24. Dimension finie • Supposons E de dimension finie. Comme l’ensemble Vect(F ) est un sous-espace vectoriel de E , on a dim Vect F dim E , i.e. rg F dim E .
• Si F possède une sous-famille libre de cardinal r , alors on a rg F r .
Ex. 23. La famille F = (1, 2, 3), (3, 2, 1), (1, 1, 1) , d’éléments de IR3 , est de rang 2 , car : • les vecteurs (1, 2, 3) et (3, 2, 1) n’étant pas colinéaires, on a rg F 2 ;
• comme (1, 2, 3) + (3, 2, 1) = 4 (1, 1, 1) , on a :
Vect(F) = Vect (1, 2, 3), (3, 2, 1)
II 1
et donc
rg F 2.
Relations entre les dimensions Produit d’espaces vectoriels
Proposition 11 Si E et F sont deux IK-espaces vectoriels de dimension finie, alors E × F est de dimension finie et : dim(E × F ) = dim E + dim F.
Démonstration page 926 Prendre (ei )1in base de E et (fi )1ip base de F , puis montrer que G = (e1 , 0), . . . , (en , 0), (0, f1 ), . . . , (0, fp ) est une base de E × F .
Principe de démonstration.
Ex. 24. Si dim E = n , alors l’espace produit E 2 est de dimension finie et dim E 2 = 2n .
Le résultat précédent s’étend au cas de plusieurs espaces vectoriels : Proposition 12 Soit un entier p 2 ainsi que E1 , . . . , Ep des IK-espaces vectoriels de dimension finie. Alors E1 × · · · × Ep est de dimension finie, et l’on a : dim(E1 × · · · × Ep ) = dim E1 + · · · + dim Ep .
Démonstration.
La démonstration de la proposition 11 s’adapte à cette situation plus générale, donnant une preuve assez lourde et sans idée nouvelle ; nous ne l’écrirons pas. La frustration du lecteur sera soulagée par l’exemple 33 de la page 918.
Corollaire 13 Supposons E de dimension finie. Alors, pour tout p ∈ IN∗ , l’espace vectoriel E p est de dimension finie, et l’on a dim E p = p dim E . Ex. 25. On retrouve ainsi que dim(IKn ) = n .
914
II Relations entre les dimensions
2
Sommes de sous-espaces vectoriels, base adaptée
Base adaptée à une somme directe Proposition 14 Supposons E de dimension finie n. Soit p ∈ [[0, n]].
1. Soit (e1 , . . . , en ) une base de E . Alors les sous-espaces vectoriels : F = Vect(e1 , . . . , ep )
et
G = Vect(ep+1 , . . . , en )
sont supplémentaires dans E . 2. Soit F et G deux sous-espaces vectoriels supplémentaires de E . Si (f1 , . . . , fp ) est une base de F et (g1 , . . . , gq ) une base de G, alors la famille (f1 , . . . , fp , g1 , . . . , gq ) est une base de E . Une telle base est dite adaptée à la décomposition E = F ⊕ G.
Démonstration page 927
Principe de démonstration. 1. Montrer E = E1 + E2 et E1 ∩ E2 = {0} en utilisant que (e1 , . . . , en ) est une base. 2. Montrer que (f1 , . . . , fp , g1 , . . . , gq ) est libre et génératrice.
Interprétation • En « concaténant » des bases de deux sous-espaces vectoriels supplémentaires de E , on obtient une base de E . • En « fractionnant » en deux une base de E , on obtient des bases de deux sousespaces vectoriels supplémentaires. Existence d’un supplémentaire Proposition 15 Si E est de dimension finie, alors tout sous-espace vectoriel F de E admet au moins un supplémentaire dans E . Démonstration.
Soit E de dimension finie et F un sous-espace vectoriel de E .
• On sait que F est de dimension finie. Posons p = dim F et considérons (e1 , . . . , ep ) une base de F . C’est en particulier une famille libre de E . • Complétons-la en une base B de E de la forme B = (e1 , , . . . , ep , ep+1 , . . . , en ) . D’après le premier point de la proposition précédente, G = Vect(ep+1 , . . . , en ) est un supplémentaire de F .
Terminologie La base B = (e1 , . . . , ep , ep+1 , . . . , en ) construite dans la démonstration précédente « débute » par une base de F : elle est dite adaptée à F . Ex. 26. Dans IR2 , si l’on note B = (e1 , e2 ) la base canonique, et si F = Vect(e1 + e2 ) , alors (e1 + e2 , e1 ) est une base de IR2 adaptée à F .
915
Chapitre 24. Dimension finie Ex. 27. Dans IK3 [X] , l’ensemble F = {P ∈ IK3 [X] : P (1) = 0} est un sous-espace vectoriel car c’est le noyau de la forme linéaire IK3 [X] −→ IK P �−→ P (1). • On constate que les polynômes P1 = (X −1) , P2 = (X −1)2 et P3 = (X −1)3 appartiennent à F . Puisque la famille (P1 , P2 , P3 ) est libre car échelonnée en degré, on obtient dim F 3 . • Il est clair que F n’est pas égal à IK3 [X] car par exemple le polynôme 1 n’est pas dans F . Par suite, dim F = 3 , et (P1 , P2 , P3 ) est une base de F . • Une base de IK3 [X] adaptée à F est alors (P1 , P2 , P3 , 1) .
Dimension d’une somme directe, d’une somme Proposition 16 Soit F et G deux sous-espaces vectoriels de dimension finie de E . Alors F + G est de dimension finie. De plus, si F et G sont en somme directe, alors on a : dim(F ⊕ G) = dim F + dim G. Démonstration. Notons p = dim F et q = dim G . Considérons (f1 , . . . , fp ) une base de F , et (g1 , . . . , gq ) une base de G . • Il est clair que la famille finie (f1 , . . . , fp , g1 , . . . , gq ) est génératrice de F + G , ce qui assure que F + G est de dimension finie. • Supposons F et G en somme directe. Alors F et G sont supplémentaires dans F ⊕ G , et la famille (f1 , . . . , fp , g1 , . . . , gq ) est une base de F ⊕ G (cf. proposition 14 de la page précédente). Par suite, on a dim(F ⊕ G) = p + q = dim F + dim G .
Ex. 28. En particulier, si E est de dimension finie, et si F et G sont deux sous-espaces supplémentaires dans E , alors on a : dim E = dim F + dim G. Ex. 29. Soit E un espace vectoriel de dimension n . On sait qu’un sous-espace vectoriel H de E est un hyperplan si, et seulement s’il possède un supplémentaire de dimension 1 . Ainsi, H est un hyperplan si, et seulement si, dim H = n−1 . On retrouvera ce résultat à la proposition 31 de la page 922.
Proposition 17 (Formule de Grassmann) Soit F et G deux sous-espaces vectoriels de E . Si F et G sont de dimension finie, alors F + G est aussi de dimension finie, et l’on a : Exo 24.7
dim(F + G) = dim F + dim G − dim(F ∩ G).
Démonstration page 928
Principe de démonstration. En notant S un supplémentaire de F ∩ G dans G , montrer que F et S sont supplémentaires dans F + G . 916
III Applications linéaires et dimension finie Ex. 30. Dans un IK -espace vectoriel E de dimension 3 , montrons que l’intersection de deux plans vectoriels distincts H1 et H2 est une droite vectorielle. La formule de Grassmann donne : dim(H1 ∩ H2 ) = dim H1 + dim H2 − dim(H1 + H2 ) = 4 − dim(H1 + H2 ). Pour obtenir que dim(H1 ∩ H2 ) = 1 , justifions que dim(H1 + H2 ) = 3 . • Comme H1 et H2 ont même dimension, si l’un était inclus dans l’autre, ils seraient égaux. On en déduit que H2 n’est pas inclus dans H1 ; l’inclusion de H1 dans H1 + H2 est donc stricte, ce qui assure que dim(H1 + H2 ) > dim H1 i.e. dim(H1 + H2 ) 3 . • L’inégalité dim(H1 + H2 ) 3 est quant à elle immédiate car H1 + H2 est un sous-espace vectoriel de E .
Corollaire 18 Soit F et G deux sous-espaces vectoriels de dimension finie de E . On a alors dim(F + G) dim F + dim G, avec égalité si, et seulement si, la somme est directe. Démonstration.
Les sous-espaces F et G étant de dimension finie, on a, d’après la formule
de Grassmann : dim(F + G) = dim F + dim G − dim(F ∩ G).
• L’inégalité souhaitée vient du fait que dim(F ∩ G) 0 . • Il y a égalité si, et seulement si, dim F ∩ G = 0 , i.e. F ∩ G = {0} .
Théorème 19 Soit F et G deux sous-espaces vectoriels de E . Alors les propositions suivantes sont équivalentes : (i) F et G sont supplémentaires dans E ; (ii) F ∩ G = {0} et dim E = dim F + dim G ;
(iii) F + G = E et dim E = dim F + dim G.
Principe de démonstration. Utiliser la formule de Grassmann. Ex. 31. On a IK2 = Vect (1, 0) ⊕ Vect (1, 1) car :
Démonstration page 928
• ces deux sous-espaces vectoriels de IK2 sont de dimension 1 , et donc la somme de leurs dimensions est égale à celle de IK2 ; • ils sont en somme directe car les vecteurs (1, 0) et (1, 1) ne sont pas proportionnels.
III 1
Applications linéaires et dimension finie Dimension finie et isomorphismes
Proposition 20 Soit E et F deux IK-espaces vectoriels. Si E est de dimension finie, alors F est isomorphe à E si, et seulement si, F est de dimension finie avec dim F = dim E . Principe de démonstration.
Démonstration page 928 L’image d’une base par un isomorphisme est une base.
917
Chapitre 24. Dimension finie
Ex. 32. Soit (a, b) ∈ IK2 . On considère E l’espace vectoriel des suites à valeurs dans IK vérifiant la relation de récurrence linéaire d’ordre 2 : ∀n ∈ IN
un+2 = aun+1 + bun .
Pour justifier que dim E = 2 , on peut considérer l’application ϕ : E u
−→ �−→
IK2 (u0 , u1 ).
En effet, ϕ est linéaire, et elle est bijective car pour tout (a, b) ∈ IK2 , il existe une unique suite (un )n∈IN dans E telle que (u0 , u1 ) = (a, b) . Par suite, ϕ est un isomorphisme, ce qui entraîne dim E = dim IK2 = 2 . Ex. 33. Esquissons ici une preuve de la proposition 12 de la page 914. Soit E1 , . . . , Ep des IK -espaces vectoriels de dimension finie. Montrons que E1 × · · · × Ep est de dimension finie et que : dim(E1 × · · · × Ep ) = dim E1 + · · · + dim Ep . On peut démontrer que l’application : ϕ : E1 × · · · × Ep (x1 , . . . , xp )
−→ �−→
(E 1 × · · · × Ep−1 ) × Ep (x1 , . . . , xp−1 ), xp
est un isomorphisme d’espaces vectoriels. Ainsi, si l’on sait que E1 × · · · × Ep−1 est de dimension finie, alors la proposition 11 de la page 914 nous assure que E1 × · · · × Ep l’est aussi et donne : dim(E1 × · · · × Ep ) = dim(E1 × · · · × Ep−1 ) + dim Ep . Une preuve complète consiste donc à faire une récurrence sur p .
Corollaire 21 Tout IK-espace vectoriel de dimension n est isomorphe à IKn . Remarque Si E est un IK -espace vectoriel de dimension n et si B = (e1 , . . . , en ) est une base de E , alors l’application suivante est un isomorphisme de E vers IKn : IKn
−→ E n (x1 , . . . , xn ) �−→ xk ek , k=1
dont l’isomorphisme réciproque est l’application qui à un vecteur de E associe la liste des ses coordonnées dans la base B .
2
Rang d’une application linéaire, théorème du rang
Rang d’une application linéaire Définition 3 Soit E et F deux IK-espaces vectoriels et u ∈ L(E, F ). On dit que u est de rang fini si son image Im u est de dimension finie. On appelle alors rang de u , et l’on note rg u , la dimension de Im u . Soit E et F deux IK -espaces vectoriels et u ∈ L(E, F ) . Ex. 34. Si F est de dimension finie, alors u est de rang fini, et l’on a rg(u) dim F , avec égalité si, et seulement si, u est surjective.
918
III Applications linéaires et dimension finie Ex. 35. Si E est de dimension finie, alors u est de rang fini, et l’on a rg(u) dim E , avec égalité si, et seulement si, u est injective. En effet, si (e1 , . . . , en ) est une base de E , alors Im u = Vect u(e1 ), . . . , u(en ) . On a donc rg u n , avec égalité si, et seulement si, la
famille u(e1 ), . . . , u(en ) est libre, ce qui, puisque (e1 , . . . , en ) est une base de E , équivaut à l’injectivité de u .
Composition d’applications linéaires et rang Proposition 22 Soit E , F et G des IK -espaces vectoriels, ainsi que u ∈ L(E, F ) et v ∈ L(F, G).
• Si u est un isomorphisme et si v est de rang fini, alors v ◦ u est de rang fini, et rg(v ◦ u) = rg v .
• Si v est un isomorphisme et si u est de rang fini, alors v ◦ u est de rang fini, et rg(v ◦ u) = rg u .
Démonstration.
On a Im(v ◦ u) = v u(x) | x ∈ E = v(y) | y ∈ Im u = v(Im u).
• Si u est bijective, alors Im u = F et donc Im(v ◦ u) = v(F ) = Im v . D’où rg(v ◦ u) = rg v . • Si v est bijective, alors v induit un isomorphisme de Im u sur v(Im u) . Ces deux sous-espaces vectoriels ont donc même dimension, d’où rg(v ◦ u) = rg u .
Proposition 23 Soit E , F et G trois IK -espaces vectoriels ainsi que u ∈ L(E, F ) et v ∈ L(F, G) deux applications linéaires de rang fini. Alors v ◦ u est de rang fini et : rg(v ◦ u) min(rg v, rg u).
Démonstration page 929
Théorème du rang
Exo 24.12
Proposition 24 Soit E et F deux IK-espaces vectoriels, et u ∈ L(E, F ). Si S est un supplémentaire de Ker u dans E , alors u induit un isomorphisme de S sur Im u . Principe de démonstration.
Exo 24.13 Exo 24.14 Exo 24.15
Démonstration page 929 Considérer l’application linéaire v : S −→ Im u x �−→ u(x).
Théorème 25 (Théorème du rang ou formule du rang) Soit E et F deux IK-espaces vectoriels avec E de dimension finie et u ∈ L(E, F ). Alors u est de rang fini, et l’on a : dim E = rg u + dim(Ker u). Démonstration.
Comme E est de dimension finie, on peut considérer S un supplémentaire de Ker u dans E . D’après la proposition précédente, les sous-espaces vectoriels S et Im u sont isomorphes. Comme S est de dimension finie, Im u l’est aussi et dim(Im u) = dim S . Par suite : dim E = dim S + dim(Ker u) = dim(Im u) + dim(Ker u) = rg u + dim(Ker u).
919
Chapitre 24. Dimension finie Ex. 36. Soit n ∈ IN∗ . Considérons l’endomorphisme ∆ de IRn [X] défini par : ∀P ∈ IRn [X]
∆(P ) = P (X + 1) − P (X).
• Il est évident que IR0 [X] ⊂ Ker ∆ . Montrons l’inclusion réciproque.
Soit donc P ∈ IR[X] tel que ∆(P ) = 0 . Alors on a P (X + 1) = P (X) et le polynôme P (X) − P (0) possède une infinité de racines : tous les entiers. Par suite, il est nul et P est constant. Ainsi, on a Ker ∆ = IR0 [X] .
• D’après la formule du rang, on a dim Im ∆ = n . Comme Im ∆ est évidemment incluse dans IRn−1 [X] (car les polynômes P (X) et P (X + 1) ont le même coefficient en X n ), on en déduit, par égalité des dimensions, que Im ∆ = IRn−1 [X] .
3
Isomorphismes et endomorphismes en dimension finie
Théorème 26 Soit E et F deux IK -espaces vectoriels de même dimension finie. Étant donné u ∈ L(E, F ), les trois assertions suivantes sont équivalentes : (i) u est injective,
(ii) u est surjective,
(iii) u est bijective.
Démonstration.
Il suffit de montrer que (i) et (ii) sont équivalentes. D’après le théorème du rang et par égalité des dimensions de E et de F , on a : rg u + dim(Ker u) = dim E = dim F.
(⋆)
• Si u est injective, alors dim(Ker u) = 0 , et (⋆) donne rg u = dim F , i.e. u surjective.
• Si u est surjective, alors rg(u) = dim F , et (⋆) donne dim(Ker u) = 0 , i.e. u injective.
Point méthode Sous les hypothèses du théorème précédent, on montre le plus souvent l’injectivité pour en déduire la bijectivité (et donc que u est un isomorphisme de E vers F ). Polynômes interpolateurs de Lagrange Donnons une autre démonstration du théorème 18 de la page 752. Soit n ∈ IN∗ ainsi que x1 , . . . , xn des éléments de IK distincts. Montrons que pour tout (y1 , . . . , yn ) ∈ IKn , il existe un unique P ∈ IKn−1 [X] tel que : ∀i ∈ [[1, n]]
P (xi ) = yi .
n Pour cela, considérons l’application ϕ : IKn−1 [X] −→ IK P �−→ P (x1 ), P (x2 ), . . . , P (xn ) . • L’application ϕ est clairement linéaire. • Elle est injective : en effet, si P ∈ Ker ϕ , alors le polynôme P possède n racines distinctes et, comme P ∈ IKn−1 [X] , on en déduit P = 0 .
• Comme dim IKn−1 [X] = n = dim IKn , l’application linéaire ϕ est donc bijective, ce qui prouve le résultat souhaité.
920
III Applications linéaires et dimension finie Corollaire 27 Si u est un endomorphisme d’un espace vectoriel de dimension finie, il est équivalent de dire que u est injectif, que u est surjectif ou que u est bijectif (ou encore que u est un automorphisme de E ). Attention Le résultat précédent n’est valable qu’en dimension finie. Si un IK-espace vectoriel E n’est pas de dimension finie : • un endomorphisme de E peut être injectif sans être surjectif, • un endomorphisme de E peut être surjectif sans être injectif. Ex. 37. L’endomorphisme u : IR[X] P
−→ �−→
IR[X] XP
−→ �−→
IR[X] P′
est injectif mais non surjectif. En effet :
• si P ∈ Ker u vérifie donc XP = 0 , alors, par intégrité de IK[X] , on a P = 0 ; d’où l’injectivité de u ; • en revanche, u n’est pas surjectif, car tout polynôme de la forme XP possède 0 comme racine, ce qui n’est pas le cas, par exemple, du polynôme constant 1 . Ex. 38. L’endomorphisme u : IR[X] P
est surjectif mais non injectif. En effet :
• l’endomorphisme v est surjectif, puisque tout polynôme P = antécédent par v , par exemple
n ak
k=0
k+1
X k+1 ;
n
ak X k a au moins un
k=0
• en revanche, Ker v contient le polynôme non nul 1 , donc v n’est pas injectif.
Corollaire 28 Supposons E de dimension finie. Soit u un endomorphisme de E . Alors les assertions suivantes sont équivalentes : (i) u est inversible (i.e. u est un automorphisme de E ) ; (ii) u est inversible à gauche (i.e. il existe v ∈ L(E) tel que v ◦ u = IdE ) ; (iii) u est inversible à droite (i.e. il existe v ∈ L(E) tel que u ◦ v = IdE ).
Démonstration page 929 Les relations v ◦ u = IdE et u ◦ v = IdE entraînent respectivement l’injectivité et la surjectivité de u .
Principe de démonstration.
4
Dimension de L(E, F )
Concernant le résultat suivant, nous nous contentons dans ce chapitre de l’énoncer, sans en faire sa démonstration : celle-ci sera faite lors du chapitre suivant « Représentation matricielle » qui offre un cadre plus agréable (cf. corollaire 2 de la page 947). Théorème 29 Soit E et F deux IK -espaces vectoriels de dimension finie. Alors le IK -espace vectoriel L(E, F ) est de dimension finie et l’on a : dim L(E, F ) = dim(E) × dim(F ).
921
Chapitre 24. Dimension finie
IV
Formes linéaires et hyperplans en dimension finie
Dans cette partie, E est un IK-espace vectoriel de dimension n et B = (e1 , . . . , en ) est une base de E .
1
∈
IN∗ ,
Expression d’une forme linéaire dans une base
Rappels On désigne par e∗1 , . . . , e∗n les formes linéaires coordonnées dans la base B . Pour i ∈ [[1, n]], la forme linéaire e∗i est définie par son comportement sur la base B par : e∗i (ei ) = 1 et ∀j ∈ [[1, n]] \ {i} e∗i (ej ) = 0. Proposition 30 La famille (e∗1 , . . . , e∗n ) est une base de L(E, IK). Démonstration.
Puisque dim L(E, IK) = dim E = n , et comme la famille (e∗1 , . . . , e∗n ) est de cardinal n , il suffit de démonter qu’elle est libre. Soit (a1 , . . . , an ) ∈ IKn tel que
n
i=1
ai e∗i = 0 . Pour j ∈ [[1, n]] , en évaluant la relation précédente
(qui est une égalité entre deux formes linéaires) en ej , et par définition des formes linéaires coordonnées e∗1 , . . . , e∗n , il vient directement aj = 0 . D’où la liberté.
Conséquence
Toute forme linéaire ϕ ∈ L(E, IK) s’écrit de manière unique : ϕ=
n
ak e∗k
(a1 , . . . , an ) ∈ IKn .
avec
k=1
Pour tout vecteur x ∈ E s’écrivant x =
n
xk ek , on a alors ϕ(x) =
k=1
n
ak xk ; on
k=1
parle de l’expression de ϕ dans la base B .
Attention L’expression d’une forme linéaire dans une base dépend évidemment de la base utilisée. Ex. 39. Soit f la forme linéaire :
IR2 −→ IR (x1 , x2 ) �−→ x1 + x2 . Donnons l’expression de f dans la base (u, v) avec u = (1, 1) et v = (1, −1) (la famille (u, v) est bien une base de IR2 puisqu’elle est formée de deux vecteurs non colinéaires). On a : f (u) = 2
et
f (v) = 0.
Donc, pour x ∈ IR2 , en notant (x′1 , x′2 ) ses coordonnées dans la base (u, v) , on a f (x) = 2x′1 .
2
Hyperplans vectoriels et dimension finie
Dimension Exo 24.22
Proposition 31 Un sous-espace vectoriel H de l’espace vectoriel E est un hyperplan (vectoriel) de E si, et seulement si, dim H = dim E − 1 .
Démonstration page 929
922
IV Formes linéaires et hyperplans en dimension finie
Ex. 40. En dimension 2 , les hyperplans sont les droites vectorielles. Ex. 41. En dimension 3 , les hyperplans sont les sous-espaces vectoriels de dimension 2 , i.e. les plans vectoriels.
Équation d’un hyperplan Corollaire 32 Une partie H de E est un hyperplan si, et seulement s’il existe une famille (a1 , . . . , an ) ∈ IKn de scalaires non tous nuls telle que : ∀x ∈ E
x ∈ H ⇐⇒
n i=1
ai xi = 0 ,
où (x1 , . . . , xn ) désigne la liste des coordonnées de x dans la base B . Démonstration.
Conséquence du fait qu’un hyperplan est le noyau d’une forme linéaire non nulle et de l’expression d’une forme linéaire dans la base B .
Terminologie n La relation ai xi = 0 est appelée équation de H dans la base B . i=1
Ex. 42. En dimension 2 , une droite vectorielle possède une équation de la forme a x + b y = 0 avec (a, b) �= (0, 0) .
Ex. 43. En dimension 3 , un plan vectoriel possède une équation de la forme a x + b y + c z = 0 avec (a, b, c) �= (0, 0, 0) .
Proposition 33 Soit (a1 , . . . , an ) ∈ IKn \ {0} et (b1 , . . . , bn ) ∈ IKn \ {0} . Les hyperplans, d’équations respectives : n
ai xi = 0
n
bi xi = 0
i=1
i=1
sont égaux si, et seulement si, ∃λ ∈ IK∗ Principe de démonstration.
et
(b1 , . . . , bn ) = λ (a1 , . . . , an ).
Démonstration page 930 C’est une conséquence de la proposition 27 de la page 888.
Remarque On dit aussi qu’en dimension finie, deux hyperplans sont égaux si, et seulement si, leurs équations dans une même base sont proportionnelles.
923
Chapitre 24. Dimension finie Intersection d’hyperplans Proposition 34 Soit m ∈ IN∗ ainsi que H1 , . . . , Hm des hyperplans de E . Alors : m Hi dim E − m. dim i=1
Démonstration page 930
Principe de démonstration. Utiliser le rang de u : E x
−→ �−→
m IK ϕ1 (x), . . . , ϕm (x)
avec Hi = Ker ϕi .
Ex. 44. Si ϕ1 , . . . ϕm sont des formes linéaires sur E , alors : dim
m
Ker ϕi
i=1
Plus précisément, on a dim
m
Ker ϕi
i=1
non nulles de la famille (ϕ1 , . . . , ϕm ) .
dim E − m.
dim E − k, où k est le nombre de formes linéaires
Remarque Dans un système linéaire homogène à n équations (non nulles) et p inconnues, chacune des n équations apparaît comme équation d’un hyperplan de IRp . Ainsi, l’ensemble des solutions du système est l’intersection de n hyperplans de IRp . La proposition 34 assure que le sous-espace vectoriel des solutions d’un tel système est de dimension au moins p − n. Proposition 35 Soit m ∈ IN∗ . Si F est un sous-espace vectoriel de E , avec dim F = n − m, alors m Hi . il existe m hyperplans H1 , . . . , Hm de E tels que F = i=1
Démonstration page 930
Principe de démonstration.
924
Partir d’une base de F .
Démonstrations
Démonstrations Proposition 1 Notons Ω l’ensemble des sous-familles libres de G contenant F . Il s’agit de montrer qu’il existe une famille A ∈ Ω telle que A soit une base de E . • L’ensemble Γ = {card A | A ∈ Ω} est une partie de IN , non vide (car card F ∈ Γ ) et majoré (par card G ). Par suite, Γ admet un plus grand élément, que nous notons p . •
•
Soit A ∈ Ω telle que card A = p . Montrons que A est génératrice de E . Pour cela, puisque G est génératrice, il suffit de montrer que tout vecteur G appartient à Vect(A) . Soit x ∈ G . En adjoignant le vecteur x à la famille A , on obtient une sousfamille de G contenant F et de cardinal p + 1 ; par définition de p , cette famille est liée. La famille A étant libre, on a donc x ∈ Vect(A) . D’où le caractère générateur de A . La famille A appartenant à Ω , elle est de plus libre, donc est une base de E . D’où le résultat.
Lemme 5 Soit Hn la propriété à démontrer. Procédons par récurrence sur n ∈ IN . • H0 est triviale ; en effet, si E est un IK -espace vectoriel engendré par la famille vide, alors E est l’espace nul, et donc la seule famille à un élément de E est la famille (0) , qui est liée. • Soit n 1 . Supposons Hn−1 et montrons Hn . Soit E = Vect(g1 , . . . , gn ) un IK -espace vectoriel engendré par n vecteurs. Soit également F = (x0 , . . . , xn ) une famille de n + 1 vecteurs de E . Montrons que F est liée. Pour k ∈ [[0, n]] , il existe αk ∈ IK et zk ∈ Vect(g1 , . . . , gn−1 ) tels que : xk = zk + αk gn .
∗ ∗
Si tous les scalaires αk sont nuls, alors (x1 , . . . , xn ) est une famille de n vecteurs appartenant à Vect(g1 , . . . , gn−1 ) ; elle est donc liée d’après Hn−1 . A fortiori, la surfamille (x0 , . . . , xn ) est liée. Sinon, l’un au moins des αk est non nul. Quitte à permuter les vecteurs, on peut alors k supposer α0 �= 0 . Si, pour tout k ∈ [[1, n]] , on pose yk = xk − α x , on a alors : α0 0 yk = (zk + αk gn ) −
αk αk (z0 + α0 gn ) = zk − z0 . α0 α0
Par suite, (y1 , . . . , yn ) est une famille de n vecteurs appartenant à Vect(g1 , . . . , gn−1 ) . D’après Hn−1 , cette famille est liée ; il existe donc des scalaires λ1 , . . . , λn non tous nuls tels que : n
λk yk = 0.
k=1
En posant alors λ0 = −
n αj λj j=1
α0
, on a
n
λk xk = 0 . Cela prouve le caractère
k=0
lié de la famille (x0 , . . . , xn ) , puisqu’au moins l’un des n derniers scalaires de la famille (λ0 , . . . , λn ) est non nul. Cela prouve Hn et termine la récurrence.
925
Chapitre 24. Dimension finie Proposition 8 (i) ⇒ (ii) libre. • •
Supposons E de dimension infinie et construisons par récurrence une suite (xn )n∈IN
Puisque E n’est pas de dimension finie, il n’est pas réduit à {0} et l’on peut y trouver un élément x0 non nul. Ainsi (x0 ) est libre. Supposons construite une famille libre (x0 , . . . , xk ) . Comme E n’est pas de dimension finie, (x0 , . . . , xk ) n’est pas une famille génératrice de E . Il existe donc un xk+1 ∈ E / Vect(x0 , . . . , xk ) . Par suite, (x0 , . . . , xk+1 ) est libre. tel que xk+1 ∈
La suite (xn )n∈IN ainsi construite est libre puisque, pour tout k ∈ IN , la famille (x0 , . . . , xk ) est libre. (ii) ⇒ (iii)
Immédiat.
(iii) ⇒ (i) Par la contraposée. Si E est de dimension finie, alors en notant n = dim E , toute famille d’éléments de E contenant strictement plus de n éléments est liée (cf. proposition 7 de la page 911).
Théorème 9
Les implications (i) ⇒ (ii) et (i) ⇒ (iii) sont immédiates.
(ii) ⇒ (i) Supposons (ii) . Comme B est une famille libre finie d’éléments de E , on peut, par le théorème de la base incomplète, la compléter en une base B′ de E . Comme dim E = n , on a card B′ = n . Ainsi, B et B′ ont même cardinal. Comme l’une est une sous-famille de l’autre, on a donc nécessairement B = B′ ; en particulier, B est une base de E .
(iii) ⇒ (i)
Supposons (iii) . Puisque B est une famille génératrice finie de E ,
Théorème 10 •
Toute famille libre de F est aussi une famille libre de E , donc admet au plus n éléments. Considérons-en une de cardinal maximal noté p n ; notons-la (x1 , . . . , xp ) .
•
Pour tout élément x de F , la famille (x1 , . . . , xp , x) possède p + 1 éléments ; elle n’est donc pas libre par définition de p . Par liberté de (x1 , . . . , xp ) , on a alors x ∈ Vect(x1 , , . . . , xp ) .
Par suite, la famille libre (x1 , . . . , xp ) est génératrice de F ; il s’agit donc d’une base de F . Cela prouve que F est de dimension finie et que dim F = p n . •
Prouvons maintenant que F = E si, et seulement si, p = n . ∗ ∗
Si E = F , alors ils ont même dimension, i.e. n = p . Réciproquement, supposons n = p . Une base (x1 , . . . , xn ) de F est alors une famille libre de E possédant n vecteurs. Il s’agit donc d’une base de E , puisque E est de dimension n . Par suite, les espaces vectoriels E et F admettent (x1 , . . . , xn ) comme base commune et sont donc égaux.
Proposition 11 Posons n = dim E et p = dim F . Soit (ei )1in une base de E et (fi )1ip une base de F . Montrons que la famille :
G = (e1 , 0), (e2 , 0), . . . , (en , 0), (0, f1 ), (0, f2 ), . . . , (0, fp )
est une base de E × F . Commençons par remarquer que si λ1 , . . . , λn , µ1 , . . . , µp sont des scalaires, alors par propriétés de calcul dans l’espace produit E × F , on a :
926
n i=1
λi e i ,
p i=1
µi fi
=
n i=1
λi (ei , 0) +
p i=1
µi (0, fi ).
(⋆)
Démonstrations •
Montrons que G engendre E×F . Si (x, y) ∈ E×F , alors les vecteurs x et y se décomposent dans les bases respectives (ei )1in et (fi )1ip sous la forme : n
x=
y=
et
λi e i
µi fi .
i=1
i=1
•
p
Alors, la relation (⋆) entraîne que (x, y) est combinaison linéaire des vecteurs de la famille G . D’où le caractère générateur de la famille G . Montrons que G est libre. Soit λ1 , . . . , λn , µ1 , . . . , µp des scalaires tels que : n
λi (ei , 0) +
i=1
Alors la relation (⋆) donne
p
n
λi ei = 0 et
p
µi fi = 0 , puis, par liberté des fa-
i=1
i=1
milles (ei )1in et (fi )1ip , on obtient : ∀i ∈ [[1, n]]
µi (0, fi ) = 0.
i=1
λi = 0
∀i ∈ [[1, p]]
et
µi = 0.
D’où la liberté de G . Par suite, G est une base de E × F . On en déduit que dim(E × F ) = card G = n + p .
Proposition 14 1. Les familles (e1 , . . . , ep ) et (ep+1 , . . . , en ) , sous-familles d’une base, sont toutes deux libres et sont donc des bases des sous-espaces vectoriels de E qu’elles engendrent. Montrons que F et G sont supplémentaires dans E . •
Montrons que F + G = E . Soit x ∈ E ; montrons que x ∈ F + G . Écrivons x dans la base (e1 , . . . , en ) sous la forme x =
n
λi ei . En posant y =
i=1
•
p
λi ei et z =
i=1
n
λi e i ,
i=p+1
on a alors x = y + z , avec y ∈ F et z ∈ G . D’où x ∈ F + G . Montrons que F ∩ G = {0} . Soit x ∈ F ∩ G . Notons (λ1 , . . . , λp ) ses composantes dans la base (e1 , . . . , ep ) de F , et (µp+1 , . . . , µn ) ses composantes dans la base (ep+1 , . . . , en ) de G . On a alors : x=
p i=1
λi e i ,
x=
n
µi ei
et donc
i=p+1
p
λi e i =
i=1
En posant λi = −µi pour tout i ∈ [[p + 1, n]] , on a alors
n
n
µi ei .
i=p+1
λi ei = 0.
i=1
Comme la famille (e1 , . . . , en ) est libre, on en déduit que tous les λi sont nuls et donc x = 0 . Ainsi, on a démontré E = F ⊕ G . 2. Montrons que B = (f1 . . . , fp , g1 , . . . , gq ) est une base de E . • Caractère générateur. Soit x ∈ E . Comme E = F ⊕ G , il existe y ∈ F et z ∈ G tels que x = y + z . Le vecteur y est combinaison linéaire des éléments de (f1 , . . . , fp ) , et z de ceux de (g1 , . . . , gq ) . Par suite, x est combinaison linéaire des éléments de B , qui est donc une famille génératrice de E . • Liberté. Soit (λ1 , . . . , λp ) ∈ IKp et (µ1 , . . . , µq ) ∈ IKq tels que : p i=1
λi fi +
q
µi gi = 0.
i=1
927
Chapitre 24. Dimension finie p
Posons y =
λi fi et z =
i=1
q
i=1
µi gi . On a alors y + z = 0 , avec y ∈ F et z ∈ G .
Puisque F et G sont en somme directe, on a donc y = 0 et z = 0 , c’est-à-dire : p
λi fi = 0
et
q
µi gi = 0.
i=1
i=1
Chacune des familles (f1 , . . . , fp ) et (g1 , . . . , gq ) étant libre, on en déduit que tous les scalaires sont nuls. Ainsi la famille B est libre. Par suite, B est une base de E . Proposition 17 Soit S un supplémentaire de F ∩ G dans G , montrons que F et S sont supplémentaires dans F + G . • Tout d’abord, F et S sont bien des sous-espaces vectoriels de F + G . • Montrons que F ∩ S = {0} . Soit x ∈ F ∩ S . Par définition de S , on a S ⊂ G , donc x , en plus d’être dans F et dans S , est aussi dans G . On a ainsi x ∈ (F ∩ G) ∩ S , donc x = 0 puisque F ∩ G et S sont en somme directe. •
Montrons que F + S = F + G . Soit x ∈ F + G . Écrivons x = f + g avec (f, g) ∈ F × G . Puisque (F ∩ G) ⊕ S = G , on peut écrire g = g1 + g2 avec g1 ∈ F ∩ G et g2 ∈ S . Alors on a : x = f + g1 + g2 d’où x ∈ F + S.
∈F
∈S
Cela prouve que F et S sont supplémentaires dans F + G . Il en résulte que : dim(F + G) = dim F + dim S. Or, S étant un supplémentaire de F ∩ G dans G , on a dim G = dim(F ∩ G) + dim S . En remplaçant dim S par dim G − dim(F ∩ G) dans la relation précédente, on peut conclure : dim(F + G) = dim F + dim G − dim(F ∩ G).
Théorème 19 • L’assertion (i) entraîne immédiatement (ii) et (iii) d’après ce que l’on a vu sur les dimensions de deux sous-espaces vectoriels supplémentaires. • (ii) ⇒ (i) . Supposons (ii) , i.e. F ∩ G = {0} et dim E = dim F + dim G ; alors on a : dim(F + G) = dim F + dim G − dim(F ∩ G) = dim E. Comme F + G est un sous-espace de E , on en déduit F + G = E et donc (i) . •
(iii) ⇒ (i) . Supposons (iii) , i.e. F + G = E et dim E = dim F + dim G ; alors on a : dim(F ∩ G) = dim F + dim G − dim(F + G) = 0 et donc F ∩ G = {0} , ce qui entraîne (i) .
Proposition 20 • S’il existe un isomorphisme u de E dans F et si (ei )1in est une base de E , alors d’après le corollaire 21 de la page 884, la famille u(ei ) 1in est une base de F , donc F •
est de dimension finie n . Supposons dim E = dim F = n . Soit (ei )1in une base de E et (fi )1in une base de F . Il existe une (unique) application linéaire u de E dans F telle que :
Comme u(ei )
1in
∀i ∈ [[1, n]]
est une base de F , d’après le corollaire 21 de la page 884, l’application
linéaire u est un isomorphisme de E dans F .
928
u(ei ) = fi .
Démonstrations Proposition 23
On a :
Im(v ◦ u) = v u(E) ⊂ v(F ) = Im v. •
Comme Im(v ◦ u) ⊂ Im v , l’application v ◦ u est de rang fini et rg(v ◦ u) rg v .
•
Comme Im(v ◦ u) = v (u(E)) = v(Im u) , on a : rg(v ◦ u) = dim v(Im u) dim Im u = rg u, l’inégalité précédente provenant du fait que si (f1 , . . . , fp ) est une base de Im u , alors la famille v(f1 ), . . . , v(fp ) est une famille génératrice de v(Im u) .
Proposition 24 Comme, pour tout x ∈ E , on a u(x) ∈ Im u , on peut considérer v : S −→ Im u x �−→ u(x). L’application v est évidemment linéaire puisque u l’est ; montrons qu’elle est bijective. •
Injectivité. Le noyau de v est :
Ker v = x ∈ S : u(x) = 0 = S ∩ Ker u. Comme S et Ker u sont en somme directe, on a S ∩ Ker u = {0} ; par suite, v est injective. •
Surjectivité. Soit y ∈ Im u . Alors il existe x ∈ E tel que y = u(x) . Puisque E = S ⊕ Ker u , il existe (s, h) ∈ S × Ker u tel que x = s + h . On a alors : y = u(x) = u(s) + u(h) = u(s).
=0
Puisque s ∈ S , il s’agit d’un antécédent de y par v , ce qui montre la surjectivité de v . Par suite, v est un isomorphisme de S sur Im u . Corollaire 28
Les implications (i) =⇒ (ii) et (i) =⇒ (iii) sont immédiates.
(ii) =⇒ (i) Supposons qu’il existe v ∈ L(E) tel que v ◦ u = IdE et montrons que u est inversible. Puisque u est un endomorphisme d’un IK -espace vectoriel de dimension finie, prouver son injectivité suffit. Soit x ∈ Ker u . Alors, par linéarité de v , on a (v ◦ u)(x) = 0 donc x = 0 puisque v ◦ u = IdE . D’où l’injectivité de u . (iii) =⇒ (i) Supposons qu’il existe v ∈ L(E) tel que u◦v = IdE , et montrons que u est inversible. Puisque u est un endomorphisme d’un IK -espace vectoriel de dimension finie, prouver sa surjectivité suffit. C’est le cas puisque, pour tout x ∈ E , on a x = (u ◦ v)(x) = u v(x) . Proposition 31 Par définition, H est un hyperplan de E si, et seulement si, H possède un supplémentaire de dimension 1 . Étant donné qu’en dimension finie, tout sous-espace vectoriel possède un supplémentaire et que la dimension d’une somme directe est la somme des dimensions, on en déduit que H est un hyperplan si, et seulement si, dim H = dim E − 1 .
929
Chapitre 24. Dimension finie Proposition 33
Soit ϕ et ψ les deux formes linéaires non nulles définies sur E par : ϕ(x) =
∀x ∈ E
n
et
ai xi
ψ(x) =
i=1
ce qui s’écrit encore : ϕ=
n
ai e∗i
n
bi x i ,
i=1
ψ=
et
i=1
n
bi e∗i .
i=1
On sait (cf. proposition 27 de la page 888) que les deux hyperplans d’équations respectives ϕ(x) = 0 et ψ(x) = 0 sont égaux si, et seulement si, les formes linéaires ϕ et ψ sont proportionnelles. On en déduit le résultat puisque (a1 , . . . , an ) et (b1 , . . . , bn ) sont les coordonnées respectives de ϕ et de ψ dans la base (e∗i )i∈[[1,n]] . Proposition 34 Pour tout i ∈ [[1, m]] , soit Considérons l’application u : E −→ x �−→
ϕi ∈ L(E, IK) tel que Hi = Ker ϕi . m IK ϕ1 (x), . . . , ϕm (x) .
Il est facile de vérifier que u est linéaire et que Ker u =
m
Hi .
i=1
Comme Im u ⊂ IKm , on a rg u m , et le théorème du rang nous donne : dim
m
i=1
Proposition 35
Hi
= dim(Ker u) = dim E − rg u dim E − m.
Soit (em+1 , . . . , en ) une base de F .
Complétons-la en une base (e1 , . . . , en ) de E . On peut alors construire la famille des formes linéaires coordonnées (e∗1 , . . . , e∗n ) . Pour x =
n
i=1
∀i ∈ [[1, m]] Par suite, on a F =
m
xi = 0
xi ei , on a alors x ∈ F si, et seulement si :
ce qui équivaut à
∀i ∈ [[1, m]]
Ker e∗i , où chaque e∗i est une forme linéaire non nulle.
i=1
Ainsi, F est l’intersection de la famille des hyperplans (Ker e∗i )i∈[[1,m]] .
930
e∗i (x) = 0.
Exercices
S’entraîner et approfondir Dimension finie, rang 24.1 Dans IR4 , considérons le sous-espace vectoriel :
→909
F = (x1 , x2 , x3 , x4 ) ∈ IR4 : x1 + x2 = x3 + x4 = 0 . Montrer qu’il s’agit d’un sous-espace vectoriel de IR4 et donner sa dimension. 24.2 On considère l’ensemble F : →909
F = f ∈ F(IR, IR) : ∃(A, ϕ) ∈ IR2
∀x ∈ IR
f (x) = A cos(x + ϕ) .
Montrer qu’il s’agit d’un sous-espace vectoriel de dimension finie de F(IR, IR) et donner sa dimension. 24.3 Soit E un IK -espace vectoriel de dimension n , et (V1 , . . . , Vn ) une famille de vecteurs de E . →911 Montrer que la famille F = (Vi − Vj )(i,j)∈[[1,n]]2 n’est pas génératrice de E . Indication. On pourra noter Ui = Vi − V1 , et montrer que chaque vecteur de la famille F est combinaison linéaire de U2 , . . . , Un . 24.4 Soit I un intervalle de IR d’intérieur non vide. Montrer que le IK -espace vecto→911 riel E = F(I, IR) est de dimension infinie. Indication. Utiliser des fonctions polynomiales.
24.5 Pour a ∈ IK , on considère la famille F = 1, (X − a), (X − a)2 , (X − a)3 , . . . , (X − a)n . →912
1. Montrer que F est une base de IKn [X] .
2. En déduire une nouvelle démonstration de la formule de Taylor polynomiale. 24.6 Soit (Pn )n∈IN une famille d’éléments de IK[X] vérifiant : ∀n ∈ IN →912
deg Pn = n .
Montrer que (Pn )n∈IN est une base de IK[X] .
24.7 Soit E un IK -espace vectoriel de dimension finie. Soit F un sous-espace vectoriel et H un →916 hyperplan de E . Montrer que : Dans quel cas a-t-on égalité ?
dim(F ∩ H) dim F − 1.
24.8 Soit E un IK -espace vectoriel de dimension finie n ∈ IN . Soit G une famille génératrice de E . Montrer que de la famille G on peut extraire une base de E . 24.9 Soit E un C -espace vectoriel de dimension finie. On munit E d’une structure de IR -espace vectoriel par restriction à IR de sa loi externe. 1. Montrer que l’on obtient ainsi un IR -espace vectoriel de dimension finie. 2. En désignant par dimC E et dimIR E leurs dimensions respectives, montrer que : dimIR E = 2 dimC E.
931
Chapitre 24. Dimension finie 24.10 Soit F1 et F2 deux familles finies d’un IK -espace vectoriel E de dimension finie. En notant F la famille obtenue en concaténant F1 et F2 , montrer que : max(rg F1 , rg F2 ) rg F rg F1 + rg F2 .
⋆ 24.11 1. Soit F et G deux sous-espaces vectoriels d’un IK -espace vectoriel E . On suppose que F et G sont de dimension finie et que dim F = dim G . Montrer que si F et G sont distincts, alors il existe x ∈ E \ (F ∪ G) .
2. Soit E un IK -espace vectoriel de dimension finie n , et F et G deux sous-espaces vectoriels de E . Montrer que F et G admettent un supplémentaire commun si, et seulement s’ilont même dimension. Indication. Le sens difficile pourra être fait par récurrence décroissante finie sur la dimension commune de F et G , en utilisant la première question.
Applications linéaires et dimension finie 24.12 Montrer qu’il n’existe pas d’application linéaire de IR5 vers IR3 dont le noyau est une droite →919 vectorielle. 24.13 Soit E un espace vectoriel de dimension finie ainsi que F et G deux sous-espaces vectoriels →919 de E . En considérant l’application : F ×G (x1 , x2 )
−→ �−→
F +G x1 + x2 ,
retrouver la formule de Grassmann. 24.14 Soit f un endomorphisme d’un espace vectoriel E de dimension finie paire n = 2p . Montrer :
→919
f2 = 0
et
rg f = p ⇐⇒ (Im f = Ker f ).
24.15 Soit E un IK -espace vectoriel de dimension finie, et u ∈ L(E) . Montrer →919 que rg(u2 ) = rg(u) si, et seulement si, Im u et Ker u sont supplémentaires dans E . 24.16 Soit E et F deux IK -espaces vectoriels, E étant de dimension finie. Soit K un sous-espace vectoriel de E , et V un sous-espace vectoriel de dimension finie de F . Montrer qu’il existe une application linéaire u ∈ L(E, F ) telle que Ker u = K et Im u = V si, et seulement si, dim K + dim V = dim E . ⋆ 24.17 Soit E un IK -espace vectoriel de dimension finie n , et u ∈ L(E) . 1. Montrer qu’il existe p ∈ [[0, n]] tel que Ker up+1 = Ker up .
Dans la suite, on considère un tel indice p . 2. Montrer que : ∀k p
Ker uk = Ker up
3. Montrer que E = Ker up ⊕ Im up .
932
et
Im uk = Im up .
Exercices 24.18 Soit E , F et G trois IK -espaces vectoriels de dimension finie, ainsi que u ∈ L(E, F ) et v ∈ L(F, G) . 1. En appliquant la formule du rang à la restriction de v à Im u , montrer que : rg u = rg(v ◦ u) + dim(Im u ∩ Ker v). 2. En déduire que rg(v ◦ u) rg v + rg u − dim F.
3. Montrer que dim Ker(v ◦ u) dim(Ker v) + dim(Ker u) . 24.19 Soit E un IK -espace vectoriel de dimension n , et f ∈ L(E) . Supposons f nilpotent d’indice n , c’est-à-dire vérifiant f n−1 �= 0 et f n = 0 .
1. Montrer qu’il existe a ∈ E tel que la famille a, f (a), . . . , f n−1 (a) soit une base de E .
2. Montrer que l’ensemble des endomorphismes de est Vect(IdE , f, . . . , f n−1 ) .
E
qui commutent avec
f
24.20 Soit E un IK -espace vectoriel de dimension finie n ainsi que u et v deux endomorphismes de E vérifiant u + v = IdE et rg(u) + rg(v) n . Montrer que u et v sont des projecteurs vérifiant u ◦ v = v ◦ u = 0 . 24.21 Soit E et F deux IK -espaces vectoriels de dimension finie, et G un sous-espace vectoriel de E . On définit l’ensemble H par : H = {u ∈ L(E, F ) : G ⊂ Ker u}.
Montrer que H est un sous-espace vectoriel de L(E, F ) et déterminer dim H .
Formes linéaires, hyperplans 24.22 Soit F un sous-espace vectoriel de E . Montrer que dim F < dim E , si, et seulement si, F →922 est inclus dans un hyperplan de E . ⋆ 24.23 Soit E un IK -espace vectoriel de dimension finie, et ϕ1 , . . . , ϕm des formes linéaires sur E . Montrer l’équivalence entre les deux assertions suivantes : (i) dim
m
i=1
Ker ϕi
= dim E − m
Indication. Considérer l’application u : E x
(ii) la famille (ϕ1 , . . . , ϕm ) est libre. −→ �−→
m IK ϕ1 (x), . . . , ϕm (x) .
933
Chapitre 24. Dimension finie
Solutions des exercices 24.1 Les éléments de F sont les vecteurs de la forme (x1 , −x1 , −x4 , x4 ) et donc : F = Vect(f1 , f2 )
avec
f1 = (1, −1, 0, 0)
et
4
f2 = (0, 0, −1, 1).
Ainsi, F est bien un sous-espace vectoriel de IR . De plus, la famille (f1 , f2 ) est libre, car ses deux vecteurs ne sont pas proportionnels. Ainsi (f1 , f2 ) est une base de F , et dim F = 2 . Le sous-espace vectoriel F est donc un plan vectoriel. 24.2 • Soit (A, ϕ) ∈ IR2 . La fonction x �→ A cos(x+ϕ) est combinaison linéaire des fonctions sin et cos puisque : ∀x ∈ IR
A cos(x + ϕ) = (A cos ϕ) cos x + (−A sin ϕ) sin x.
Ainsi, l’ensemble F est inclus dans Vect(cos, sin) . • Réciproquement, soit f ∈ Vect(cos, sin) . Il existe donc deux réels a et b tels que f = a cos +b sin . ∗ Si a = b = 0 , alors pour tout x ∈ IR , on a f (x) = 0 cos(x + 0) donc f ∈ F . ∗ Sinon, alors a ou b est non nul, et alors, pour x ∈ IR , on peut écrire : f (x) = en posant A =
a 2 + b2 √
a b cos x + √ sin x = A cos(x + θ) a 2 + b2 a 2 + b2
√ a2 + b2 et θ ∈ IR tel que cos θ, sin θ = √
a a2 +b2
, √ −b 2 a
+b2
.
On a donc f ∈ F . Par conséquent, on a F = Vect(cos, sin) . • Puisque les fonctions sin et cos ne sont pas proportionnelles, elles forment une famille libre. Par suite, la famille (cos, sin) est une base de F , qui est donc de dimension finie égale à 2 . L’ensemble F est donc un plan vectoriel. 24.3 Pour i ∈ [[1, n]] , notons Ui = Vi − V1 . Alors, pour tout (i, j) ∈ [[1, n]]2 , on a : Vi − Vj = (Vi − V1 ) − (Vj − V1 ) = Ui − Uj .
Par suite, on a Vect(F) ⊂ Vect(U1 , . . . , Un ) . En remarquant que U1 = 0 , on a alors : Vect(F) ⊂ Vect(U2 , . . . , Un ).
Par suite, on a rg F n − 1 , donc F n’est pas génératrice de E . 24.4 Pour prouver que E est de dimension infinie, construisons une suite (pk )k∈IN libre d’éléments de E . Pour tout k ∈ IN , posons pk : I −→ IR x �−→ xk . Montrons que, pour tout n ∈ IN∗ , la famille (pk )k∈[[0,n]] est libre.
Soit (λ0 , . . . , λn ) ∈ IRn+1 tel que
n
λk pk = 0 . On a alors :
k=0
∀x ∈ I Posons P =
n
n
λk xk = 0.
k=0
λk X k . Comme I est un ensemble infini, le polynôme P admet une infinité
k=0
de racines, et il est donc nul. Par suite, tous ses coefficients sont nuls, d’où la liberté de la famille (pk )k∈[[0,n]] .
934
Solutions des exercices 24.5 1. La famille F est libre car elle est échelonnée en degré. Comme c’est une famille de n + 1 polynômes de IKn [X] , et comme dim IKn [X] = n + 1 , c’est une base de IKn [X] . 2. Soit P ∈ IKn [X] . D’après la question précédente, il existe (ak )k∈[[0,n]] telle que : P =
n k=0
ak (X − a)k .
(⋆)
Pour j ∈ [[0, n]] , la dérivée j -ème du polynôme P est alors : P (j) =
n
ak
k=j
k! (X − a)k−j . (k − j)!
En évaluant en a , on a P (j) (a) = aj j! et donc aj =
P (j) (a) · j!
La relation (⋆) se réécrit donc : P =
n P (k) (a) k=0
k!
(X − a)k .
24.6 • La liberté de la famille est justifiée par le fait que chacune de ses sous-familles finies est une famille de polynômes échelonnée en degré, donc libre (cf. page 849). • Prouvons le caractère générateur. Soit Q ∈ IK[X] non nul. En notant d = deg Q , on a Q ∈ IKd [X] . Or, la famille (P0 , . . . , Pd ) est libre et constituée de d + 1 polynômes de IKd [X] : c’en est donc une base. On en déduit que Q ∈ Vect(P0 , . . . , Pd ) , et donc a fortiori Q ∈ Vect (Pn )n∈IN . D’où le caractère générateur.
24.7 • Si F ⊂ H , alors F ∩H = F , et dim(F ∩H) = dim F . L’inégalité dim(F ∩H) dim F −1 est alors vraie, et est stricte. • Supposons F �⊂ H . Notons n = dim E . La formule de Grassmann donne : dim(F ∩ H) = dim F + dim H − dim(F + H) = dim F + n − 1 − dim(F + H).
(⋆)
∗ Puisque F �⊂ H , on a F + H �⊂ H ; l’inclusion H ⊂ F + H est donc stricte. Puisque dim H = n − 1 , on en déduit dim(F + H) n . Or F + H est un sousespace vectoriel de E , et dim E = n ; on a donc dim(F + H) = n . La relation (⋆) donne alors dim(F ∩H) = dim F −1 . On est donc dans le cas d’égalité de l’inégalité étudiée. • Conclusion : on a dim(F ∩ H) dim F − 1 , avec égalité si, et seulement si, F n’est pas inclus dans H . 24.8 Remarque La différence entre les hypothèses de cet exercice et celles du théorème de la base extraite (cf. théorème 3 de la page 909) est qu’ici la famille génératrice G n’est pas supposée finie. Le cas n = 0 est trivial, puisqu’alors la famille vide, qui est évidemment une sous-famille de G , est une base de E . Supposons donc n ∈ IN∗ . • Notons Ω l’ensemble des sous-famille finies libres de G . L’ensemble Γ = {card F | F ∈ Ω} est une partie de IN , non vide (car 0 ∈ Γ ) et majoré (par n ) ; Γ admet donc un plus grand élément, que nous notons p .
935
Chapitre 24. Dimension finie • Montrons que F est génératrice de E . Puisque G est génératrice de E , il suffit de montrer que tout vecteur de G appartient à Vect(F) . Soit x ∈ G . En adjoignant x à la famille F , on obtient une sous-famille de G , de cardinal p + 1 . Par définition de p , cette famille est liée. Puisque F est libre, on a donc x ∈ Vect(F) . D’où le caractère générateur de F .
• Par définition de Ω , la famille F est une sous-famille libre de G ; le fait qu’elle soit de plus génératrice de E nous assure qu’il s’agit d’une base de E .
24.9 1. Posons n = dimC E et soit (e1 , . . . , en ) une base du C -espace vectoriel E . Soit x ∈ E . Il existe donc (z1 , . . . , zn ) ∈ Cn tel que : x=
n
zk ek .
k=1
Si, pour tout k ∈ [[1, n]] , on pose xk = Re zk et yk = Im zk , alors : x=
n
(xk + i yk ) ek =
k=1
n
x k ek +
k=1
n
yk (i ek ).
k=1
Par suite, (e1 , . . . , en , i e1 , . . . , i en ) ∈ E 2n est une famille génératrice finie du IR -espace vectoriel E qui est donc un IR -espace vectoriel de dimension finie. 2. Pour prouver que dimIR (E) = 2 dimC (E) = 2n , montrons que la famille : (e1 , . . . , en , i e1 , . . . , i en ) est une base du IR -espace vectoriel E . On sait déjà, d’après la question précédente, qu’elle est génératrice. Montrons qu’elle est libre. Soit (x1 , . . . , xn , y1 , . . . , yn ) ∈ IR2n tel que : 0=
n k=1
x k ek +
n
yk (i ek ) =
k=1
n
(xk + i yk ) ek .
k=1
Comme (e1 , . . . , en ) est une base du C -espace vectoriel E , on en déduit : ∀k ∈ [[1, n]]
x k + i yk = 0
et donc
ce qui prouve la liberté.
∀k ∈ [[1, n]]
xk = yk = 0,
24.10 Appelons respectivement F1 et F2 les sous-espaces vectoriels engendrés par F1 et F2 . On a ainsi :
rg F1 = dim F1
et
rg F2 = dim F2 .
• Puisque F1 est une sous-famille de F , il est clair que : Vect F1 ⊂ Vect F
et donc
rg F1 rg F.
De même, on a rg F2 rg F , d’où l’inégalité max(rg F1 , rg F2 ) rg F .
• On constate d’autre part que Vect F = F1 + F2 , donc :
rg F = dim(F1 + F2 ) dim F1 + dim F2 = rg F1 + rg F2 ,
où l’on a utilisé le corollaire 18 de la page 917.
936
Solutions des exercices 24.11 1. Supposons F et G distincts. Si l’un de ces deux sous-espaces était inclus dans l’autre, alors, comme ils ont même dimension, ils seraient égaux. Par suite, on a F �⊂ G et G �⊂ F . On peut donc considérer f ∈ F \ G et g ∈ G \ F . Si f + g appartenait à F , alors on aurait g = (f + g) − f ∈ F , ce qui est faux. Donc f + g ∈ / F , et de même f + g ∈ / G. Ainsi, on a f + g ∈ E \ (F ∪ G) . 2. • Un sens est évident : si F et G admettent un supplémentaire commun H , alors : dim F = dim E − dim H = dim G.
• Montrons l’autre sens par récurrence décroissante finie. L’espace vectoriel E étant fixé de dimension n , et pour F et G deux sous-espaces vectoriels de E , considérons la propriété : P (k) : « Si dim F = dim G = k , alors F et G ont un supplémentaire commun » et montrons, par récurrence décroissante finie, que P (k) est vraie pour tout k ∈ [[0, n]] . Initialisation. La propriété P (n) est trivialement vraie, car si dim F = dim G = n , alors F et G sont égaux à E , et admettent l’espace nul comme supplémentaire commun. Hérédité. Soit k ∈ [[1, n]] . Supposons P (k) et montrons P (k − 1) . Supposons que dim F = dim G = k−1 , et montrons que F et G admettent un supplémentaire commun. ∗ Si F = G , alors tout supplémentaire de F est aussi un supplémentaire de G (un tel supplémentaire existe car E est de dimension finie). ∗ Supposons F �= G . D’après la première question, on peut considérer un vecteur x ∈ E \ (F ∪ G) . La droite vectorielle Vect(x) est alors en somme directe avec F et avec G . Posons : F = F ⊕ Vect(x)
= G ⊕ Vect(x). G
et
sont alors de dimension k , donc, Les deux sous-espaces vectoriels F et G
. d’après l’hypothèse de récurrence, admettent un supplémentaire commun H En posant :
H = Vect(x) ⊕ H, on montre que H est un supplémentaire commun à F et G , ce qui prouve P (k) et achève la récurrence. 24.12 Soit u une application linéaire de IR5 vers IR3 . Le théorème du rang donne : dim(Ker u) + rg u = dim(IR5 ) = 5
dim(Ker u) = 5 − dim(Im u).
i.e. 3
Or, Im u étant un sous-espace vectoriel de IR , on a dim(Im u) 3 . Par suite, on a dim(Ker u) 5 − 3 = 2 . Donc Ker u n’est pas une droite vectorielle. 24.13 Considérons l’application f :
F ×G (x1 , x2 )
−→ �−→
F +G x1 + x2 .
• On vérifie facilement qu’elle est linéaire. • Par définition de F + G , son image est F + G .
• On vérifie facilement que son noyau est Ker f = (x, −x) | x ∈ F ∩ G .
• L’application x �→ (x, −x) permet de prouver que Ker f est isomorphe à F ∩ G . On a donc dim(F ∩ G) = dim(Ker f ) et la formule du rang nous donne alors : dim(F × G) = dim(F + G) + dim(F ∩ G).
Comme dim(F × G) = dim F + dim G , on en déduit le résultat.
937
Chapitre 24. Dimension finie 24.14 • Supposons f 2 = 0 et rg f = p . Comme f ◦ f = 0 , on a Im f ⊂ Ker f . De plus, d’après la formule du rang, on a : dim Im f = n − dim Ker f = 2p − dim Ker f.
Puisque dim Im f = p , on a dim Ker f = p . Ainsi dim Im f = dim Ker f ; on en déduit Im f = Ker f (car on a déjà Im f ⊂ Ker f ).
• Supposons Im f = Ker f. On a en particulier Im f ⊂ Ker f et donc f 2 = 0 . De plus, d’après la formule du rang, on a dim Im f + dim Ker f = n = 2p . Puisque Im f = Ker f , on a dim Im f = rg f = p . 24.15 • Supposons Im u et Ker u supplémentaires dans E .
∗ Prouvons que Ker u2 = Ker u . L’inclusion Ker u ⊂ Ker u2 étant immédiate par linéarité de u , il s’agit de prouver l’autre. Soit x ∈ Ker u2 . Montrons que Ker u = 0 . On a u2 (x) = 0 , c’est-à-dire u u(x) = 0 , ou encore u(x) ∈ Ker u . Comme u(x) ∈ Im u et que Im u et Ker u ont été supposés supplémentaires, donc en somme directe, on en déduit u(x) = 0 , c’est-à-dire x ∈ Ker u . ∗ On en déduit dim Ker u2 = dim Ker u , puis, par théorème du rang, rg u2 = rg u .
• Réciproquement, supposons rg u2 = rg u . Alors, par le théorème du rang, on obtient : dim Ker u2 = dim Ker u
et donc, puisque Ker u ⊂ Ker u2 , on a Ker u2 = Ker u . ∗ Montrons que Ker u ∩ Im u = {0} . Prenons y ∈ Ker u ∩ Im u et montrons que y = 0 . Soit x un antécédent de y par u . Alors on a u(x) ∈ Ker u , donc u2 (x) = 0 , c’est-àdire x ∈ Ker u2 , ou encore x ∈ Ker u . On en déduit que u(x) = 0 , i.e. y = 0 . ∗ Comme le théorème du rang assure que dim Ker u + dim Im u = dim E , le fait qu’ils soient en somme directe entraîne que Ker u et Im u sont supplémentaires dans E . 24.16 • Un sens est évident : s’il existe u ∈ L(E, F ) telle que Ker u = K et Im u = V , alors, par le théorème du rang, on a dim K + dim V = dim E . • Réciproquement, supposons que dim K + dim V = dim E , et construisons u ∈ L(E, F ) telle que Ker u = K et Im u = V . Soit S un supplémentaire de K dans E . On a alors dim K + dim S = dim E , donc dim S = dim V . Par suite, les espaces S et V sont isomorphes : soit ϕ ∈ L(S, V ) un isomorphisme. Considérons alors l’application linéaire u ∈ L(E, F ) , définie par ses restrictions à chacun des deux sous-espaces vectoriels supplémentaires K et S : ∀x ∈ K
u(x) = 0
et
∀x ∈ S
u(x) = ϕ(x).
∗ Par construction, on a immédiatement K ⊂ Ker u . On a de plus V ⊂ Im u car pour tout y ∈ V , la surjectivité de ϕ assure l’existence de x ∈ S tel que ϕ(x) = y , et donc u(x) = y . ∗ Disposant déjà d’inclusions entre espaces de dimension finie, un argument de dimension permet d’en déduire les égalités souhaitées. Le théorème du rang donne : ce qui donne
dim Ker u + dim Im u = dim E = dim K + dim V,
dim Ker u − dim K + dim Im u − dim V
0
0
On a donc dim Ker u = dim K et dim Im u = dim V. D’où le résultat.
938
= 0.
Solutions des exercices 24.17 1. Raisonnons par l’absurde en supposant que : ∀k ∈ [[0, n]] k
Ker uk+1 �= Ker uk .
Par linéarité de u , on sait que : ∀k ∈ IN Ker u ⊂ Ker uk+1 . L’hypothèse faite se traduit donc ainsi : ∀k ∈ [[0, n]] Ker uk Ker uk+1 ce qui implique : ∀k ∈ [[0, n]] dim Ker uk < dim Ker uk+1 , ou encore, puisque les quantités manipulées sont des entiers : ∀k ∈ [[0, n]]
dim Ker uk+1 − dim Ker uk 1.
En sommant pour k ∈ [[0, n]] , il vient : n k=0
dim Ker uk+1 − dim Ker uk
n
1 = n + 1.
k=0
Par télescopage, et comme dim Ker u0 = dim Ker IdE = 0 , il vient dim Ker un+1 n + 1 . On aboutit à une contradiction, puisque Ker un+1 , en tant que sous-espace vectoriel de E , est de dimension au plus n . 2. • À une récurrence près, prouver que ∀k p Ker uk = Ker up revient à prouver que ∀k p Ker uk = Ker uk+1 . Soit k p . ∗ L’inclusion Ker uk ⊂ Ker uk+1 est immédiate, par linéarité de u . ∗ Réciproquement, soit x ∈ Ker uk+1 . En écrivant la relation uk+1 (x) = 0 sous la forme up+1 uk−p (x) = 0 , on obtient uk−p (x) ∈ Ker up+1 . Or
Ker up+1 = Ker up par définition de p , donc on a uk−p (x) ∈ Ker up , ce qui offre finalement x ∈ Ker uk . • Pour k p , on a de plus Im uk = Im up car : ∗ l’inclusion Im uk ⊂ Im up est évidente ; ∗ l’égalité Ker uk = Ker up donne dim Ker uk = dim Ker up et donc, par le théorème du rang, dim Im uk = dim Im up . 3. Par le théorème du rang, on a dim Ker up + dim Im up = n . Pour prouver que Ker up et Im up sont supplémentaires dans E , il suffit de prouver qu’ils sont en somme directe, ce qui revient à montrer que Ker up ∩ Im up = {0} . Soit x ∈ Ker up ∩ Im up . Montrons que x = 0 . Comme x ∈ Im up , il existe z ∈ E tel que up (z) = x . Comme x ∈ Ker up , on a alors z ∈ Ker u2p . Or, d’après la question précédente, on a Ker u2p = Ker up . On en déduit z ∈ Ker up , et donc x = 0 . 24.18 1. Par linéarité de v , l’application w : Im u −→ G est aussi linéaire. y �−→ v(y) On a de plus : • Im w = v(Im u) = Im(v ◦ u) , donc rg w = rg(v ◦ u) ; • Ker w = {y ∈ Im u : v(y) = 0} = Im u ∩ Ker v . Le théorème du rang donne : dim Im u = rg w + dim(Ker w)
et donc
rg u = rg(v ◦ u) + dim(Im u ∩ Ker v).
2. Comme Im u ∩ Ker v ⊂ Ker v , on a dim(Im u ∩ Ker v) dim(Ker v) . En utilisant l’égalité de la première question, on en déduit : rg u rg(v ◦ u) + dim(Ker v).
D’après la formule du rang, on a dim(Ker v) = dim F − rg v . On en déduit : rg u rg(v ◦ u) + dim F − rg v.
939
Chapitre 24. Dimension finie 3. La formule du rang donne : dim(Ker u) = dim E − rg u et
dim(Ker v) = dim F − rg v
dim Ker(v ◦ u) = dim E − rg(v ◦ u).
En reportant dans l’inégalité obtenue à la question précédente, on obtient :
dim Ker(v ◦ u) dim(Ker v) + dim(Ker u).
24.19 1. Soit a ∈ E tel que f n−1 (a) �= 0 . Montrons que la famille a, f (a), . . . , f n−1 (a) est une base de E . Comme elle est de cardinal n , il suffit de montrer sa liberté. Considérons (λ0 , . . . , λn−1 ) ∈ IKn tel que : n−1
λi f i (a) = 0.
(∗)
i=0
Montrons que ∀i ∈ [[0, n − 1]] λi = 0 . Raisonnons par l’absurde en supposant que l’ensemble : i ∈ [[0, n − 1]] : λi �= 0
ne soit pas vide ; notons i0 son plus petit élément. La relation (⋆) s’écrit alors
n−1
λi f i (a) = 0, et en lui appliquant f n−i0 −1 , on obtient :
i=i0
λi0 f
n−1
n−1
(a) +
λi f i−i0 +n−1 (a) = 0.
(⋆⋆)
i=i0 +1
Or, pour tout i ∈ [[i0 + 1, n − 1]] , on a : i − i0 + n − 1 n,
f i−i0 +n−1 = 0
donc
f i−i0 +n−1 (a) = 0.
puis
Ainsi, la relation (⋆⋆) donne λi0 f n−1 (a) = 0 . Comme f n−1 (a) �= 0 , on en déduit λi0 = 0 , ce qui contredit la définition de i0 . Cela montre que les scalaires λ0 , . . . , λn−1 sont tous nuls. D’où la liberté de la famille. 2. • Il est clair que tout endomorphisme de la forme
n−1
αk f k commute avec f .
k=0
• Soit g ∈ L(E) commutant avec f . Étant donné que a, f (a), . . . , f n−1 (a) base de E et que g(a) ∈ E , on peut trouver (αk )0kn−1 ∈ IKn tel que : g(a) =
n−1
est une
αk f k (a).
k=0
Posons alors h =
n−1
αk f k . En utilisant le fait que f et g commutent, on a, pour
k=0
tout j ∈ [[0, n − 1]] :
n−1
g f j (a) = f j g(a) = f j et aussi :
h f j (a) =
k=0
n−1
αk f k (a)
k=0
αk f k f j (a) =
n−1
=
n−1
αk f k+j (a)
k=0
αk f k+j (a).
k=0
Par suite, les endomorphismes g et h coïncident sur une base ; ils sont donc égaux. On a donc bien g ∈ Vect(IdE , f, . . . , f n−1 ) .
940
Solutions des exercices 24.20 On a évidemment : Im(u + v) = {u(x) + v(x) | x ∈ E} ⊂ Im u + Im v ⊂ E. Comme u + v = IdE , on en déduit E = Im(u + v) = Im u + Im v . La formule de Grassmann et l’hypothèse rg(u) + rg(v) n nous donnent alors : Im u ∩ Im v = {0}
et donc
• Soit x ∈ Im u . On a alors :
E = Im u ⊕ Im v.
x + 0 = x = (u + v)(x) = u(x) + v(x).
Comme Im u et Im v sont en somme directe, on en déduit u(x) = x et v(x) = 0 . • De même, pour tout x ∈ Im v , on prouve v(x) = x et u(x) = 0 .
Soit p le projecteur sur Im u parallèlement à Im v . Comme u et p coïncident sur les sousespaces Im u et Im v , qui sont supplémentaires de E , on a u = p . Par suite, v = IdE −u est le projecteur associé, c’est-à-dire le projecteur sur Im v parallèlement à Im u . On a en particulier Ker u = Im v et Ker v = Im u , et donc u ◦ v = v ◦ u = 0 . 24.21 Notons n = dim E et p = dim G . Soit (e1 , . . . , ep ) une base de G . Complétons cette famille libre en une base (e1 , . . . , en ) de E . Considérons l’application Ψ : L(E, F ) u
p F u(e1 ), . . . , u(ep ) .
−→ �−→
• Puisque u est une application linéaire, cette application Ψ est également linéaire.
• On a Ker Ψ = H . En effet, une application linéaire u s’annule sur G si, et seulement si, Ψ(u) = (0, . . . , 0) puisque (e1 , . . . , ep ) est une base de G . • On a Im Ψ = F p . En effet, soit (x1 , . . . , xp ) ∈ F p . Il existe une (unique) application linéaire u de E vers F telle que : ∀i ∈ [[1, p]]
u(ei ) = xi
et
∀i ∈ [[p + 1, n]]
u(ei ) = 0.
Ainsi, Ψ(u) = (x1 , . . . , xp ) et donc (x1 , . . . , xp ) ∈ Im Ψ . Par suite, H est bien un sous-espace vectoriel de L(E, F ) , puisque c’est le noyau d’une application linéaire, et le théorème du rang donne : dim L(E, F ) = dim(Ker Ψ) + dim(Im Ψ) .
=dim E×dim F
=dim H
Ainsi, on a dim H = dim F × (dim E − dim G).
=dim(F p )= dim G × dim F
24.22 • Supposons qu’il existe un hyperplan H de E contenant F . On a alors : dim F dim H = dim E − 1 < dim E.
• Réciproquement, soit F un sous-espace vectoriel de E , de dimension p < n . Prenons (e1 , . . . , ep ) une base de F et complétons-la en une base (e1 , . . . , en ) de E . Le sous-espace vectoriel : H = Vect(e1 , . . . , en−1 ) est alors un hyperplan de E , et il contient F puisque p n − 1 .
941
Chapitre 24. Dimension finie 24.23 Remarquons que l’on a
m
i=1
Ker ϕi = Ker u , avec u : E x
(i) ⇒ (ii) Supposons que dim
m
Ker ϕi
i=1
m IK ϕ1 (x), . . . , ϕm (x) .
−→ �−→
= dim E − m . Le théorème du rang donne
alors rg u = m , donc u est surjective. Par conséquent, tous les vecteurs de la base canonique de IKm sont atteints par u ; pour i ∈ [[1, m]] , notons ei un antécédent par u du i -ème vecteur de la base canonique de IKm . Si (λ1 , . . . , λm ) ∈ IKm est tel que
m
j=1
λj ϕj = 0 , alors, pour i ∈ [[1, m]] , en évaluant la
relation en ei , il vient λi = 0 . D’où la liberté de la famille (ϕ1 , . . . , ϕm ) . (ii) ⇒ (i) Par la contraposée. Supposons (i) fausse, et montrons que (ϕ1 , . . . , ϕm ) est une famille liée. En conséquence de la proposition 34 de la page 924 on peut affirmer que : dim
m
Ker ϕi
i=1
dim E − m.
> dim E − m.
Le fait que (i) soit fausse se traduit donc par : dim
m
Ker ϕi
i=1
Le théorème du rang donne alors rg u < m , donc u n’est pas surjective. Ainsi, Im u est un sous-espace vectoriel strict de IKm ; il est donc inclus dans un hyperplan H (cf. exercice 24.22 de la page 933). Si
m
ai xi = 0 est une équation d’un tel hyperplan H dans
i=1
la base canonique de IKm , alors la propriété Im u ⊂ H s’écrit : ∀x ∈ E
m i=1
ai ϕi (x) = 0
autrement dit
m
ai ϕi = 0.
i=1
D’où le caractère lié de la famille (ϕ1 , . . . , ϕm ) (les scalaires ai n’étant pas tous nuls, par définition de l’équation d’un hyperplan).
942
Chapitre 25 : Représentation matricielle I
Matrices et applications linéaires . . . . . . . . . . Matrice d’un vecteur, d’une famille de vecteurs . . Matrice d’une application linéaire . . . . . . . . . . Application linéaire canoniquement associée . . . . Rang et opérations élémentaires . . . . . . . . . . Lien avec les systèmes linéaires . . . . . . . . . . . II Changements de bases, équivalence et similitude 1 Matrice de changement de base . . . . . . . . . . . 2 Changement de bases et applications linéaires . . . 3 Matrices équivalentes et rang . . . . . . . . . . . . 4 Matrices semblables et trace . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3 4 5
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . .
944 944 945 949 954 954 955 955 957 957 961 965 970
Représentation matricielle
25
Dans tout le chapitre, IK désigne IR ou C, et n et p des entiers naturels non nuls. Sauf mention plus précise, les espaces vectoriels considérés sont de dimension finie.
I
Matrices et applications linéaires
1
Matrice d’un vecteur, d’une famille de vecteurs
Dans cette partie, et sauf mention plus précise, E désigne un IK -espace vectoriel de dimension n ∈ IN∗ .
Définition 1
Soit B = (e1 , . . . , en ) une base de E . Si x ∈ E s’écrit x =
Exo 25.1
n �
xk ek , on appelle
k=1
matrice de x dans la base B , et l’on note MatB (x), la matrice colonne : x1 MatB (x) = ... ∈ Mn,1 (IK). xn
Remarque La matrice MatB (x) est donc la matrice colonne constituée des coordonnées de x dans la base B . Ex. 1. Plaçons-nous dans IR2 . Les vecteurs u1 = (1, 1) et u2 = (1, −1) étant non colinéaires,
la famille B = (u1 , u2 ) est libre, donc est une base de IR2 . Notons B0 = (e1 , e2 ) la base canonique de IR2 . Le vecteur x = (5, 1) s’écrivant x = 5e1 + e2 et x = 3u1 + 2u2 , on a : MatB0 (x) =
�
5 1
�
et
MatB (x) =
�
3 2
�
.
Remarque Comme on le voit sur l’exemple précédent, la matrice d’un vecteur dans une base n’est pas intrinsèque à ce vecteur, mais dépend de la base dans laquelle on se place.
I Matrices et applications linéaires Ex. 2. Plaçons-nous dans IKn muni de sa base canonique B0 = (e1 , . . . , en ) . Soit x ∈ IKn ; notons X la matrice de x dans la base B0 . Si l’on écrit x = (x1 , . . . , xn ) ∈ IKn , alors
x1 � .. on a x = xk ek , et donc on a simplement X = . . k=1 xn n
Convention Dans la pratique, on identifie Mn,1 (IK) et IKn (ce qui explique l’écriture en colonne d’un élément de IKn parfois utilisée). Cette identification sera en particulier utilisée lorsque l’on considèrera l’application linéaire canoniquement associée à une matrice (page 949). Définition 2 Soit B une base de E et F = (f1 , . . . , fp ) une famille de vecteurs de E . On appelle matrice de F dans la base B , et l’on note MatB (F ), la matrice de taille (n, p) dont, pour tout j ∈ [[1, p]], la j -ème colonne vaut MatB (fj ).
2
Matrice d’une application linéaire
Définition 3 Soit E et F deux IK -espaces vectoriels, de dimensions p et n respectivement. Soit BE = (e1 , . . . , ep ) une base de E , et BF une base de F . Étant donné u ∈ L(E, F ), on appelle matrice de u dans les bases BE et BF , et l’on � � note MatBE ,BF (u), la matrice de la famille u(e1 ), . . . , u(ep ) dans la base BF . Remarques Avec les notations de la définition précédente, la matrice MatBE ,BF (u) : • appartient à Mn,p (IK) ;
• nous permet de lire, colonne par colonne, les coordonnées, dans la base BF de l’espace d’arrivée, des images par u des vecteurs de la base BE de l’espace de départ. Si l’on note (ai,j )1in cette matrice, alors on a : n 1jp � ai,j fi . ∀j ∈ [[1, p]] u(ej ) = i=1
Ex. 3. Notons B2 et B3 = (e1 , e2 , e3 ) les bases canoniques de IK2 et IK3 respectivement. � � � � x1 x1 + x2 + x3 3 2 x Considérons l’application u ∈ L(IK , IK ) définie par u : . � → 2 x1 + 2x2 + 3x3 x3 Alors, on a u(e1 ) =
�
1 1
�
, u(e2 ) =
�
1 2
�
MatB3 ,B2 (u) =
et u(e3 ) =
�
�
1 3
1 1
1 2
1 3
�
�
, donc :
.
945
Chapitre 25. Représentation matricielle Ex. 4. Soit a ∈ IK . L’application linéaire : u : IK2 [X] P
3 IK P (a), P ′ (a), P ′′ (a)
−→ �−→
vérifie u(1) = (1, 0, 0) , u(X) = (a, 1, 0) et u(X 2 ) = (a2 , 2a, 2) . Par suite, la matrice de u dans 1 a a2 3 0 1 2a les bases canoniques de IK2 [X] et IK est . 0 0 2
Définition 4 (Matrice d’un endomorphisme dans une base)
Exo 25.2
Soit B une base de E . Étant donné u ∈ L(E), on appelle matrice de u dans la base B , et l’on note MatB (u), la matrice de u dans les bases B et B : MatB (u) = MatB,B (u).
Remarques • On a MatB (u) ∈ Mn (IK) (où n = dim E ).
• Considérer la matrice de u dans la base B signifie que l’on prend B comme base de E , vu à la fois comme espace de départ et comme espace d’arrivée de u . C’est ce que l’on fait presque toujours lorsque l’on écrit la matrice d’un endomorphisme. • Si l’on note B = (e1 , . . . , en ), alors MatB (u) est la matrice dans la base B de la fa mille de vecteurs u(e1 ), . . . , u(en ) . Autrement dit, la j -ème colonne de MatB (u) est constituée des coordonnées dans la base B du vecteur u(ej ).
Terminologie Pour signifier que A = MatB (u), on dit que A représente l’endomorphisme u dans la base B . On dit simplement que A représente u pour signifier qu’il existe une base B telle que A = MatB (u). Ex. 5. Pour toute base B de E , on a MatB (IdE ) = In (où n = dim E ).
Ex. 6. Notons B0 = (e1 , e2 ) la base canonique de IK2 . Soit u l’endomorphisme de IK2 défini par u :
x1 x2
�→
x1 + x2 x1 − x2
. On a u(e1 ) =
MatB0 (u) =
1 1
1 1
1 −1
et u(e2 ) =
1 −1
, donc :
.
Ex. 7. Plaçons-nous dans C vu comme un IR -espace vectoriel de dimension 2, muni de la est un endomorbase (1, i) . Pour (a, b) ∈ IR2 , la similitude directe u : C −→ C z �−→ (a + ib)z phisme de C . Puisque : u(1) = a + bi
et
u(i) = −b + ai,
la matrice de u dans la base (1, i) est Mat(1,i) (u) =
946
a b
−b a
.
I Matrices et applications linéaires Ex. 8. Notons B0 = (1, X, X 2 , X 3 ) la base canonique de IK3 [X] . L’endomorphisme D de IK3 [X] défini par D : P �→ P ′ vérifie : D(1) = 0,
D(X) = 1,
D(X 2 ) = 2X
donc on a :
0 0 MatB0 (D) = 0 0
1 0 0 0
0 2 0 0
et
D(X 3 ) = 3X 2 ,
0 0 . 3 0
Isomorphisme d’espaces vectoriels de L(E, F ) dans Mn,p (IK) Proposition 1 Soit E et F deux IK -espaces vectoriels de dimensions respectives p et n, et BE et BF des bases de E et F respectivement. Alors l’application : ϕ : L(E, F ) u
−→ Mn,p (IK) �−→ MatBE ,BF (u)
est un isomorphisme d’espaces vectoriels.
Démonstration page 965
Principe de démonstration.
On prouve la linéarité, puis la bijectivité.
Conséquences En reprenant les notations du résultat précédent, alors : • la surjectivité de ϕ exprime le fait que pour toute matrice A ∈ Mn,p (IK), il existe une application linéaire u ∈ L(E, F ) dont A est la matrice dans les bases BE et BF ; • l’injectivité de ϕ assure que si u ∈ L(E, F ) et v ∈ L(E, F ) ont la même matrice dans les bases BE et BF , alors u = v .
Corollaire 2 Si E et F sont deux IK-espaces vectoriels de dimension finie, alors l’espace vectoriel L(E, F ) est de dimension finie et l’on a : dim L(E, F ) = dim E × dim F.
Démonstration.
En notant p = dim E et n = dim F , les espaces L(E, F ) et Mn,p (IK) étant isomorphes, et l’un étant de dimension finie, l’autre l’est aussi et ils ont même dimension. De plus on sait que dim Mn,p (IK) = np = dim E × dim F .
Cas des endomorphismes Si B est une base de E , et en notant n = dim E , on dispose de l’isomorphisme suivant : ϕ : L(E) −→ Mn (IK) u �−→ MatB (u) et par conséquent dim L(E) = dim(E)2 . 947
Chapitre 25. Représentation matricielle Coordonnées de l’image d’un vecteur Proposition 3 Soit E et F deux IK-espaces vectoriels de dimension finie, munis respectivement de bases BE et BF , ainsi que u ∈ L(E, F ). Soit (x, y) ∈ E × F . Si l’on note A = MatBE ,BF (u), X = MatBE (x) et Y = MatBF (y), alors on a : Y = AX ⇐⇒ y = u(x).
Démonstration page 965
Composition, inversibilité Proposition 4 Soit E , F et G trois IK-espaces vectoriels de dimension finie, respectivement munis de bases BE , BF et BG . Pour u ∈ L(E, F ) et v ∈ L(F, G), on a : MatBE ,BG (v ◦ u) = MatBF ,BG (v) MatBE ,BF (u).
Démonstration page 966
On en déduit le cas particulier où u et v sont des endomorphismes : Corollaire 5 Soit B une base de E . Pour tout (u, v) ∈ L(E)2 , on a :
MatB (v ◦ u) = MatB (v) MatB (u).
Conséquence
Si B est une base de E , alors l’application : ϕ : L(E) u
−→ Mn (IK) �−→ MatB (u),
dont on sait déjà que c’est un isomorphisme d’espaces vectoriels, vérifie également : ∀(u, v) ∈ L(E)2
ϕ(v ◦ u) = ϕ(v)ϕ(u).
Comme de plus ϕ(IdE ) = MatB (IdE ) = In , ϕ est un isomorphisme d’anneaux. Proposition 6 Soit E et F deux IK-espaces vectoriels de même dimension n, munis respectivement de bases BE et BF . Une application linéaire u ∈ L(E, F ) est bijective si, et seulement si, la matrice MatBE ,BF (u) est inversible, et l’on a alors : −1 MatBE ,BF (u) = MatBF ,BE u−1 .
Démonstration page 966
Principe de démonstration.
• Si u est bijective, traduire matriciellement les relations u ◦ u−1 = IdF et u−1 ◦ u = IdE .
• Si la matrice MatBE ,BF (u) est inversible, considérer v ∈ L(F, E) telle que MatBF ,BE (v)
soit MatBE ,BF (u)
948
−1
.
I Matrices et applications linéaires
Exo 25.3
Corollaire 7 Soit B une base de E . Un endomorphisme u ∈ L(E) est bijectif si, et seulement si, la matrice MatB (u) est inversible, et alors : −1 = MatB u−1 . MatB (u)
Proposition 8 Soit B une base de E . Une famille (x1 , . . . , xn ) de n vecteurs de E est une base de E si, et seulement si, la matrice MatB (x1 , . . . , xn ) est inversible. Démonstration.
La matrice MatB (x1 , . . . , xn ) est la matrice dans la base B de l’endomorphisme u ∈ L(E) qui transforme la base B en (x1 , . . . , xn ) . La famille (x1 , . . . , xn ) est donc une base de E si, et seulement si, l’endomorphisme u est bijectif, ce qui, d’après le corollaire 7, équivaut à dire que la matrice MatB (u) , autrement dit MatB (x1 , . . . , xn ) , est inversible.
Ex. 9. On se place dans IKn , dont on note B0 = (e1 , . . . , en ) la base canonique. Justifions que n la famille F =
ej
j�=i
1in
est une base de IK . En notant J ∈ Mn (IK) la matrice dont
tous les coefficients valent 1 , la matrice de F dans la base B0 est : MatB0 (F) = J − In .
On montre alors que cette matrice est inversible (cf. exercice 19.12 de la page 733), ce qui prouve que F est une base.
3
Application linéaire canoniquement associée
On rappelle l’identification de Mn,1 (IK) à IKn . Ainsi, on pourra écrire le produit matriciel AX avec A ∈ Mn,p (IK) et X ∈ IKp . Définition 5 Soit A ∈ Mn,p (IK). On appelle application linéaire canoniquement associée à A l’application linéaire de IKp dans IKn dont A est la matrice dans leurs bases canoniques respectives.
Exo 25.4
Remarque Soit A ∈ Mn,p (IK). Si (E1 , . . . , Ep ) désigne la base canonique de IKp , alors, pour j ∈ [[1, p]], le produit matriciel AEj est la j -ème colonne de A. Par conséquent, l’application linéaire canoniquement associée à A n’est rien d’autre que l’application linéaire : IKp −→ IKn X �−→ AX.
949
Chapitre 25. Représentation matricielle Ex. 10. En considérant l’application linéaire canoniquement associée, calculons les puissances 0
1 0 0 0 1 0 . 0 0 1 0 0 0 0 Représentons de manière informelle la manière dont l’endomorphisme u canoniquement associé à J et ses itérés transforment la base canonique de IR4 , notée (e1 , e2 , e3 , e4 ) :
0 positives de J = 0
e1 e2 e3 e4
u �→ �→ � → � →
0 e1 e2 e3
u � → �→ � → � →
0 0 e1 e2
u � → �→ � → � →
0 0 0 0
0 0 0 0
0 0 0 e1
u � → �→ � → �→
0 0 0 0.
Cela se traduit matriciellement par :
0 0 2 J = 0 0
0 0 0 0
1 0 0 0
0 0 3 J = 0 0
0 1 0 0
1 0 0 0
∀n 4
puis
J n = 0.
Noyau, image et rang d’une matrice Définition 6 Soit A ∈ Mn,p (IK) ; notons u l’application linéaire canoniquement associée à A.
• Le noyau de A est le noyau de u (c’est donc un sous-espace vectoriel de IKp ). • L’image de A est l’image de u (c’est donc un sous-espace vectoriel de IKn ). • Le rang de A est le rang de u .
Notations On note respectivement Ker A, Im A et rg A le noyau, l’image et le rang de A. Remarque Un vecteur X ∈ IRp appartient à Ker A si, et seulement si, AX = 0 . Les lignes de A fournissent donc un système d’équations de son noyau. Point méthode Déterminer le noyau de A revient à résoudre le système linéaire homogène AX = 0 .
Ex. 11. Considérons A =
�
1 −1 3
4 4 −4
3 2 −1
�
X ∈ Ker A ⇐⇒ AX = 0 ⇐⇒
∈ M3 (IR) . Pour X =
�
x + 4y + 3z −x + 4y + 2z 3x − 4y − z
= = =
�
x y z
�
0 0 0.
La résolution du système linéaire homogène obtenu donne alors Ker A = Vect
950
∈ IR3 , on a :
�
4 5 −8
�
.
I Matrices et applications linéaires Ex. 12. Pour toutes matrices A ∈ Mn,p (IK) et B ∈ Mp,q (IK) , on a : rg(AB) min(rg A, rg B). En effet, en notant f et g les applications linéaires canoniquement associées à A et B respectivement, on a rg A = rg f , rg B = rg g et rg(A B) = rg(f ◦ g) . Cela fournit bien la relation rg(AB) min(rg A, rg B) souhaitée, car (cf. proposition 23 de la page 919) : rg(f ◦ g) min(rg f, rg g).
Proposition 9 Soit A ∈ Mn,p (IK). L’image de A est le sous-espace vectoriel de IKn engendré par ses colonnes. Démonstration. Notons u l’endomorphisme canoniquement associé à A . Alors on a, en notant (e1 , . . . , ep ) la base canonique de IKp :
Im A = Im u = Vect u(e1 ), . . . , u(ep ) . Cela donne le résultat, car u(e1 ), . . . , u(ep ) ne sont rien d’autre que les colonnes de A .
Conséquence
Le rang de A est le rang de la famille de ses colonnes.
Ex. 13. Retrouvons ici le fait que l’inverse d’une matrice triangulaire inversible est encore triangulaire (cf. proposition 27 de la page 725). Quitte à transposer, donnons-nous A ∈ Mn (IK) une matrice triangulaire supérieure inversible. Notons u ∈ L(IKn ) canoniquement associé à A , B0 = (e1 , . . . , en ) la base canonique de IKn et, pour tout k ∈ [[1, n]] , posons : Ek = Vect(e1 , . . . , ek ). Le caractère triangulaire supérieur de A s’interprète par la stabilité par u de chaque sousespace Ek (cf. exercice 25.2 de la page 970). Pour prouver que A−1 est encore triangulaire supérieure, prouvons que u−1 (qui est canoniquement associé à A−1 ) laisse stable chaque sousespace Ek . Fixons k ∈ [[1, n]] . Soit x ∈ Ek . Par stabilité de Ek par u , on a :
u(ei ) ∈ Ek .
∀i ∈ [[1, k]]
Par injectivité de u , la famille u(e1 ), . . . , u(ek ) est libre ; comme son cardinal vaut la dimension de Ek , c’en est une base. Par suite, x peut s’écrire comme combinaison linéaire des vecteurs u(e1 ), . . . , u(ek ) : x=
k
λi u(ei ).
i=1
k
Par linéarité de u , cela donne x = u
λi ei . Cette dernière relation nous explicite l’antécé-
i=1
dent de x par u , ou encore son image par u−1 , et offre le résultat souhaité : u−1 (x) =
k i=1
λi e i ∈ E k .
951
Chapitre 25. Représentation matricielle Exo 25.5 Exo 25.6
Proposition 10 Pour tout A ∈ Mn,p (IK), on a :
dim(Ker A) + rg(A) = p.
Démonstration. Il suffit d’appliquer le théorème du rang à l’application linéaire u : IKp → IKn
canoniquement associée à A .
Proposition 11 Soit E et F deux IK -espaces vectoriels de dimension finie, munis respectivement de bases BE et BF . Si u ∈ L(E, F ), et si A = MatBE ,BF (u), alors rg(A) = rg(u). Principe de démonstration.
Démonstration page 966 Montrer que dim(Ker A) = dim(Ker u) , puis appliquer le
théorème du rang.
Condition d’inversibilité d’une matrice Proposition 12 Une matrice carrée A ∈ Mn (IK) est inversible si, et seulement si, rg(A) = n. Démonstration. Si u ∈ L(IKn ) désigne l’endomorphisme canoniquement associé à A , on sait
que u est bijectif si, et seulement si, rg(u) = n . Cela donne le résultat puisque rg(A) = rg(u) par définition, et car A est inversible si, et seulement si, u est bijectif.
Conséquence Une matrice A ∈ Mn (IK) est inversible si, et seulement si, la famille de ses colonnes est génératrice de IKn , ce qui équivaut à sa liberté puisqu’il s’agit d’une famille à n éléments d’un espace de dimension n. Le résultat suivant donne une autre condition nécessaire et suffisante pour qu’une matrice carrée soit inversible, et offre ainsi une méthode utile et efficace pour étudier l’inversibilité d’une matrice, qui vient compléter ce qui a déjà été présenté dans le chapitre « Calcul matriciel et systèmes linéaires » (page 721 et suivantes). Proposition 13 Une matrice carrée A ∈ Mn (IK) est inversible si, et seulement si : ∀X ∈ IKn
AX = 0 =⇒ X = 0.
Démonstration. Soit A ∈ Mn (IK) . En notant u ∈ L(IKn ) l’endomorphisme canoniquement associé, la propriété :
∀X ∈ IKn AX = 0 =⇒ X = 0. traduit l’injectivité de u , et donc sa bijectivité puisqu’il s’agit d’un endomorphisme en dimension finie. Cela donne le résultat, puisque la bijectivité de u équivaut à l’inversibilité de A .
Reformulation Une matrice A ∈ Mn (IK) est inversible si, et seulement si, Ker A ⊂ {0} (ce qui revient à Ker A = {0} , puisque l’inclusion ⊃ est vraie par linéarité. Remarques Soit A ∈ Mn (IK). • L’équation AX = 0 est l’écriture matricielle du système linéaire homogène dont la matrice associée est A. Ainsi, la matrice A est inversible si, et seulement si, le système linéaire AX = 0 admet comme unique solution la solution nulle. 952
I Matrices et applications linéaires
x1 n � xk Ck . • En notant C1 , . . . , Cn les colonnes de A et X = ... , on a AX = k=1 xn Par conséquent, la propriété : ∀X ∈ Mn,1 (IK) AX = 0 =⇒ X = 0
équivaut à la liberté de la famille des colonnes de A, ce qui rejoint ce qui a déjà été dit en conséquence de la proposition 12. Point méthode Soit A ∈ Mn (IK).
• La matrice A est inversible si, et seulement si, ses vecteurs colonnes forment une base de IKn ; comme il y en a n, cela équivaut à dire qu’ils forment une famille libre. • Comme A est inversible si, et seulement si, sa transposée l’est (cf. proposition 19 de la page 720), on en déduit que A est inversible si, et seulement si, ses vecteurs lignes forment une famille libre.
Ex. 14. Prouvons que la matrice A =
�
2 1 1
1 2 1
1 1 2
�
est inversible, en montrant que le système
linéaire AX = 0 admet comme unique solution la solution nulle. Prenons (x, y, z) ∈ IR3 une � 2x + y + z = 0 solution du système linéaire (S) : x + 2y + z = 0 et montrons que (x, y, z) = (0, 0, 0) . x + y + 2z = 0 En faisant la somme des trois équations, puis en divisant par 4, on obtient x + y + z = 0 . En retranchant alors cette nouvelle équation aux trois équations initiales du système, on obtient immédiatement x = y = z = 0 . Ex. 15. Retrouvons ici le critère d’inversibilité d’une matrice triangulaire (cf. proposition 26 de
la page 725). Quitte à transposer, donnons-nous A =
(⋆)
λ1 .. (0)
. λn
∈ Tn+ (IK) .
• Le système (S) : AX = 0 est un système triangulaire homogène. Si les λi sont tous non nuls, alors on voit, en résolvant (S) du bas vers le haut, qu’il admet comme unique solution la solution nulle. Dans ce cas, A est inversible d’après la proposition 13. • S’il existe i0 ∈ [[1, n]] tel que λi0 = 0 , alors la famille des i0 premières colonnes de A est liée, car il s’agit d’une famille de i0 vecteurs de IKn appartenant au sous-espace de dimension i0 − 1 engendré par les i0 − 1 premiers vecteurs de la base canonique. Dans ce cas, A n’est pas inversible.
953
Chapitre 25. Représentation matricielle Proposition 14 Si (A, B) ∈ Mn (IK)2 vérifient AB = In , alors A et B sont inversibles et inverses l’une de l’autre.
Démonstration page 966
Principe de démonstration. En notant u et v les endomorphismes canoniquement associés
à A et B respectivement, commencer par montrer, au choix, que u est surjectif ou que v est injectif.
4
Rang et opérations élémentaires
Proposition 15 Multiplier une matrice à droite par une matrice inversible conserve son image, et donc son rang. Démonstration page 967
Conséquence Effectuer une opération élémentaire sur les colonnes d’une matrice conserve son image, et donc son rang, puisque cela revient à la multiplier à droite par la matrice d’opération élémentaire associée. Proposition 16 Multiplier une matrice à gauche par une matrice inversible conserve son noyau, et donc son rang. Démonstration page 967
Conséquence Effectuer une opération élémentaire sur les lignes d’une matrice conserve son noyau, et donc son rang, puisque cela revient à la multiplier à gauche par la matrice d’opération élémentaire associée. Corollaire 17 Les opérations élémentaires conservent le rang.
5
Lien avec les systèmes linéaires
Soit (S) un système linéaire d’écriture matricielle : (S) : AX = B
avec
A ∈ Mn,p (IK)
et B ∈ IKn .
• On appelle rang de (S) le rang de sa matrice associée A ; on le note rg S .
• Le système homogène (S0 ) : AX = 0 a pour ensemble solution S0 = Ker(A) ; c’est donc un sous-espace vectoriel de IKp , de dimension p − rg A, i.e. p − rg S . • L’ensemble AX | X ∈ IKp n’est rien d’autre que Im(A) ; ainsi, le système (S) est compatible si, et seulement si, B ∈ Im A. • Si X1 est une solution de (S), alors l’ensemble S des solutions de (S) est : S = X 1 + S0 ;
autrement dit, S est le sous-espace affine passant par X1 et dirigé par S0 . • Dans le cas où n = p, la matrice A est carrée ; si elle est inversible, alors le système (S) possède une unique solution, donnée par A−1 B ; dans ce cas, on dit que le système linéaire (S) est un système de Cramer. 954
II Changements de bases, équivalence et similitude
1 2 3 3 2 5 ∈ M3 (IR) . Les deux premières colonnes étant non proEx. 16. Soit A = −1 2 1 portionnelles, mais la troisième étant somme des deux premières, on a rg A = 2 . Déterminons une équation de l’hyperplan Im A . Pour Y ∈ IR3 , on a Y ∈ Im A si, et seulement si, le x1 y1 et Y = x2 y2 , on a : système (S) : AX = Y est compatible. En notant X = x3 y3
(S) ⇐⇒
x1 + 2x2 + 3x3 3x1 + 2x2 + 5x3 −x1 + 2x2 + x3
= = =
y1 y2 y3 .
Les opérations élémentaires L2 ← L2 − 3L1 et L3 ← L3 + L1 dans un premier temps, puis L3 ← L3 + L2 dans un second temps, donnent : (S) ⇐⇒
x1 + 2x2 + 3x3 −4x2 − 4x3 4x2 + 4x3
= = =
y1 −3y1 + y2 y1 + y3
⇐⇒
x1 + 2x2 + 3x3 −4x2 − 4x3 0
= = =
y1 −3y1 + y2 −2y1 + y2 + y3 .
Le système est compatible si, et seulement si, −2y1 + y2 + y3 = 0 . Autrement dit, pour y1 y2 ∈ IR3 , on a Y ∈ Im A ⇐⇒ −2y1 + y2 + y3 = 0. tout Y = y3 Une équation de Im A est donc −2y1 + y2 + y3 = 0.
II 1
Changements de bases, équivalence et similitude Matrice de changement de base
Soit E un IK -espace vectoriel de dimension n. Définition 7 Soit B et B ′ deux bases de E . On appelle matrice de passage de B à B ′ la matrice de la famille B ′ dans la base B . Notation
Dans la suite, la matrice de passage de B à B ′ sera notée PB→B ′ .
Remarques • Une matrice de passage est toujours une matrice carrée. • On a, par définition, PB→B′ = MatB (B ′ ). Ainsi :
∗ la matrice de passage de B à B ′ s’obtient en écrivant, colonne par colonne, les coordonnées, dans la base B , des vecteurs de la base B ′ ; ∗ on a aussi PB→B′ = MatB IdE (B ′ ) = MatB′ ,B (IdE ).
955
Chapitre 25. Représentation matricielle Ex. 17. Dans IR , notons B0 = (e1 , e2 ) la base canonique et B = (u1 , u2 ) avec u1 = 2
et u2 =
1 −1
3 2
. Les vecteurs u1 et u2 n’étant pas colinéaires, B est bien une base de IR2 .
• La matrice de passage PB0 →B s’écrit immédiatement : PB0 →B =
3 2
1 −1
.
• Pour déterminer la matrice de passage PB→B0 , décomposons e1 et e2 dans la base B : e1 = Par suite, on a PB→B0 =
1 (u1 + 2u2 ) 5
1 5
1 2
1 −3
et
e2 =
1 (u1 − 3u2 ). 5
.
Remarque Dans IKn , les vecteurs sont le plus souvent donnés par leur écriture dans la base canonique B0 ; comme on le voit sur l’exemple précédent, l’écriture d’une matrice de passage du type PB0 →B se fait alors sans aucun calcul. Cette remarque vaut aussi pour IKn [X] et Mn,p (IK).
Cette matrice permet d’écrire les formules de changement de base. Proposition 18 Soit B et B ′ deux bases de E et x ∈ E . Si l’on note X = MatB (x), X ′ = MatB′ (x) et P = PB→B′ , alors on a X = P X ′ .
Démonstration page 967 Partir de l’expression de x dans la base B′ , puis exprimer chaque vecteur de B′ dans la base B .
Principe de démonstration.
Attention En conservant les notations précédentes, on retiendra que la matrice de passage PB→B′ : • donne les coordonnées des vecteurs de B ′ dans la base B ;
• mais, étant donné un vecteur x, permet d’obtenir ses coordonnées dans B à partir de ses coordonnées dans B ′ , et non l’inverse.
Proposition 19 Soit B et B ′ deux bases de E . La matrice de passage PB→B′ est inversible et : −1 = PB′ →B . PB→B′
Démonstration page 967
Remarques Soit A ∈ GLn (IK) et B est une base de E . • Il existe une base B ′ de E telle que A = PB→B′ . En effet, si l’on considère B ′ la famille dont la matrice dans la base B est A (i.e. la famille dont le j -ème vecteur a pour coordonnées dans B la j -ème colonne de A), alors B ′ est une base de E car A est inversible, et l’on a A = PB→B′ .
• Il existe une base B ′ de E telle que A = PB′ →B . En effet, selon le premier point, on peut considérer B ′ une base de E telle que A−1 = PB→B′ . D’après la proposition 19, on a alors A = PB′ →B .
956
II Changements de bases, équivalence et similitude
2
Changement de bases et applications linéaires
Cas général Proposition 20 Soit E et F deux IK-espaces vectoriels de dimension finie ainsi que u ∈ L(E, F ). ′ deux bases de E , ainsi que BF et BF′ deux bases de F . Soit BE et BE Si l’on note :
A = MatBE ,BF (u),
A′ = MatBE′ ,BF′ (u),
P = PBE →BE′
et
Q = PBF →BF′ ,
alors on a : A′ = Q−1 AP. Démonstration.
Soit x ∈ E . Notons :
X = MatBE (x),
X ′ = MatB′ (x), E
�
Y = MatBF u(x)
�
et
�
�
Y ′ = MatB′ u(x) . F
• Par définition de la matrice A , on a Y = AX . D’autre part, par définition des matrices P et Q , on a : X = P X′ et Y = QY ′ . La relation Y = AX s’écrit donc QY ′ = AP X ′ , ou encore Y ′ = Q−1 AP X ′ . • D’autre part, par définition de la matrice A′ , on a Y ′ = A′ X ′ . On obtient donc : A′ X ′ = Q−1 AP X ′ .
Le vecteur x ayant été pris quelconque dans E , cette relation est vraie pour toute matrice X ′ ∈ Mp,1 (IK) (en notant p = dim E ). On en déduit l’égalité des applications linéaires canoniquement associées aux matrices A′ et Q−1 AP , donc des matrices elles-mêmes : A′ = Q−1 AP.
Cas des endomorphismes Le résultat suivant est un cas particulier de la proposition 20. Corollaire 21 Soit E un IK -espace vectoriel de dimension finie et u ∈ L(E). Soit B et B ′ deux bases de E . Si l’on note : A = MatB (u),
A′ = MatB′ (u)
et
P = PB→B′ ,
alors on a : A′ = P −1 AP.
3
Matrices équivalentes et rang
Équivalence à Jr pour une matrice de rang r Soit r ∈ [[0, min(n, p)]]. (n,p)
On note Jr la matrice de Mn,p (IK) dont les r premières colonnes sont les r premiers vecteurs de la base canonique de IKn et les p − r dernières sont nulles ; il est immédiat que le rang (n,p)
de la matrice Jr
vaut r .
Jr(n,p)
1 0
=
0
0 r
0 1 0
0 0
0
0
0 0
0 p−r
r
n−r
957
Chapitre 25. Représentation matricielle
(··)
Ex. 18. Quelques exemples concrets de matrices J2 (2,3) J2
=
1 0
0 1
0 0
;
(3,3) J2
=
1 0 0
0 1 0
0 0 0
(n,p)
Ex. 19. Pour tout (n, p) ∈ (IN∗ )2 , la matrice J0 ∗
Ex. 20. Pour tout n ∈ IN , on a
Notation
(n,n) Jn
:
(3,4) J2
et
=
1 0 0
0 1 0
0 0 0
0 0 0
.
est la matrice nulle.
= In .
En général, il n’y a pas d’ambiguïté sur la taille des matrices manipulées. (n,p)
On s’autorise alors à noter simplement Jr au lieu de Jr
.
Proposition 22 Soit E et F deux IK -espaces vectoriels de dimensions respectives p et n, ainsi que u ∈ L(E, F ). Si r = rg(u), alors il existe deux bases BE et BF , de E et F respectivement, telles que : MatBE ,BF (u) = Jr .
Démonstration page 967 On suppose rg u = r et l’on construit une base BE de E et BF une base de F telles que MatBE ,BF (u) = Jr . La base BE sera construite en complétant une base de Ker u en une base de E .
Principe de démonstration.
Définition 8 Soit (A, B) ∈ Mn,p (IK)2 . On dit que les matrices A et B sont équivalentes s’il existe (P, Q) ∈ GLn (IK) × GLp (IK) tel que B = P AQ . Remarque La relation « être équivalente à » est une relation d’équivalence sur l’ensemble Mn,p (IK) : réflexivité : toute matrice A est équivalente à elle-même, puisque A = In AIp ; symétrie : si B = P AQ , alors A = P −1 BQ−1 ; transitivité : si B = P1 AQ1 et C = P2 BQ2 , alors C = P2 P1 A Q1 Q2 . ∈GLn (IK)
∈GLp (IK)
Proposition 23 Une matrice est de rang r si, et seulement si, elle est équivalente à la matrice Jr . Démonstration page 968
Corollaire 24 Deux matrices de même taille sont équivalentes si, et seulement si, elles ont même rang. Démonstration.
Soit (A, B) ∈ Mn,p (IK)2 .
• Si rg(A) = rg(B) = r , alors A et B sont équivalentes à Jr . Par transitivité de la relation « être équivalente à » (cf. remarque de la présente page), A et B sont alors équivalentes.
958
II Changements de bases, équivalence et similitude • Réciproquement, si A et B sont équivalentes, il existe (P, Q) ∈ GLn (IK) × GLp (IK) tel que B = P AQ . Alors rg(A) = rg(B) par invariance du rang par multiplication par une matrice inversible (cf. propositions 15 et 16 de la page 954 page 954).
Corollaire 25 Une matrice et sa transposée ont même rang. Démonstration page 968
Conséquence Puisque les vecteurs colonnes de AT sont les transposés des vecteurs lignes de A, l’invariance du rang par transposition nous dit que le rang de A, dont on sait déjà qu’il vaut le rang de la famille de ses colonnes, est aussi égal au rang de la famille de ses lignes. Remarque Pour récapituler, le rang d’une matrice A ∈ Mn,p (IK) est égal : • au rang de la famille de ses colonnes ; • au rang de la famille de ses lignes ;
• au rang de toute application linéaire représentée par A ;
• au rang de toute famille de vecteurs dont A est la matrice dans une base. Rang et sous-matrices Proposition 26 est une sous-matrice de A, alors rg(A) rg(A). Soit A ∈ Mn,p (IK). Si A
Démonstration page 968
Proposition 27 Soit A ∈ Mn,p (IK). Le rang de A est la taille maximale des sous-matrices carrées inversibles que l’on peut extraire de A. Démonstration page 968
Principe de démonstration.
En notant r = rg(A) ,
• on prouve qu’il existe une sous-matrice de A , carrée inversible et de taille r ;
• parmi les sous-matrices carrées de A de taille strictement supérieure à r , aucune n’est inversible.
Méthodes pratiques de calcul de rang Rappelons qu’appliquer une opération élémentaire sur les lignes ou les colonnes d’une matrice ne modifie pas son rang (cf. corollaire 17 de la page 954). Point méthode Pour calculer le rang d’une matrice, on peut chercher à la transformer, par opérations élémentaires, en une matrice dont le rang est plus simple à déterminer. 959
Chapitre 25. Représentation matricielle Ex.
21.
Illustrons le point méthode précédent : déterminons le rang 1 2 −1 3 0 4 2 1 de A = en la transformant en une matrice dont le rang est plus 4 5 −2 10 3 0 1 5 simple à calculer. Les opérations élémentaires : L2 ← L2 − 2L1 ,
L3 ← L3 − 4L1
et
L4 ← L4 − 3L1
transforment A en la matrice suivante (qui a même rang que A ) :
1 0 0 0
2 −3 −3 −6
−1 2 2 4
3 −2 . −2 −4
Les opérations élémentaires L3 ← L3 − L2 et L4 ← L4 − 2L2 donnent alors la matrice :
1 0 0 0
2 −3 0 0
−1 2 0 0
3 −2 . 0 0
Cette matrice étant de rang 2 (les deux premières lignes ne sont pas proportionnelles, et les deux dernières sont nulles), on a donc rg A = 2 .
Lorsque l’on veut calculer le rang d’une matrice, la proposition suivante peut se révéler utile. Proposition 28 Soit A = (ai,j )1in ∈ Mn,p (IK) vérifiant : 1jp
a1,1 �= 0
Alors on a :
et ∀i ∈ [[2, n]] ai,1 = 0. � rg(A) = 1 + rg(A)
A=
� est la sous-matrice A˜ = (ai,j )2in . où A
a1,1 0 .. . 0
(⋆) � A
2jp
Démonstration. Notons (L1 , . . . , Ln ) la famille des lignes de A . Le fait que a1,1 �= 0 assure que L1 ∈ / Vect(L2 , . . . , Ln ) . On a donc : rg(L1 , . . . , Ln ) = 1 + dim Vect(L2 , . . . , Ln )
c’est-à-dire
rg A = 1 + rg(L2 , . . . , Ln ).
Or, la matrice de taille (n − 1, p) dont les lignes sont L2 , . . . , Ln est aussi la matrice dont la
� . On a donc rg(L2 , . . . , Ln ) = rg A � , puis : première colonne est nulle, et les autres celles de A 960
� rg A = 1 + rg A.
II Changements de bases, équivalence et similitude
1 2 3 Ex. 22. Soit (a, b, c) ∈ IR . Déterminons le rang de la matrice A = 3 a
2 3 4 b
3 4 5 a
Les opérations élémentaires :
L2 ← L2 − 2L1 ,
L3 ← L3 − 3L1
et
4 5 . 6 c
L4 ← L4 − a L1 ,
transforment A en la matrice (qui a même rang que A ) :
1 0 0 0
2 −1 −2 b − 2a
3 −2 −4 −2a
4 −3 . −6 c − 4a
La proposition 28 offre alors rg A = 1 + rg A1 avec A1 =
�
−1 −2 b − 2a
−2 −4 −2a
−3 −6 c − 4a
�
.
Les opérations L2 ← L2 − 2L1 et L3 ← L3 + (b − 2a) L1 transforment alors A1 en la matrice :
�
−1 0 0
−2 0 2(a − b)
On en déduit que rg A1 = 1 + rg A2 avec A2 =
−3 0 2a − 3b + c
�
0 2(a − b)
�
.
0 2a − 3b + c
�
.
On obtient finalement : • si a = b et 2a − 3b + c = 0 , i.e. si a = b = c , alors rg A2 = 0 puis rg A = 2 , • sinon, on a rg A2 = 1 et donc rg A = 3 .
4
Matrices semblables et trace
Matrices semblables
Exo 25.16
Définition 9 Soit (A, B) ∈ Mn (IK)2 . On dit que A et B sont semblables s’il existe une matrice P ∈ GLn (IK) telle que B = P −1 AP . Remarque La relation « être semblable à » est une relation d’équivalence sur Mn (IK) : réflexivité : toute matrice A est semblable à elle-même, puisque A = In−1 AIn ; symétrie : si B = P −1 AP , alors A = Q−1 BQ avec Q = P −1 ; transitivité : si B = P −1 AP et C = Q−1 BQ, alors C = R−1 AR avec R = P Q . 961
Chapitre 25. Représentation matricielle Ex. 23. Soit A ∈ Mn (IK) . Si P ∈ GLn (IK) et B ∈ Mn (IK) vérifient A = P BP −1 , alors l’associativité du produit matriciel donne, pour tout k ∈ IN∗ : Ak = (P BP −1 )k = (P BP −1 ) · · · (P BP −1 )
k facteurs
= P B (P −1 P ) B · · · B (P −1 P ) BP −1 = P B k P −1 .
=In
=In
Si B k est aisée à calculer (par exemple si elle est diagonale), cela offre un moyen efficace de calculer Ak . Remarque
Une récurrence permet d’établir rigoureusement : ∀k ∈ IN
Ak = P B k P −1 .
Interprétation en termes de matrices d’endomorphismes Remarque Si u est un endomorphisme de E de dimension finie, et si A et B représentent toutes deux l’endomorphisme u , alors A et B sont semblables. En effet, si B et B ′ sont deux bases de E telles que A = MatB (u) et B = MatB′ (u), alors on a B = P −1 AP avec P = PB→B′ . Le résultat suivant donne en quelque sorte la réciproque de la remarque précédente.
Exo 25.17
Proposition 29 Soit A ∈ Mn (IK) et u ∈ L(E). Supposons que B soit une base de E telle que A = MatB (u). Si B ∈ Mn (IK) est une matrice semblable à A, alors il existe une base B ′ de E telle que B = MatB′ (u). Démonstration.
Les matrices A et B étant semblables, on peut considérer P ∈ GLn (IK) telle que B = P −1 AP . Soit alors B′ la base de E tel que PB→B′ = P (cf. remarque de la page 956). D’après la formule de changement de base pour les endomorphismes (cf. corollaire 21 de la page 957), on a : MatB′ (u) = P −1 AP
et donc
B = MatB′ (u).
Remarque C’est essentiellement comme cela qu’il faut comprendre le fait que deux matrices sont semblables : elles représentent le même endomorphisme dans deux bases différentes.
Ex. 24. Retrouvons, à l’aide des endomorphismes, le fait que si A ∈ Mn (IK) et B ∈ Mn (IK) vérifient A = P BP −1 avec P ∈ GLn (IK) , alors on a : ∀k ∈ IN Ak = P B k P −1 (ce qui a été obtenu de manière calculatoire à l’exemple 23). Notons u ∈ L(IKn ) l’endomorphisme canoniquement associé à A . Si B est la base de IKn telle que P = PB0 →B ( B0 désignant la base canonique), alors on a B = MatB (u) . Pour k ∈ IN , on a alors Ak = MatB0 (uk ) et B k = MatB (uk ) . Par suite, la formule de changement de base pour les endomorphismes donne Ak = P B k P −1 .
962
II Changements de bases, équivalence et similitude Ex. 25. Soit A ∈ Mn (IK) vérifiant A2 = A . En notant p ∈ L(IKn ) l’endomorphisme canoniquement associé à A , on a p2 = p , autrement dit p est un projecteur. Par suite, les deux sous-espaces vectoriels Ker(p − IdIKn ) et Ker(p) sont supplémentaires dans E .
En notant r = rg(A) = rg(p) , si B = (e1 , . . . , er , er+1 , . . . , en ) est une base de IKn adaptée à la décomposition IKn = Ker(p − IdIKn ) ⊕ Ker(p) , on a alors : MatB (p) = Diag(1, . . . , 1, 0, . . . , 0)
MatB (p) = Jr .
i.e.
r termes
La matrice A est donc semblable à Jr .
Ex. 26. Sur le même principe, si A ∈ Mn (IK) vérifie A2 = In , alors l’endomorphisme s canoniquement associé à A vérifie s2 = IdIKn , donc est une symétrie. Par suite, on a : IKn = Ker(s − IdIKn ) ⊕ Ker(s + IdIKn ). Si B est une base adaptée à cette décomposition, alors on a : MatB (s) = D
où
D = Diag(1, . . . , 1, −1, . . . , −1)
avec
p = dim Ker(s − IdIKn ).
p termes
Ainsi, les deux matrices A et D sont semblables.
Trace Définition 10 La trace d’une matrice carrée A, notée tr A, est la somme de ses coefficients n ai,i . diagonaux ; autrement dit, si A = (ai,j )1i,jn , alors on a tr A = i=1
Proposition 30 L’application tr : Mn (IK) → IK est une forme linéaire sur Mn (IK). Démonstration.
Immédiat en introduisant les coefficients des matrices.
Proposition 31 Pour tout (A, B) ∈ Mn,p × Mp,n (IK), on a tr(AB) = tr(BA).
Démonstration page 969
Principe de démonstration. On exprime tr(AB) à l’aide d’une somme double, et l’on constate que tr(BA) s’exprime à l’aide de la même somme.
Remarque Dans la proposition précédente, si n �= p, les matrices A et B sont de tailles différentes, mais les matrices AB et BA sont bien carrées : on a AB ∈ Mn (IK) et BA ∈ Mp (IK). 963
Chapitre 25. Représentation matricielle Corollaire 32 Deux matrices semblables ont même trace. Démonstration. Soit (A, B) ∈ Mn (IK)2 . Supposons A et B semblables. Soit P ∈ GLn (IK) telle que B = P −1 AP . Par associativité du produit matriciel et en utilisant la proposition 31 :
tr(B) = tr(P −1 AP ) = tr (P −1 )(AP )
= tr (AP )(P −1 ) = tr (A)(P P −1 ) = tr(AIn ) = tr(A).
Définition 11 Soit u ∈ L(E). On appelle trace de u , et l’on note tr(u), la trace commune des matrices représentant u dans une base de E . Démonstration.
La validité de cette définition vient du fait que si B et B′ sont deux bases de E , alors pour tout u ∈ L(E) , les matrices MatB (u) et MatB′ (u) sont semblables, d’après la formule de changement de base pour les endomorphismes ; elles ont donc même trace d’après le corollaire 32.
Proposition 33 Soit E un IK -espace vectoriel de dimension finie. L’application tr : L(E) → IK est une forme linéaire sur E et vérifie de plus : ∀(u, v) ∈ L(E)2 tr (u ◦ v) = tr (v ◦ u) .
Démonstration page 969
Principe de démonstration.
Si l’on fixe B une base de E , alors tr(u) = tr MatB (u) .
Proposition 34 La trace d’un projecteur est égale à son rang. Démonstration.
Soit p un projecteur d’un IK -espace vectoriel E de dimension n . Puisque p est un projecteur, Ker p et Im p sont supplémentaires dans E . Par suite, si l’on note r = dim Im p = rg p , et si l’on considère une base B = (e1 , . . . , en ) adaptée à la décomposition E = Im p ⊕ Ker p , alors on a : MatB (p) = Diag(1, . . . , 1, 0, . . . , 0) = Jr .
Exo 25.18
r termes
Il est alors immédiat que tr(p) = tr MatB (p) = r , c’est-à-dire tr(p) = rg(p) .
964
Démonstrations
Démonstrations Proposition 1 Linéarité.
Notons BE = (e1 , . . . , ep ) et BF = (f1 , . . . , fn ) .
Étant donné (u, v) ∈ L(E, F )2 ainsi que λ ∈ IK , posons : A = MatBE ,BF (u) = (ai,j )(i,j)∈[[1,n]]×[[1,p]] B = MatBE ,BF (v) = (bi,j )(i,j)∈[[1,n]]×[[1,p]] C = MatBE ,BF (λ u + v) = (ci,j )(i,j)∈[[1,n]]×[[1,p]] .
Il s’agit de montrer que λA + B = C . Soit j ∈ [[1, p]] . On a d’une part : (λ u + v) (ej ) =
n
ci,j fi ,
i=1
et d’autre part : (λ u + v) (ej ) = λ u (ej ) + v (ej ) = λ
n
ai,j fi +
i=1
n
=
n
bi,j fi
i=1
(λ ai,j + bi,j ) fi .
i=1
Par unicité de la décomposition dans une base, on en déduit : ∀(i, j) ∈ [[1, n]] × [[1, p]]
ci,j = λ ai,j + bi,j .
Il en résulte que λA + B = C , ce qui prouve que ϕ est une application linéaire. Bijectivité. Soit A = (ai,j )(i,j)∈[[1,n]]×[[1,p]] ∈ Mn,p (IK) . Une application linéaire étant entièrement déterminée par son comportement sur une base, il existe une unique application linéaire u ∈ L(E, F ) vérifiant : ∀j ∈ [[1, p]]
u (ej ) =
n
ai,j fi ,
i=1
autrement dit, il existe un unique antécédent u de A par ϕ . D’où la bijectivité de ϕ . Proposition 3 Notons p = dim E , n = dim F , BE = (e1 , . . . , ep ) et BF = (f1 , . . . , fn ) . Notons également A = (ai,j )(i,j)∈[[1,n]]×[[1,p]] , X = (xi )1ip et Y = (yi )1in . On a : u(x) = u
p j=1
x j ej
=
p
xj u(ej ) =
j=1
p
xj
j=1
=
p n
n
ai,j fi
i=1
xj ai,j fi =
j=1 i=1
Il apparaît alors que MatBF u(x) = AX , et donc :
p n i=1
j=1
xj ai,j
fi .
Y = AX ⇐⇒ MatBF (y) = MatBF u(x) ⇐⇒ y = u(x).
965
Chapitre 25. Représentation matricielle Proposition 4
Notons BE = (e1 , . . . , ep ) , BF = (f1 , . . . , fn ) et BG = (g1 , . . . , gq ) . Posons :
A = MatBE ,BF (u) ;
B = MatBF ,BG (v)
C = MatBE ,BG (v ◦ u).
et
Notons ai,j , bi,j et ci,j les coefficients d’indice (i, j) des matrices A , B et C respectivement. Soit k ∈ [[1, p]] . On a, par définition des matrices A et B , et par linéarité de v :
(v ◦ u)(ek ) = v u(ek ) = v
n
aj,k fj
j=1
=
n
aj,k v (fj )
j=1
=
n
aj,k
j=1
=
q n
q
aj,k bi,j gi =
j=1 i=1
Ainsi, le coefficient d’indice (i, k) de la matrice C vaut
bi,j gi
i=1
n q i=1
n
bi,j aj,k
j=1
gi .
bi,j aj,k . Par définition du produit
j=1
matriciel, cela prouve que C = BA . Proposition 6 •
Si u est bijective, alors on a les deux relations suivantes : MatBE ,BF (u) MatBF ,BE (u−1 ) = MatBF ,BF (u ◦ u−1 ) = MatBF ,BF (IdF ) = In MatBF ,BE (u−1 ) MatBE ,BF (u) = MatBE ,BE (u−1 ◦ u) = MatBE ,BE (IdE ) = In
ce qui prouve que MatBE ,BF (u) est inversible et que sa matrice inverse est MatBF ,BE u−1 . •
Réciproquement, supposons MatBE ,BF (u) inversible. Considérons v ∈ L(F, E) dont la ma-
trice dans les bases BF et BE est MatBE ,BF (u)
−1
. Alors les deux calculs :
MatBF ,BF (u ◦ v) = MatBE ,BF (u) MatBF ,BE (v) = In = MatBF ,BF (IdF ) MatBE ,BE (v ◦ u) = MatBF ,BE (v) MatBE ,BF (u) = In = MatBE ,BE (IdE ), offrent respectivement u ◦ v = IdF et v ◦ u = IdE . Conclusion : u est bijective et u−1 = v . Proposition 11
L’isomorphisme ϕ : IKp x ∀x ∈ E
−→ �−→
Mp,1 (IK) vérifie ϕ(Ker u) = Ker A , puisque : MatBE (x)
x ∈ Ker u ⇐⇒ AMatBE (x) = 0 ⇐⇒ MatBE (x) ∈ Ker A.
On en déduit dim(Ker A) = dim(Ker u) , puis par théorème du rang, rg A = rg u . Proposition 14
Soit A ∈ Mn (IK) et B ∈ Mn (IK) vérifiant A B = In .
Désignons par u et v les endomorphismes de IKn canoniquement associés à A et B respectivement. Alors l’hypothèse AB = In entraîne u ◦ v = IdIKn . L’endomorphisme u est donc surjectif et, comme c’est un endomorphisme d’un espace vectoriel de dimension finie, on en déduit qu’il est bijectif. Par suite A est inversible. En multipliant alors la relation A B = In par A−1 à gauche, on obtient B = A−1 . On en déduit donc que B est inversible et, en passant à l’inverse dans la relation précédente, on a B −1 = A .
966
Démonstrations Proposition 15 Soit (A, B) ∈ Mn,p (IK) × GLp (IK) . Montrons que Im(AB) = Im(A) . Notons u ∈ L(IKp , IKn ) et v ∈ L(IKp ) les applications linéaires canoniquement associées à A et B respectivement. Alors la matrice AB est la matrice de u ◦ v dans les bases canoniques de IKp et IKn ; on a donc Im(AB) = Im(u ◦ v) . De plus, B est inversible, donc v est un automorphisme ; en particulier, la surjectivité de v donne Im v = IKp , d’où : Im(AB) = Im(u ◦ v) = u(Im v) = u(IKp ) = Im u = Im A. Proposition 16 Soit (A, B) ∈ Mn,p (IK) × GLn (IK) . • Montrons que Ker(BA) = Ker(A) . Notons u ∈ L(IKp , IKn ) et v ∈ L(IKn ) les applications linéaires canoniquement associées à A et B respectivement. Alors BA est la matrice de v ◦u dans les bases canoniques de IKp et IKn ; on a donc : Ker(BA) = Ker(v ◦ u).
Comme B est inversible, v est un automorphisme, donc en particulier injectif. Pour x ∈ IKp , on a alors, en utilisant le fait que Ker v = {0} : (v ◦ u)(x) = 0 ⇐⇒ u(x) ∈ Ker v ⇐⇒ u(x) = 0.
•
Cela prouve que Ker(v ◦ u) = Ker(u) , i.e. Ker(BA) = Ker(A) . Le fait que BA et A aient même rang provient alors du théorème du rang puisque, ces deux matrices ayant p colonnes, on a : rg A = p − dim Ker(A)
Proposition 18
x1 .. Notons X = . , X ′ = xn x=
n �
x′j e′j =
j=1
n �
x′j
j=1
rg(BA) = p − dim Ker(BA).
et
�� n
x′1
.. . et P = (pi,j )1i,jn . On a : x′n
pi,j ei
i=1
�
=
n � n � � i=1
j=1
ce qui, par unicité de la décomposition dans la base B , donne : ∀i ∈ [[1, n]]
xi =
n �
pi,j x′j
i.e.
�
pi,j x′j ei
X = P X ′.
j=1
Proposition 19 On a PB→B′ = MatB′ ,B (IdE ) et PB′ →B = MatB,B′ (IdE ) . Ainsi on a (cf. proposition 4 de la page 948) : PB′ →B PB→B′ = MatB,B′ (IdE )MatB′ ,B (IdE ) = MatB′ ,B′ (IdE ◦ IdE ) = MatB′ (IdE ) = In . D’où le résultat, d’après la proposition 14 de la page 954. Proposition 22 Le théorème du rang donne dim Ker u = dim E − rg u , i.e. dim Ker u = p − r . Soit (er+1 , er+2 , . . . , ep ) une base de Ker u . Complétons cette famille libre en une base de E : BE = (e1 , . . . , er , er+1 , . . . , ep ).
Pour tout i ∈ [[1, r]] , posons alors fi = u(ei ) . Le sous-espace H = Vect(er+1 , . . . , ep ) étant un supplémentaire de Ker u dans E , la restriction de u à H est injective, donc la famille (f1 , . . . , fr ) est libre ; on peut donc la compléter en une base de F : BF = (f1 , . . . , fr , fr+1 , . . . , fn ).
Par construction, on a alors MatBE ,BF (u) = Jr . D’où le résultat.
967
Chapitre 25. Représentation matricielle Proposition 23 Soit A ∈ Mn,p (IK) ; notons u ∈ L(IKp , IKn ) son application linéaire canoniquement associée. •
Supposons rg A = r . On a alors rg u = r . D’après la proposition 22 de la page 958, il existe deux bases B et C , de IKp et IKn respectivement, telles que MatB,C (u) = Jr . La formule de changement de bases pour les applications linéaires donne alors le résultat annoncé : en effet, en notant P la matrice de passage de la base canonique de IKp à B , et Q la matrice de passage de la base canonique de IKn à C , on a Jr = Q−1 A P .
•
Réciproquement, si M et Jr sont équivalentes, alors il existe (P, Q) ∈ GLn (IK) × GLp (IK) tel que M = P Jr Q . On a alors rg(M ) = rg(Jr ) = r , car la multiplication par une matrice inversible ne modifie pas le rang (cf. propositions 15 et 16 page 954).
Corollaire 25 lente à
Soit A ∈ Mn,p (IK) . Notons r = rg(A) . On sait alors que la matrice A est équiva-
(n,p) Jr .
(n,p)
Soit (P, Q) ∈ GLn (IK) × GLp (IK) tel que A = P Jr T
AT = QT Jr(n,p) P T
i.e.
Q . Transposons :
AT = QT Jr(p,n) P T .
Puisque les matrice P T et QT sont inversibles (car la transposition préserve l’inversibilité), les (p,n)
matrices AT et Jr
Proposition 26
sont équivalentes, autrement dit rg AT = r .
Toute sous-matrice de A est obtenue, à partir de A , en supprimant certaines
est obtenue, à partir de A , colonnes et lignes. Par récurrence finie, il suffit de traiter le cas où A par suppression d’une colonne ou d’une ligne.
•
•
est une sous-famille Dans le cas de la suppression d’une colonne, la famille des colonnes de A rg(A) . de celle des colonnes de A . On a donc rg(A)
qui est une sousDans le cas de la suppression d’une ligne, c’est la famille des lignes de A
rg(A) . famille de celle des lignes de A , avec la même conséquence : rg(A)
Proposition 27 •
Prouvons qu’il existe une sous-matrice de A , carrée inversible et de taille r . ∗ ∗
•
Notons r = rg(A) .
Puisque rg(A) = r , on peut trouver une famille libre constituée de r colonnes de A . Par suite, il existe une sous-matrice A1 extraite de A , de taille n×r , et dont les colonnes forment une famille libre. On a alors rg A1 = r . Comme r est aussi le rang de la famille des lignes de A1 , on peut trouver r lignes de A1 formant une famille libre. En extrayant la sous-matrice r × r correspondante, on obtient une matrice carrée de taille r et de rang r , qui est donc inversible.
∈ GLp (IK) est une sous-matrice carrée et inversible de A , Il reste à prouver que si A ∈ GLp (IK) une telle sous-matrice. Alors : alors p r . Soit A
∗
∗
968
, on a p = rg(A) ; d’une part, par inversibilité de A
rg(A) . d’autre part, d’après la proposition 26 de la page 959, on a rg(A)
Démonstrations Proposition 31
Notons A = (ai,j )(i,j)∈[[1,n]]×[[1,p]] et B = (bi,j )(i,j)∈[[1,p]]×[[1,n]] .
Pour tout i ∈ [[1, n]] , on a [AB]i,i = tr (AB) =
p
ai,j bj,i , donc :
j=1
p n
ai,j bj,i =
i=1 j=1
De même, pour tout j ∈ [[1, p]] , on a [BA]j,j = tr (BA) =
p n
ai,j bj,i .
1in 1jp
n
bj,i ai,j , donc :
i=1
bj,i ai,j =
j=1 i=1
ai,j bj,i .
1in 1jp
On a donc obtenu tr (AB) = tr (BA). Proposition 33
Soit B une base de E . L’application tr : L(E) → IK vérifie : ∀u ∈ L(E)
tr(u) = tr MatB (u) .
L’application tr : L(E) → IK est donc linéaire, comme composée des deux applications linéaires : L(E) u
Mn (IK) MatB (u)
−→ �−→
Mn (IK) A
et
D’autre part, pour (u, v) ∈ L(E)2 , on a :
tr(u ◦ v) = tr MatB (u ◦ v) = tr MatB (u) MatB (v)
= tr MatB (v)MatB (u)
−→ �−→
IK tr(A).
(matrice d’une composée) (propriété de la trace)
= tr MatB (v ◦ u) = tr(v ◦ u).
969
Chapitre 25. Représentation matricielle
S’entraîner et approfondir 25.1 Soit n ∈ IN , ainsi que n + 1 scalaires distincts a0 , . . . , an . On considère B = (L0 , . . . , Ln ) →944 la base de IKn [X] des polynômes de Lagrange associés à la famille (a0 , . . . , an ) . Pour P ∈ IKn [X] , donner la matrice de P dans la base B . 25.2 Soit E un IK -espace vectoriel de dimension n , muni d’une base B = (e1 , . . . , en ) . Posons, →946 pour k ∈ [[1, n]] , Ek = Vect(e1 , . . . , ek ) . Notons A = MatB (u) . Montrer que A est triangulaire supérieure si, et seulement si, pour tout k ∈ [[1, n]] , le sous-espace Ek est stable par u . 25.3 Soit A = (ai,j )1i,jn ∈ Mn (IR) définie par ai,j = →949
j −1 . i−1
1. Considérons l’endomorphisme u de IRn−1 [X] défini par u : P (X) �→ P (X + 1) . Montrer que u est un automorphisme et expliciter u−1 . 2. Que représente A vis-à-vis de u ? En déduire l’inversibilité de A et expliciter A−1 . 3. Démontrer la formule d’inversion de Pascal : si (xn )0kn−1 et (yk )0kn−1 sont deux familles de scalaires telles que : ∀k ∈ [[0, n − 1]]
yk =
i
i=0
alors on a : ∀k ∈ [[0, n − 1]]
k k
k
xk =
(−1)
k−i
i=0
Indication. En notant X = x0 · · · xn−1 une relation faisant intervenir X , Y et A .
xi ,
et Y =
k yi . i
y0
···
yn−1
, trouver
25.4 Si y = (y1 , y2 ) est l’image de x = (x1 , x2 , x3 ) par l’application linéaire canoniquement →949
associée à A =
1 1
3 2
2 4
, exprimer les yi en fonction des xj .
25.5 Donner le rang de la matrice A = →952
25.6 Donner le rang de la matrice A = →952
2
25.7 Dans le plan IK , on prend u1 =
1 1
2 2
1 2 3
2 3 4
1 1
5 5 3 5 7
ainsi que des bases de Im A et Ker A .
5 8 11
, u2 =
ainsi que des bases de Im A et Ker A .
1 −1
que E2 = Vect(u2 ) . On considère de plus : • p la projection sur E1 parallèlement à E2 , • s la symétrie par rapport à E1 parallèlement à E2 .
et l’on pose E1 = Vect(u1 ) ainsi
1. Déterminer les matrices P et S , respectivement de p et de s , dans la base canonique de IK2 . 2. Évaluer toutes les puissances de P et S .
970
Exercices ⋆ 25.8 Soit E un espace vectoriel de dimension finie n 2 . 1. Soit u ∈ L(E) et M sa matrice dans une base B = (e1 , . . . , en ) . Par quelles opérations élémentaires sur M obtient-on :
(a) la matrice de u dans la base B1 = (−e1 , e2 , . . . , en ) ? (b) la matrice de u dans la base B2 = (e2 , e1 , e3 , e4 , . . . , en ) ?
2. Quels sont les endomorphismes de l’espace vectoriel E dont les matrices sont indépendantes de la base choisie ?
25.9 Soit u l’endomorphisme de IR3 dont la matrice dans la base canonique est : A=
0 1 −1
−1 0 1
1 −1 0
.
1. Montrer que IR3 = Ker u ⊕ Im u .
2. L’endomorphisme u est-il un projecteur ?
25.10 Soit E un IK -espace vectoriel de dimension 3 . Soit u ∈ L(E) tel que u3 0 Montrer qu’il existe une base de E dans laquelle la matrice de u est 1 0
25.11 Soit A =
1 1 1
1 1 1
1 1 1
=0 0 0 1
et u2 �= 0 . 0 0 0
. Déterminer les dimensions des deux sous-espaces vectoriels :
E1 = M ∈ M3 (IK) : A M = 0
et
E2 = A M | M ∈ M3 (IK)
⋆ 25.12 On travaille dans l’espace vectoriel IK3 [X] , dont on note B0 la base canonique. 1. Montrer que la famille :
B = (X − 1)3 , (X − 1)2 (X + 1), (X − 1)(X + 1)2 , (X + 1)3 est une base de E .
2. Déterminer la matrice de passage M de B0 à B .
3. Calculer M 2 , et en déduire la matrice de passage de B à B0 .
⋆ 25.13 Soit A ∈ Mn (IK) telle que : ∀i ∈ [[1, n]]
1jn j=i
|ai,j | < |ai,i |.
Montrer que A est inversible.
971
Chapitre 25. Représentation matricielle
Rang 25.14 Étant donné un paramètre complexe m , déterminer le rang de :
1 3 M = m −1
1 m 3 0
0 −1 −2 2
1 3 . 0 3
25.15 Soit n 2 . Déterminer le rang de la matrice A = (i + j − 1)1i,jn .
Matrices semblables �
�
25.16 Soit n ∈ IN∗ ainsi que (A, B) ∈ Mn (IK)2 . On pose Ω = M ∈ Mn (IK) : M A = BM . →961
1. Montrer que Ω est un sous-espace vectoriel de Mn (IK) .
2. À quelle condition Ω contient-il une matrice inversible ?
25.17 Soit A = →962
�
1 0 0
1. Calculer A2 .
2 1 −2
2 0 −1
�
.
2. En déduire que A est semblable à la matrice D =
�
1 0 0
0 1 0
3. Expliciter P ∈ GL3 (IR) telle que P −1 AP = D .
0 0 −1
�
.
Trace 25.18 Soit E un IK -espace vectoriel de dimension n , et s une symétrie de E . Montrer que tr(s) →964 est un entier de même parité que n . 25.19 Déterminer la trace de l’application transposition ϕ : Mn (IK) A Indication. On pourra détecter que ϕ est une symétrie.
972
−→ �−→
Mn (IK) AT .
Solutions des exercices
Solutions des exercices 25.1 Soit P ∈ IKn [X] . Écrivons P dans la base B = (L0 , . . . , Ln ) : P =
n �
λk Lk .
k=0
Soit i ∈ [[0, n]] . Pour k ∈ [[1, n]] , par définition du polynôme Lk , on a Lk (ai ) = δi,k . Ainsi : P (ai ) =
n �
λk Lk (ai ) =
k=0
n �
λk δi,k = λi .
k=0
P (a0 ) .. On en en conclut que MatB (P ) = . . P (an ) 25.2 • Supposons A triangulaire supérieure. Fixons k ∈ [[1, n]] et montrons que Ek est stable par u . Comme Ek = Vect(e1 , . . . , ek ) , et par linéarité de u , il s’agit de prouver que : ∀i ∈ [[1, k]]
u(ei ) ∈ Ek .
Soit i ∈ [[1, k]] . La matrice A étant triangulaire supérieure, on a en particulier : ∀s ∈ [[i + 1, n]]
as,i = 0.
Cela signifie que u(ei ) ∈ Vect(e1 , . . . , ei ) et offre le résultat car : Vect(e1 , . . . , ei ) ⊂ Vect(e1 , . . . , ek ) = Ek .
• Réciproquement, supposons les sous-espaces Ek stables par u . Soit k ∈ [[1, n]] .
Puisque ek ∈ Ek , la stabilité de Ek par u donne u(ek ) ∈ Vect(e1 , . . . , ek ) , et donc : ∀s ∈ [[k + 1, n]]
as,k = 0.
D’où le caractère triangulaire supérieur de A .
25.3 Remarque Par définition du coefficient binomial, on a ai,j = 0 si i > j . Ainsi, la matrice A est triangulaire supérieure. 1. L’application u est facilement un endomorphisme de IRn−1 [X] . Comme : v : IRn−1 [X] P (X)
−→ �−→
IRn−1 [X] P (X − 1)
vérifie u ◦ v = v ◦ u = IdIRn−1 [X] , on peut affirmer que u est bijectif et que u−1 = v . Remarque Comme il s’agit d’endomorphismes en dimension finie, une seule des deux relations u ◦ v = IdIRn−1 [X] et v ◦ u = IdIRn−1 [X] suffit pour conclure à la bijectivité de u . 2. En utilisant la formule du binôme, on constate que A est la matrice de l’endomorphisme u � � dans la base canonique de IRn−1 [X] . Comme u ∈ GL IRn−1 [X] et u−1 = v , on en déduit que A est inversible et a pour inverse la matrice de v dans la base canonique de IRn−1 [X] . Toujours en utilisant la formule du binôme, on obtient que A−1 est la matrice dont le � � j−1 . terme d’indice (i, j) vaut (−1)j−i i−1
973
Chapitre 25. Représentation matricielle 3. Supposons que (xk )0kn−1 et (yk )0kn−1 vérifient : ∀k ∈ [[0, n − 1]] En considérant les matrices lignes X =
�
x0
···
xn−1
�
et Y =
�
yk =
k � � � k
i=0
y0
···
i
xi .
yn−1
�
,
on constate que l’on a Y = XA . En multipliant cette relation à droite par A−1 , on obtient alors X = Y A−1 . Étant donné ce qu’est la matrice A−1 , on obtient, pour tout k ∈ [[0, n − 1]] : xk =
k �
(−1)k−i
i=0
ce qui est la relation souhaitée.
� �
k yi , i
25.4 L’application linéaire canoniquement associée à la matrice A =
�
1 1
3 2
2 4
tion ϕ ∈ L(IR3 , IR2 ) qui à x = (x1 , x2 , x3 ) , associe y = (y1 , y2 ) défini par :
�
ce qui s’écrit aussi :
y1 y2
�
�
y1 y2
=
�
= =
1 1
3 2
2 4
�
est l’applica-
� � x1 � x2 x3
x1 + 3 x2 + 2 x3 x1 + 2 x2 + 4 x3 .
25.5 • Étant donné que l’image de A est engendrée par ses vecteurs colonnes, qui sont tous � � 1 , on a rg(A) = 1 , et la famille (e) est une proportionnels au vecteur non nul e = 1 base de Im A . • La matrice A ayant 3 colonnes, le théorème du rang donne dim Ker A = 3 − rg A , donc dim Ker A = 2 . En notant C1 , C2 et C3 les colonnes de A , on constate que : 2C1 − C2 = 0
�
et
�
5C1 − C3 = 0.
�
�
2 5 On en déduit que les deux vecteurs et appartiennent à Ker A . Ces −1 0 0 −1 deux vecteurs étant non colinéaires, ils forment une base de Ker A . 25.6 • Notons C1 , C2 , C3 , C4 les colonnes de A . On constate que C1 et C2 forment une famille libre, puis que : C3 = C1 + C2
et
C4 = C2 + C3 = C1 + 2C2 .
On en déduit que rg A = 2 et l’on peut prendre (C1 , C2 ) comme base de Im A . • La matrice A ayant 4 colonnes, le théorème du rang donne dim Ker A = 4 − rg A , donc dim Ker A = 2 . On déduit linéaires entre les colonnes obtenues ci desrelations 1 1 1 2 dessus que les vecteurs appartiennent à Ker A . Ces deux vecteurs et −1 0 0 −1 étant non colinéaires, ils forment une base de Ker A .
974
Solutions des exercices 25.7 1. • Matrice de p dans à la base canonique. Notons B0 = (e1 , e2 ) la base canonique de IK2 . On constate que : 1 1 e1 = (u1 + u2 ) et e2 = (u1 − u2 ). 2 2 1 1 Par définition de p , on a alors p(e1 ) = p(e2 ) = u1 = (e1 + e2 ) . La matrice 2 2 1 1 1 recherchée est donc P = . 1 1 2 • Matrice de s dans la base canonique. On sait que s = 2 p − IdIR2 ; comme l’application u �→ MatB0 (u) est linéaire, on obtient : S = 2P − I2 =
1 1
1 1
−
1 0
0 1
=
0 1
1 0
.
2. • L’endomorphisme p étant un projecteur, on a p0 = IdIR2 et : ∀n ∈ IN∗ En utilisant l’isomorphisme u �→ MatB0 (u) on en déduit : P 0 = I2
et, pour n 1,
pn = p .
P n = P.
Remarque Il est exclu de parler des puissances négatives de P car, p n’étant pas bijectif, la matrice P , qui le représente, n’est pas inversible. • En ce qui concerne s , on a : ∀n ∈ ZZ s2n = IdIR2 et s2n+1 = s . Pour les matrices correspondantes, on en déduit : S 2n = I2 et S 2n+1 = S. Dans ce cas n peut prendre des valeurs négatives car s est bijective et S est donc inversible. 25.8 1. (a) La matrice de u dans la base B′ = (e′1 , e′2 , . . . , e′n ) = (−e1 , e2 , . . . , en ) est la matrice des vecteurs (−u(e1 ), u(e2 ), . . . , u(en )) dans la base (−e1 , e2 , . . . , en ) . En exprimant u(e′1 ), u(e′2 ), . . . , u(e′n ) en fonction de (e′1 , e′2 , . . . , e′n ) on voit qu’elle elle est obtenue, à partir de M , en multipliant la première colonne par −1 et en multipliant la première ligne par −1 (l’ordre n’ayant pas d’importance car ces deux opérations élémentaires commutent). (b) De même la matrice de u dans la base B2 = (e2 , e1 , e3 , e4 , . . . , en ) est obtenue, à partir de M , en permutant les deux premières colonnes et en permutant les deux premières lignes (l’ordre n’ayant pas d’importance car ces deux opérations élémentaires commutent). 2. • Soit u un endomorphisme répondant au problème ainsi que M sa matrice dans la base B = (e1 , . . . , en ) . Reprenons les notations B1 et B2 de la question précédente. ∗ Comme sa matrice dans la base B1 doit être égale à M , tous les coefficients non diagonaux de la première ligne et de la première colonne doivent être nuls. En utilisant la base obtenue en multipliant par −1 le i -ème vecteur de la base initiale on trouve un résultat similaire pour toute ligne et toute colonne. Par suite la matrice M est diagonale. ∗ Comme la matrice de u dans la base B2 doit aussi être égale à M , on en déduit que m1,1 = m2,2 . ∗ Sur le même principe, en utilisant la base obtenue en permutant les vecteurs e1 et ei , on obtient m1,1 = mi,i . Par suite, la matrice M est scalaire i.e. u est une homothétie. • Réciproquement, il est évident que toute homothétie répond au problème.
975
Chapitre 25. Représentation matricielle
25.9 1. • Prouvons que Ker u ∩ Im u = {0} . Soit y = Comme y ∈ Im u , il existe x =
x1 x2 x3
y1 = −x2 + x3 ,
y1 y2 y3
∈ Ker u ∩ Im u .
tel que y = u(x) , et l’on a :
y2 = x 1 − x 3
y3 = −x1 + x2
et donc y1 + y2 + y3 = 0 . Comme y ∈ Ker u , on a −y2 + y3 = y1 − y3 = −y1 + y2 = 0 et donc :
(a)
y1 = y2 = y3 .
(b)
Des relations (a) et (b) on déduit y = 0 , ce qui donne Ker u ∩ Im u = {0} .
• Étant donné que Ker u ∩ Im u = {0} et que dim Ker u + dim Im u = dim IR3 (par le théorème du rang), on en déduit que IR3 = Ker u ⊕ Im u . 2
2. Comme A =
−2 ∗ ∗
∗ ∗ ∗
∗ ∗ ∗
�= A, on voit que A n’est pas la matrice d’un projecteur.
Remarque On aurait aussi pu remarquer que tr A = 0 . Donc si A était une matrice de projecteur, on aurait rg A = tr A = 0 , ce qui est faux car A n’est pas la matrice nulle. 25.10 L’hypothèse u2 �= 0 nous dit qu’il existe a ∈ E tel que u2 (a) �= 0 .
• Montrons que la famille a, u(a), u2 (a) est libre. Soit (α, β, γ) ∈ IK3 tel que : α a + β u(a) + γ u2 (a) = 0.
∗ En appliquant u2 à cette relation, on obtient α u2 (a) = 0 et, comme u2 (a) �= 0 , on en déduit α = 0 . ∗ En appliquant alors u à la relation initiale, on obtient β u2 (a) = 0 et, toujours comme u2 (a) �= 0 , on en déduit β = 0 . ∗ On obtient alors γ u2 (a) = 0 , qui entraîne γ = 0 .
Ainsi la famille a, u(a), u2 (a) est libre. • Comme c’est une famille de 3 vecteurs dans un espace vectoriel de dimension 3 , on en déduit que c’est une base de E ; la matrice de u dans cette base répond évidemment au problème. 25.11 • L’application ϕ : M3 (IK) M
−→ �−→
M3 (IK) AM
est évidemment linéaire, et l’on a : et
Ker ϕ = E1
Im ϕ = E2 .
Comme dim M3 (IK) = 9 , on a, par le théorème du rang : dim E1 + dim E2 = 9. • En considérant les images par ϕ des éléments de la base canonique de M3 (IK) , on voit que, pour tout j ∈ [[1, 3]] :
ϕ(E1,j ) = ϕ(E2,j ) = ϕ(E3,j ).
Par suite, on a Im ϕ = Vect ϕ(E1,1 ), ϕ(E1,2 ), ϕ(E1,3 ) , avec : ϕ(E1,1 ) =
976
1 1 1
0 0 0
0 0 0
,
ϕ(E1,2 ) =
0 0 0
1 1 1
0 0 0
et
ϕ(E1,3 ) =
0 0 0
0 0 0
1 1 1
.
Solutions des exercices On voit facilement que la famille base de Im ϕ . On obtient donc :
�
ϕ(E1,1 ), ϕ(E1,2 ), ϕ(E1,3 )
dim E2 = dim Im ϕ = 3
puis
�
est libre ; c’est donc une
dim E1 = dim Ker ϕ = 6.
25.12 1. Étant donné que dim IK3 [X] = 4 et que cette famille contient 4 vecteurs de IK3 [X] , il suffit de prouver qu’elle est libre . Soit (a, b, c, d) ∈ IK4 tel que : a(X − 1)3 + b (X − 1)2 (X + 1) + c (X − 1)(X + 1)2 + d (X + 1)3 = 0.
• En évaluant en 1 puis en −1 , on trouve successivement d = 0 puis a = 0 . • On a alors : b (X − 1)2 (X + 1) + c(X − 1)(X + 1)2 = 0 c’est-à-dire : � � (X − 1)(X + 1) b(X − 1) + c(X + 1) = 0. Comme (X − 1)(X + 1) n’est pas le polynôme nul, et par intégrité de IK[X] , on en déduit b(X − 1) + c(X + 1) = 0 , et en évaluant en 1 et en −1 , on trouve b = c = 0 .
D’où la liberté.
2. La matrice de passage de la base canonique à B s’obtient en écrivant en colonne les coordonnées des éléments de B dans la base canonique de IK3 [X] , ce qui donne : −1 1 −1 1 3 3 −1 −1 . M = −3 −1 1 3 1 1 1 1 1 M . On a alors : 8 1 = M −1 = M. 8
3. On constate que M 2 = 8I4 , d’où l’on déduit M −1 =
�
PB→B0 = PB0 →B
�−1
25.13 Pour prouver que A est inversible, montrons que pour X ∈ IKn , on a AX = 0 =⇒ X = 0 .
x1 Soit X = ... ∈ IKn tel que AX = 0 . Montrons que X = 0 . xn
Par l’absurde, supposons X �= 0 . Soit i0 ∈ [[1, n]] tel que :
�
�
�
|xi0 | = max |xi | � i ∈ [[1, n]] .
En regardant le i0 -ème coefficient de la matrice colonne AX , la relation AX = 0 offre : n �
ai0 ,j xj = 0
ce qui se récrit
j=1
ai0 ,i0 xi0 = −
�
ai0 ,j xj .
1jn j�=i0
En passant au module, et par inégalité triangulaire, il vient :
� � � � � �ai0 ,i0 xi0 � �ai0 ,j xj �. 1jn j�=i0
977
Chapitre 25. Représentation matricielle Par définition de i0 , on a : ∀j ∈ [[1, n]]
|xj | |xi0 | , donc |ai0 ,i0 | |xi0 |
�
1jn j�=i0
|ai0 ,j | |xi0 | .
Comme X �= 0 , on a |xi0 | > 0 , ce qui permet de simplifier l’inégalité précédente, et donne :
� � � � � �ai0 ,i0 � �ai0 ,j �. 1jn j�=i0
Cela contredit l’hypothèse initiale.
25.14 En réalisant, dans l’ordre, les opérations suivantes : L2 ← L2 − 3 L1 ,
puis
L3 ← L3 − m L1 ,
L2 ↔ L4 , L3 ← L3 + (m − 3) L2 , on voit que M est équivalente à :
1 0 0 0
1 1 0 0
0 2 2m − 8 5 − 2m
L4 ← L4 + L1
L4 ← L4 − (m − 3) L2 ,
1 4 . 3 m − 12 12 − 4 m
À ce niveau, on pourrait discuter selon que m = 4 ou non pour continuer strictement la méthode du pivot, mais préférons faire L3 ← L3 + L4 pour éliminer le m du pivot. En continuant avec L4 ← L4 +
1
0 T = 0 0
1 1 0 0
0 2 −3 0
(5−2m) 3
1 4 −m k
L3 , on obtient la matrice suivante, équivalente à M :
avec
k=
� 1 1� 2 m2 − 17 m + 36 = (m − 4) (2 m − 9). 3 3
Puisque A et T sont équivalentes, elles ont même rang. • si m = 4 ou m = 9/2 , alors k = 0 et rg M = rg T = 3 (les trois premières lignes de T forment une famille libre, et sa quatrième ligne est nulle) ; • dans les autres cas, on a rg M = rg T = 4 (la matrice T est alors inversible, car triangulaire avec des coefficients diagonaux tous non nuls). 25.15 En explicitant cette matrice :
A=
1 2 3 .. . n
2 3 4 .. . n+1
3 4 5 .. . n+2
... ... ... ...
n−1 n n+1 .. . 2n − 2
n n+1 n+2 .. . 2n − 1
on constate que ses vecteurs colonnes C1 , . . . , Cn sont tous combinaisons linéaires de C1 et 1 .. de la colonne U = . . Concrètement, on a : 1 ∀j ∈ [[1, n]]
Cj = C1 + (j − 1)U.
Par suite, le rang de la famille des vecteurs colonnes est au plus 2 . Comme de plus les colonnes C1 et C2 ne sont pas proportionnelles, le rang de A vaut au moins 2 . Conclusion : on a rg(A) = 2 .
978
Solutions des exercices 25.16 1. On constate que l’application ϕ :
Mn (IK) M
pour M ∈ Mn (IK) , on a :
−→ �−→
Mn (IK) M A − BM
est linéaire, et
M ∈ Ω ⇐⇒ M A − BM = 0 ⇐⇒ ϕ(M ) = 0. Autrement dit, Ω = Ker ϕ ; en particulier, Ω est un sous-espace vectoriel de Mn (IK) .
2. • Si Ω contient une matrice inversible P , alors en multipliant à gauche par P −1 la relation P A = BP , on obtient A = P −1 BP . Les matrices A et B sont donc semblables. • Réciproquement, si A et B sont semblables, alors il existe une matrice P ∈ GLn (IK) telle que A = P −1 BP , ce qui offre P A = BP , i.e. P ∈ Ω . En conclusion, Ω contient une matrice inversible si, et seulement si, A et B sont semblables.
25.17 1. On obtient, par calcul, A2 = I3 . 2. Soit u ∈ L(IR3 ) l’endomorphisme canoniquement associé à A .
• Puisque A2 = I3 , on a u2 = IdIR3 , autrement dit u est une symétrie. Ainsi, on a : Ker(u − IdIR3 ) ⊕ Ker(u + IdIR3 ) = IR3 .
0 2 2 0 0 0 . Il ap• On a rg(u − IdIR3 ) = rg(A − I3 ) . Or, on a A − I3 = 0 −2 −2 paraît que rg(A − I3 ) = 1 , donc rg(u − IdIR3 ) = 1 . Le théorème du rang donne alors dim Ker(u − IdIR3 ) = 2 . • Les deux sous-espaces vectoriels Ker(u−IdIR3 ) et Ker(u+IdIR3 ) étant supplémentaires dans IR3 , on en déduit que dim Ker(u + IdIR3 ) = 1 . Si B est une base adaptée à la somme directe Ker(u − IdIR3 ) ⊕ Ker(u + IdIR3 ) , on a alors : MatB (u) =
1 0 0
0 1 0
0 0 −1
= D.
• Conclusion : A et D sont semblables, puisque représentent toutes les deux l’endomorphisme u . 3. Reprenons les notations précédentes. Notons B0 la base canonique de IR3 . Si B est une base de IR3 adaptée à la somme directe Ker(u − IdIR3 ) ⊕ Ker(u + IdIR3 ) , alors la formule de changement de base pour les endomorphismes donne P −1 AP = D avec P la matrice de passage de B0 vers B . Déterminons une telle base B . • On a A−I3 = et v2 =
0 1 −1
0 0 0
2 0 −2
2 0 −2
et l’on voit facilement que les vecteurs v1 =
1 0 0
forment une base de Ker(A − I3 ) , donc de Ker(u − IdIR3 ) .
979
Chapitre 25. Représentation matricielle
2 2 2 1 0 2 0 0 et l’on voit que le vecteur v3 = forme une • On a A + I3 = 0 −2 0 −1 base de la droite vectorielle Ker(A + I3 ) , donc de Ker(u + IdIR3 ) . • La famille B = (v1 , v2 , v3 ) est alors une base de IR3 adaptée à décomposition : IR3 = Ker(u − IdIR3 ) ⊕ Ker(u + IdIR3 ). Conclusion : on a P
−1
AP = D avec P = PB0 →B =
1 0 0
0 1 −1
1 0 −1
.
25.18 Puisque s est une symétrie, on a : E = Ker(s − IdE ) ⊕ Ker(s + IdE ).
Ainsi, si B est une base de E adaptée à cette décomposition, on a : MatB (s) = Diag(1, . . . , 1, −1, . . . , −1)
avec
r = dim Ker(s − IdE ).
r termes
On en déduit que :
tr s = r − (n − r) = 2r − n.
Il en résulte que tr(s) est un entier de même parité que n .
25.19 • L’application ϕ est linéaire, par linéarité de la transposition, et vérifie ϕ ◦ ϕ = IdMn (IK) . Ainsi, il s’agit d’une symétrie, et l’on a :
Mn (IK) = Ker ϕ − IdMn (IK) ⊕ Ker ϕ + IdMn (IK) . Dans une base adaptée à la décomposition précédente, la matrice de ϕ est : Diag(1, . . . , 1, −1, . . . , −1)
r termes
• Par suite, on a :
avec
n2 −r termes
On a donc r = dim Sn (IK) =
= Sn (IK)
et
Ker ϕ + IdMn (IK)
= An (IK).
n(n + 1) (cf. exemple 11 de la page 910), puis : 2 tr ϕ = n(n + 1) − n2 = n.
980
tr ϕ = r − (n2 − r) = 2r − n2 .
• On constate que de plus que : Ker ϕ − IdMn (IK)
r = dim Ker ϕ − IdMn (IK) .
Chapitre 26 : Déterminants I
Groupe symétrique . . . . . . . . . . . . . . . . . Définition . . . . . . . . . . . . . . . . . . . . . . Décomposition d’une permutation . . . . . . . . Signature . . . . . . . . . . . . . . . . . . . . . . II Formes p -linéaires alternées . . . . . . . . . . . . 1 Formes 2 -linéaires ou bilinéaires . . . . . . . . . 2 Formes p -linéaires . . . . . . . . . . . . . . . . . 3 Formes n -linéaires alternées en dimension n . . 4 Propriétés des formes n -linéaires alternées . . . . 5 Expression d’une forme n -linéaire alternée . . . III Déterminant d’une famille de vecteurs . . . . . . 1 Définition . . . . . . . . . . . . . . . . . . . . . . 2 Propriétés . . . . . . . . . . . . . . . . . . . . . . 3 Interprétation géométrique . . . . . . . . . . . . IV Déterminant d’un endomorphisme . . . . . . . . 1 Définition . . . . . . . . . . . . . . . . . . . . . . 2 Propriétés . . . . . . . . . . . . . . . . . . . . . . V Déterminant d’une matrice carrée . . . . . . . . 1 Définition . . . . . . . . . . . . . . . . . . . . . . 2 Propriétés . . . . . . . . . . . . . . . . . . . . . . VI Calcul des déterminants . . . . . . . . . . . . . . 1 Opérations sur les lignes ou les colonnes . . . . 2 Développement suivant une colonne ou une ligne 3 Déterminant de Vandermonde . . . . . . . . . . . VII Comatrice . . . . . . . . . . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
982 . 982 . 983 . 986 986 . 986 . 988 . 988 . 989 . 990 991 . 991 . 992 . 993 993 . 993 . 994 995 . 995 . 996 998 . 998 . 999 . 1000 1002 1003 1012
Déterminants
26
Dans tout ce chapitre, IK désigne IR ou C.
I
Groupe symétrique
1
Définition
Notation Soit n ∈ IN∗ . On note Sn l’ensemble des permutations de l’ensemble [[1, n]], c’est-à-dire l’ensemble des bijections de [[1, n]] dans lui-même. Immédiatement, on a S1 = {Id} . Dans toute la suite, nous supposerons n 2 . Proposition 1 Muni de la composition des applications, Sn est un groupe de cardinal n!, que l’on appelle groupe symétrique. Si n 3 , le groupe Sn n’est pas commutatif. Démonstration.
Cela a été démontré à la proposition 7 de la page 683
Notations 1. Si (σ, τ ) ∈ Sn2 , la composée σ ◦ τ est notée σ τ et appelée produit de σ et τ . 2. Lorsque p ∈ ZZ, on notera σ p l’itéré p-ième d’une permutation σ .
Exo 26.1
3. Une permutation σ de Sn pourra se noter de la manière suivante : 1 2 ··· n σ= . σ(1) σ(2) · · · σ(n)
I Groupe symétrique Définition 1 Étant donné un entier p 2 , ainsi que a1 , . . . , ap des éléments de [[1, n]] distincts deux à deux, l’application σ définie sur [[1, n]] par : ∀x ∈ [[1, n]] \ {a1 , . . . , ap } σ(x) = x,
∀i ∈ [[1, p − 1]] σ(ai ) = ai+1 , σ(ap ) = a1 ,
est une permutation de [[1, n]] que l’on note (a1 a2 · · · ap ).
Une telle permutation est appelée p-cycle ou cycle d’ordre p. On appelle support du cycle σ l’ensemble {a1 , . . . , ap } . Définition 2 Un 2 -cycle τ de Sn est appelée transposition. Il existe alors deux éléments distincts i et j de [[1, n]] tels que : τ (i) = j
, τ (j) = i
et ∀x �∈ {i, j} τ (x) = x.
Remarques • Une transposition τ vérifie τ 2 = Id ; on a donc τ −1 = τ (c’est une involution). • Par définition, Id n’est pas un cycle.
Exo 26.2
• Il y a plusieurs façons d’écrire le même p-cycle. Par exemple, les cycles suivants sont identiques : (a1 a2 · · · ap )
(a2 a3 · · · ap a1 )
...
(ap a1 · · · ap−1 ).
• Le support d’un cycle est l’ensemble des éléments x ∈ [[1, n]] tels que σ(x) �= x. Étude de S2 et S3 • On a S2 = Id, (1 2) et on remarque que le groupe (S2 , ◦) est commutatif. • Les 6 éléments de S3 sont : ∗ l’application Id ;
∗ les trois transpositions τ1 = (2 3), τ2 = (1 3) et τ3 = (1 2) ; ∗ les deux 3 -cycles σ1 = (1 2 3) et σ2 = σ1−1 = (3 2 1).
2
Décomposition d’une permutation
Proposition 2 Deux cycles à supports disjoints commutent. Démonstration page 1003
Principe de démonstration.
Soit c1 et c2 des cycles à supports respectifs A1 et A2 . On suppose que A1 ∩ A2 = ∅ . Soit x ∈ [[1, n]] . On montre que (c1 ◦ c2 )(x) = (c2 ◦ c1 )(x) en distinguant les cas x �∈ A1 ∪ A2 et x ∈ A1 ∪ A2 .
983
Chapitre 26. Déterminants Remarque Soit c1 , c2 , . . . , cr des cycles à supports disjoints deux à deux. Comme ces permutations commutent deux à deux, la permutation obtenue en composant tous ces cycles peut s’écrire ci . i∈[[1,r]]
Proposition 3 Soit σ une permutation de [[1, n]]. On définit sur [[1, n]] la relation suivante : x Rσ y ⇐⇒ ∃k ∈ ZZ y = σ k (x).
Cette relation Rσ est une relation d’équivalence sur [[1, n]] .
Démonstration page 1003
Proposition 4 Soit σ une permutation de [[1, n]] et x ∈ [[1, n]]. Il existe un entier naturel non nul p tel que :
x, σ(x), . . . , σ p−1 (x) soient deux à deux distincts
et σ p (x) = x.
La classe d’équivalence de x pour la relation d’équivalence Rσ est alors l’en semble x, σ(x), . . . , σ p−1 (x) , appelé orbite de x .
Si σ(x) �= x, la restriction de σ à l’orbite de x est le cycle (x σ(x) · · · σ p−1 (x)).
Démonstration page 1003
Principe de démonstration. Montrer que le plus petit élément de l’ensemble {q ∈ IN∗ : σ q (x) = x} convient.
Ex. 1. Soit σ =
1 7
2 2
3 8
4 5
5 1
6 3
7 4
8 . 6
Pour la relation d’équivalence Rσ , on a, en notant cl(x) l’orbite de x : cl(1) = {1, 7, 4, 5} = cl(4) = cl(5) = cl(7) ; cl(3) = {3, 8, 6} = cl(6) = cl(8) ; cl(2) = {2}. Tout élément de [[1, 8]] a la même image par σ et par (1 7 4 5)(3 8 6) ; ces applications sont donc égales. Les cycles apparaissant dans la décomposition de σ ont pour support les orbites de σ non réduites à un point.
984
I Groupe symétrique L’exemple précédent est, en fait, une illustration du théorème suivant. Théorème 5 (Décomposition en produit de cycles à supports disjoints) Toute permutation de [[1, n]] autre que l’identité se décompose, de manière unique à l’ordre près des facteurs, en un produit de cycles à supports deux à deux disjoints. Démonstration (non exigible) page 1004
Point méthode Pour décomposer une permutation en produit de cycles à supports disjoints, on considère les orbites de σ de cardinal au moins égal à 2 ; puis on construit les cycles associés. On sait alors que σ est le produit des cycles ainsi construits. Ex. 2. Pour décomposer en produit de cycles à supports disjoints la permutation : σ=
1 2
2 6
3 4
4 5
5 3
6 , 1
on commence par expliciter les orbites non triviales : σ
σ
σ
1 �−→ 2 �−→ 6 �−→ 1
puis
σ
σ
σ
3 �−→ 4 �−→ 5 �−→ 1.
On en déduit que σ = (1 2 6)(3 4 5).
Pour terminer ce paragraphe, on démontre que toute permutation peut s’écrire comme produit de transpositions en utilisant le théorème de décomposition précédemment démontré. Lemme 6 Soit p 2 et a1 , . . . , ap des éléments de [[1, n]] distincts deux à deux. Alors : (a1 a2 )(a2 a3 ) · · · (ap−1 ap ) = (a1 a2 · · · ap ).
Démonstration page 1004
Proposition 7 (Décomposition en produit de transpositions) Toute permutation de [[1, n]] est un produit de transpositions. Démonstration page 1004
Attention La décomposition en produit de transpositions n’est pas unique. Par exemple, (1 2 3) = (1 3)(1 2) = (1 2)(2 3). Point méthode Pour décomposer une permutation en produit de transpositions, on peut d’abord décomposer la permutation en produit de cycles, puis utiliser l’écriture d’un cycle sous forme de produit de transpositions du lemme 6.
985
Chapitre 26. Déterminants
3
Signature
Théorème 8 Il existe un unique morphisme de groupes ε de Sn dans {−1, +1} tel que : ε(τ ) = −1 pour toute transposition τ .
On appelle signature cette application.
Démonstration (non exigible) page 1005
Corollaire 9 Si σ = τ1 · · · τp est une décomposition en produit de transpositions de la permutation σ , alors ε(σ) = (−1)p . Remarque Pour une permutation σ , il n’y a pas unicité de la décomposition en produit de transpositions. En revanche, la parité du nombre de transpositions intervenant dans un tel produit est indépendante de la décomposition. Ex. 3. La signature du p -cycle (a1 a2 · · · ap ) est (−1)p−1 , car on peut écrire : (a1 a2 · · · ap ) = (a1 a2 )(a2 a3 ) · · · (ap−1 ap ).
On en déduit alors, aisément, le corollaire qui suit. Corollaire 10 Soit c1 , . . . , cp des cycles de longueurs respectives ℓ1 , . . . , ℓp . Alors la permutation σ = c1 · · · cp a pour signature : ε(σ) = (−1)α
avec α =
p i=1
(ℓi − 1).
Point méthode Pour déterminer la signature d’une permutation, il suffit donc de la décomposer en un produit de cycles.
Exo 26.3
II
Formes p-linéaires alternées
Dans cette partie, E désigne un IK -espace vectoriel.
1
Formes 2-linéaires ou bilinéaires
Définition 3 Une forme 2-linéaire ou bilinéaire sur E est une application f de E × E dans IK telle que : 1. pour tout x fixé dans E , l’application E y
−→ IK soit linéaire ; �−→ f (x, y)
2. pour tout y fixé dans E , l’application E −→ IK soit linéaire. x �−→ f (x, y) 986
II Formes p-linéaires alternées
Ex. 4. L’application : IR2 × IR�2 (x1 , x2 ), (y1 , y2 )
�
−→ �−→
IR x 1 y1 + x 2 y2
est une forme bilinéaire sur IR2 , qui définit le produit scalaire usuel sur IR2 . De la même manière, l’application : IR3 × IR�3 −→ IR � (x1 , x2 , x3 ), (y1 , y2 , y3 ) �−→ x1 y1 + x2 y2 + x3 y3
est une forme bilinéaire sur IR3 , qui définit le produit scalaire usuel sur IR3 .
Ex. 5. Si E est de dimension 2 et (e1 , e2 ) une base de E , l’application suivante est une forme bilinéaire sur E : (x1 e1 + x2 e2 , y1 e1 + y2 e2 ) �−→ x1 y2 − x2 y1 . Ex. 6. Soit q un entier naturel non nul. L’application suivante est une forme bilinéaire sur Mq (IK) :
�
�2
Mq (IK) (A, B)
−→ �−→
IK tr(AB).
Ex. 7. L’application qui, à tout couple (f, g) de fonctions continues sur [0, 1] à valeurs dans IR , associe
�
0
1
�
�
f (t) g(t) dt , est une forme bilinéaire sur C 0 [0, 1], IR .
Expression d’une forme bilinéaire dans une base de E On suppose E de dimension n muni d’une base (ei )1in . Soit f une forme bilinéaire sur E . • Si u et v sont des vecteurs de E , il existe des familles de scalaires (ai )1in et (bi )1in telles que : u=
n �
ai e i
et
v=
f (u, v) = f
�
n �
ak e k ,
k=1
=
n �
k=1
=
n �
k=1
bi ei .
i=1
i=1
Alors, on a :
n �
n �
ℓ=1
bℓ eℓ
�
� � n � ak f e k , bℓ eℓ ak
�
ℓ=1
n �
ℓ=1
� n n � � ak bℓ f (ek , eℓ ). bℓ f (ek , eℓ ) = k=1 ℓ=1
• Réciproquement, si (yi,j )(i,j)∈[[1,n]]2 est une famille de scalaires, l’application : n n � � � bj ej �−→ ai bj yi,j ai e i , i=1
j=1
(i,j)∈[[1,n]]2
est une forme bilinéaire sur E .
987
Chapitre 26. Déterminants
2
Formes p-linéaires
Soit p ∈ IN∗ .
Définition 4 Une forme p-linéaire sur E est une application f de E p dans IK telle que, pour toute famille (u1 , . . . , up ) ∈ E p et pour tout i ∈ [[1, p]], l’application : E x
−→ IK �−→ f (u1 , . . . , ui−1 , x, ui+1 , . . . , up )
soit une application linéaire.
Ex. 8. Soit f1 , . . . , fp des formes linéaires sur E . Alors l’application : Ep (x1 , . . . , xp )
IK
−→
p
�−→
fk (xk )
k=1
est une forme p -linéaire sur E .
Expression d’une forme p-linéaire en dimension finie On suppose E de dimension n muni d’une base B = (ei )1in .
Proposition 11 Soit f une forme p-linéaire sur E et u1 , . . . , up des vecteurs de E , que l’on écrit dans la base B : n ∀j ∈ [[1, p]] uj = ai,j ei . i=1
Alors, on a :
f (u1 , . . . , up ) =
ai1 ,1 . . . aip ,p f (ei1 , . . . , eip ).
(i1 ,...,ip )∈[[1,n]]p
Démonstration page 1006
Remarque Si (yϕ )ϕ∈[[1,n]][[1,p]] est une famille de scalaires, l’application suivante est une forme p-linéaire sur E : n n aϕ(1),1 · · · aϕ(p),p yϕ . ai,p ei �−→ ai,1 ei , . . . , i=1
i=1
3
ϕ∈[[1,n]][[1,p]]
Formes n-linéaires alternées en dimension n
Soit n ∈ IN∗ . On suppose E de dimension n.
Définition 5 Une forme n-linéaire f sur E est dite alternée si, pour tout (u1 , . . . , un ) ∈ E n et 2
pour tout (i, j) ∈ [[1, n]] avec i �= j , on a :
ui = uj =⇒ f (u1 , . . . , un ) = 0.
988
II Formes p-linéaires alternées Proposition 12 Si f est une forme n-linéaire alternée, alors elle est antisymétrique, c’est-àdire qu’elle vérifie, pour tout (u1 , . . . , un ) ∈ E n et pour tout (i, j) ∈ IN2 tel que 1 i < j n : f (u1 , . . . , ui , . . . uj , . . . , un ) = −f (u1 , . . . , uj , . . . , ui , . . . , un ). ↑ i-ème
↑ j-ème
↑ i-ème
↑ j-ème
Démonstration page 1006
Principe de démonstration.
Pour un n -uplet (u1 , . . . , un ) de E n tel que ui = uj avec i < j , calculer f (u1 , . . . , u + uj , . . . , u + ui , . . . , un ) . i j ↑
i-ème
↑
j-ème
Remarque La réciproque est vraie. Soit en effet f une forme n-linéaire antisymétrique. Si (u1 , . . . , un ) ∈ E n et 1 i < j n sont tels que ui = uj , alors : f (u1 , . . . , ui , . . . , uj , . . . , un ) = −f (u1 , . . . , uj , . . . , ui , . . . , un ). ↑ i-ème
↑ j-ème
↑ i-ème
↑ j-ème
Par ailleurs, puisque ui = uj : f (u1 , . . . , ui , . . . , uj , . . . , un ) = f (u1 , . . . , uj , . . . , ui , . . . , un ). ↑ i-ème
↑ j-ème
↑ i-ème
↑ j-ème
On en déduit que f (u1 , . . . , ui , . . . uj , . . . , un ) = 0 , ce qui prouve que f est alternée.
4
Propriétés des formes n-linéaires alternées
La proposition 12 implique que, si f est une forme n-linéaire alternée sur E , alors, pour toute transposition τ ∈ Sn et pour tout (u1 , . . . , un ) ∈ E n , on a f (uτ (1) , . . . , uτ (n) ) = −f (u1 , . . . , un ), c’est-à-dire : f (uτ (1) , . . . , uτ (n) ) = ε(τ ) f (u1 , . . . , un ), où ε(τ ) désigne la signature de τ . Comme toute permutation s’écrit comme un produit de transpositions, en utilisant le corollaire 9 de la page 986, on obtient la proposition suivante. Proposition 13 Soit f une forme n-linéaire alternée sur E et σ ∈ Sn . Alors : ∀(u1 , . . . , un ) ∈ E n
f (uσ(1) , . . . , uσ(n) ) = ε(σ) f (u1 , . . . , un ).
Démonstration.
Soit σ ′ ∈ Sn , τ une transposition de [[1, n]] et (u1 , . . . , un ) ∈ E n . Pour tout i ∈ [[1, n]] , notons vi = uσ ′ (i) . Alors : f (uσ ′ (1) , . . . , uσ ′ (n) ) = f (v1 , . . . , vn ) = −f (vτ (1) , . . . , vτ (n) ) = −f (uσ ′ τ (1) , . . . , uσ ′ τ (n) ). On démontre ensuite le résultat par récurrence sur le nombre de facteurs apparaissant dans une décomposition de σ en produit de transpositions.
989
Chapitre 26. Déterminants Proposition 14 Soit f une forme n-linéaire alternée sur E . Si (u1 , . . . , un ) est une famille liée de vecteurs de E , alors f (u1 , . . . , un ) = 0 . Démonstration page 1006
Principe de démonstration. La famille étant liée, un des vecteurs est combinaison linéaire des autres. On utilise alors le caractère « n -linéaire alterné » de f .
Corollaire 15 Étant donné une forme n-linéaire alternée f sur E et (u1 , . . . , un ) ∈ E n , le scalaire f (u1 , . . . , un ) est inchangé si l’on ajoute à l’un des vecteurs de la famille une combinaison linéaire des autres.
Démonstration page 1007
5
Expression d’une forme n-linéaire alternée
Soit E un espace vectoriel de dimension n muni d’une base (e1 , . . . , en ). Soit ϕ une forme n-linéaire alternée sur E et u1 , . . . , un des vecteurs de E . On peut écrire : ∀j ∈ [[1, n]] uj =
n
ai,j ei
i=1
avec (ai,j )1i,jn ∈ Mn (IK).
Alors on a, d’après la proposition 11 de la page 988 :
ϕ(u1 , . . . , un ) =
ai1 ,1 . . . ain ,n ϕ(ei1 , . . . , ein )
(i1 ,...,in )∈[[1,n]]n
=
aσ(1),1 . . . aσ(n),n ϕ(eσ(1) , . . . , eσ(n) )
σ∈[[1,n]][[1,n]]
=
aσ(1),1 . . . aσ(n),n ϕ(eσ(1) , . . . , eσ(n) ),
σ∈Sn
la dernière égalité venant du fait que, lorsque σ n’est pas bijective, la famille (eσ(1) , . . . , eσ(n) ) possède au moins deux vecteurs égaux et alors son image par l’application n-linéaire alternée ϕ est nulle. La proposition 13 de la page précédente nous donne alors : ϕ(u1 , . . . , un ) =
σ∈Sn
990
ε(σ)aσ(1),1 . . . aσ(n),n ϕ(e1 , . . . , en ).
(∗)
III Déterminant d’une famille de vecteurs
III
Déterminant d’une famille de vecteurs
Dans cette partie, E désigne un IK -espace vectoriel de dimension finie notée n.
1
Définition
Théorème 16 Soit (e1 , . . . , en ) une base de E . • Il existe une unique forme n-linéaire alternée ϕ0 sur E telle que : ϕ0 (e1 , . . . , en ) = 1.
• Toute forme n-linéaire alternée sur E est proportionnelle à ϕ0 .
Démonstration page 1007 La démonstration de l’existence n’est pas exigible. Pour l’unicité et le deuxième point, utiliser l’expression d’une forme n -linéaire alternée.
Principe de démonstration.
Définition 6 Soit B une base de E et ϕ0 l’unique forme n-linéaire alternée sur E telle que ϕ0 (B) = 1 . Si (u1 , . . . , un ) est une famille de vecteurs de E , le scalaire ϕ0 (u1 , . . . , un ) s’appelle déterminant de la famille de vecteurs (u1 , . . . , un ) par rapport à la base B et se note detB (u1 , . . . , un ). On note detB l’application de E n dans IK définie par : (u1 , . . . , un ) �→ detB (u1 , . . . , un ). En reprenant la formule (∗) de la page ci-contre, on obtient la proposition suivante. Proposition 17 Soit B = (e1 , . . . , en ) une base de E et u1 , . . . , un des vecteurs de E , que l’on écrit dans la base B : n ai,j ei . ∀j ∈ [[1, n]] uj = i=1
Alors, on a :
detB (u1 , . . . , un ) =
ε(σ)aσ(1),1 aσ(2),2 . . . aσ(n),n .
σ∈Sn
Reprenons les notations de la proposition précédente : Ex. 9. Pour n = 2 , detB (u1 , u2 ) = a1,1 a2,2 − a1,2 a2,1 .
a1,1
On notera detB (u1 , u2 ) =
Ex. 10. Pour n = 3 :
a2,1
detB (u1 , u2 , u3 ) =
a1,2 . a2,2
a1,1 a2,2 a3,3 + a1,2 a2,3 a3,1 + a1,3 a2,1 a3,2 −a1,1 a2,3 a3,2 − a1,2 a2,1 a3,3 − a1,3 a2,2 a3,1 .
Ce résultat se retrouve facilement grâce à la règle de Sarrus de la page 995, mais on peut souvent s’en passer en pratique.
991
Chapitre 26. Déterminants
2
Propriétés
En reprenant les propriétés des formes n-linéaires alternées de la page 989, on obtient les deux propositions suivantes. Proposition 18 Soit B une base de E . Pour tout σ ∈ Sn et pour tout (u1 , . . . , un ) ∈ E n , on a : detB (uσ(1) , . . . , uσ(n) ) = ε(σ) detB (u1 , . . . , un ).
Proposition 19 Soit B une base de E et (u1 , . . . , un ) ∈ E n . Le scalaire detB (u1 , . . . , un ) est inchangé si l’on ajoute à l’un des vecteurs une combinaison linéaire des autres. Proposition 20 Soit B et B ′ deux bases de E .
Alors les formes n-linéaires detB et detB′ sont proportionnelles. Plus précisément : ∀(u1 , . . . , un ) ∈ E n
detB′ (u1 , . . . , un ) = detB′ (B) detB (u1 , . . . , un ).
Démonstration. Comme B est une base de E , d’après le théorème 16 de la page précédente et la définition 6 de la page précédente, toute forme n -linéaire alternée est proportionnelle à detB et en particulier la forme n -linéaire alternée detB′ . Il existe donc un scalaire λ tel que detB′ = λ detB , c’est-à-dire : ∀(u1 , . . . , un ) ∈ E n
detB′ (u1 , . . . , un ) = λ detB (u1 , . . . , un ).
En prenant (u1 , . . . , un ) = B et puisque detB (B) = 1 , on obtient λ = detB′ (B) .
Corollaire 21 Soit B et B ′ deux bases de E . Alors detB′ (B) detB (B ′ ) = 1. Démonstration.
On prend (u1 , . . . , un ) = B′ dans la relation de la proposition 20.
Théorème 22 Si B est une base de E et (u1 , . . . , un ) une famille de vecteurs de E , les propriétés suivantes sont équivalentes : (i) (ii)
(u1 , . . . , un ) est une base de E ; detB (u1 , . . . , un ) �= 0 .
Démonstration. (i) ⇒ (ii) C’est une conséquence immédiate du corollaire 21.
(ii) ⇒ (i) Puisque E est de dimension n , si (ui )1in est une famille libre de E , alors (ui )1in est une base de E . Par la contraposée, si (ui )1in n’est pas une base de E , elle est liée et en utilisant la proposition 14 de la page 990, on obtient : detB (u1 , . . . , un ) = 0.
992
IV Déterminant d’un endomorphisme
3
Interprétation géométrique
On considère un parallélogramme ABCD du plan IR2 que l’on munit de sa base canonique notée B . On écrit sous forme trigonométrique les af−− → −−→ fixes des vecteurs AB et AD : ′
′
′
cos θ D xyA +r +r ′ sin θ ′
θ) ′ − in(θ s
r′
′
= rr′ (cos θ sin θ′ − sin θ cos θ′ ) O
A
r
− → = reiθ − → = r′ eiθ , z− et z− AB AD −− → de sorte que AB = r cos(θ)e1 + r sin(θ)e2 −−→ et AD = r′ cos(θ′ )e1 + r′ sin(θ′ )e2 . L’aire géométrique du parallélogramme ABCD est alors donnée par rr′ | sin(θ′ − θ)|. De plus, r cos θ r′ cos θ′ −− → −−→ e2 detB (AB, AD) = r sin θ r′ sin θ′
C
θ′ − θ
r θ′
+r cos θ B xyA A +r sin θ
θ
A xA yA
e1
= rr′ sin(θ′ − θ).
Ce réel est appelé aire orientée du parallélogramme ABCD . Remarque De même, si A, B , C , D sont quatre points de l’espace IR3 qu’on munit −− → −→ −−→ de sa base canonique notée B , alors detB (AB, AC, AD) est appelé volume orienté − − → −→ −−→ du parallélépipède construit sur les trois vecteurs AB, AC, AD .
IV
Déterminant d’un endomorphisme
Soit E un IK -espace vectoriel de dimension n 1 .
1
Définition
Proposition 23 Soit f ∈ L(E). Il existe alors un unique scalaire λ, appelé déterminant de f , tel que pour toute base B de E et pour tout (u1 , . . . , un ) ∈ E n , on ait : detB f (u1 ), . . . , f (un ) = λ detB (u1 , . . . , un ). Exo 26.5
Le déterminant de f se note det(f ) et, pour toute base B de E , on a : det(f ) = detB f (B) .
Démonstration page 1008
Ex. 11. Comme detB (B) = 1 , on obtient que det IdE = 1 . Ex. 12. Soit σ ∈ Sn et B une base de E . L’endomorphisme de E défini par : ∀i ∈ [[1, n]]
f (ei ) = eσ(i)
a pour déterminant det f = detB (eσ(1) , eσ(2) , . . . , eσ(n) ) = ε(σ) .
993
Chapitre 26. Déterminants
2
Propriétés
Proposition 24 Soit (f, g) ∈ L(E)2 et λ ∈ IK . Alors : det(λ f ) = λn det f
et
det(f ◦ g) = det f det g. Démonstration page 1008
Remarques 1. Même si (L(E), ◦) n’est pas commutatif (en général), on a tout de même : ∀(f, g) ∈ L(E)2
det(f ◦ g) = det(g ◦ f ).
2. Par ailleurs, si f ∈ L(E) est une homothétie de rapport λ, alors det(f ) = λn . Ex. 13. On suppose que E est un IR -espace vectoriel de dimension finie n et qu’il existe f ∈ L(E) tel que f 2 = − IdE .
Alors, par passage au déterminant, det(f )2 = det(f 2 ) = det(− IdE ) = (−1)n puis n = dim E est un entier pair puisque det(f )2 est un réel positif.
Proposition 25 Un endomorphisme f de E est un automorphisme si, et seulement si, son déterminant est non nul et l’on a alors : det f −1 = (det f )−1 . Démonstration.
Soit B = (ei )1in une base de E . On a :
det f = detB f (e1 ), . . . , f (en ) . Donc, d’après le théorème 22 de la page 992, le scalaire det f est non nul si, et seulement si, f (e1 ), . . . , f (en ) est une base de E , c’est-à-dire si, et seulement si, f est un automorphisme de E . La proposition 24 permet alors d’écrire :
det(f ) det f −1 = det(IdE ) = 1
et donc det f −1 = (det f )−1 .
Remarque L’application det induit donc un morphisme de groupes de (GL(E), ×) vers (IK∗ , ×). 994
V Déterminant d’une matrice carrée
V
Déterminant d’une matrice carrée
Soit n ∈ IN∗ et E un IK -espace vectoriel de dimension n.
1
Définition
Définition 7 Pour A ∈ Mn (IK), on appelle déterminant de A, et l’on note det(A), le déterminant de la famille de ses vecteurs colonnes dans la base canonique de IKn . Notation
Exo 26.6
Si A = (ai,j )1i,jn , le déterminant a1,1 · · · a1,j .. .. . . det A = ai,1 · · · ai,j . .. .. . an,1 · · · an,j
de A se note : · · · a1,n .. . · · · ai,n . .. . · · · an,n
Proposition 26 Si A = (ai,j )1i,jn est une matrice carrée de taille n, on a : ε(σ) aσ(1),1 aσ(2),2 . . . aσ(n),n . det A = σ∈Sn
Démonstration.
Ex. 14.
Ex. 15.
a b a1,1 a2,1 a3,1
C’est la formule démontrée à la page 1007.
c = ad − bc . d a1,2 a2,2 a3,2
a1,3 a2,3 a3,3
= a1,1 a2,2 a3,3 + a1,2 a2,3 a3,1 + a1,3 a2,1 a3,2 −a1,1 a2,3 a3,2 − a1,2 a2,1 a3,3 − a1,3 a2,2 a3,1 .
Cette formule peut se retrouver à l’aide de la méthode dite de Sarrus ; on recopie les deux premières lignes de la matrice sous la troisième et l’on effectue les produits en diagonale, chacun étant affecté du signe + ou − selon le schéma ci-contre. Attention Cette méthode n’est pas généralisable à des matrices de taille différente de 3 .
−
a1,1
a1,2
a1,3
−
a2,1
a2,2
a2,3
−
a3,1
a3,2
a3,3
a1,1
a1,2
a1,3
+
a2,1
a2,2
a2,3
+ +
995
Chapitre 26. Déterminants Corollaire 27 Si (u1 , . . . , un ) est une famille de n vecteurs de E dont A est la matrice dans une base B , alors det A = detB (u1 , . . . , un ). Démonstration. Ce résultat est une conséquence de la formule trouvée dans la démonstration du théorème 16 de la page 991. Ex. 16. Si D est la matrice diagonale d’éléments diagonaux λ1 , . . . , λn , on a : det D =
n
λi .
i=1
En effet, si l’on note B = (e1 , . . . , en ) la base canonique de IKn , D est la matrice de la famille (λ1 e1 , . . . , λn en ) par rapport à la base B et on a donc : det D = detB (λ1 e1 , . . . , λn en ) =
n i=1
λi
detB (e1 , . . . , en ) =
n
λi .
i=1
En particulier, det In = 1 .
Proposition 28 Soit f ∈ L(E) et B = (ei )1in une base de E . Si A est la matrice de f dans la base B , alors det f = det A. Démonstration.
Par définition de la matrice d’un endomorphisme dans une base, on a :
det A = detB (MatB (f )) = detB (f (e1 ), . . . , f (en )) = det f.
2
Propriétés
Proposition 29 Soit (A, B) ∈ Mn (IK)2 , P ∈ GLn (IK) et λ ∈ IK. Alors : • det(λ A) = λn det A ;
• det(AB) = det A det B ; • det(P −1 AP ) = det(A).
Démonstration page 1008 Il suffit de considérer les endomorphismes de IKn canoniquement associés aux matrices A et B .
Principe de démonstration.
Proposition 30 Une matrice A ∈ Mn (IK) est inversible si, et seulement si, det A �= 0 et alors : det A−1 = (det A)−1 .
Démonstration page 1009
Principe de démonstration.
Utiliser une propriété similaire démontrée pour les endomorphismes.
996
V Déterminant d’une matrice carrée Remarque L’application det induit donc un morphisme de groupes de (GLn (IK), ×) vers (IK∗ , ×). Proposition 31 L’application qui à une matrice carrée de taille n associe son déterminant est une forme n-linéaire alternée sur l’espace vectoriel des matrices lignes. Démonstration.
La formule : det A =
�
ε(σ) aσ(1),1 aσ(2),2 . . . aσ(n),n
σ∈Sn
montre que A �→ det A permet de définir une forme n -linéaire sur l’espace vectoriel des matrices lignes, puisque dans tous les produits ci-dessus intervient un et un seul élément de chaque ligne de A . D’autre part, si deux lignes sont égales, alors la matrice n’est pas inversible et donc son déterminant est nul, ce qui prouve que cette forme n -linéaire est alternée.
Remarque Par définition, A �→ det(A) est aussi une forme n-linéaire alternée sur l’espace vectoriel des matrices colonnes. Corollaire 32
� � Étant donné une matrice A ∈ Mn (IK), on a det A = det AT .
Démonstration.
Les applications :
(C1 , . . . , Cn ) �→ det(C1 . . . Cn )
et
C1 T . (C1 , . . . , Cn ) �→ det .. Cn T
sont des formes n -linéaires alternées non nulles sur l’espace vectoriel des matrices colonnes. Elles sont donc proportionnelles et il existe un scalaire λ tel que : ∀A ∈ Mn (IK)
�
�
det A = λ det AT .
En prenant A = In , on en déduit λ = 1 .
Remarque La relation det A = det(AT ) s’écrit aussi : � � ε(σ)aσ(1),1 . . . aσ(n),n = ε(σ)a1,σ(1) . . . an,σ(n) ; σ∈Sn
σ∈Sn
elle peut donc se retrouver en remarquant que, pour σ ∈ Sn , on a : aσ(1),1 . . . aσ(n),n = a1,σ−1 (1) . . . an,σ−1 (n)
par permutation des termes dans le produit et, comme s �→ s−1 est une bijection de Sn sur lui-même, on peut effectuer le changement d’indice [σ ′ = σ −1 ] dans la somme. 997
Chapitre 26. Déterminants
VI
Calcul des déterminants
1
Opérations sur les lignes ou les colonnes
L’application qui à une matrice carrée associe son déterminant pouvant être vue comme une forme n-linéaire alternée sur l’espace vectoriel des matrices colonnes ou des matrices lignes, les propriétés des formes n-linéaires alternées permettent d’énoncer les règles suivantes. • Si une matrice a deux colonnes (ou deux lignes) identiques, son déterminant est nul. • Si l’on échange deux colonnes (ou deux lignes) d’une matrice, on change son déterminant en son opposé. • Si l’une des colonnes (respectivement lignes) d’une matrice est combinaison linéaire des autres colonnes (respectivement des autres lignes), alors son déterminant est nul. • Si une matrice a une colonne (ou une ligne) nulle, son déterminant est nul.
• Le déterminant d’une matrice est inchangé si l’on ajoute à une colonne (respectivement à une ligne) une combinaison linéaire des autres colonnes (respectivement des autres lignes). • Si l’on multiplie une colonne (ou une ligne) d’une matrice par un scalaire λ, son déterminant est multiplié par λ. Par conséquent, si l’on multiplie par λ tous les coefficients d’une matrice n × n, son déterminant est multiplié par λn . Point méthode Ces règles de transformation d’un déterminant permettent : • soit de prouver qu’il est nul ;
• soit d’introduire dans une colonne (respectivement une ligne) un maximum de 0 afin d’utiliser avec profit les résultats qui vont suivre, à savoir développer par rapport à une ligne ou une colonne. Ex. 17. Sans les calculer explicitement, justifions que les déterminants suivants sont nuls : 1 2 3 2 1 2 1 2 3 2 3 4 . 1 2 4 , 1 3 1 et 3 4 5 0 0 0 1 2 5
Le premier déterminant est nul, puisque la matrice a deux colonnes proportionnelles. Le second aussi, puisque la troisième ligne est nulle. Enfin, le troisième est nul car la deuxième ligne est la demi-somme des deux autres. Ex. 18. Soit A ∈ A2n+1 (IK) une matrice antisymétrique. Alors : det(A) = det(AT ) = det(−A) = (−1)2n+1 det(A) = − det(A),
donc det(A) = 0 . 998
VI Calcul des déterminants
2
Développement suivant une colonne ou une ligne
On suppose dans cette partie n 2 . Proposition 33 Soit A une matrice carrée de la forme :
Alors det A = an,n det A′ .
A=
0 .. .
A′
0 an,n
∗ ··· ∗
.
Démonstration page 1009 On utilise la formule de la proposition 26 de la page 995 en distinguant les permutations σ telles que σ(n) = n des autres.
Principe de démonstration.
Corollaire 34 Soit A = (ai,j )1i,jn une matrice triangulaire de Mn (IK). Alors on a : det A =
n �
ai,i .
i=1
Démonstration. • Comme le déterminant d’une matrice est égal au déterminant de sa transposée, il suffit de démontrer le résultat pour les matrices triangulaires inférieures. • Si A est triangulaire inférieure, la proposition précédente nous donne : det A = an,n det A′ ,
où A′ est la sous-matrice de A obtenue en supprimant la dernière ligne et la dernière colonne. Le résultat est alors immédiat par récurrence.
Ex. 19. Soit a , b et c trois scalaires. Cherchons � � 1 a � ∆=� 1 b � 1 c
On a successivement :
� � 1 a � ∆=� 0 b−a � 0 c−a
a2 b − a2 c2 − a2 2
� � � = (b − a)(c − a) � � � � � = (b − a)(c − a) � �
1 0 0 1 0 0
� � � � �
� � � � � � a a2 � � 1 b+a � 0 c−b � a 1 1
= (b − a)(c − a)(c − b).
a2 b+a c+a
une expression factorisée du déterminant : a2 b2 c2
� � � �. �
L2 ← L2 − L1 L3 ← L3 − L1 (mise en facteur dans L2 et L3 )
L3 ← L3 − L2 (déterminant d’une matrice triangulaire)
999
Chapitre 26. Déterminants Définition 8 2
Soit A = (ai,j )1i,jn ∈ Mn (IK) et (i, j) ∈ [[1, n]] . On appelle :
• mineur d’indice (i, j) le déterminant ∆i,j de la matrice extraite de A obtenue en supprimant la i -ème ligne et la j -ème colonne de A,
• cofacteur d’indice (i, j) le scalaire (−1)i+j ∆i,j . Remarque Les matrices obtenues à partir de la matrice A dans la définition précédente sont des matrices carrées de taille n − 1 , ce qui justifie l’existence de ∆i,j . Théorème 35 (Développement suivant une colonne) Soit A = (ai,j )1i,jn ∈ Mn (IK). On a : ∀j ∈ [[1, n]]
det A =
n �
ai,j (−1)i+j ∆i,j .
i=1
Démonstration page 1009
En appliquant ce résultat à la transposée, on obtient le théorème suivant. Théorème 36 (Développement suivant une ligne) Soit A = (ai,j )1i,jn ∈ Mn (IK). On a : ∀i ∈ [[1, n]]
det A =
n �
ai,j (−1)i+j ∆i,j .
j=1
Point méthode Dans la pratique, pour calculer un déterminant, on pourra combiner l’utilisation des opérations élémentaires pour faire apparaitre des coefficients nuls et la formule de développement suivant une ligne ou une colonne (qui contient beaucoup de coefficients nuls par exemple).
Exo 26.7 Exo 26.8
3
Déterminant de Vandermonde
Définition 9 Étant donné des scalaires x0 , . . . , xn , on appelle déterminant de Vandermonde associé à la liste (x0 , . . . , xn ) le déterminant de la matrice de taille n + 1 suivante :
Il sera noté V (x0 , . . . , xn ). 1000
1 x0 x20 .. .
1 x1 x21 .. .
··· 1 · · · xn · · · x2n .. .
xn0
xn1
· · · xnn
.
VI Calcul des déterminants Proposition 37 Étant donné des scalaires x0 , . . . , xn , on a : V (x0 , x1 , . . . , xn ) =
�
0j card (F ), alors f n’est pas injective. Point méthode (principe des tiroirs) Si l’on place n objets dans m tiroirs, avec n > m, alors il y a un tiroir qui contient au moins deux objets.
1054
II Dénombrement
Ex. 4. Soit n ∈ IN∗ . Parmi n + 1 réels de l’intervalle [0, 1] , il y en a au moins deux dont la 1 distance est inférieure ou égale à · n En effet, on peut diviser le segment [0, 1] en n « tiroirs », les intervalles disjoints :
0,
,
n n
,...,
n − 1 n
,1 ,
1 , dont la réunion est [0, 1] . Chacun des n + 1 réels appartient à l’un de ces n n intervalles, donc nécessairement l’un des intervalles contient au moins deux des n + 1 réels, dont 1 la distance est ainsi inférieure ou égale à · n Ex. 5. Dans une pièce, des personnes (au moins deux) sont en train de se serrer la main (pour se saluer). Alors, à chaque instant, il y a deux personnes qui ont serré la main à un nombre identique de personnes. En effet, si à un instant donné k 2 personnes ont déjà serré des mains, le nombre de mains serrées par l’une de ces k personnes est un entier entre 1 et k − 1 . Donc nécessairement deux de ces personnes ont serré le même nombre de mains, car l’application qui à chacune de ces personnes associe le nombre de mains qu’elle a serrés ne peut pas être injective.
de longueur
Exo 28.5
1 2
1 , n
Théorème 12 Soit E et F deux ensembles finis de même cardinal, ainsi que f une application de E dans F . Il y équivalence entre : (i) f est injective ; Principe de démonstration.
(ii) f est surjective ;
(iii) f est bijective.
Démonstration page 1065 C’est une conséquence des propositions 4 de la page 1053
et 11 de la page précédente. Exo 28.6
Remarque Le résultat s’applique en particulier si F = E , c’est-à-dire si E est un ensemble fini et f une application de E dans E .
II
Dénombrement
Dénombrer, c’est compter le nombre d’éléments d’un ensemble, c’est-à-dire déterminer son cardinal. Dans les démonstrations, il sera souvent fait usage de la proposition 2 de la page 1053. De manière générale, pour dénombrer un ensemble, on montre souvent qu’il a même nombre d’éléments qu’un autre ensemble plus simple dont on connaît le cardinal, même si la bijection n’est pas exhibée formellement.
1
Produit cartésien
On rappelle que les éléments d’un produit cartésien de p ensembles sont appelés des p-listes ou p-uplets. Proposition 13 Soit E et F deux ensembles finis. Alors E × F est fini et : card (E × F ) = card (E) × card (F ).
Démonstration page 1065
1055
Chapitre 28. Dénombrement Proposition 14 Soit p ∈ IN∗ et E1 , . . . , Ep des ensembles finis. Alors E1 × · · · × Ep est fini et : p card (Ek ). card (E1 × · · · × Ep ) = k=1
Démonstration. On démontre la propriété par récurrence sur p . Pour passer du rang p au rang p + 1 , on remarque que l’application : (x1 , . . . , xp , xp+1 ) �→ ((x1 , . . . , xp ), xp+1 )
réalise une bijection de E1 ×· · · × Ep ×Ep+1 sur (E1 ×· · · × Ep )×Ep+1 , ce qui permet d’écrire : card (E1 × · · · × Ep × Ep+1 ) = card (E1 × · · · × Ep ) × card (Ep+1 )
et de conclure grâce à l’hypothèse de récurrence.
Corollaire 15 Si E est un ensemble fini, alors card (E p ) = (card (E))p . Exo 28.7
Démonstration.
2 Exo 28.8 Exo 28.9
On applique la proposition 14, au cas E1 = · · · = Ep = E .
Applications
Proposition 16 Soit E et F deux ensembles finis non vides. Alors l’ensemble F E des applications de E dans F est un ensemble fini et : card (F E ) = (card (F ))card (E) . Démonstration page 1065
Principe de démonstration. On pose p = card (E) et l’on note E = {a1 , . . . , ap } . Il suffit E p
de se convaincre que l’application qui, à f ∈ F , associe le p -uplet f (a1 ), . . . , f (ap ) ∈ F est bijective.
Remarque C’est le résultat de la proposition 16 qui explique la notation F E utilisée pour désigner l’ensemble des applications de E dans F . Parties d’un ensemble Proposition 17 Si E est un ensemble de cardinal n, l’ensemble P(E) des parties de E a pour cardinal 2n . Démonstration.
Il a été démontré dans le chapitre 3 (remarque de la page 41) que l’appli-
cation suivante : u : P(E) A
−→ �−→
{0, 1}E 1A
est une bijection. On a donc card (P(E)) = card {0, 1}E = 2n .
Remarque On peut retrouver ce résultat par le raisonnement suivant : déterminer une partie A de E , c’est déterminer pour chaque élément de E s’il appartient ou non à A. Il y a 2 possibilités pour chaque élément de E donc, en tout, 2n choix. 1056
II Dénombrement
3
Arrangements
Définition 2 Soit p ∈ IN∗ . On appelle p-arrangement d’un ensemble E , toute p-liste d’éléments distincts de E . Remarque Si card (E) < p, on ne peut pas trouver p éléments distincts dans E . Il n’y a donc pas de p-arrangement d’éléments de E . Théorème 18 Si p ∈ IN∗ , alors le nombre de p-arrangements d’un ensemble de cardinal n est : n(n − 1) · · · (n − p + 1). n! · Si 1 p n, il est donc égal à (n − p)!
Démonstration page 1066
Remarques • Si n < p, alors n(n − 1) · · · (n − p + 1) = 0 , car n − n est l’un des p facteurs du produit, ce qui est bien le résultat attendu. • Le nombre de p-arrangements d’un ensemble de cardinal n est parfois noté Apn . Ex. 6. Le nombre de mots de p lettres distinctes qu’on peut former avec un alphabet de n n! · lettres est (n−p)! Ex. 7. Une course de chevaux comporte 20 partants. Le nombre de résultats possibles de tiercés dans l’ordre est 20 · 19 · 18 = 6840 .
Proposition 19 Le nombre d’injections d’un ensemble E de cardinal p dans un ensemble F de cardinal n est n(n − 1) · · · (n − p + 1).
Démonstration page 1066 On note E = {a1 , . . . , ap } . Considérer l’application qui, à f ∈ F , associe le p -uplet f (a1 ), . . . , f (ap ) ∈ F p .
Principe de démonstration. E
Corollaire 20 Si card (E) = card (F ) = n, le nombre de bijections de E sur F est n!.
Démonstration. Si E et F ont même cardinal n , les bijections de E sur F sont exactement les injections de E dans F (d’après le théorème 12 de la page 1055). Il y en a donc n! = n! . 0! On rappelle qu’une permutation d’un ensemble E est une bijection de E sur luimême. Exo 28.10
Corollaire 21 Le nombre de permutations d’un ensemble de cardinal n est n!. 1057
Chapitre 28. Dénombrement
4
Combinaisons
n Dans le chapitre 4, ont été définis les coefficients binomiaux . On rappelle que, p pour tous entiers naturels n et p : n(n − 1) · · · (n − p + 1) n = · p p! On remarque que le numérateur est le nombre de p-arrangements d’un ensemble de cardinal n. Définition 3 Soit p ∈ IN. Un sous-ensemble de cardinal p d’un ensemble E est appelé une p-combinaison d’éléments de E . Théorème 22 Soit n et p des entiers naturels. Le nombre de sous-ensembles de cardinal p (ou n p-combinaisons) d’un ensemble E de cardinal n est . Exo p 28.12 Exo 28.11
Démonstration page 1066
Principe de démonstration.
Soit E un ensemble de cardinal n . Si p 1 , on considère l’application qui à un p -arrangement (a1 , . . . , ap ) de E associe le sous-ensemble {a1 , . . . , ap } de E . On examine le nombre d’antécédents de chaque sous-ensemble {a1 , . . . , ap } .
Remarques 1. Si n et p sont des entiers tels que 0 p n, le nombre de sous-ensembles de n! · cardinal p d’un ensemble de cardinal n est donc p!(n − p)!
2. Si n < p, il n’y a pas de sous-ensemble de cardinal p dans un ensemble de cardinal n. On retrouve le fait que np = 0 dans ce cas.
Propriétés des coefficients
n p
Les propriétés des coefficients binomiaux ont été démontrées par des calculs, dans le chapitre 4. Nous proposons de les redémontrer en faisant appel à des méthodes combinatoires, c’est-à-dire à des dénombrements. Proposition 23 Si n et p sont des entiers tels que 0 p n, on a : n n = . p n−p Démonstration.
L’application s qui, à un sous-ensemble A de [[1, n]] , associe son complémentaire est bijective, car involutive (c’est-à-dire vérifie s ◦ s = IdP([[1,n]]) ). Il y a donc autant de façons de choisir un sous-ensemble de cardinal p , soit
n p
complémentaire, i.e. un sous-ensemble de cardinal (n − p) , soit
1058
, que de façons de choisir son
n n−p
. D’où l’égalité.
II Dénombrement Proposition 24 (Formule de Pascal) Si n et p sont des entiers tels que 1 p n, on a : n n−1 n−1 = + . p p−1 p Démonstration.
On fixe un élément a de [[1, n]] . Parmi les parties de [[1, n]] de cardinal p ,
on distingue : • celles qui contiennent a ; il y a en a éléments de [[1, n]] \ {a} ;
n−1 p−1
car, en plus de a , cela revient à choisir p − 1
• celles qui ne contiennent pas a ; il y a en a de [[1, n]] \ {a} .
n−1 p
, car cela revient à choisir p éléments
Comme ces ensembles de parties sont disjoints et que le nombre total de parties de E de cardinal p est np , on obtient la formule voulue. On note que la formule reste vérifiée pour p > n .
Ex. 8. Formule du binôme La formule du binôme a été démontrée page 118 par récurrence. Nous en proposons une autre démonstration fondée sur des arguments combinatoires. Soit a et b deux nombres complexes, n un entier naturel. 1. On développe (a + b)n = (a + b) × (a + b) × · · · × (a + b) .
Chaque terme du produit s’obtient en prenant un facteur dans chaque parenthèse, a ou b . S’il y a k facteurs a , il y a n − k facteurs b . Donc chaque terme est de la forme ak bn−k , où 0 k n .
2. Pour un k fixé, il y autant de termes de la forme ak bn−k qu’il y a de façons de choisir les k parenthèses où l’on prend les facteurs a , c’est-à-dire nk .
Comme k peut varier de 0 à n , ce qui précède montre que (a + b)n =
n n k=0
Exo 28.13
k
ak bn−k .
Applications de la formule du binôme Ex. 9. En prenant a = b = 1 dans la formule du binôme, on obtient
n n k=0
k
= 2n . Cela
donne une nouvelle démonstration du fait que, si card (E) = n , alors card P(E) = 2n . En effet si l’on note, pour 0 k n , Pk (E) l’ensemble des parties de E de cardinal k , alors P(E) est la réunion disjointe de P0 (E), P1 (E), . . . , Pn (E) , donc : card P(E) =
n k=0
card Pk (E) =
Remarque Pour 1 p n, on a p
n p
=n
n n k=0
n−1 p−1
k
= 2n .
.
1059
Chapitre 28. Dénombrement Ex. 10. Soit n un entier naturel. Calculons
n n
k
k=0
Exo 28.14
k
, par deux méthodes.
1. En utilisant la remarque qui précède, on obtient :
n n k
k=0
k
=
n n k
k
k=1
=
n n−1 n
k=1
k−1
=n
n−1 n−1 j
j=0
= n2n−1 .
2. On peut également partir de la formule du binôme et dériver. On a : ∀x ∈
IR∗+
n
(x + 1) =
∀x ∈
ce qui donne, en évaluant en 1 ,
n(x + 1)
n n
k
k=1
5
k
n−1
=
xk
k
k=0
et donc, en dérivant : IR∗+
n n
n n k
k
= n2n−1 .k=1
xk−1 ,
Techniques classiques de dénombrement
Choix successifs Point méthode Soit p ∈ IN∗ . On cherche à dénombrer un ensemble de plistes (x1 , . . . , xp ). On suppose que : • x1 peut prendre n1 valeurs ;
Exo 28.15 Exo 28.16
• pour chaque valeur de x1 , l’élément x2 peut prendre n2 valeurs, . . . ;
• pour chaque valeur de (x1 , . . . , xp−1 ), l’élément xp peut prendre np valeurs.
Alors, le nombre total de valeurs que peut prendre le p-uplet (x1 , . . . , xp ) est n1 × · · · × np . Ex. 11. Soit k , p et n des entiers tels que 0 k p n . On souhaite dénombrer l’ensemble des couples (A, B) de parties d’un ensemble E de cardinal n telles que card A = k, card B = p
et
A ⊂ B.
Pour cela, on peut : • soit choisir B , et il y a np choix possibles, puis choisir A ; alors, B étant fixé, A est simplement une partie de B de cardinal k ; il y en a couples (A, B) ;
p k
, ce qui donne au total
np p
k
• soit choisir A , et il y a nk choix possibles, puis choisir B ; alors, A étant fixé, B s’obtient en rajoutant p − k éléments à A qui doivent être choisis dans E \ A ; ce dernier ensemble choix, ce qui donne au total nk n−k couples (A, B) . étant de cardinal n − k , il y a n−k p−k p−k
On en déduit donc :
np p
k
=
nn−k k
p−k
.
Remarque On voit qu’une égalité entre deux expressions entières peut résulter du dénombrement d’un ensemble par deux méthodes distinctes. 1060
II Dénombrement Partition Exo 28.17 Exo 28.18
Si on dispose d’une partition (A1 , A2 , . . . , An ) d’un ensemble n � fini E , alors on a card (E) = card Ai .
Point méthode
i=1
Remarque Ce principe a été utilisé dans la démonstration de la proposition 13 de la page 1055.
Ex. 12. Soit E un ensemble fini de cardinal n . Dénombrons le nombre de couples (A, B) de parties de E tels que A ⊂ B . • Première méthode On note C l’ensemble de ces couples (A, B) et, pour k ∈ [[0, n]] , on � � note Ck l’ensemble des élément de C pour lesquels card B = k . On a alors card Ck = nk 2k . En effet, il faut choisir une partie quelconque B de E de cardinal k , puis une partie A quelconque de B . Comme C0 , C1 , . . . , Cn est une partition de C , on obtient : card C =
n � k=0
card Ck =
n � � � n
2k = (2 + 1)n = 3n ,
k
k=0
d’après la formule du binôme. • Deuxième méthode Le résultat trouvé incite à penser qu’on peut l’obtenir en montrant que C est en bijection avec un ensemble de cardinal 3n . On construit une application Φ de C dans {0, 1, 2}E . Si (A, B) ∈ C , on définit l’application Φ(A, B) ∈ {0, 1, 2}E par :
∀x ∈ E
Φ(A, B)(x) =
0 si x ∈ A
1 2
si x ∈ B \ A si x ∈ / B.
Montrons que Φ est bijective. Pour cela, considérons une application f de E dans {0, 1, 2} et cherchons (A, B) ∈ C tel que Φ(A, B) = f . Cela est réalisé si, et seulement si : A = f −1 ({0})
et
B = f −1 ({0, 1}).
Les sous-ensembles A et B sont déterminés de manière unique et il est clair que, par construction, A ⊂ B , donc (A, B) ∈ C . Ainsi toute application f a un antécédent unique : Φ est bijective. � � On retrouve card C = card {0, 1, 2}E = 3n .
1061
Chapitre 28. Dénombrement Compter plusieurs fois la même chose
Exo 28.19
Point méthode Souvent, pour dénombrer, plusieurs méthodes sont possibles. La méthode adoptée peut mener directement à un dénombrement exact. Mais parfois elle conduit à compter tous les objets considérés plusieurs fois. Si chaque objet est compté exactement k fois pour un certain entier k , il suffit de diviser le nombre trouvé par k . Cela arrive en particulier quand le dénombrement amène à créer un ordre sur des objets qui n’étaient pas a priori ordonnés. Remarque Ce principe a été utilisé dans la démonstration du théorème 22 de la page 1058. Ex. 13. On désire organiser des matchs entre 2n équipes de basket, chacune disputant un match. De combien de façons un peut-on organiser ces matchs, c’est-à-dire apparier les équipes deux à deux ? • Première méthode. On choisit 2 équipes (
2n
2n−2
2
choix) pour former un premier match,
choix) pour former un deuxième match,. . . , puis 2 équipes parmi les 2n−2 restantes ( 2 enfin 2 équipes parmi les 2 restantes pour faire un dernier match. On a ainsi :
2n 2
2n − 2 2 ··· 2 2
=
(2n)! 2n
choix. Mais on a ainsi construit des listes (M1 , M2 , . . . , Mn ) de matchs, alors ce que l’on cherche à compter ce sont les ensembles {M1 , M2 , . . . , Mn } de n matchs, sans ordre. Pour obtenir le nombre cherché, il faut donc diviser par n! , nombre de façons de permuter M1 , M2 , . . . , Mn . On obtient : (2n)! un = n · 2 n! • Seconde méthode. On détermine une relation de récurrence. Soit n 2 . Choisissons une équipe e parmi les 2n . Elle dispute un match, avec l’une des 2n − 1 autres équipes. Une fois cette équipe choisie, il reste 2n − 2 = 2(n − 1) équipes à apparier. On a donc : un = (2n − 1)un−1 . En effet, en procédant ainsi, on est sûr de ne pas compter certaines listes de matchs deux fois : on compte en premier le nombre de matchs de l’équipe e , qui n’interviendra plus après. En itérant cette formule et sachant que u1 = 1 , on obtient : un = (2n − 1)(2n − 3) · · · 3u1 = (2n − 1)(2n − 3) · · · 3 · 1. En multipliant numérateur et dénominateur par le produit des nombres pairs de 2 à 2n , on retrouve la formule précédente.
1062
Démonstrations
Démonstrations Proposition 1
La démonstration repose sur le lemme suivant.
Lemme Si n et p sont deux entiers naturels non nuls tels que [[1, n]] et [[1, p]] soient en bijection, alors on a n = p . Démonstration. Montrons par récurrence la propriété Hn : « si p ∈ IN∗ est tel que [[1, n]] soit en bijection avec [[1, p]] , alors n = p ». • •
Démontrons H1 . S’il existe une application bijective f de [[1, 1]] = {1} sur [[1, p]] , alors on a [[1, p]] = {f (1)} , donc p = f (1) = 1 . Soit n 1 . On suppose établie la propriété Hn et l’on montre Hn+1 . Soit f une bijection de [[1, n + 1]] sur [[1, p]] , où p ∈ IN∗ . Comme f (1) �= f (n + 1) , on a en fait p 2 . On pose k = f (n + 1) , élément de [[1, p]] . Alors l’application g : [[1, n]] −→ [[1, p]] \ {k} est bijective. x �−→ f (x) Considérons l’application ϕ : [[1, p]] \ {k}
−→
x
�−→
[[1, p − 1]] x x−1
si si
x k.
Elle envoie injectivement [[1, k − 1]] sur [[1, k − 1]] et [[k + 1, p]] sur [[k, p − 1]] . Elle réalise donc une bijection de [[1, p]]\{k} sur [[1, p −1]] . La composée ϕ◦g est donc une bijection de [[1, n]] sur [[1, p − 1]] . Par hypothèse de récurrence, on obtient n = p − 1 et donc n + 1 = p . Démontrons maintenant la proposition. •
Si E = ∅ et s’il existe une bijection de [[1, n]] sur E , alors [[1, n]] = ∅ , donc nécessairement n = 0 .
•
Montrons l’unicité pour un ensemble E non vide. Celui-ci ne peut pas être en bijection avec [[1, 0]] = ∅ . Supposons donc qu’il existe deux entiers naturels non nuls n et p tels que E soit en bijection avec [[1, n]] et avec [[1, p]] . Alors [[1, n]] est en bijection avec [[1, p]] . En effet, si f (resp. g ) est une bijection de E sur [[1, n]] (resp. [[1, p]] ) alors g ◦ f −1 est une bijection de [[1, n]] sur [[1, p]] . D’après le lemme qui précède, n = p .
Proposition 3 • •
Soit f une bijection de [[1, n]] sur E et a ∈ E .
Si n = 1 , on a E = {f (1)} et nécessairement a = f (1) . Ainsi E = {a} , donc E \ {a} = ∅ et card (E \ {a}) = 0 = 1 − 1 . On suppose désormais n 2 . Soit k ∈ [[1, n]] tel que f (k) = a . L’application g : [[1, n]] \ {k} x
−→ �−→
L’application ϕ : [[1, n − 1]]
−→
x
�−→
E \ {a} est une bijection de [[1, n]]\{k} sur E \{a} . f (x) [[1, n]] \ {k} x x+1
est bijective. En effet elle si si
xk−1 x k.
envoie injectivement [[1, k − 1]] sur [[1, k − 1]] et [[k, n − 1]] sur [[k + 1, n]] . La composée g ◦ ϕ est une bijection de [[1, n − 1]] sur E \ {a} . Donc E \ {a} est fini et card (E \ {a}) = n − 1 .
1063
Chapitre 28. Dénombrement Proposition 4 On démontre par récurrence la propriété Hn : « si E est un ensemble fini de cardinal n et F un sous-ensemble de E , alors F est fini et card (F ) n ; de plus card (F ) = n équivaut à F = E ». • Le cas n = 0 est évident, car on a alors E = F = ∅ . • Soit n 1 . Supposons que Hn−1 soit vérifiée et montrons Hn . Considérons donc un ensemble E de cardinal n et F ⊂ E . ∗ Si F = E , alors F est fini et card (F ) = n . ∗ Si F �= E , il existe un élément a de E qui n’est pas dans F . On a donc F ⊂ E \ {a} . D’après la proposition 3 de la page 1053, card (E \ {a}) = n − 1 . Par hypothèse de récurrence, tout sous-ensemble de E \ {a} est fini, de cardinal inférieur ou égal à n − 1 . On obtient donc card (F ) n − 1 < n . On a bien démontré que tout sous-ensemble F de E est de cardinal inférieur ou égal à n , avec égalité si, et seulement si, F = E . Proposition 6 On note m le cardinal de A et n celui de B . Soit f une bijection de [[1, m]] sur A et g une bijection de [[1, n]] sur B . On définit une application h de [[1, m + n]] sur A ∪ B par :
f (x) si x ∈ [[1, m]] g(x − m) si x ∈ [[m + 1, m + n]]. Montrons que h est bijective. Pour cela, donnons-nous y ∈ A ∪ B et montrons qu’il possède un antécédent unique par h . • Si y ∈ A , comme alors y n’appartient pas à B , puisque A ∩ B = ∅ , un antécédent de y appartient nécessairement à [[1, m]] et, pour x ∈ [[1, m]] : h(x) = y ⇐⇒ f (x) = y ⇐⇒ x = f −1 (y). h(x) =
Si y ∈ / A , alors y ∈ B ; un antécédent de y appartient nécessairement à [[m + 1, m + n]] et, pour x ∈ [[m + 1, m + n]] : h(x) = y ⇐⇒ g(x − m) = y ⇐⇒ x = m + g −1 (y). Tout élément y de A ∪ B possède un antécédent unique, donc h est bijective. On en déduit que A ∪ B est fini et que : card (A ∪ B) = m + n = card (A) + card (B).
•
Proposition 9 L’ensemble A ∪ B est la réunion disjointe des ensembles finis A et B \ A , donc d’après la proposition 6 de la page 1053, A ∪ B est fini et l’on a : card (A ∪ B) = card (A) + card (B \ A).
De même B est la réunion disjointe de B \ A et de A ∩ B , donc :
card (B) = card (B \ A) + card (A ∩ B).
En soustrayant les deux égalités précédentes, on obtient :
card (A ∪ B) = card (A) + card (B) − card (A ∩ B). Proposition 11 On démontre par récurrence sur n la propriété Hn : « pour tout ensemble E de cardinal n et toute application f : E → F , où F est un ensemble quelconque, l’ensemble f (E) est fini et card (f (E)) card (E) ; de plus, il y égalité si, et seulement si, f est injective ». • •
Si n = 0 , alors E = ∅ et f (E) = ∅ , donc card (f (E)) = 0 = card (E) et f est injective. Soit n 1 . On suppose que Hn−1 est vérifiée et on montre Hn . On considère un ensemble E de cardinal n et une application f de E dans F .
1064
Démonstrations ∗ ∗
Si f est injective, il résulte du lemme 10 de la page 1054 que f (E) est fini et que l’on a card (f (E)) = card (E) . Si f n’est pas injective, il existe deux éléments x et y de E distincts tels que f (x) = f (y) . On a alors f (E) = f (E \ {y}) et card (E \ {y}) = n − 1 . Par hypo thèse de récurrence, on en déduit que f (E \ {y}) est fini et card f (E \ {y}) n − 1 . Ainsi f (E) est fini et card (f (E)) n − 1 < card (E) .
On a donc dans tous les cas card f (E) card (E) , avec égalité si, et seulement si, f est injective. La propriété est vraie au rang n , ce qui termine la démonstration par récurrence. Théorème 12 •
•
Il est clair que (iii) ⇒ (i) et (iii) ⇒ (ii) .
Montrons (i) ⇒ (iii) . Si f est injective, on a card f (E) = card (E) d’après la proposition 11 de la page 1054. Comme E et F ont même cardinal, on en déduit card (f (E)) = card (F ) ; de plus, on a f (E) ⊂ F donc, d’après la proposition 4 de la page 1053, f (E) = F . L’application f est donc surjective. Montrons (ii) ⇒ (iii) . Si f est surjective, on a card (f (E)) = card (F ) et, comme E et F ont même cardinal, on en déduit card (f (E)) = card (E) . D’après la proposition 11 de la page 1054, cela implique que f est injective.
Proposition 13 Si l’un des deux ensembles est l’ensemble vide, alors E × F = ∅ , donc est fini et card (E × F ) = 0 = card (E) × card (F ) . On suppose card (E) = n 1 . On note E = {a1 , . . . , an } . On a alors : E × F = {(x, y) | x ∈ E
et
y ∈ F} =
n
i=1
Gi , où Gi = {(ai , y) | y ∈ F }.
Pour tout i , l’application y �→ (ai , y) est une bijection de F sur Gi . On a donc card (Gi ) = card (F ) . Alors E × F est fini, car réunion finie d’ensembles finis, et comme la réunion est disjointe, on obtient : card (E × F ) = Proposition 16
n
card Gi =
i=1
n i=1
card (F ) = n card (F ) = card (E) × card (F ).
On pose p = card (E) et l’on note E = {a1 , . . . , ap } . Montrons que : Φ : FE f
−→ �−→
p F f (a1 ), . . . , f (ap )
est bijective. Étant donné un p -uplet (y1 , . . . , yp ) d’éléments de F , l’égalité Φ(f ) = (y1 , . . . , yp ) équivaut à f (ai ) = yi pour tout i ∈ [[1, p]] . Cela définit bien une application unique f de E dans F , car cela équivaut à se donner les images par f de tous les éléments de E . Ainsi tout élément de F p a un antécédent unique par Φ . L’application Φ est bijective. On en déduit que F E est fini de même cardinal que F p , c’est-à-dire (card (F ))p , i.e. (card (F ))card (E) .
1065
Chapitre 28. Dénombrement Théorème 18 On note Apn le nombre de p -arrangements d’un ensemble E de cardinal n . Pour p 2 , un p -arrangement (x1 , . . . , xp ) de E est constitué d’un (p − 1) -arrangement (x1 , . . . , xp−1 ) et de xp ∈ E \ {x1 , . . . , xp−1 } . Si n p − 1 , il y a n − (p − 1) = n − p + 1 choix pour xp , ce qui donne : (n − p + 1). Apn = Ap−1 n = 0 . En itérant cette relation, on Cette égalité reste vérifiée si n < p − 1 , car alors Apn = Ap−1 n trouve : Apn = A1n (n − 1)(n − 2) · · · (n − p + 1) = n(n − 1) · · · (n − p + 1), car il est clair que A1n = n ; en effet, un 1 -arrangement de E est une liste (x1 ) , avec x1 ∈ E .
Si 1 p n , en multipliant numérateur et dénominateur par (n − p)! , on obn! · tient Apn = (n − p)! Proposition 19 On note E = {a1 , . . . , ap } . On considère l’application Φ qui, à f ∈ F E , associe le p -uplet f (a1 ), . . . , f (ap ) ∈ F p . Alors, une application f de E dans F est injective si, et seulement si, Φ(f ) est un p -arrangements. En effet, dire que f est injective signifie que les p éléments de E ont des images distinctes, c’est-à-dire que (f (a1 ), . . . , f (ap )) est une p -liste d’éléments distincts de F . Il a été démontré page 1065 que Φ est bijective. Il y a donc autant d’injections de E dans F que de p -arrangements de F , soit n(n − 1) · · · (n − p + 1) . Théorème 22 Si p = 0 , alors le seul sous-ensemble de E de cardinal 0 est ∅ . Le nombre de tels 1 · sous-ensemble est donc 1 = 0! On suppose désormais p 1 . Soit l’application Ψ qui, au p -arrangement (a1 , . . . , ap ) , associe la partie {a1 , . . . , ap } de cardinal p de E .
L’application Ψ est surjective et tout sous-ensemble {a1 , . . . , ap } de E de cardinal p a autant d’antécédents par Ψ qu’il y a de façons d’ordonner ses éléments pour construire un arrangement, c’est-à-dire p! , nombre de permutations de {a1 , . . . , ap } . Ainsi, pour toute partie F de E de cardinal p , il y a exactement p! arrangements dont l’image par Ψ est F . Le nombre total d’images, c’est-à-dire de parties de E de cardinal p , s’obtient donc en divisant par p! le nombre d’arrangements. n(n − 1) · · · (n − p + 1) , c’est-à-dire à Il est égal à p!
1066
n . p
Exercices
S’entraîner et approfondir 28.1 Montrer que les parties finies de IN sont exactement les parties majorées. →1053
28.2 Montrer qu’un ensemble E est infini si, et seulement s’il contient une suite (un )n∈IN d’éléments distincts.
→1053
28.3 Soit A , B et C des sous-ensembles d’un ensemble fini E . Démontrer : →1054
card (A ∪ B ∪ C) = card A + card B + card C − card (A ∩ B) − card (A ∩ C) − card (B ∩ C) + card (A ∩ B ∩ C).
28.4 Soit A1 , A2 , . . . , An des parties d’un ensemble fini E . Démontrer : →1054
card (A1 ∪ A2 ∪ · · · ∪ An )
n
card (Ai ).
i=1
28.5 Soit n ∈ IN∗ . Soit a1 , a2 , . . . , an des entiers non nécessairement distincts. En considérant les restes modulo n des sommes s1 = a1 , s2 = a1 + a2 , . . . , sn = a1 + a2 + · · · + an , montrer que l’on peut trouver un sous-ensemble non vide I de [[1, n]] tel que ai soit divisible par n .
→1055
i∈I
28.6 Soit (G, ∗) un groupe et H une partie finie non vide de G stable pour la loi ∗ .
→1055
1. On fixe x dans H . Montrer que l’application fx : H −→ H , définie par fx (y) = x ∗ y , réalise une bijection de H sur H . 2. En déduire que l’élément neutre e appartient à H , puis que H est un sous-groupe de G .
28.7 Le codage RGB d’une couleur consiste à indiquer, par trois entiers entre 0 et 255 , la quantité des trois couleurs primaires (rouge, vert, bleu) dont elle est constituée. Combien peut-on coder de couleurs différentes en RGB ?
→1056
28.8 Quel est le nombre de façons de ranger p objets distincts dans n tiroirs, chaque tiroir pouvant recevoir autant d’objets que l’on veut ?
→1056
28.9 Soit n ∈ IN∗ . 1. Combien y a-t-il de surjections de [[1, n]] sur [[1, 2]] ?
→1056
2. Combien y a-t-il de surjections de [[1, n]] sur [[1, 3]] ? 28.10 Un groupe de 2n personnes comprend n hommes et n femmes. →1057 1. Combien y a-t-il de manières de les disposer autour d’une table ronde, en ne tenant compte que de leurs positions relatives ? Deux dispositions sont identiques si chaque invité a le même voisin à sa gauche et le même voisin à sa droite. 2. Même question si l’on veut respecter l’alternance homme-femme. 3. Même question si l’on veut respecter l’alternance homme-femme et que de plus Madame X soit à côté de Monsieur Y.
1067
Chapitre 28. Dénombrement 28.11 On tire 8 cartes dans un jeu de 32 cartes. →1058 1. Combien y a-t-il de tirages possibles ? 2. Combien y a-t-il de tirages contenant deux carrés (un carré est un ensemble de quatre cartes de même hauteur, par exemple quatre as) ? 28.12 Soit n et p des entiers naturels non nuls. Combien y a-t-il de listes d’entiers (i1 , . . . , ip ) →1058 telles que 1 i1 < · · · < ip n ? 28.13 Soit n un entier naturel non nul. En considérant (1 − 1)n , montrer que tout ensemble de →1059 cardinal n possède autant de parties de cardinal pair que de parties de cardinal impair. 28.14 Calculer
n
k=0
→1060
k(k − 1)
n k
de deux manières. En déduire
n
k=0
k2
n k
.
28.15 Une puce se déplace sur un cube. Chaque déplacement la mène d’un sommet à un autre relié →1060 par une arête. Elle fait n déplacements en tout. Combien y a-t-il de trajets possibles ? 28.16 1. En utilisant l’alphabet usuel de 26 lettres, combien peut-on former de mots de cinq lettres →1060 (ayant un sens ou pas) dans lesquels figurent dans l’ordre une consonne, une voyelle, deux consonnes et enfin une voyelle ? 2. Même question si on impose que les cinq lettres soient distinctes. 28.17 Pour (n, p) ∈ IN∗ × IN , on note un,p le nombre de n -listes (x1 , . . . , xn ) d’entiers naturels →1061 telles que x1 + x2 + · · · + xn = p . Montrer que, pour tout n 2 et p ∈ IN : un,p =
p
un−1,k .
k=0
28.18 Formule de Vandermonde →1061 1. Soit m , n et p trois entiers naturels. Démontrer que :
p m n k=0
k
p−k
m+n . p
=
Indication. Considérer un ensemble de cardinal m + n , réunion d’un ensemble de cardinal m et d’un ensemble de cardinal n . 2. En déduire que l’on a, pour tout entier naturel n : n 2 n k=0
k
=
2n . n
28.19 Anagrammes →1062 Étant donné un mot m , on appelle anagramme de m tout mot formé des mêmes lettres que m (un mot est simplement une liste de lettres). 1. Quel est le nombre d’anagrammes du mot orange ? 2. Quel est le nombre d’anagrammes du mot ananas ? 3. Quel est le nombre d’anagrammes d’un mot contenant n1 fois la lettre ℓ1 , n2 fois la lettre ℓ2 , . . . , np fois la lettre ℓp ?
1068
Exercices 28.20 Pour tout n ∈ IN∗ , on note an le nombre de listes d’entiers naturels non nuls de somme n . 1. Calculer an pour n 3 . 2. Conjecturer la formule donnant an . La démontrer. 28.21 Combien y a-t-il d’applications strictement croissantes de [[1, p]] dans [[1, n]] (où 1 p n ) ?
28.22 On se donne n points dans le plan, trois quelconques n’étant pas alignés. On considère toutes les droites joignant deux de ces points. On suppose que les droites obtenues ne sont jamais parallèles et que trois droites ne peuvent être concourantes qu’aux points initiaux. Calculer le nombre de points d’intersection ainsi obtenus (en plus des n points initiaux). 28.23 Soit E un ensemble fini de cardinal n . 1. Combien y a-t-il de lois de composition interne sur E ? 2. Combien y a-t-il de lois de composition interne commutatives sur E ? 3. Combien y a-t-il de lois de composition interne sur E possédant un élément neutre ? ⋆ 28.24 Soit E un ensemble fini de cardinal n . Calculer : 1.
X⊂E
card (X) ;
2.
X,Y ⊂E
card (X ∩ Y ) .
28.25 Soit E un ensemble fini de cardinal n . 1. Combien y a-t-il de couples (X, Y ) de parties disjointes de E ? 2. Combien y a-t-il de couples (X, Y ) de parties de E telles que X ∩ Y soit un singleton ? 28.26 Pour tout ensemble fini E de cardinal n 1 , on note un le nombre d’involutions de E , c’est-à-dire le nombre d’applications f de E dans E telles que f ◦ f = IdE . 1. Calculer u1 , u2 et u3 . 2. Montrer que pour tout n ∈ IN∗ , on a un+2 = un+1 + (n + 1)un . ⋆ 28.27 Pour n ∈ IN∗ , on note πn le nombre de partitions de [[1, n]] . On rappelle qu’une partition d’un ensemble E est un ensemble de parties non vides et deux à deux disjointes, dont la réunion est E . On pose, de plus, π0 = 1 . 1. Calculer π1 , π2 , π3 . 2. Démontrer que, pour tout n ∈ IN , on a πn+1 =
n n k=0
k
πk .
⋆ 28.28 On considère n poteaux numérotés de 1 à n sur lesquels on veut répartir r drapeaux distincts. Chaque poteau peut accueillir un nombre quelconque de drapeaux entre 0 et r . Lorsqu’un poteau accueille plusieurs drapeaux, on tient compte de l’ordre dans lequel les drapeaux sont disposés sur ce poteau. 1. On suppose r = 2 et n = 2 . De combien de façons peut-on disposer les drapeaux sur les poteaux ? 2. Même question dans le cas général. On pourra raisonner par récurrence sur r .
1069
Chapitre 28. Dénombrement ⋆ 28.29 1. On considère p boules identiques que l’on désire ranger dans n boîtes numérotées de 1 à n , chaque boîte pouvant recevoir un nombre quelconque de boules ( n et p appartiennent à IN∗ ). rangements distincts. Montrer qu’il y a n+p−1 p
On utilisera le codage suivant : à un rangement, on associe la liste de 0 et de 1 , commençant et se terminant par 0 , telle que le nombre de 1 entre le k -ième et le (k + 1) -ième zéro soit égal au nombre de boules dans la k -ième boîte. 2. (a) Déterminer le nombre de solutions de l’équation x1 + x2 + · · · + xn = p, d’inconnue (x1 , x2 , . . . , xn ) ∈ INn , n et p étant deux entiers naturels non nuls. (b) En déduire le nombre de solutions de l’équation x1 + x2 + · · · + xn = p , d’inconnue (x1 , x2 , . . . , xn ) ∈ (IN∗ )n , n et p étant deux entiers naturels non nuls.
28.30 Soit n ∈ IN∗ . 1. Combien y a-t-il de surjections de [[1, n]] sur [[1, n]] ? 2. Combien y a-t-il de surjections de [[1, n + 1]] sur [[1, n]] ? 3. Combien y a-t-il de surjections de [[1, n + 2]] sur [[1, n]] ? ⋆ 28.31 Pour n 1 , on note dn le nombre de permutations d’un ensemble fini E de cardinal n ne laissant aucun point fixe (une telle permutation s’appelle un dérangement). On pose d0 = 1 . 1. Montrer que, pour tout n ∈ IN : n! =
n n k=0
2. En déduire, que, pour tout n ∈ IN :
dn = n!
k
dk .
n (−1)k k=0
k!
·
Indication. On pourra utiliser la formule d’inversion de Pascal (cf. exercice 25.3 de la page 970) : si (an )n∈IN et (bn )n∈IN sont deux suites de réels telles que, pour tout n ∈ IN , bn =
n n
p=0
p
ap , alors on a, pour tout n ∈ IN , an =
n
(−1)n−p
p=0
n p
bp .
3. En déduire que le nombre de permutations de E , ensemble de cardinal n , laissant exactement p points fixes ( 0 p n ) est : n−p n! (−1)k · p! k! k=0
1070
Solutions des exercices
Solutions des exercices 28.1 Soit E une partie de IN . • Supposons que E soit majorée. Il existe donc n ∈ IN tel que E ⊂ [[0, n]] . Comme [[0, n]] est fini, il en est de même de E , d’après la proposition 4 de la page 1053. • Supposons que E soit finie. Démontrons par récurrence sur n = card (E) que E est majorée. ∗ Si n = 0 , alors E = ∅ . La partie vide est majorée (par exemple par 0 ), donc la propriété est vraie pour n = 0 . ∗ Soit n ∈ IN . Supposons que la propriété soit vraie au rang n et considérons une partie E de IN de cardinal n + 1 . Soit a ∈ E . Posons F = E \ {a} . Alors F est finie de cardinal n , d’après la proposition 3 de la page 1053. Par hypothèse de récurrence, F est majorée. Soit m un majorant de F . Posons M = max(a, m) . Alors M est un majorant de E . Donc E est majorée et la propriété est vraie au rang n + 1 . La propriété est vraie pour tout n ∈ IN . Une partie E de IN est donc finie si, et seulement si, elle est majorée.
28.2 • Supposons qu’il existe une suite (un )n∈IN d’éléments de E distincts. Alors, l’application n �→ un est injective donc induit une bijection de IN sur son image qui est une partie F de E . Alors F est infinie, car est en bijection avec IN qui est infini. Donc E qui contient une partie infinie est infini. • Supposons que E soit infini et construisons, par récurrence, une suite (un )n∈IN d’éléments de E distincts. ∗ L’ensemble E n’est pas vide, car sinon il serait fini. On prend pour u0 un élément quelconque de E . ∗ Soit n ∈ IN . Supposons construits des éléments distincts u0 , u1 , . . . , un de E . L’ensemble {u0 , . . . , un } n’est pas égal à E car sinon E serait fini. On prend pour un+1 un élément quelconque de E \ {u0 , . . . , un } .
28.3 On applique plusieurs fois la formule de la proposition 9 de la page 1054. De A ∪ B ∪ C = (A ∪ B) ∪ C , on déduit :
card (A ∪ B ∪ C) = card (A ∪ B) + card (C) − card
(A ∪ B) ∩ C
= card A + card B − card (A ∩ B) + card (C) − card
(A ∩ C) ∪ (B ∩ C)
= card (A) + card (B) − card (A ∩ B) + card (C) − card (A ∩ C) − card (B ∩ C) + card
(A ∩ C) ∩ (B ∩ C)
= card (A) + card (B) + card (C) − card (A ∩ B) − card (A ∩ C) − card (B ∩ C) + card (A ∩ B ∩ C).
1071
Chapitre 28. Dénombrement 28.4 On démontre la propriété par récurrence sur n . Pour n = 1 , il n’y a rien à démontrer et pour n = 2 : card (A1 ∪ A2 ) = card (A1 ) + card (A2 ) − card (A1 ∩ A2 ) card (A1 ) + card (A2 ). Soit n 1 . Si l’on suppose que la propriété est vérifiée au rang n , on obtient, pour des sousensembles A1 , A2 , . . . , An+1 de E , en utilisant le cas n = 2 , puis l’hypothèse de récurrence : card (A1 ∪ · · · ∪ An ∪ An+1 ) = card
(A1 ∪ · · · ∪ An ) ∪ An+1
card (A1 ∪ · · · ∪ An ) + card (An+1 )
n i=1
card (Ai ) + card (An+1 ) =
n+1
card (Ai ).
i=1
28.5 Si l’une de ces sommes est divisible par n , c’est fini. Sinon leurs restes modulo n ne peuvent être tous différents (car il y a n sommes et n − 1 restes possibles ; en effet, 0 est exclu). Il existe deux entiers p < q tels que sp et sq aient même reste modulo n . Leur différence sq − sp = ap+1 + · · · + aq est divisible par n . 28.6 1. Comme x appartient à H et H est stable, fx est bien une application de H dans H . Soit y1 et y2 deux éléments de H tels que fx (y1 ) = fx (y2 ) . On a alors x ∗ y1 = x ∗ y2 et comme x est inversible dans G , on a y1 = y2 . Donc fx est injective. Comme H est fini, on en déduit, d’après le théorème 12 de la page 1055, que fx est bijective. 2. Posons a = fx−1 (x) . On a alors fx (a) = x et donc x ∗ a = x . En multipliant par x−1 , on en déduit a = e . Or a est dans H , donc e est dans H . Comme e est dans H , on peut ensuite poser b = fx−1 (e) . On a alors fx (b) = e , donc x ∗ b = e , c’est-à-dire b = x−1 . Or b est dans H , donc x−1 est dans H . Ainsi, H est une partie stable de G qui contient l’élément neutre et les symétriques de tous ses éléments. C’est donc un sous-groupe de G . 28.7 L’ensemble des couleurs possibles est en bijection avec [[0, 255]]3 , ce qui donne 2563 = 224 couleurs. 28.8 Il s’agit de compter le nombre d’applications de l’ensemble des objets dans l’ensemble des tiroirs. Il y en a np . 28.9 1. • Si n = 1 , il n’y a pas de surjection de [[1, n]] sur [[1, 2]] . • Pour n 2 , il y a 2n applications de [[1, n]] sur [[1, 2]] . Une telle application n’est pas surjective si, et seulement si, tous les éléments de [[1, n]] ont même image. Il y a donc 2 applications non surjectives et 2n − 2 surjections. 2. • Si n 2 , il n’y a pas de surjection de [[1, n]] sur [[1, 3]] . • Pour n 3 , il y a 3n applications de [[1, n]] dans [[1, 3]] . Une telle application n’est pas surjective si, et seulement si : ∗ soit tous les éléments de [[1, n]] ont même image ; il y a trois applications de ce type ; ∗ soit il y a deux images différentes. Si par exemple, ces images sont 1 et 2 , on obtient les surjections de [[1, n]] sur [[1, 2]] . Il y en a 2n − 2 , d’après la première question. On a trois cas identiques et donc en tout 3(2n − 2) applications de ce type. Le nombre de surjections de [[1, n]] sur [[1, 3]] est 3n − 3 − 3(2n − 2) = 3n − 3 · 2n + 3 . Toutes les formules trouvées restent valables dans les cas où il n’y a pas de surjection.
1072
Solutions des exercices 28.10 1. On a (2n − 1)! dispositions différentes. En effet, une des personnes étant fixée, il y en a autant que de manières de placer les personnes restantes dans les 2n − 1 autres places.
2. On reprend le même raisonnement. Imaginons qu’on ait choisi la place d’une femme. Cela détermine les places où il faudra mettre les n − 1 femmes restantes et les n hommes. On obtient (n − 1)! n! dispositions.
3. Fixons la place de Madame X. Il y a deux places possibles pour Monsieur Y. Ensuite, on place les n−1 femmes et les n−1 hommes restants. On obtient 2 ((n − 1)!)2 dispositions.
28.11 1. Il y a autant de tirages que de parties à 8 éléments dans l’ensemble des cartes soit
32 8
.
2. Il y a autant de tels tirages que de paires de carrés. Comme il y a 8 carrés possibles, on a 82 tels tirages. 28.12 Il y a autant de telles p -listes que de parties de [[1, n]] de cardinal p , i.e. • à une telle p -liste, on peut associer la partie {i1 , . . . , ip } de [[1, n]] ;
n . En effet : p
• réciproquement, une partie de [[1, n]] de cardinal p étant choisie, il n’y a qu’une façon de ranger ses p éléments par ordre croissant pour obtenir une p -liste (i1 , . . . , ip ) telle que 1 i1 < · · · < ip n .
28.13 Pour n 1 , on a (1 − 1)n = 0 et donc
n n
k=0
(−1)k = 0 .
k
En séparant les k pairs et les k impairs, on obtient : n n k=0
Mais les sommes
⌋ ⌊n 2
n
j=0
2j
(−1) =
k
et
⌊2⌋ n n
k
2j
j=0
⌊
n−1 ⌋ 2
j=0
n 2j+1
⌊
−
n−1 ⌋ 2 n
j=0
2j + 1
= 0.
sont égales au nombre de parties de cardinal pair
et au nombre de parties de cardinal impair d’un ensemble de cardinal n , respectivement. D’où le résultat. Comme le nombre total de parties d’un ensemble de cardinal n est 2n , n chacune de ces sommes vaut 22 = 2n−1 .
28.14 • Première méthode Pour 2 k n , on a :
n k(k − 1) k
n−1 = n(k − 1) k−1
n−2 = n(n − 1) . k−2
On en déduit : n k=0
k(k − 1)
n k
=
n k=2
k(k − 1)
n k
= n(n − 1)
n−2 n−2 j=0
j
= n(n − 1)2n−2 .
1073
Chapitre 28. Dénombrement • Seconde méthode On peut également partir de la formule du binôme et dériver. On a : ∀x ∈ IR∗+
(x + 1)n =
k=0
et donc, en dérivant deux fois : ∀x ∈
IR∗+
n(n − 1)(x + 1)
n
ce qui donne, en évaluant en 1 ,
k=2
n n
n−2
=
n k=2
k(k − 1)
n k
k
xk
k(k − 1)
n k−2 x , k
= n(n − 1)2n−2 .
On en déduit, en écrivant k2 = k(k − 1) + k et en utilisant l’exemple 10 de la page 1060 : n k=0
k2
n k
=
n k=0
k(k − 1)
n k
+
n n k
k=0
k
= n(n − 1)2n−2 + n2n−1 = n(n + 1)2n−2 .
28.15 Quelle que soit sa position sur le cube, la puce a, après k déplacements, le choix pour le déplacement suivant entre 3 sommets. Il y a donc au total 3n trajets possibles.
28.16 1. L’alphabet contient 20 consonnes et 6 voyelles. Pour la première lettre x1 , on a le choix entre 20 consonnes. Pour chaque choix de x1 , on peut choisir la seconde lettre x2 parmi 6 voyelles, etc. Le nombre total de mots de cinq lettres, c’est-à-dire de quintuplets (x1 , x2 , x3 , x4 , x5 ) vérifiant les conditions souhaitées est donc 20 · 6 · 20 · 20 · 6 , c’est-à-dire 288000 . 2. Pour x1 , on a le choix entre 20 consonnes ; pour x3 (resp. x4 ) on a le choix entre 19 (resp. 18 ) consonnes. En raisonnant de la même façon pour les voyelles, on trouve que le nombre cherché est 20 · 6 · 19 · 18 · 5 = 205200 .
28.17 Soit n 2 et p ∈ IN . On note L l’ensemble des n -listes (x1 , . . . , xn ) d’entiers naturels vérifiant x1 + x2 + · · · + xn = p et pour tout k ∈ [[0, p]] , on note Lk l’ensemble des éléments (x1 , . . . , xn ) de L tels que xn = k . Alors L est la réunion disjointe de L0 , L1 , . . . , Lp , car si (x1 , . . . , xn ) ∈ L , alors il existe un unique k ∈ [[0, p]] tel que xn = k . On en déduit : card (L) = card (L0 ) + card (L1 ) + · · · + card (Lp ). On a, par définition, card (L) = un,p . Pour j ∈ [[0, p]] , (x1 , . . . , xn−1 , j) ∈ Lj si, et seulement si, x1 + · · · + xn−1 = p − j . Il y a donc autant d’éléments dans Lj que de (n − 1) listes (x1 , . . . , xn−1 ) d’entiers naturels telles que x1 + · · · + xn−1 = p − j .
On a donc card (Lj ) = un−1,p−j . On obtient ainsi : un,p =
p j=0
1074
un−1,p−j =
p k=0
un−1,k .
Solutions des exercices 28.18 1. Soit E et F deux ensembles disjoints de cardinal m et n , respectivement. Alors, le cardinal de E ∪ F est m + n . On note C l’ensemble des parties de E ∪ F de cardinal p . On a donc card (C) = m+n . p Une partie de E ∪ F de cardinal p se compose de k éléments de E et p − k éléments de F , où 0 k p . Pour k fixé, on note Ck l’ensemble des parties de E ∪ F composées de k éléments de E et de p − k éléments de F . Alors C est la réunion disjointe de C0 , C1 , . . . , Cp , donc :
card (C0 ) + card (C1 ) + · · · + card (Cp ) = card (C).
n , car il faut choisir d’une part k Mais, pour tout k ∈ [[0, p]] , on a card (Ck ) = m k p−k éléments dans un ensemble de cardinal m et d’autre part, p−k éléments dans un ensemble de cardinal n . On a donc :
p m n k=0
k
p−k
=
m+n . p
2. En prenant m = p = n dans l’égalité démontrée à la question 1, on obtient, par symétrie des coefficients binomiaux :
2n n
=
n n n k
k=0
n−k
=
n 2 n k=0
k
.
28.19 1. Un anagramme du mot orange résulte de la permutation de ses lettres. Comme elles sont distinctes, ces permutations donnent des mots distincts. Il y a donc 6! = 720 anagrammes. 2. Il y a trois a et deux n , donc les permutations ne conduisent pas à des mots différents. Voici deux manières de compter. • Il y a 6! permutations possibles de l’ensemble des lettres. Mais à chaque anagramme correspond 3! 2! permutations, car on peut permuter les trois a et les deux n . On 6! = 60 anagrammes. obtient 3! 2! • Pour construire un anagramme, c’est-à-dire une 6 -liste, on place d’abord les trois a . Il y a 63 = 20 choix possibles. On place ensuite les n parmi les places restantes.
Il y a 32 = 3 choix possibles. Le s est la lettre restante. Il y a donc 20 × 3 = 60 anagrammes.
n! , n1 ! n2 ! · · · np ! où n = n1 + · · · + np . Si l’on appliquait la deuxième méthode, on trouverait :
3. En appliquant la première des deux méthodes de la question 2, on obtient
n n1
n − n1 n2
···
n − n1 − · · · − np−1 . np
En écrivant les coefficients binomiaux sous forme de factorielles, on voit qu’on peut simplifier (n − n1 )! , (n − n1 − n2 )! ,. . . , (n − n1 − · · · − np−1 )! pour obtenir le même résultat que par la première méthode.
1075
Chapitre 28. Dénombrement 28.20 1. On trouve a1 = 1 , a2 = 2 , a3 = 4 (pour n = 3 , les listes sont : (3) , (1, 2) , (2, 1) et (1, 1, 1) ). 2. On conjecture que an = 2n−1 . Pour le prouver, il suffit, puisque a1 = 1 , de démontrer an = 2an−1 pour n 2 . Il y a deux sortes de listes dont la somme est n : • celles dont le dernier élément est égal à 1 ; il y en a an−1 car se donner une telle liste (x1 , . . . , xk , 1) revient à se donner (x1 , . . . , xk ) de somme n − 1 ; • celles dont le dernier élément est strictement supérieur à 1 ; il y en a an−1 car se donner une telle liste (x1 , . . . , xk ) , avec xk 2 revient à se donner (x1 , . . . , xk − 1) de somme n − 1 .
Cela montre que an = 2an−1 pour n 2 et donc an = 2n−1 pour tout n 1 .
28.21 Il y a autant d’applications strictement croissantes de [[1,p]] dans [[1, n]] que de listes (i1 , . . . , ip ) d’entiers tels que 1 i1 < · · · < ip n , soit np . 28.22 • Première méthode Un tel point s’obtient comme intersection des droites (AB) et (CD) ,
n choix de {A, B, C, D} , 4 puis trois façons de les apparier (si on fixe un des points, on lui adjoint un des trois autres
où A , B , C et D sont quatre points initiaux distincts. Il y a
points). On obtient 3
n 4
points.
• Seconde méthode On choisit une première droite (AB) , il y a droite (CD) ne passant ni par A , ni par B , il y a
n−2
n 2
choix, puis une seconde
choix. On obtient
nn−2 2
2
2 points (il faut diviser par deux car on introduit un ordre entre les deux droites (AB) n(n − 1)(n − 2)(n − 3) · et (CD) ). On trouve le même résultat que dans le premier cas : 8 2
28.23 1. Une loi de composition interne sur E est une application de E 2 dans E . 2
2
Il y a en a (card (E))card (E) = nn . 2. La loi est commutative si, et seulement si, (x, y) et (y, x) ont même image pour x �= y . Elle est alors entièrement déterminée par les images des couples (x, x) et des paires {x, y} . n2 + n On choisit donc n + n2 = images. Le nombre de lois de composition interne 2 commutatives est donc n
n2 +n 2
.
3. On commence par choisir un élément neutre e ; il y a n choix. Le fait que e soit élément neutre détermine les images de tous les couples (e, x) et (x, e) . On est ramené ensuite 2
à déterminer une application de (E \ {e})2 dans E . Il y en a n(n−1) . On obtient 2
donc n · n(n−1) = n(n−1) neutre.
1076
2
+1
lois de composition interne sur E possédant un élément
Solutions des exercices 28.24 1. Pour tout p ∈ [[0, n]] , il y a
X⊂E
p
parties de E de cardinal p . On en déduit :
n
card (X) =
n
p=0
n
n−1 n p= n p p−1 p=1
=n
n−1 n−1 k=0
k
= n2n−1 .
2. Notons S la deuxième somme. Quand Y décrit P(E) , son complémentaire Y décrit card (X ∩ Y ) , puis : aussi P(E) . On en déduit S = 1 S= 2
X,Y ⊂E
X,Y ⊂E
card (X ∩ Y ) + card (X ∩ Y )
=
1 card X, 2 X,Y ⊂E
car X est l’union disjointe de X ∩ Y et X ∩ Y . En utilisant la première question, on obtient : 1 1 n−1 1 S= card X = n2 = card (P(E)) n2n−1 = n22n−2 . 2 2 2 Y ⊂E X⊂E
Y ⊂E
28.25 1. On note C l’ensemble des couples (X, Y ) de parties disjointes de E et pour p ∈ [[0, n]] , on note Cp l’ensemble des couples (X, Y ) ∈ C tels que card (X) = p . Alors (C0 , . . . , Cn ) est une partition de C et on a donc : card (C) =
n
card (Cp ).
p=0
Soit p ∈ [[0, n]] . Pour déterminer un élément (X, Y ) de Cp , on choisit d’abord une partie X de E de cardinal p ; il y a
n p
choix. Alors Y est une partie quelconque
de X , ensemble de cardinal n − p ; il y a donc 2n−p choix pour Y . On a donc card (Cp ) =
n p
2n−p . On en déduit :
card (C) =
n n p=0
p
2n−p = (1 + 2)n = 3n ,
d’après la formule du binôme. 2. Soit a ∈ E . Dire que (X, Y ) est un couple de parties de E telles que X ∩ Y = {a} signifie que X et Y contiennent a et que X \ {a} et Y \ {a} sont des parties disjointes de E\{a} . D’après la première question, il y a 3n−1 couples de parties disjointes de E\{a} et donc 3n−1 couples de parties de E telles que X ∩ Y = {a} . Comme a est un élément quelconque de E , il y a en tout n3n−1 couples de parties de E telles que X ∩ Y soit un singleton. 28.26 1. On trouve u1 = 1 , u2 = 2 et u3 = 4 . 2. Soit E un ensemble de cardinal n+2 . Fixons un élément a de E . Si f est une involution de E : • soit f (a) = a et la restriction de f à E \ {a} est une involution de E \ {a} ; il y a un+1 involutions f de ce type ; • soit f (a) = b �= a , alors f (b) = a et la restriction de f à E \ {a, b} est une involution de E \{a, b} ; il y a n+1 choix pour b et un choix pour la restriction de f à E \{a, b} donc (n + 1)un involutions f de ce type. Le nombre total d’involutions de E est : un+2 = un+1 + (n + 1)un .
1077
Chapitre 28. Dénombrement 28.27 1. On trouve π1 = 1 , π2 = 2 et π3 = 5 . 2. On note P l’ensemble des partitions de [[1, n + 1]] . Pour tout élément de P , on nomme A la partie contenant n + 1 . Pour k ∈ [[0, n]] , on note Pk les éléments de P tels que A contienne k éléments en plus de n + 1 . Alors P0 , . . . , Pn forment une partition de P .
Soit j ∈ [[0, n]] . Pour déterminer un élément de Pj , on choisit A , c’est-à-dire A \ {n + 1} ; il y a nj choix possibles. Puis A étant choisie, les n − j éléments de [[1, n]] \ A peuvent
être partitionnés de πn−j façons. On a donc card (Pj ) = n
πn+1 = card (P) =
card (Pj ) =
j=0
n n j=0
j
n j
πn−j . On en déduit :
πn−j =
n n k=0
k
πk .
28.28 1. Soit on met un drapeau par poteau, ce qui peut se faire de 2 façons différentes, soit on met les deux drapeaux sur le même poteau, ce qui peut se faire de 2 · 2 façons (choix du poteau et de l’ordre des drapeaux). En tout, il y a 6 possibilités. 2. Notons un,r le nombre cherché. Supposons que r − 1 drapeaux soient déjà placés et qu’il y ait di drapeaux sur le i -ème poteau (où 1 i n ). Si l’on place le r -ième drapeau sur le i -ème poteau, il y a di + 1 emplacements possibles. Donc le nombre total de choix pour le r -ième drapeau est
n
(di + 1) =
i=1
n
i=1
di + n = r − 1 + n . On voit que ce nombre
est indépendant de la disposition initiale des r − 1 premiers drapeaux. D’où la relation : un,r = (n + r − 1)un,r−1 .
Il est clair que un,1 = n . En appliquant la relation de récurrence, on obtient : un,r = (n + r − 1)(n + r − 2) · · · (n + 1)un,1 = (n + r − 1)(n + r − 2) · · · n =
(n + r − 1)! · (n − 1)!
28.29 1. Il est clair qu’à tout rangement on peut associer une liste de 0 et de 1 et que réciproquement une telle suite détermine le nombre de boules dans chaque boîte. Il suffit donc de compter le nombre de listes. Dans une telle liste, il y a n + 1 fois 0 (car on commence et on finit par un 0 ) et p fois 1 . On a donc des (n + p + 1) -listes. Il y a autant de listes possibles que de façons de placer les 1 (par exemple). Comme on commence et finit par un 0 , il y a n + p − 1 emplacements possibles pour les 1 . Le nombre de rangements n+p−1 . possibles est p Remarque On peut donner du codage proposé par l’énoncé une description plus informelle : imaginons que les n boîtes sont placées côte à côte ; les n boîtes sont séparées par n − 1 cloisons. Il s’agit de placer les p boules par rapport à ces n − 1 cloisons. On a donc au total p + n − 1 « emplacements » (les cloisons plus les boules) parmi lesquels il faut en choisir p pour placer les boules. D’où le résultat. 2. (a) Le nombre de solutions dans INn de l’équation est égal au nombre de rangements précédemment calculé. Il suffit d’appeler xk le nombre de boules dans le k -ième tiroir. (b) Pour trouver le nombre de solutions dans (IN∗ )n , on écrit l’équation :
1078
(x1 − 1) + (x2 − 1) + · · · + (xn − 1) = p − n,
Solutions des exercices où (x1 − 1, . . . , xn − 1) appartient à INn . Pour qu’il y ait des solutions, il faut évidemment p n . Le nombre de solutions s’obtient alors en remplaçant p par p − n dans p−1 p−1 le résultat de la question précédente. Il y a donc i.e. solutions, p−n n−1 par symétrie des coefficients binomiaux (pour n > p , ce coefficient est nul).
28.30 1. D’après le théorème 12 de la page 1055, les surjections de [[1, n]] sur [[1, n]] sont les permutations de [[1, n]] . Il y a donc n! telles surjections. 2. Une application de [[1, n + 1]] dans [[1, n]] est une surjection si, et seulement si, deux éléments ont la même image et les autres des images distinctes (et distinctes de celle des deux premiers éléments). Il y a n+1 façons de choisir les éléments qui ont même 2 image et n façons de choisir cette image commune. Il reste ensuite n − 1 éléments dans l’ensemble de départ et l’ensemble d’arrivée qui doivent être mis en bijection, ce qui peut se faire de (n − 1)! manières. Le nombre de surjections cherché est donc :
n(n + 1)! n+1 · n(n − 1)! = 2 2
3. De même, une application de [[1, n + 2]] dans [[1, n]] est une surjection si, et seulement si : • soit trois éléments ont la même image et les autres des images distinctes ; • soit deux paires d’éléments ont même image (et ces images sont distinctes) et les n−2 éléments restants ont des images distinctes, ce qui nous fournit une partition de l’ensemble de surjections considéré.
n+2 façons de choisir les • Dénombrons les surjections du premier type. Il y a 3 éléments qui ont même image, puis n façons de choisir cette image commune. Les n−1 éléments restants de chacun des ensembles doivent être mis en bijection. On trouve :
n (n + 2)! (n + 2)(n + 1)n n+2 n! = n(n − 1)! = 6 6 3
surjections de ce type. • Dénombrons les surjections du second type. On choisit les quatre éléments de [[1, n+2]] qui n’ont pas une image distincte de toutes les autres, puis les deux éléments de [[1, n]] qui sont leurs images. Il faut ensuite attribuer aux quatre éléments choisis leur image parmi les deux images possibles. Pour cela on prend une des images et l’on choisit ses deux antécédents parmi quatre. Enfin, on met en bijection les n − 2 éléments restants dans chaque ensemble. On obtient :
n+2 4
n 2
(n + 2)(n + 1)n(n − 1) n(n − 1) 4 (n − 2)! = · 6 (n − 2)! 24 2 2 =
n(n − 1)(n + 2)! 8
surjections de ce type. Le nombre de surjections cherché est donc : n(n + 2)! n(n − 1)(n + 2)! n(3n + 1)(n + 2)! + = · 6 8 24
1079
Chapitre 28. Dénombrement 28.31 1. Le nombre total de permutations de E est n! . Pour 0 p n , le nombre de permutations de E ayant exactement p points fixes n dn−p . En effet, il faut choisir les p points fixes et effectuer un dérangement est p des n − p points restants. Comme p peut varier de 0 à n , on obtient : n! =
n n p=0
p
dn−p =
n n k=0
k
dk .
2. On applique la formule d’inversion de Pascal, avec an = n! et bn = dn , pour tout n ∈ IN . On obtient : ∀n ∈ IN
dn =
n n k=0
k
(−1)n−k k! = n!
n (−1)n−k k=0
(n − k)!
= n!
n (−1)k k=0
k!
·
3. Il résulte de la démonstration de la question 1 que le nombre de dérangements ayant p points fixes est :
n dn−p = p
1080
n−p n−p (−1)k n! (−1)k n = · (n − p)! k! p! k! p k=0
k=0
Chapitre 29 : Probabilités sur un univers fini Variables aléatoires
I
Univers . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Univers et événements . . . . . . . . . . . . . . . . . . . 2 Variable aléatoire . . . . . . . . . . . . . . . . . . . . . . 3 Quelques exemples d’expériences aléatoires . . . . . . . II Espaces probabilisés . . . . . . . . . . . . . . . . . . . . . 1 Probabilité . . . . . . . . . . . . . . . . . . . . . . . . . 2 Propriétés des probabilités . . . . . . . . . . . . . . . . . 3 Détermination d’une probabilité par les images des événements élémentaires . . . . . . . . . . . . . . . . . . . . III Loi d’une variable aléatoire . . . . . . . . . . . . . . . . 1 Définition - Propriétés . . . . . . . . . . . . . . . . . . . 2 Lois usuelles . . . . . . . . . . . . . . . . . . . . . . . . IV Couples de variables aléatoires . . . . . . . . . . . . . . 1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . 2 Loi conjointe . . . . . . . . . . . . . . . . . . . . . . . . 3 Lois marginales . . . . . . . . . . . . . . . . . . . . . . . 4 Généralisation aux n -uplets de variables aléatoires . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1082 . 1082 . 1083 . 1085 1087 . 1087 . 1087 . 1089 1090 . 1090 . 1092 1094 . 1094 . 1095 . 1096 . 1097 1098 1101
Probabilités sur un univers fini Variables aléatoires
29
Le programme de probabilités de première année se limite aux espaces probabilisés finis. Il s’agit de présenter dans ce cadre simple les concepts fondamentaux des probabilités (univers, événements, variables aléatoires, probabilité). On formalise des résultats déjà vus en terminale en s’appuyant en particulier sur le chapitre 28.
I
Univers
1
Univers et événements
Définition 1 Un univers fini est un ensemble fini non vide, noté en général Ω. Un élément ω ∈ Ω est appelé une éventualité ou une issue. Dans toute la suite, sauf mention plus précise, Ω désigne un univers fini. Définition 2 Toute partie de Ω est appelée un événement. • L’ensemble Ω est appelé l’événement certain.
• L’ensemble vide est appelé l’événement impossible.
• Un singleton {ω} , où ω ∈ Ω, est appelé événement élémentaire. Remarque L’ensemble des événements est donc P(Ω).
Terminologie Bien qu’un événement ne soit rien d’autre qu’un ensemble, quelques termes de vocabulaire sont spécifiques aux probabilités. Ainsi : • le complémentaire d’un événement A, noté A , est appelé l’événement contraire de A ; • lorsque deux événements A et B sont disjoints, i.e. vérifient A ∩ B = ∅ , on dit qu’ils sont incompatibles.
Ex. 1. Si A est un événement, alors A et son contraire A sont incompatibles.
I Univers Systèmes complets d’événements Définition 3 On appelle système complet d’événements de Ω toute famille d’événements (Ai )i∈[[1,n]] (où n ∈ IN∗ ), telle que : • pour tout couple (i, j) d’éléments distincts de [[1, n]], on ait Ai ∩ Aj = ∅ ; n Ai = Ω. • i=1
Ex. 2. Pour tout événement A , la famille (A, A) est un système complet d’événements de Ω . Ex. 3. La famille ({ω})ω∈Ω , formée des événements élémentaires, est un système complet d’événements de Ω .
Remarque La famille ({ω})ω∈Ω joue un grand rôle dans la définition d’une probabilité (cf.théorème 6 de la page 1089).
2
Variable aléatoire
Définition 4 Une variable aléatoire sur un univers fini Ω est une application définie sur Ω à valeurs dans un ensemble E . Remarques 1. Notons qu’une variable aléatoire est une application définie sur Ω, et non une variable, et qu’elle n’est pas aléatoire. 2. Une variable aléatoire est dite réelle si elle est à valeurs dans IR, complexe si elle est à valeurs dans C. Définition 5 Si a est un élément d’un ensemble E , alors l’application X : Ω −→ E est une ω �−→ a variable aléatoire appelée variable aléatoire constante ou certaine. Définition 6 Si A est un événement de Ω, alors l’application : X : Ω −→ IR 1 ω �−→ 0
si ω ∈ A si ω ∈ /A
est une variable aléatoire réelle appelée variable indicatrice de A et notée 1A .
1083
Chapitre 29. Probabilités — Variables aléatoires Remarque Une variable aléatoire réelle sur un univers Ω est une application de Ω dans IR. L’ensemble des variables aléatoires réelles définies sur Ω est donc F (Ω, IR), ensemble sur lequel ont été définies une structure d’espace vectoriel et une multiplication interne. Si X et Y sont des variables aléatoires réelles sur Ω et λ un réel, alors X + Y , λX et XY sont des variables aléatoires réelles. On peut faire la même remarque pour les variables aléatoires complexes. Définition 7 Soit X une variable aléatoire sur Ω et f une application définie sur X(Ω). L’application f ◦ X est une variable aléatoire, notée f (X). Remarque La notation f (X), a priori incorrecte pour nommer la composée de X et f , s’accorde avec la terminologie qui nomme variable l’application X . Événements liés à une variable aléatoire Notations La théorie des probabilités utilise, pour décrire certains événements liés aux variables aléatoires, des notations spéciales dont il importe de bien comprendre la signification. Soit X une variable aléatoire définie sur l’univers Ω, à valeurs dans E . • Soit A une partie de E . L’ensemble X −1 (A) = {ω ∈ Ω : X(ω) ∈ A} , image réciproque de A par l’application X , est noté, en probabilités : {X ∈ A} ou (X ∈ A).
C’est une partie de Ω, c’est-à-dire un événement.
• Plus généralement, si P est une propriété quelconque pouvant être vérifiée ou non par un élément de E , l’ensemble des éléments ω de Ω tels que X(ω) vérifie la propriété P est noté {X vérifie P } . • En particulier, pour tout x ∈ E , on note :
{X = x}
l’événement {ω ∈ Ω : X(ω) = x} . On remarque que, pour tout x ∈ E , on a {X = x} = ∅ si x ∈ / X(Ω) ; ainsi {X = x} = ∅ sauf pour un nombre fini de valeurs de x.
• Si X est une variable aléatoire réelle, on écrit, pour tout réel x : {X {X {X {X
x} = {ω ∈ Ω x} = {ω ∈ Ω < x} = {ω ∈ Ω > x} = {ω ∈ Ω
: : : :
X(ω) x} ; X(ω) x} ; X(ω) < x} ; X(ω) > x}.
On a alors, pour tout réel x :
{X x} = {X < x} ∪ {X = x}. Ex. 4. Si 1A est la fonction indicatrice de l’événement A , on a, par définition : {1A = 1} = A
1084
et
{1A = 0} = A.
I Univers Ex. 5. Soit X une variable aléatoire, à valeurs dans E , ainsi que A et B deux parties de E . On a alors : {X ∈ A ∪ B} = X −1 (A ∪ B) = X −1 (A) ∪ X −1 (B) = {X ∈ A} ∪ {X ∈ B} {X ∈ A ∩ B} = X −1 (A ∩ B) = X −1 (A) ∩ X −1 (B) = {X ∈ A} ∩ {X ∈ B} {X ∈ E \ A} = X −1 (E \ A) = Ω \ X −1 (A) = {X ∈ A}.
Remarque Si X est une variable aléatoire sur l’univers Ω à valeurs dans E , alors, pour tout A ⊂ E , l’événement {X ∈ A} peut s’écrire comme réunion finie d’événements de la forme {X = x} . En effet : {X = x}. {X ∈ A} = X ∈ A ∩ X(Ω) = x∈A∩X(Ω)
Proposition 1
Si X est une variable aléatoire sur Ω, la famille {X = x} x∈X(Ω) est un système complet d’événements, appelé système complet d’événements associé à X .
Démonstration page 1098
¯ . Ex. 6. Le système complet d’événements associé à la variable 1A est (A, A)
3
Quelques exemples d’expériences aléatoires
Les notions introduites jusqu’à présent peuvent servir à modéliser une expérience aléatoire : l’univers représente l’ensemble des résultats possibles de l’expérience. À une propriété du résultat de l’expérience, on associe l’ensemble des résultats pour lesquels elle est vérifiée, c’est-à-dire un événement. Ex. 7. On lance un dé et on s’intéresse au numéro obtenu. On prend comme univers Ω = [[1, 6]] . Les événements A : « le numéro obtenu est pair », B : « le numéro obtenu est impair » et C : « le numéro obtenu vaut au moins 4 » sont : A = {2, 4, 6} ,
B = {1, 3, 5}
et
C = {4, 5, 6}.
Les événements A et B sont contraires l’un de l’autre. Ex. 8. Considérons l’expérience consistant à lancer deux fois une pièce, modélisée par l’univers {P, F }2 . Notons A l’événement « le premier lancer montre pile » et B l’événement « le deuxième lancer montre pile », c’est-à-dire A = (P, P ), (P, F ) et B = (F, P ), (P, P ) . Alors les événements « un des deux lancers montre pile » et « les deux lancers montrent pile » sont respectivement :
A ∪ B = (F, P ), (P, F ), (P, P )
et
A ∩ B = (P, P ) .
1085
Chapitre 29. Probabilités — Variables aléatoires Ex. 9. On lance deux dés et on s’intéresse aux deux numéros obtenus. On suppose que ces dés sont discernables (par exemple qu’ils sont de couleurs différentes) ou qu’au moins on peut les distinguer mentalement (de telle sorte qu’il y ait un premier dé et un second). On choisit comme univers Ω = [[1, 6]]2 , de telle sorte qu’une issue soit le couple des résultats obtenus. On introduit les variables aléatoires X1 et X2 désignant respectivement les résultats du premier dé et du second dé : X1 :
Ω (a, b)
−→ �−→
[[1, 6]] a
X2 :
et
Ω (a, b)
−→ �−→
[[1, 6]] b.
Ces variables aléatoires X1 et X2 permettent d’exprimer de manière simple les événements associés à cette expérience aléatoire. Par exemple : • l’événement A : « le premier dé donne un numéro pair » s’écrit : A = {X1 est pair}
ou encore
A = X1 ∈ {2, 4, 6} ;
• l’événement E : « les deux dés donnent le même résultat » s’écrit :
E = (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6) , mais s’écrit aussi E = {X1 = X2 } ;
• si l’on note S la variable aléatoire « somme des deux résultats obtenus » : S:
Ω (a, b)
−→ �−→
[[2, 12]] a + b,
alors on a S = X1 +X2 , de telle sorte que l’événement « la somme des deux résultats obtenus vaut au moins 7 » s’écrit {X1 + X2 7} .
Ex. 10. Considérons l’expérience consistant à tirer simultanément 4 cartes d’un jeu de 52 cartes. On peut modéliser cette expérience aléatoire en considérant comme univers l’ensemble des parties à 4 éléments parmi les 52 cartes du jeu. • Parmi les événements que l’on peut considérer, citons-en deux : A : « obtenir au moins un as » ; B : « obtenir au moins une carte rouge et une carte noire ». Les événements contraires de A et B s’expriment ainsi : A : « aucune des cartes obtenues n’est un as » ; B : « n’obtenir que des cartes rouges ou que des cartes noires ». • Si X est la variable aléatoire donnant le nombre d’as obtenus, alors on a : A = {X 1}
et
A = {X = 0}.
• Si Y est la variable aléatoire donnant le nombre de cartes rouges, alors on a : B = {1 Y 3}
1086
et
B = {Y = 0} ∪ {Y = 4}.
II Espaces probabilisés Ex. 11. On effectue n lancers d’une pièce, chaque lancer donnant pile ou face. Associons pile à 1 et face à 0 , et modélisons cette expérience aléatoire par l’univers Ω = {0, 1}n . Pour k ∈ [[1, n]] , notons Xk la variable aléatoire associée au k -ième lancer : Xk :
Ω −→ {0, 1} (x1 , . . . , xn ) �−→ xk . Ainsi, les événements « le k -ième lancer donne pile » et « le k -ième lancer donne face » sont respectivement {Xk = 1} et {Xk = 0} . Avec ces notations : • l’événement « on n’a obtenu que des piles » s’écrit • le nombre de piles obtenus est la variable aléatoire au moins autant de piles que de faces » s’écrit
n
1
Xk ; ainsi, l’événement « on a obtenu
k=1
n
k=1
II
{Xk = 1} ;
k=1 n
Xk
n 2
.
Espaces probabilisés Probabilité
Définitions Définition 8 Soit Ω un univers fini. On appelle probabilité sur Ω toute application P de P(Ω) dans [0, 1] vérifiant : 1. P(Ω) = 1 ; 2. P(A ∪ B) = P(A) + P(B) pour tous événements A et B incompatibles. Remarque La seconde propriété est appelée additivité. Définition 9 Un espace probabilisé fini est un couple (Ω, P), où Ω est un univers fini et P une probabilité sur Ω. Dans la suite, sauf mention plus précise, (Ω, P) désigne un espace probabilisé fini. Remarque Un même univers peut être muni de plusieurs probabilités.
2
Propriétés des probabilités
Théorème 2 Soit A et B deux événements de (Ω, P). On a : 1. P(∅) = 0 ; 2. P(A) = 1 − P(A) ;
3. si A ⊂ B , alors P(A) P(B) : on dit que P est croissante ; de plus, P(B \ A) = P(B) − P(A) ;
4. P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
Démonstration page 1098
1087
Chapitre 29. Probabilités — Variables aléatoires Proposition 3 (Additivité finie) Pour toute famille finie (A1 , . . . , An ) d’événements deux à deux incompatibles de (Ω, P), on a : n P (A1 ∪ · · · ∪ An ) = P(Ak ). k=1
Démonstration page 1098
Principe de démonstration.
Récurrence sur n .
Union finie d’événements Examinons ce qu’il en est de la probabilité de la réunion de trois événements. Ex. 12. Soit A , B et C trois événements d’un espace probabilisé fini. On obtient en appliquant plusieurs fois la propriété 4 du théorème 2 de la page précédente :
P(A ∪ B ∪ C) = P(A ∪ B) + P(C) − P (A ∪ B) ∩ C) = P(A) + P(B) − P(A ∩ B) + P(C) − P ((A ∩ C) ∪ (B ∩ C)) = P(A) + P(B) − P(A ∩ B) + P(C)
− P(A ∩ C) + P(B ∩ C) − P(A ∩ B ∩ A ∩ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C)
+ P(A ∩ B ∩ C).
La formule du crible généralise ce qui précède au cas d’une union de n événements. Cette formule n’est pas au programme. Elle sera démontrée à l’aide des variables aléatoires dans l’exercice 31.13 de la page 1170. Mais il existe une majoration simple de la probabilité d’une union d’événements. Proposition 4 (Inégalité de Boole) Pour toute famille finie (A1 , . . . , An ) d’événements de (Ω, P), on a : n P A1 ∪ · · · ∪ An P(Ak ).
Exo 29.1
k=1
Démonstration page 1098
Remarque Cette propriété est aussi appelée sous-additivité. Propriétés des systèmes complets d’événements Proposition 5 Si (A1 , . . . , An ) est un système complet d’événements de (Ω, P), alors on a : n P(Ai ) = 1 i=1
et, plus généralement, pour tout événement B : n P(B) = P(B ∩ Ai ). i=1
1088
Démonstration page 1099
II Espaces probabilisés
3
Détermination d’une probabilité par les images des événements élémentaires
Une probabilité P sur un univers fini Ω est entièrement déterminée par la connaissance des probabilités des événements élémentaires. Définition 10 Une distribution de probabilités sur un ensemble fini E est une famille d’éléments de IR+ , indexée par E et de somme 1 . Théorème 6 Soit Ω un univers fini.
1. Si P est une probabilité sur Ω, alors P({ω}) ω∈Ω est une distribution de probabilités sur Ω.
Exo 29.2
2. Réciproquement, si (pω )ω∈Ω est une distribution de probabilités sur Ω, il existe une unique probabilité P sur Ω telle que P({ω}) = pω pour tout ω ∈ Ω. Cette probabilité P est définie, pour tout événement A, par : pω . P(A) = ω∈A
Démonstration page 1099
Exo 29.3 Exo 29.4
Théorème 7 Sur tout univers fini Ω, il existe une unique probabilité P prenant la même valeur sur tous les événements élémentaires. 1 Pour tout élément ω de Ω, on a P({ω}) = · card (Ω) card (A) · Pour tout événement A, on a P(A) = card (Ω) Cette probabilité est appelée probabilité uniforme sur Ω. Démonstration page 1099
Remarques • Si notre perception de l’expérience aléatoire nous laisse supposer que tous les événements élémentaires ont la même chance d’être réalisés, on dit qu’il y a équiprobabilité et l’on munit l’univers de la probabilité uniforme. Ainsi, quand on parle de lancers d’une pièce équilibrée, d’un dé ou de tirages au hasard dans une urne contenant des boules ou des jetons, on signifie implicitement que l’on est dans un cas d’équiprobabilité. card (A) • La formule P(A) = s’énonce parfois : la probabilité de A est le quotient card Ω du nombre de cas favorables sur le nombre de cas possibles, favorable signifiant ici réalisant l’événement A. • Quand l’univers Ω est muni de la probabilité uniforme, le calcul des probabilités se ramène en partie à des dénombrements. 1089
Chapitre 29. Probabilités — Variables aléatoires Ex. 13. On lance six fois un dé non truqué. On calcule la probabilité d’obtenir les six numéros de 1 à 6 . Comme le dé est non truqué, à chaque lancer, chaque numéro a la même chance de sortir qu’un autre. Nous munirons donc l’univers Ω = [[1, 6]]6 de la probabilité uniforme. L’événement A « obtenir les six numéros » est l’ensemble des 6 -uplets dont les composantes sont les six numéros dans des ordres différents, donc le cardinal de cet événement est le nombre 6! 5 de permutations d’un ensemble à 6 éléments. On obtient P(A) = 6 = · 6 324 Point méthode Considérons une urne contenant des boules de différentes couleurs, dans laquelle on effectue des tirages. Selon le mode de tirage, les éléments de Ω apparaîtront comme des listes, des combinaisons, des arrangements. Supposons que l’urne contienne N boules et que nous tirions n boules. Notons B l’ensemble des boules. Tirages simultanés. Les boules sont tirées en même temps. On choisit pour Ω l’ensemble des n-combinaisons de l’ensemble B . On a alors card (Ω) = N n .
Tirages avec remise. Les tirages sont successifs et la boule tirée est replacée dans l’urne avant le tirage suivant. On peut tirer plusieurs fois la même boule. On choisit pour Ω l’ensemble des n-listes de B . On a alors card (Ω) = N n . Tirages sans remise. Les tirages sont successifs et la boule tirée n’est pas replacée dans l’urne avant le tirage suivant. On choisit pour Ω l’ensemble des n! arrangements de B . Si n N , on a alors card (Ω) = (NN−n)! ·
Exo 29.5
Remarque Ces « modèles d’urnes » peuvent également être vus comme des modèles de prélèvements d’échantillons dans une population au cours d’un sondage.
III 1
Loi d’une variable aléatoire Définition - Propriétés
Notations En vue d’alléger les notations, on écrit P(X ∈ A) pour désigner la proba bilité de l’événement {X ∈ A} , au lieu de P {X ∈ A} ; de même, on écrit P(X = x) au lieu de P {X = x} .
Théorème 8 Si X est une variable aléatoire sur (Ω, P), alors l’application : P (X(Ω)) −→ [0, 1] A �−→ P(X ∈ A) est une probabilité sur X(Ω), appelée loi de X et notée PX .
Démonstration page 1100
Remarques 1. Considérer la loi de X , c’est s’intéresser uniquement à X(Ω) et à sa probabilité PX . On oublie l’univers Ω et X en tant qu’application. 2. Il résulte de la définition de la loi de X que celle-ci dépend de la probabilité choisie sur Ω, alors que la variable aléatoire X peut être définie indépendamment de la probabilité. 1090
III Loi d’une variable aléatoire Proposition 9 La loi d’une variable aléatoire X sur (Ω, P) est déterminée de manière unique par la distribution de probabilités (P (X = x))x∈X(Ω) . Plus précisément, on a pour tout A ⊂ X(Ω) : PX (A) = P (X = x) . x∈A
Démonstration. Compte tenu du théorème 8 de la page ci-contre, il s’agit d’un cas particulier de définition d’une probabilité sur un univers par la probabilité des événements élémentaires (théorème 6 de la page 1089). Exo 29.14
Point méthode Déterminer la loi de X revient donc à déterminer X(Ω) et à calculer, pour tout x ∈ X(Ω), la valeur de P(X = x). Ex. 14. Un dé est lancé deux fois successivement. On note X la variable aléatoire égale à la somme des chiffres apparus. Déterminons la loi de X . On considère l’univers Ω = [[1, 6]]2 , muni de la probabilité uniforme. On a X(Ω) = [[2, 12]] et, pour tout k ∈ [[2, 12]] : {X = k} = {(i, j) ∈ [[1, 6]]2 : i + j = k} = {(i, k − i) : i ∈ [[1, 6]]
(k − i) ∈ [[1, 6]]}.
et
k−1 · 36 13 − k • Si 8 k 12 , alors i peut varier entre k − 6 et 6 . On obtient P(X = k) = · 36 • Si 2 k 7 , alors i peut varier entre 1 et k − 1 . On obtient P(X = k) =
Remarque Parfois, on ne connaît a priori qu’un ensemble E tel que X(Ω) ⊂ E . On calcule P(X = x) pour tout x ∈ E . Si x ∈ / X(Ω), on trouve P(X = x) = 0 . Notation On note X ∼ Y la relation PX = PY , c’est-à-dire X et Y ont même loi. Cela équivaut à : X(Ω) = Y (Ω) et
∀x ∈ X(Ω) P(X = x) = P(Y = x).
Attention Dire que deux variables aléatoires sur le même espace probabilisé ont même loi ne signifie pas qu’elles sont égales. En effet, l’égalité X = Y équivaut à : ∀ω ∈ Ω
X(ω) = Y (ω) c’est-à-dire à ∀x ∈ X(Ω) {X = x} = {Y = x}.
Que les événements {X = x} et {Y = x} aient même probabilité ne signifie pas qu’ils sont égaux. Ex. 15. Si A est un événement de probabilité
1 2
, alors les variables 1A et 1A¯ ont même loi.
En effet, elles sont à valeurs dans {0, 1} et : P(1A = 0) = P(1A = 1) = P(1A¯ = 0) = P(1A¯ = 1) =
1 · 2
Mais 1A n’est pas égal à 1A¯ car, pour tout ω ∈ Ω : 1A (ω) = 1 ⇐⇒ 1A¯ (ω) = 0 .
1091
Chapitre 29. Probabilités — Variables aléatoires Point méthode Parfois, il est plus simple de déterminer d’abord P(X x) resp. P(X x) plutôt que directement P(X = x). C’est le cas en particulier dans des problèmes de maximum (resp. minimum). Dans le cas où X(Ω) ⊂ ZZ, on utilisera, pour tout k ∈ ZZ, les égalités : P(X = k) = P(X k) − P(X k − 1), P(X = k) = P(X k) − P X k + 1 .
Exo 29.15
Loi de f (X)
Exo 29.16
Proposition 10 Soit X une variable aléatoire sur (Ω, P) et f une application définie sur X(Ω). La loi de la variable aléatoire f (X) est donnée par : P(X = x). ∀y ∈ f (X)(Ω) P(f (X) = y) = x∈f −1 ({y})
Démonstration page 1100
Ex. 16. On garde les notations de la proposition 10. Soit f l’application x �→ x2 .
Si X(Ω) = [[−n, n]] , alors X 2 (Ω) = {k2 , k ∈ [[0, n]]} et la loi de X 2 est donnée par : P(X 2 = 0) = P(X = 0)
et
∀k ∈ [[1, n]]
P(X 2 = k2 ) = P(X = −k) + P(X = k).
Proposition 11 Soit X et Y deux variables aléatoires sur (Ω, P) telles que X ∼ Y et f une application définie sur X(Ω). Alors f (X) ∼ f (Y ).
Démonstration page 1100
Remarque Le résultat reste vrai si X et Y ont même loi, mais ne sont pas définies sur le même espace probabilisé.
2
Lois usuelles
Si (px )x∈E est une distribution sur un ensemble fini E , alors il existe une variable aléatoire X à valeurs dans E telle que pour tout x ∈ E , on ait P(X = x) = px . En effet il suffit de considérer l’univers Ω = E , muni de la probabilité définie par (px )x∈E , et de prendre X = IdE . Cela justifie les définitions suivantes. Loi uniforme Définition 11 Soit E un ensemble fini non vide. On dit qu’une variable aléatoire X suit la loi uniforme sur E , si X est à valeurs dans E et : Exo 29.17
∀x ∈ E 1092
P(X = x) =
1 · card (E)
III Loi d’une variable aléatoire Notations On note X ∼ U E l’assertion « X suit la loi uniforme sur E ». Dans la pratique, l’ensemble E est souvent de la forme [[1, n]], avec n ∈ IN∗ , ou [[a, b]], où a et b sont des entiers tels que a b . Ex. 17. On choisit un élément au hasard dans un ensemble fini non vide E . La variable aléatoire égale à l’élément choisi suit la loi uniforme sur E . Ex. 18. Une urne contient n boules numérotées de 1 à n . On en prend une au hasard et l’on note X le numéro de la boule tirée. Alors X suit une loi uniforme sur [[1, n]] . Ex. 19. Un dé équilibré est lancé. Soit X la variable aléatoire égale au numéro de la face supérieure : elle suit la loi uniforme sur [[1, 6]] .
Loi de Bernoulli Définition 12 Soit p ∈ [0, 1]. On dit qu’une variable aléatoire X suit la loi de Bernoulli de paramètre p si elle est à valeurs dans {0, 1} et P(X = 1) = p. Notations On note X ∼ B(p) l’assertion « X suit la loi de Bernoulli de paramètre p ». On dit aussi que X est une variable de Bernoulli. Remarque Une variable aléatoire X est une variable de Bernoulli si, et seulement si, elle est à valeurs dans {0, 1} . Si p ∈ ]0, 1[ , alors l’image de X est {0, 1} . Ex. 20. Toute épreuve à deux issues peut être représentée par une variable de Bernoulli, en notant 1 et 0 les deux résultats possibles. Par exemple, si on lance une pièce, la variable aléatoire réelle qui vaut 1 si la pièce tombe sur pile et 0 si la pièce tombe sur face, suit une loi de Bernoulli. Ex. 21. Pour tout événement mètre P(1A = 1) = P(A) .
A,
1A
est
une
variable
de
Bernoulli,
de
para-
Réciproquement, toute variable de Bernoulli est la variable indicatrice de l’événement {X = 1} .
Remarque Si X et Y sont deux variables de Bernoulli définies sur le même espace probabilisé, alors leur produit XY est une variable de Bernoulli, car il est clair qu’il est à valeurs dans {0, 1} . En particulier, X 2 est une variable de Bernoulli ; de plus, on a X 2 = X . Loi binomiale
Exo 29.18 Exo 29.19
Définition 13 Soit p ∈ [0, 1] et n ∈ IN∗ . On dit que la variable aléatoire X suit la loi binomiale de paramètre (n, p) si X est à valeurs dans [[0, n]] et : n k ∀k ∈ [[0, n]] P(X = k) = p (1 − p)n−k . k 1093
Chapitre 29. Probabilités — Variables aléatoires Notations On note X ∼ B(n, p) l’assertion « X suit la loi binomiale de paramètre (n, p) ». Remarques 1. La formule du binôme donne l’égalité :
n
P(X = k) = 1 , ce qui montre qu’on
k=0
définit bien une loi.
2. Si p ∈ ]0, 1[ , alors l’image de X est exactement [[0, n]].
3. La loi binomiale de paramètre (1, p) n’est rien d’autre que la loi de Bernoulli de paramètre p. Les notations B(p) et B(1, p) ont la même signification.
On démontrera dans le chapitre 30 que, si on répète une épreuve aléatoire n fois indépendamment, le nombre de succès suit la loi binomiale B(n, p), où p est la probabilité 1129 d’obtenir un succès sur une épreuve..
Ex. 22. On lance n fois une pièce équilibrée et l’on considère la variable aléatoire X égale au 1 . nombre de piles obtenu. La variable X suit la loi binomiale de paramètre n, 2 Ex. 23. On fait une suite de n tirages avec remise dans une urne contenant une proportion p de boules blanches. Le nombre X de boules blanches tirées suit la loi binomiale de paramètre (n, p) .
IV 1
Couples de variables aléatoires Définitions
Définition 14 Si X et Y sont deux variables aléatoires sur Ω, à valeurs dans E et E ′ respectivement, alors l’application : ′ Ω −→ E ×E ω �−→ X(ω), Y (ω) est appelée couple de variables aléatoires sur Ω. On le note (X, Y ). Remarques 1. Un couple de variables aléatoires est simplement une application de Ω dans E×E ′ , c’est-à-dire une variable aléatoire à valeurs dans E × E ′ . 2. L’image (X, Y )(Ω) est la partie du produit cartésien X(Ω) × Y (Ω) formée des couples X(ω), Y (ω) où ω décrit Ω. En général (X, Y )(Ω) est inclus strictement dans X(Ω) × Y (Ω).
Ex. 24. On lance deux dés équilibrés. Soit X la variable aléatoire égale au plus petit des nombres apparus lors du lancer et Y la variable aléatoire égale au plus grand des nombres apparus. Alors (X, Y ) est un couple de variables aléatoires réelles. Les variables aléatoires X et Y sont à valeurs dans [[1, 6]] et, par définition de X et Y , l’ensemble des valeurs prises par (X, Y ) est : {(i, j) ∈ [[1, 6]]2 : i j}.
1094
IV Couples de variables aléatoires Ex. 25. Une urne contient 2 boules blanches, 3 boules rouges et 4 boules bleues. On extrait simultanément 3 boules de l’urne. On note X le nombre de boules blanches et Y le nombre de boules rouges. Alors (X, Y ) est un couple de variables aléatoires réelles. La variable aléatoire X est à valeurs dans [[0, 2]] et Y est à valeurs dans [[0, 3]] . L’ensemble des valeurs prises par (X, Y ) est : {(i, j) ∈ [[0, 2]] × [[0, 3]] : i + j 3}, car on ne tire que 3 boules en tout.
Proposition 12 Soit (X, Y ) un couple de variables aléatoires sur Ω. Alors la famille d’événe ments {X = x} ∩ {Y = y} (x,y)∈X(Ω)×Y (Ω) est un système complet d’événements de Ω appelé système complet d’événements associé au couple (X, Y ).
Démonstration page 1100
Remarques • Il découle de cette proposition que si l’univers Ω est muni d’une probabilité P , on a l’égalité : P {X = x} ∩ {Y = y} = 1. (x,y)∈X(Ω)×Y (Ω)
• Pour l’événement {X = x} ∩ {Y = y} , on trouve aussi les notations {(X, Y ) = (x, y)} , ainsi que P(X = x, Y = y) pour sa probabilité.
2
Loi conjointe
Définition 15 Soit X et Y deux variables aléatoires sur (Ω, P). La loi conjointe de X et Y est la loi du couple (X, Y ). Remarque Par définition de la loi d’une variable aléatoire (cf.théorème 8 de la page 1090), la loi du couple (X, Y ) est l’application : P (X, Y )(Ω) −→ [0, 1] A �−→ P((X, Y ) ∈ A). C’est une probabilité sur (X, Y )(Ω).
Point méthode Quand on demande la loi conjointe des variables aléatoires X et Y , on attend le calcul de P ({X = x} ∩ {Y = y}), pour tout (x, y) ∈ X(Ω) × Y (Ω).
La loi peut être représentée par un tableau à double entrée, les lignes correspondant aux valeurs de X(Ω) et les colonnes à celles de Y (Ω) Ex. 26. On lance deux dés : X est la variable aléatoire égale au plus petit des nombres apparus et Y est la variable aléatoire égale au plus grand des nombres apparus. On munit l’univers Ω = [[1, 6]]2 de la probabilité uniforme. On obtient, pour (i, j) ∈ [[1, 6]]2 : • si i > j , P({X = i} ∩ {Y = j}) = P(∅) = 0 ; 1 ; • si i = j , P({X = i} ∩ {Y = j}) = P({(i, i)}) = 36 2 1 • si i < j , P({X = i} ∩ {Y = j}) = P({(i, j), (j, i)}) = = · 36 18
1095
Chapitre 29. Probabilités — Variables aléatoires
3
Lois marginales
Définition 16 Pour tout couple (X, Y ) de variables aléatoires, la loi de X est appelée première loi marginale du couple et celle de Y est appelée deuxième loi marginale du couple. Le théorème suivant exprime le fait que l’on peut déduire les lois marginales de la loi du couple. Pour obtenir une loi marginale, on somme par rapport à l’autre variable. Théorème 13 Soit (X, Y ) un couple de variables aléatoires sur (Ω, P). On a alors : ∀x ∈ X(Ω) P(X = x) = P {X = x} ∩ {Y = y} . y∈Y (Ω)
Démonstration.
Cette égalité résulte de ce que ({Y = y})y∈Y (Ω) est un système complet d’événements (on applique la proposition 5 de la page 1088).
Remarque On obtient de même P(Y = y) en sommant sur x ∈ X(Ω). Ex. 27. Déterminons les lois marginales du couple dont on a déterminé la loi conjointe dans l’exemple précédent. On obtient que, pour tout i ∈ [[1, 6]] : P(X = i) =
6 j=1
P {X = i} ∩ {Y = j} =
6 1 + 2(6 − i) 13 − 2i 1 1 + = = · 36 18 36 36 j=i+1
De même, pour tout entier j de [[1, 6]] , on a : P(Y = j) =
6 i=1
P {X = i} ∩ {Y = j} =
j−1 1 i=1
18
+
2(j − 1) + 1 1 2j − 1 = = · 36 36 36
Remarque Si la loi conjointe est représentée sous la forme d’un tableau, pour obtenir les lois de X et Y , il faut sommer sur les lignes ou les colonnes. Ex. 28. Une urne contient 3 boules blanches et 5 boules noires. On tire successivement deux boules de l’urne, sans remise. On note X (resp. Y ) la variable aléatoire de Bernoulli qui vaut 1 si le premier (resp. le second) tirage est blanc. Déterminons la loi conjointe de (X, Y ) . On obtient : 5·4 5 = ; 8·7 14 15 3·5 = ; P(X = 1, Y = 0) = 8·7 56 P(X = 0, Y = 0) =
5·3 15 = ; 8·7 56 3·2 3 P(X = 1, Y = 1) = = · 8·7 28 P(X = 0, Y = 1) =
❍❍ La loi conjointe de (X, Y ) est donc donnée dans le tableau suivant, grâce auquel on calcule les lois marginales.
Y X ❍❍ ❍ 0 1 loi de Y
1096
0
1
loi de X
5 14 15 56 5 8
15 56 3 28 3 8
5 8 3 8
1
IV Couples de variables aléatoires
Exo 29.20
Remarque La connaissance des lois marginales ne suffit pas, en général, à reconstituer la loi conjointe d’un couple de variables aléatoires, sauf pour des variables aléatoires indépendantes, ce que nous verrons page 1123.
4
Généralisation aux n-uplets de variables aléatoires
Définition 17 Soit n ∈ IN∗ . Si X1 , . . . , Xn sont des variables aléatoires sur Ω, à valeurs dans E1 , . . . , En respectivement, alors l’application : Ω −→ E 1 × · · · × En ω �−→ X1 (ω), . . . , Xn (ω)
est appelé n-uplet de variables aléatoires sur Ω. On le note (X1 , . . . , Xn ). Remarque Un n-uplet de variables aléatoires est simplement une application de Ω dans E1 × · · · × En , c’est-à-dire une variable aléatoire à valeurs dans E1 × · · · × En . Définition 18 Soit X1 , . . . , Xn des variables aléatoires sur (Ω, P). La loi conjointe de X1 , . . . , Xn est la loi du n-uplet (X1 , . . . , Xn ). Les lois marginales du n-uplet (X1 , . . . , Xn ) sont les lois des variables aléatoires X1 , . . . , Xn . Remarque Si X1 , . . . , Xn sont des variables aléatoires sur (Ω, P), leur loi conjointe est déterminée par la donnée, pour tout (x1 , . . . , xn ) ∈ X1 (Ω) × · · · × Xn (Ω), de : P {X1 = x1 } ∩ · · · ∩ {Xn = xn } .
Comme dans le cas des couples de variables aléatoires, les lois marginales des n-uplets s’obtiennent à partir de la loi conjointe. Pour obtenir une loi marginale, il faut sommer par rapport aux autres variables.
Ex. 29. Pour trois variables aléatoires X , Y et Z , on a : ∀x ∈ X(Ω)
P(X = x, Y = y, Z = z),
P(X = x) =
(y,z)∈Y (Ω)×Z(Ω)
et des formules identiques pour Y et Z .
1097
Chapitre 29. Probabilités — Variables aléatoires
Démonstrations Proposition 1 • •
•
Par définition, {X = x} est un événement pour tout x ∈ X(Ω) .
Si x et x′ sont deux éléments de X(Ω) , distincts, les événements {X = x} et {X = x′ } sont incompatibles. En effet, pour tout ω ∈ Ω , la relation ω ∈ {X = x} équivaut, par définition, à X(ω) = x . Si ω ∈ {X = x} ∩ {X = x′ } , alors X(ω) = x = x′ , ce qui est impossible. On a enfin : {X = x} = Ω x∈X(Ω)
car, pour tout ω ∈ Ω , si on note x = X(ω) , alors ω appartient à {X = x} .
Théorème 2 1. Comme ∅ est un événement incompatible avec lui-même, on a : P(∅) = P(∅ ∪ ∅) = P(∅) + P(∅) et donc P(∅) = 0. 2.
On a par définition, puisque A et A sont incompatibles :
P(A) + P(A) = P A ∪ A = P(Ω) = 1 et donc P(A) = 1 − P(A). 3.
Si A ⊂ B , alors B est la réunion des événements incompatibles A et B \ A et donc : P(B) = P(A) + P(B \ A) P(A).
0
4.
L’événement A ∪ B est la réunion des deux événements incompatibles A et B \ A ; d’autre part, B est la réunion des événements incompatibles A ∩ B et B \ A . On a donc : P(A ∪ B) = P(A) + P(B \ A)
On en déduit que :
et
P(B) = P(A ∩ B) + P(B \ A).
P(A ∪ B) = P(A) + P(B) − P(A ∩ B). Proposition 3 Raisonnons par récurrence sur le nombre n d’événements. • Pour n = 1 , il n’y a rien à démontrer. • On suppose que la propriété est vérifiée pour n événements deux à deux incompatibles et l’on considère une famille (A1 , . . . , An , An+1 ) d’événements deux à deux incompatibles. Alors les événements A1 ∪ . . . ∪ An et An+1 sont incompatibles. On a donc, par additivité :
P(A1 ∪ · · · ∪ An ∪ An+1 ) = P (A1 ∪ · · · ∪ An ) ∪ An+1 = P(A1 ∪ · · · ∪ An ) + P(An+1 ) puis, en utilisant l’hypothèse de récurrence :
P(A1 ∪ · · · ∪ An ∪ An+1 ) = P(A1 ) + · · · + P(An ) + P(An+1 ). Proposition 4
Pour n = 2 , on a : P(A1 ∪ A2 ) = P(A1 ) + P(A2 ) − P(A1 ∩ A2 ) P(A1 ) + P(A2 ).
En utilisant le cas n = 2 , on obtient, pour tout n ∈ IN∗ :
P(A1 ∪ · · · ∪ An ∪ An+1 ) = P ((A1 ∪ · · · ∪ An ) ∪ An+1 ) P(A1 ∪ · · · ∪ An ) + P(An+1 ),
ce qui permet de conclure par une récurrence immédiate.
1098
Démonstrations Proposition 5 Soit (A1 , . . . , An ) un système complet d’événements de (Ω, P) . Par additivité, comme les événements A1 , . . . , An sont deux à deux incompatibles, on a : P
De l’égalité
n
Ai = Ω découle alors
i=1
n
Ai
i=1
n
=
n
P(Ai ).
i=1
P(Ai ) = 1 .
i=1
Comme les événements A1 , . . . , An sont deux à deux incompatibles, il en est de même des événements B ∩ A1 , . . . , B ∩ An . De additivité :
P(B) = P Théorème 6 1.
n
(B ∩ Ai ) = B ∩ (
i=1 n
(B ∩ Ai )
i=1
=
Si P est une probabilité sur Ω , que P({ω}
ω∈Ω
n
i=1
n i=1
Ai ) = B ∩ Ω = B , on déduit, par
P(B ∩ Ai ).
soit une distribution de probabilités résulte
du fait que ({ω})ω∈Ω est un système complet d’événements. 2.
Réciproquement, supposons que (pω )ω∈Ω soit une distribution de probabilités. Raisonnons par analyse-synthèse. •
Supposons que la probabilité P existe. Tout événement A s’écrivant A =
{ω} , on a
ω∈A
par additivité : P(A) =
P ({ω}) =
ω∈A
•
pω .
ω∈A
Montrons que l’application P ainsi définie est une probabilité. ∗ Pour tout événement A , on a 0 P(A) = pω pω = 1 , car les pω sont ω∈A
∗
ω∈Ω
positifs. De plus, P(Ω) = 1 . Si A et B sont deux événements incompatibles, on a : P(A ∪ B) =
pω =
ω∈A∪B
pω +
ω∈A
pω = P(A) + P(B).
ω∈B
Donc P est une probabilité et, par définition de P , on a P ({ω}) = pω , pour tout ω ∈ Ω . Théorème 7 •
On pose n = card Ω .
Si P prend la même valeur sur tous les événements élémentaires alors, pour tout ω ∈ Ω : P(Ω) =
ω ′ ∈Ω
•
P({ω ′ }) = nP({ω}) = 1 et donc P({ω}) =
1 · n
D’après le théorème 6 de la page 1089, il existe une unique probabilité P sur Ω telle 1 que P ({ω}) = pour tout ω ∈ Ω . On a alors, pour tout événement A : n P(A) =
ω∈A
P ({ω}) =
1
ω∈A
n
=
card (A) card A = · n card (Ω)
1099
Chapitre 29. Probabilités — Variables aléatoires Théorème 8 • L’application PX est définie sur P X(Ω) et à valeurs dans [0, 1] . •
•
On a, par définition, {X ∈ X(Ω)} = Ω donc PX (X(Ω)) = 1 .
Si A et B sont deux parties disjointes de X(Ω) , alors : {X ∈ A} ∩ {X ∈ B} = ∅
{X ∈ A} ∪ {X ∈ B} = {X ∈ A ∪ B}.
et
Les événements {X ∈ A} et {X ∈ B} étant incompatibles, on a, par additivité :
PX (A ∪ B) = P (X ∈ A ∪ B) = P (X ∈ A) + P (X ∈ B) = PX (A) + PX (B).
Proposition 10
L’image de la variable aléatoire f (X) est f (X)(Ω) = f (X(Ω)) .
Pour tout y ∈ f (X)(Ω) , on a : {f (X) = y} = {ω ∈ Ω : f (X(ω)) = y} = {ω ∈ Ω : X(ω) ∈ f −1 ({y})}
= X ∈ f −1 ({y}) = On en déduit, par additivité :
P(f (X) = y) =
{X = x}.
x∈f −1 ({y})
P(X = x).
x∈f −1 ({y})
Proposition 11
L’ensemble des valeurs prises par f (X) et f (Y ) est f X(Ω) , et d’après la
proposition 10 de la page 1092, on a, pour tout y ∈ f X(Ω) : P(f (X) = y) =
x∈f −1 ({y})
P(X = x) =
P(Y = x) = P(f (Y ) = y).
x∈f −1 ({y})
Proposition 12 • Pour tout (x, y) ∈ X(Ω) × Y (Ω) , {X = x} ∩ {Y = y} est un événement. •
•
Si (x, y) et (x′ , y ′ ) sont des éléments distincts de X(Ω) × Y (Ω) , on a soit x �= x′ et {X = x} ∩ {X = x′ } = ∅ , soit y �= y ′ et {Y = y} ∩ {Y = y ′ } = ∅ . On en déduit : {X = x} ∩ {Y = y} ∩ {X = x′ } ∩ {Y = y ′ } = ∅.
On a enfin
{X = x} ∩ {Y = y} = Ω car, pour tout ω ∈ Ω , si l’on
(x,y)∈X(Ω)×Y (Ω)
note x = X(ω) et y = Y (ω) , alors ω appartient à {X = x} ∩ {Y = y} .
1100
Exercices
S’entraîner et approfondir Espaces probabilisés 29.1 Montrer que, pour toute famille finie (A1 , A2 , . . . , An ) d’événements de l’espace probabilisé (Ω, P) , on a :
→1088
P A1 ∪ A2 ∪ · · · ∪ An
n k=1
P(Ak ) −
1i max(u1 , . . . , ui−1 ) . On convient qu’il y a systématiquement record à l’instant 1 . 1. Calculer, pour 1 i n , la probabilité ri qu’il y ait record à l’instant i . 2. Calculer les probabilités que, durant la totalité des tirages, on assiste exactement à : (a) un record ; (b) 2 records ; (c) n records. ⋆ 29.13 Scrutin Soit p et q deux entiers naturels non nuls tels que p > q . 1. On considère des chemins joignant des points de IN2 et formés de déplacements successifs. Les seuls déplacements autorisés à partir du point (n, m) sont : le passage de (n, m) à (n + 1, m) et de (n, m) à (n, m + 1) . On note ∆ la droite d’équation y = x . (a) Pour (a, b, m, n) ∈ IN4 , combien y a-t-il de chemins allant de (a, b) à (a + m, b + n) ? (b) Montrer, en utilisant une symétrie par rapport à la droite ∆ , que le nombre de chemins allant de (1, 0) à (p, q) et qui rencontrent la droite ∆ est égal au nombre de chemins allant de (0, 1) à (p, q) . (c) En déduire que le nombre de chemins de (0, 0) à (p, q) qui ne rencontrent ∆ qu’en (0, 0) est
p+q−1 p−1
−
p+q−1 . p
2. Dans un scrutin, il y a p bulletins pour le candidat P et q pour le candidat Q . Calculer la probabilité que le candidat P soit toujours en tête dans le dépouillement.
1102
Exercices
Loi d’une variable aléatoire — Loi d’un couple 29.14 Soit n et N deux entiers naturels non nuls tels que n N . Un joueur prélève n boules →1091 simultanément dans une urne contenant N boules numérotées de 1 à N . On considère les variables aléatoires réelles X et Y égales respectivement au plus grand et au plus petit numéro des n boules prélevées. Déterminer les lois de X et de Y. 29.15 Soit (n, N ) ∈ (IN∗ )2 . Un joueur prélève n boules successivement avec remise dans une urne →1092 contenant N boules numérotées de 1 à N ; on considère la variable X (resp. Y ) égale au plus grand numéro (resp. plus petit) des n boules tirées. 1. Donner un espace probabilisé (Ω, P) rendant compte de l’expérience. Déterminer X(Ω) et Y (Ω) . 2. Déterminer P(X k) pour k ∈ [[1, N ]] . En déduire la loi de X . 3. Déterminer P(Y k) pour k ∈ [[1, N ]] . En déduire la loi de Y . 29.16 Un joueur lance successivement deux fois un dé équilibré. Soit X la variable aléatoire égale →1092 à la différence entre les résultats du premier et du deuxième lancer. Déterminer les lois de X et |X| . 29.17 Soit X une variable aléatoire suivant la loi uniforme sur [[0, 10]] . Déterminer les lois √ →1092 de Y = ⌊ X⌋ et Z = cos Xπ · 2 29.18 Montrer que, si la variable aléatoire X suit la loi binomiale de paramètre (n, p) , la variable →1093 aléatoire n − X suit la loi binomiale de paramètre (n, 1 − p) . Interpréter. 29.19 Soit p ∈ ]0, 1[ et X une variable aléatoire qui suit la loi B (n, p) . Pour quelles valeurs de k →1093 la probabilité P(X = k) est-elle maximale ? 29.20 Une urne contient trois boules numérotées de 1 à 3 . On en tire deux, on note X le premier →1097 numéro tiré et Y le second. Déterminer la loi conjointe et les lois marginales en examinant les deux cas : tirage avec remise et tirage sans remise. Que peut-on en conclure ? 29.21 Dans une pile de n ( n 2 ) lettres, se trouvent les deux lettres que l’on doit envoyer. On enlève une par une les lettres qui sont sur le dessus. On note X1 la variable aléatoire donnant le nombre de lettres enlevées jusqu’à trouver une des deux lettres à envoyer sur le dessus de la pile. On met de côté la lettre trouvée et on recommence l’opération jusqu’à trouver la deuxième lettre et on note X2 la variable aléatoire donnant le nombre supplémentaire de lettres qu’il a fallu retirer de la pile avant que la deuxième lettre ne soit sur le dessus de la pile. Sans information supplémentaire, on peut supposer que toutes les positions possibles pour les deux lettres sont équiprobables. 1. Décrire l’ensemble Ω des résultats possibles pour cette expérience aléatoire et la probabilité P mise sur Ω . Déterminer la loi du couple (X1 , X2 ) puis la loi de X1 et de X2 . 2. On note Z = X1 + X2 + 2 . Que représente la variable aléatoire Z ? Déterminer sa loi. 29.22 Soit n et N des entiers tels que 1 n < N . Une urne contient N boules numérotées de 1 à N . On en tire n simultanément. Les numéros obtenus sont notés Y1 < Y2 < · · · < Yn . Déterminer la loi du n -uplet (Y1 , . . . , Yn ) , puis les lois marginales.
1103
Chapitre 29. Probabilités — Variables aléatoires
Solutions des exercices 29.1 On procède par récurrence sur n .
Pour n = 2 l’inégalité est une égalité : P A1 ∩ A2 = P(A1 ) + P(A2 ) − P A1 ∩ A2 ) .
Supposons que l’inégalité soit vérifiée au rang n . On a alors pour n + 1 événements : P(A1 ∪ · · · ∪ An ∪ An+1 ) = P ((A1 ∪ · · · ∪ An ) ∪ An+1 )
= P(A1 ∪ · · · ∪ An ) + P(An+1 ) − P ((A1 ∪ · · · ∪ An ) ∩ An+1 ) = P(A1 ∪ · · · ∪ An ) + P(An+1 ) − P ((A1 ∩ An+1 ) ∪ · · · ∪ (An ∩ An+1 )) . En appliquant l’hypothèse de récurrence au premier terme et l’inégalité de Boole au troisième, on obtient : P(A1 ∪ · · · ∪ An ∪ An+1 ) =
n k=1
n+1 k=1
P(Ak ) −
P(Ai ∩ Aj ) + P(An+1 ) −
1i 365 et vaut (365−r)! si r > 365 et, sinon, est égale à
1106
365! · (365 − r)! 365r
Solutions des exercices 29.10 • Dans le cas d’un tirage simultané, on choisit pour Ω l’ensemble des parties de cardinal n de l’ensemble des boules, qu’on munit de la probabilité uniforme. On a card Ω = N . n La probabilité cherchée est : p=
N1 N2 n1
n2
...
N n
N k
nk
·
• Dans le cas de tirages successifs avec remise, on choisit pour Ω un ensemble de n listes, qu’on munit de la probabilité uniforme. On a card Ω = N n . Si on tire dans cet ordre n1 boules de couleur c1 , n2 de couleur c2 , . . . , nk de couleur ck , le nombre de cas favorables est N1n1 N2n2 . . . Nknk . Il faut multiplier par le nombre de répartition possibles des tirages des différentes couleurs parmi les n tirages. Il faut choisir les tirages de couleur c1 parmi n , puis les tirages de couleur c2 parmi n − n1 ,. . . On obtient ainsi :
n n1
n − n1 n2
...
n − n1 − · · · − nk−1 nk
=
n! , n1 !n2 ! · · · nk !
car les termes se simplifient deux à deux. La probabilité cherchée est donc : p=
N1n1 N2n2 · · · Nknk n! · n1 !n2 ! · · · nk ! Nn
29.11 Un résultat peut être décrit par une (2n) -liste d’éléments de {P, F } . On a donc card (Ω) = 2n . La pièce étant équilibrée, on munit Ω de la probabilité uniforme. 1. Sur 2n lancers, on obtient au moins n faces ou au moins n piles, ce qui donne du sens à la question posée. On note A l’événement « on obtient n faces avant n piles ». L’application ϕ : Ω → Ω qui à ω = (x1 , . . . , x2n ) associe ω ′ = (y1 , . . . , y2n ) , où yi = F si xi = P et yi = P si xi = F , est une permutation de Ω (elle est involutive) et ϕ(A) = A , car si dans ω le n -ième face est placé avant le n -ième pile, alors dans ω ′ , c’est le contraire. On a donc card (A) = card (A) et P(A) = P(A) . On en déduit P(A) = 12 · 2. Là aussi, sur 2n lancers, on obtient au moins n faces ou au moins n + 1 piles. On note B l’événement « on obtient le n -ième face avant le (n+1) -ième pile ». On remarque que A ⊂ B . On en déduit P(B) = P(A) + P(B \ A) . L’événement B \ A est réalisé si l’on a obtenu le n -ième pile avant le n -ième face, mais le n -ième face avant le (n + 1) -ième pile. Juste avant d’obtenir le n -ième face, on a donc déjà obtenu n piles (et évidemment n − 1 faces), ce qui signifie que le n -ième face est obtenu exactement au (2n) -ième tirage. On peut donc dire que B \ A consiste à tirer lors des 2n − 1 premiers tirages, n piles et n − 1 faces, puis à tirer un face. On a donc card (B \ A) = 2n−1 . En effet, il s’agit de placer les n piles parmi les 2n − 1 n premiers tirages ; pour le dernier tirage, il n’y a pas de choix. On en déduit : P(B \ A) =
2n−1 n 22n
1 puis P(B) = + 2
2n−1 n
22n
·
1107
Chapitre 29. Probabilités — Variables aléatoires 29.12 On peut représenter un résultat de l’expérience par un n -uplet (u1 , u2 , . . . , un ) qui s’identifie à la permutation de [[1, n]] qui à i associe ui . On a donc card (Ω) = n! . On fait l’hypothèse que tous les tirages sont équiprobables. 1. On note Ri l’événement « il y a un record à l’instant i ». L’événement Ri est réalisé si, et seulement si, ui > max(u1 , . . . , ui−1 ) . Pour dénombrer Ri , on choisit d’abord l’ensemble {u1 , . . . , ui } . On place ensuite à la i -ème place le plus grand élément de cet ensemble , l’ordre des i − 1 autres éléments étant indifférent ; par ailleurs, l’ordre dans lequel sont tirés les n − i jetons restants est également indifférent. On obtient : card Ri =
n (i − 1)! (n − i)!, puis ri = i
n i
(i − 1)!(n − i)! 1 = · n! i
On voit que le résultat est valable pour i = 1 car, au premier tirage, il y toujours record. 2. (a) • S’il y a un seul record, il est obtenu au premier tirage. On peut remarquer que lorsqu’on tire le jeton numéro n , il y a record. Il doit donc être tiré en premier. • Réciproquement, si l’on tire le jeton n en premier, il n’y a qu’un record car, pour i 2 , on a max(u1 , . . . , ui−1 ) = n ui . Il y a donc un seul record si, et seulement si, le jeton n est tiré en premier. La (n − 1)! 1 = · probabilité d’avoir un seul record est p1 = n! n (b) S’il y a deux records, l’un est obtenu au rang 1 . Déterminons la probabilité qi d’obtenir deux records, aux rangs 1 et i , où i 2 . • Une condition nécessaire est ui = n . • Si cette condition est réalisée, il ne peut pas y avoir de record aux rangs i+1 ,. . . , n . Pour qu’il n’y ait pas non plus de record entre les rangs 2 et i − 1 , il faut et il suffit que u1 = max(u1 , u2 , . . . , ui−1 ) . On a donc deux records aux rangs 1 et i si, et seulement si, on a : ui = n
et
u1 = max(u1 , u2 , . . . , ui−1 ).
On raisonne comme dans la question 1. On choisit {u1 , . . . , ui−1 } , sous-ensemble de [[1, n − 1]] ; le plus grand élément de cet ensemble est placé en premier, les i − 2 autres dans un ordre quelconque. Pour ui , il n’y a pas de choix, puis les n−i éléments restants sont tirés dans un ordre quelconque. On obtient : qi =
n−1 i−1
(i − 2)!(n − i)! n!
=
1 · n(i − 1)
La probabilité qu’il y ait exactement deux records est : p2 =
n i=2
qi =
n i=2
n−1 11 1 = · n(i − 1) n k k=1
(c) Il y a n records si, et seulement si, on a ui > max(u1 , . . . , ui−1 ) ui−1 pour tout i ∈ [[1, n]] . Ce qui revient à dire que la suite (ui )1in est strictement croissante et donc que ui = i pour tout i . Une seule permutation convient, donc la 1 probabilité d’obtenir n records est pn = · n!
1108
Solutions des exercices 29.13 1. (a) Pour aller de (a, b) à (a + m, b + n) , il faut faire en tout m déplacements vers la droite et n vers le haut. Les différents chemins correspondent aux différentes manières d’ordonner ces m+n déplacements. Il y a autant de chemins que de manières de choisir les m déplacements vers la droite parmi les m + n déplacements, c’est-à-dire m+n . m (b) Soit C l’ensemble des chemins allant de (1, 0) à (p, q) qui rencontrent la droite ∆ et C ′ l’ensemble des chemins allant de (0, 1) à (p, q) . Un chemin de C ou C ′ est représenté par une liste de p + q couples de IN2 . • Soit C ∈ C , qu’on écrit C = (c1 , . . . , cN ) où c1 = (1, 0) , cN = (p, q) et N = p + q . On note ci = (xi , yi ) . Par définition, il existe des indices i > 0 tels que xi = yi . On note k le plus petit tel indice. • Au chemin C , on associe le chemin C ′ = (c′1 , . . . , c′N ) , obtenu en transformant la partie de C qui joint les points c1 à ck par la symétrie par rapport à ∆ et en laissant le reste invariant. On a donc : c′i = (yi , xi ) ′
si ′
0ik−1
et
c′i = ci
si
i k.
Alors C appartient à C . • Montrons que l’application f : C �→ C ′ est une bijection de C sur C ′ . On remarque que c′k est le premier point où C ′ rencontre ∆ . Soit C ′ = (c′1 , . . . , c′N ) un chemin quelconque de C ′ , où c′i = (ui , vi ) . Le chemin C ′ rencontre ∆ . En effet, u1 − v1 < 0 , uN − vN > 0 et ui − vi varie de ±1 à chaque étape, donc il existe i tel que ui = vi . On appelle k le plus petit tel entier i . Si l’on considère le chemin C obtenu en faisant la symétrie par rapport à ∆ de la partie du chemin entre c′1 et c′k et en laissant le reste invariant, on démontre comme précédemment que C est dans C . Il est clair que C est l’unique antécédent de C ′ par f . (c) Un chemin qui va de (0, 0) à (p, q) en ne rencontrant ∆ qu’en (0, 0) passe nécessairement par (1, 0) , c’est-à-dire commence par un déplacement vers la droite (car on a montré qu’un chemin de (0, 1) à (p, q) rencontre ∆ ). Il y a en tout
p+q−1 p−1
chemins
de (1, 0) à (p, q) . Il faut enlever ceux qui rencontrent ∆ . Le nombre de chemins de (1, 0) à (p, q) qui rencontrent ∆ est égal, d’après la ques tion précédente au nombre de chemins de (0, 1) à (p, q) , soit p+q−1 . Le nombre de p chemins de (0, 0) à (p, q) qui ne rencontrent ∆ qu’en (0, 0) est donc :
p+q−1 p−1
−
p+q−1 . p
2. • Après le dépouillement de i bulletins (avec 0 i p + q ), on note xi le nombre de voix pour P et yi le nombre de voix pour Q et on pose ci = (xi , yi ) . Le résultat dépouillements d’un dépouillement est donc un chemin de (0, 0) à (p, q) . Il y a p+q p possibles que l’on suppose équiprobables. • Les dépouillements pour lesquels P reste toujours en tête correspondent aux chemins qui restent en-dessous de ∆ , c’est-à-dire aux chemins qui ne rencontrent ∆ p+q−1 − . qu’en (0, 0) . Il y en a p+q−1 p−1 p • La probabilité que P reste toujours en tête est donc :
p+q−1 p−1
−
p+q−1
p+q p
p
=
q p−q p − = · p+q p+q p+q
1109
Chapitre 29. Probabilités — Variables aléatoires 29.14 On choisit pour Ω l’ensemble des parties de cardinal n de l’ensemble des boules, que l’on munit de la probabilité uniforme. On a X(Ω) = [[n, N ]] et Y (Ω) = [[1, N − n + 1]] . 1. L’événement {X = k} est « la boule numérotée k est tirée et les n − 1 autres boules portent des numéros compris entre 1 et k − 1 ». Pour les boules ne portant pas le k−1 k−1 possibilités. On obtient card ({X = k}) = · numéro k , on a n−1 n−1 Comme card (Ω) =
N n
, on en déduit, pour tout k ∈ [[n, N ]] :
k−1 n−1 P (X = k) = N · n
2. De même, {Y = k} est l’événement « la boule portant le numéro k est tirée et les n − 1 autres boules portent des numéros compris entre k + 1 et N ». Comme il y a N − k N −k numéros de k + 1 à N , on obtient card ({Y = k}) = · n−1 On en déduit, pour tout k ∈ [[1, N − n + 1]] :
N−k · P (Y = k) = n−1 N n
29.15 1. Un résultat possible est un n -uplet (k1 , . . . , kn ) d’entiers entre 1 et N , où ki est le numéro de la boule obtenue au i -ème tirage : on choisit donc Ω = [[1, N ]]n , que l’on munit de la probabilité uniforme. Les tirages étant effectués avec remise, X et Y peuvent prendre toutes les valeurs entre 1 et N , donc X(Ω) = Y (Ω) = [[1, N ]] . 2. Pour tout k ∈ [[1, n]] , l’événement {X k} : « les n boules sont tirées parmi les boules kn numérotées de 1 à k », est égal à [[1, k]]n . On obtient P(X k) = n · Cela reste vrai N pour k = 0 , car {X 0} = ∅ . On en déduit, pour tout k ∈ [[1, N ]] :
P X = k = P(X k) − P(X k − 1) =
(k − 1)n kn − · n N Nn
3. Pour tout k ∈ [[1, n]] , l’événement {Y k} : « les n boules sont tirées parmi les boules (N − k + 1)n · Cela reste numérotées de k à N », est [[k, N ]]n . On obtient P(Y k) = Nn vrai pour k = N + 1 , car {Y N + 1} = ∅ . On en déduit que, pour tout k ∈ [[1, N ]] : P(Y = k) = P(Y k) − P(Y k + 1) =
(N − k)n (N − k + 1)n − · Nn Nn
Remarque Un calcul direct est difficile, car les événements {X = k} et {Y = k} ne sont pas simples à décrire. Par exemple, l’événement {X = k} est réalisé si au moins un des numéros tirés est k , les autres étant inférieurs ou égaux à k . Il faut le décomposer en une union d’événements incompatibles Ai (pour 1 i n ) : « on a tiré i fois le numéro k , les n−i autres numéros étant inférieurs ou égaux à k−1 ». On retrouve la valeur de P(X = k) en calculant
n
i=1
1110
P(Ai ) .
Solutions des exercices 29.16 On choisit comme univers Ω = [[1, 6]]2 , muni de la probabilité uniforme. • On a X(Ω) = [[−5, 5]] et, pour k ∈ [[−5, 5]] : {X = k} = {(i, j) ∈ [[1, 6]]2 : i − j = k}. On peut remarquer que : card {X = −k} = card (i, j) ∈ [[1, 6]]2 : i − j = −k = card
(j, i) ∈ [[1, 6]]2 : j − i = k
= card {X = k}
et donc P(X = −k) = P(X = k) . On suppose désormais k 0 . On a alors : {X = k} = (j + k, j) | j ∈ [[1, 6]] et j + k ∈ [[1, 6]] . Pour j ∈ [[1, 6]] , on a j j + k . Alors j doit vérifier les inégalités 1 j j + k 6 , c’est-à-dire 1 j 6 − k . On obtient : {X = k} = (j + k, j) | 1 j 6 − k . 6−k On en déduit card {X = k} = 6 − k et donc P(X = k) = · Par symétrie, on 36 obtient : 6 − |k| · ∀k ∈ [[−5, 5]] P(X = k) = 36 • On a |X|(Ω) = [[0, 5]] et : 1 P(|X| = 0) = P(X = 0) = , 6 6−k · ∀k ∈ [[1, 5]] P(|X| = k) = P(X = −k) + P(X = k) = 18
29.17 1. La variable aléatoire Y est à valeurs dans [[0, 3]] , et pour k ∈ [[0, 2]] , on a : √ {Y = k} = {k X < (k + 1)} = {k2 X < (k + 1)2 } = {k2 X k2 + 2k}. On en déduit P(Y = k) =
2k+1 · 11
Et comme X 10 , on a {Y = 3} = {9 X 10} et donc P(Y = 3) =
2. La variable aléatoire Z est à valeurs dans {−1, 0, 1} et on a : • P(Z = −1) = P(X ≡ 2 [4]) = P(X ∈ {2, 6, 10}) =
• P(Z = 0) = P(X impair) =
5 11
3 11
2 · 11
;
;
• P(Z = 1) = P(X ≡ 0 [4]) = P(X ∈ {0, 4, 8}) =
3 · 11
29.18 Si l’on pose Y = n − X , alors on a Y (Ω) = [[0, n]] et, pour tout k ∈ [[0, n]] , on a : P(Y = k) = P(X = n − k) =
n pn−k (1 − p)k = n−k
n (1 − p)k pn−k . k
La variable aléatoire Y suit la loi binomiale de paramètre (n, 1 − p) .
Si X représente un nombre de succès parmi n expériences, alors Y = n − X mesure le nombre d’échecs.
1111
Chapitre 29. Probabilités — Variables aléatoires 29.19 On pose uk = P(X = k) =
On a donc :
n k
pk (1 − p)n−k . Pour 1 k n , on a :
n pk (1 − p)n−k (n − k + 1)p uk · = = n k k−1 (1 − p)n−k+1 uk−1 k(1 − p) p k−1
uk uk−1 ⇐⇒ (n − k + 1)p k(1 − p) ⇐⇒ k (n + 1)p.
• Si (n + 1)p < 1 , cette inégalité n’est jamais vérifiée. La suite (uk ) est décroissante et le maximum est obtenu pour k = 0 . • Si (n + 1)p n , cette inégalité est toujours vérifiée. La suite (uk ) est croissante et le maximum est obtenu pour k = n . • Si 1 (n + 1)p < n , la suite (uk ) est croissante puis décroissante. Le maximum est obtenu pour k = ⌊(n + 1)p⌋ . On peut préciser que si (n + 1)p ∈ / IN , le maximum est obtenu pour cette unique valeur, mais que si (n+1)p est un entier k0 , alors uk0 = uk0 −1 : le maximum est obtenu pour k = k0 et k = k0 − 1 . 29.20 1. Tirage avec remise On a Ω = [[1, 3]]2 , que l’on munit de la probabilité uniforme. Pour tout (i, j) ∈ [[1, 3]]2 : P({X = i} ∩ {Y = j}) = Pour tout i ∈ [[1, 3]] , P(X = i) =
3 j=1
1 · 9
P({X = i} ∩ {Y = j}) =
1 · 3
On obtient le même résultat pour Y . 2. Tirage sans remise Les deux boules tirées sont distinctes. On a Ω = {(i, j) ∈ [[1, 3]]2 : i �= j} que l’on munit encore de la probabilité uniforme. Dans ce cas, card (Ω) = 6 . On en déduit, pour tout (i, j) ∈ Ω : 1 P {X = i} ∩ {Y = j} = · 6 1 2 P({X = i} ∩ {Y = j}) = = · Pour tout i ∈ [[1, 3]] , P(X = i) = 6 3 j�=i On obtient le même résultat pour Y.
Dans les deux cas, les variables X et Y suivent la loi uniforme sur [[1, 3]] , mais le couple (X, Y ) n’a pas la même loi. Ainsi les lois marginales ne déterminent pas la loi conjointe. 29.21 1. On prend pour Ω l’ensemble des positions possibles des deux lettres parmi les n feuilles, que l’on munit de la probabilité uniforme. On a card (Ω) = n2 . Au total, on enlève au plus n − 2 feuilles. L’ensemble des valeurs prises par (X1 , X2 ) est donc : E = {(i, j) ∈ IN2 : i + j n − 2}.
La valeur de (i, j) détermine la position des deux lettres parmi les n feuilles. On a donc : ∀(i, j) ∈ E
1112
1 P (X1 , X2 ) = (i, j) = n · 2
Solutions des exercices Pour tout i ∈ [[0, n − 2]] , on a P(X1 = i) =
n−2
n−2−i
P (X1 , X2 ) = (i, j) =
j=0
1
n−1−i
2
2
n =
j=0
n
·
On trouve le même résultat pour la loi de X2 . 2. La variable aléatoire Z désigne le nombre total de lettres enlevées. Elle est à valeurs dans [[2, n]] et, pour tout k ∈ [[2, n]] : P(Z = k) = P(X1 + X2 = k − 2) =
29.22 • On fait l’hypothèse que les
N n
k−2 i=0
k−1 P (X1 , X2 ) = (i, k − 2 − 1) = n · 2
tirages sont équiprobables.
Les valeurs prises par le n -uplet de variables aléatoires (Y1 , . . . , Yn ) sont les n -uplets d’entiers (y1 , . . . , yn ) tels que 1 y1 < · · · < yn N . L’ensemble de ces n -uplets est noté E . On a donc : 1 ∀(y1 , . . . , yn ) ∈ E P (Y1 , . . . , Yn ) = (y1 , . . . , yn ) = N , n
car c’est la probabilité que les boules tirées portent les numéros y1 , . . . , yn . Ainsi (Y1 , . . . , Yn ) suit la loi uniforme sur E .
• Soit k ∈ [[1, n]] . Déterminons la loi de Yk .
L’ensemble des valeurs prises par Yk est [[k, N − n + k]] , car :
∗ la plus petite valeur de Yk est obtenue pour (Y1 , . . . , Yk ) = (1, . . . , k) ; ∗ la plus grande de Yk est obtenue pour (Yk , . . . , Yn ) = (N − n + k, . . . , N ) .
Pour yk ∈ [[k, N − n + k]] fixé, les valeurs (y1 , . . . , yn ) prises par (Y1 , . . . , Yn ) doivent vérifier : 1 y1 < · · · < yk−1 < yk < yk+1 < · · · < yn N. On a
y
en tout
k −1 choix possibles k−1 yk −1 N−yk choix k−1 n−k
pour (y1 , . . . , yk−1 ) et
N−y k
n−k
pour (yk+1 , . . . , yn ) , donc
possibles pour (y1 , . . . , yn ) .
Comme le n -uplet (Y1 , . . . , Yn ) suit la loi uniforme sur E , on en déduit : P(Yk = yk ) =
y
N−y k N n−k ·
k −1 k−1
n
1113
Chapitre 30 : Conditionnement Indépendance
I
Probabilités conditionnelles . . . . . . . . . . . . . . . . 1116 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . 1116 Formule des probabilités composées . . . . . . . . . . . . 1117 Formule des probabilités totales . . . . . . . . . . . . . . . 1117 Formule de Bayes . . . . . . . . . . . . . . . . . . . . . . . 1119 Lois conditionnelles . . . . . . . . . . . . . . . . . . . . . 1119 II Événements indépendants . . . . . . . . . . . . . . . . . 1120 1 Indépendance entre deux événements . . . . . . . . . . . . 1120 2 Indépendance d’une famille d’événements . . . . . . . . . 1122 III Variables aléatoires indépendantes . . . . . . . . . . . . 1123 1 Indépendance de deux variables aléatoires . . . . . . . . . 1123 2 Indépendance de n variables aléatoires . . . . . . . . . . . 1125 3 Somme de variables indépendantes de même loi de Bernoulli1129 Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . . . . 1130 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1135 1 2 3 4 5
Conditionnement Indépendance
30
Dans tout le chapitre (Ω, P) désigne un espace probabilisé fini.
I
Probabilités conditionnelles
1
Définition
Définition 1 Si A et B sont des événements de (Ω, P) et si P(A) �= 0 , on appelle probabilité conditionnelle de B sachant A et l’on note PA (B) ou P(B | A), le réel : P(B ∩ A) · P(A)
Exo 30.1
Ex. 1. Supposons que l’univers Ω soit muni de la probabilité uniforme. On a alors : PA (B) =
P(B ∩ A) = P(A)
card (A∩B) card (Ω) card (A) card (Ω)
=
card (A ∩ B) · card (A)
Par exemple, la probabilité qu’on ait obtenu un 6 en lançant un dé équilibré sachant qu’on a 1 obtenu un nombre pair est , car il y a trois numéros pairs et un seul 6 . 3
Théorème 1 Pour tout événement A de (Ω, P) vérifiant P(A) �= 0 , l’application : PA : P(Ω) −→ [0, 1] B �−→ PA (B)
est une probabilité sur Ω, appelée probabilité conditionnelle sachant A. Démonstration page 1130
Remarque Puisque PA est une probabilité, elle en possède toutes les propriétés. En particulier, pour tout événement B , on a PA (B) = 1 − PA (B). Attention La notation P(B | A) peut se révéler dangereuse en donnant à penser qu’il existe un événement conditionnel « B | A » dont on calculerait la probabilité. Il n’existe pas d’événements conditionnels, mais seulement des probabilités conditionnelles, c’est-à-dire d’autres probabilités que P sur le même univers Ω.
I Probabilités conditionnelles
2
Formule des probabilités composées
Le plus souvent, on ne calcule pas PA (B) à partir de P(A ∩ B) et P(A). Au contraire, c’est la connaissance de PA (B) et P(A) qui permet le calcul de P(A ∩ B). Le résultat suivant est une conséquence immédiate de la définition. Proposition 2 Pour tous événements A et B de (Ω, P), on a : P(A ∩ B) = P(A) PA (B)
si P(A) �= 0.
Remarque Si P(A) = 0 , on pose, par convention, P(A) PA (B) = 0 . Cette convention permet d’étendre au cas P(A) = 0 la formule de la proposition précédente car alors, puisque A ∩ B ⊂ A, on a aussi P(A ∩ B) = 0 . Dans la suite, on adoptera toujours cette convention. Ex. 2. Une urne contient initialement 4 boules blanches et 2 boules noires. On tire une boule. On la remet dans l’urne avec une boule de la même couleur. On procède à un deuxième tirage. On cherche la probabilité d’obtenir deux boules noires. Pour i ∈ {1, 2} , on note Ni l’événement « on tire une boule noire au i -ème tirage ». On obtient : P(N1 ∩ N2 ) = P(N1 ) PN1 (N2 ) =
1 2 3 · = , 6 7 7
car, si on a tiré une boule noire au premier tirage, alors au moment d’effectuer le second tirage, l’urne contient 4 boules blanches et 3 boules noires.
La formule précédente se généralise à l’intersection de n événements. Théorème 3 (Formule des probabilités composées) Soit n 2 un entier naturel. Pour toute famille (A1 , . . . , An ) d’événements de (Ω, P) telle que P(A1 ∩ · · · ∩ An−1 ) �= 0 , on a : P(A1 ∩ · · · ∩ An−1 ∩ An ) = P(A1 ) P(A2 | A1 ) . . . P(An | A1 ∩ · · · ∩ An−1 ).
Principe de démonstration. Exo 30.2
Démonstration page 1130 Le produit de droite est télescopique.
Remarque Cette formule est utilisée en particulier quand les événements A1 , . . . , An suivent un ordre chronologique.
3
Formule des probabilités totales
Théorème 4 (Formule des probabilités totales) Si (A1 , . . . , An ) est un système complet d’événements de (Ω, P), on a, pour tout événement B : P(B) =
n i=1
P(B ∩ Ai ) =
n i=1
P(Ai ) P(B | Ai ).
Démonstration.
La première égalité a été énoncée dans la proposition 5 de la page 1088. En écrivant P(B ∩ Ai ) = P(Ai ) P(B | Ai ) , pour tout i de [[1, n]] , on obtient la seconde égalité.
1117
Chapitre 30. Conditionnement — Indépendance Remarques • On rappelle la convention adoptée (cf. page 1117). Si Ai est de probabilité nulle, alors on pose P(Ai ) P(B | Ai ) = 0 . • Comme (A, A) est un système complet d’événements, on obtient en particulier : P(B) = P(A) P(B | A) + P(A) P(B | A). Ex. 3. Une compagnie d’assurance estime que ses clients se divisent en deux catégories : les clients enclins aux accidents, un client sur cinq, et ceux qui ont peu d’accidents. Pour la première catégorie, la probabilité d’avoir au moins un accident par an est 0,5 ; pour la seconde catégorie, cette probabilité est 0,1 . Calculons la probabilité qu’un nouvel assuré soit victime d’un accident pendant l’année qui suit la signature de son contrat. Notons N l’événement « le nouvel assuré est victime d’un accident dans l’année qui suit la signature de son contrat », et A l’événement « le nouvel assuré est enclin aux accidents ». L’hypothèse s’écrit P(A) = 0,2 et donc P(A) = 0,8 , P(N | A) = 0,5 et P(N | A) = 0,1 . On obtient donc, par la formule des probabilités totales : P(N ) = P(A) P(N | A) + P(A)P(N | A) = 0,2 · 0,5 + 0,8 · 0,1 = 0,18.
Point méthode La formule des probabilités totales doit être utilisée en particulier quand l’expérience se déroule en plusieurs étapes et que la première aboutit à plusieurs résultats incompatibles entre eux et donnant un système complet d’événements. Ex. 4. Soit n un entier naturel non nul. Une urne U contient des jetons numérotés : 1
jeton numéroté 1 , 2 jetons numérotés 2 , . . . , n jetons numérotés n . On dispose de n urnes numérotées de 1 à n ; l’urne i contient i boules blanches et n − i boules noires. On tire un jeton dans U ; si le jeton tiré porte le numéro i , on prélève une boule dans l’urne numéro i . Calculons la probabilité que la boule prélevée soit blanche. Pour i ∈ [[1, n]] , notons Ui l’événement « l’urne i est choisie » et B l’événement « la boule prélevée est blanche ». La famille (U1 , . . . , Un ) est un système complet d’événements. On obtient, d’après la formule des probabilités totales, P(B) =
n i=1
l’énoncé, P(Ui ) =
i i 2i = et P(B | Ui ) = , d’où : 1 +··· + n n(n + 1) n P(B) =
n i=1
Exo 30.3
P(Ui )P(B | Ui ) . Avec les données de
2n(n + 1)(2n + 1) 2n + 1 2i2 = = · + 1) 6n2 (n + 1) 3n
n2 (n
Point méthode Pour étudier une suite d’événements (An )n∈IN pour laquelle on connaît, pour n 1 , les probabilités P(An | An−1 ) et P(An | An−1 ), on utilise la formule des probabilités totales pour déterminer une relation de récurrence entre P(An−1 ) et P(An ).
1118
I Probabilités conditionnelles
4 Exo 30.4
Formule de Bayes
Proposition 5 Pour tous événements A et B de (Ω, P), de probabilité non nulle , on a :
Exo 30.5
P(A | B) = Démonstration.
P(A) P(B | A) · P(B)
Par définition de la probabilité conditionnelle, on a : P(A) P(B | A) = P(B ∩ A) = P(B) P(A | B).
Remarques • Cette formule, appelée également formule de probabilité des causes, permet en quelque sorte « de remonter le temps ». En effet, si l’événement B se produit après l’événement A, elle nous permet de déduire, de la probabilité PA (B) qui respecte la chronologie, la probabilité PB (A) qui, elle, remonte cette chronologie. • En général, pour exprimer P(B), on utilise la formule des probabilités totales. Ex. 5. Une certaine maladie affecte une personne sur dix mille. On dispose d’un test sanguin qui détecte cette maladie avec une fiabilité de 99% lorsque cette maladie est effectivement présente. Cependant, on obtient un résultat faussement positif pour 0,1% des personnes saines testées. Calculons la probabilité qu’une personne soit réellement malade lorsqu’elle a un test positif. Notons M l’événement « la personne est malade » et T l’événement « le test est positif ». On cherche P(M | T ) =
P(M ) P(T |M ) P(T )
, d’après la formule de Bayes. On calcule P(T ) avec la formule
des probabilités totales : P(T ) = P(M ) P(T | M ) + P(M) P(T | M ) . D’après les données de l’énoncé, on a : P(M ) = 0,0001, P(T | M ) = 0,99 On en déduit : P(M | T ) =
5
et
P(T | M ) = 0,001.
0,0001 · 0,99 ≈ 0,09. 0,0001 · 0,99 + 0,9999 · 0,001
Lois conditionnelles
Définition 2 Soit X une variable aléatoire sur (Ω, P). Pour tout événement A, tel que P(A) �= 0 , la loi conditionnelle de X sachant A est la loi de X dans l’espace probabilisé (Ω, PA ) . Elle est donc déterminée par la donnée, pour tout x ∈ X(Ω) de : PA X = x = P (X = x | A) . Remarques • Les lois conditionnelles sont des lois de variables aléatoires ; elles en ont les propriétés. • Assez fréquemment, l’événement A est de la forme {Y = y} , où Y est une autre variable aléatoire sur le même espace probabilisé. 1119
Chapitre 30. Conditionnement — Indépendance Ex. 6. On lance un dé. Soit X la variable égale au numéro obtenu et A l’événement {X est pair} . Déterminons la loi conditionnelle de X sachant A . Pour k ∈ [[1, 6]] , on a : 0
P ({X = k} ∩ A) P ({X = k} ∩ A) = = P(X = k) P(X = k | A) = 1 1 P(A) = 2 1 3 2
si
k est impair
si
k est pair.
La loi de X sachant A est la loi uniforme sur {2, 4, 6} .
Proposition 6 Soit (X, Y ) un couple de variables aléatoires sur (Ω, P). Alors, pour tout x ∈ X(Ω) : � P(Y = y) P(X = x | Y = y). P(X = x) = y∈Y (Ω)
Démonstration. Cela résulte de la formule des probabilités totales appliquée avec le système complet d’événements ({Y = y})y∈Y (Ω) . Remarque On a évidemment une formule symétrique pour P(Y = y).
II 1
Événements indépendants Indépendance entre deux événements
Définition 3 Deux événements A et B de (Ω, P) sont dits indépendants si : P(A ∩ B) = P(A) × P(B). Remarques 1. Cette relation ne dépend pas de l’ordre des événements : si A et B sont indépendants, il en est de même de B et A. 2. Si A est un événement de probabilité nulle, alors A et tout autre événement B sont indépendants, car A ∩ B ⊂ A donc P(A ∩ B) = 0 = P(A)P(B). Proposition 7 Deux événements A et B de l’espace probabilisé (Ω, P) tels que A ait une probabilité non nulle sont indépendants si, et seulement si, PA (B) = P(B). Démonstration.
Par définition de la probabilité conditionnelle, PA (B) =
P(A ∩ B) , donc P(A)
l’égalité P(A ∩ B) = P(A) P(B) équivaut à PA (B) = P(B) .
Interprétation Ainsi, si P(A) �= 0 , A et B sont indépendants si la réalisation de A n’influe pas sur celle de B . La notion d’indépendance vise à modéliser cette absence d’influence de la réalisation de l’un des événements sur celle de l’autre. 1120
II Événements indépendants
Ex. 7. On lance deux dés. On considère les événements A « le premier dé donne un numéro pair » et B « le deuxième dé donne 3 ». On choisit Ω = [[1, 6]]2 , muni de la probabilité uniforme. 1 6 1 18 = , et P(B) = = · On trouve card A = 3 × 6 = 18 , card B = 6 et donc P(A) = 36 2 36 6 Comme A ∩ B = {(2, 3), (4, 3), (6, 3)} , on obtient : P(A ∩ B) =
1 3 = = P(A) P(B). 36 12
Les événements A et B sont donc indépendants. Ex. 8. On tire une carte au hasard dans un jeu de 52 cartes. On considère les événements A « la carte est une dame » et B « la carte est un cœur ». L’ensemble Ω des 52 cartes est muni de 4 13 1 la probabilité uniforme. On obtient P(A) = , P(B) = et P(A ∩ B) = (la carte tirée 52 52 52 est la dame de cœur). Ainsi P(A ∩ B) = P(A) P(B) : les événements A et B sont indépendants.
Remarques • On veillera à ne pas confondre l’indépendance de deux événements et le fait qu’ils soient incompatibles. Ces notions s’excluent la plupart du temps. En effet, si A et B sont incompatibles, A ∩ B = ∅ , donc P(A ∩ B) = 0 . Si, de plus, A et B sont de probabilité non nulle, alors P(A ∩ B) �= P(A)P(B) et A et B ne sont pas indépendants. • Contrairement à l’incompatibilité qui est une notion ensembliste, l’indépendance est une notion probabiliste. Elle dépend de la probabilité dont est muni Ω, comme le montre l’exemple suivant. Ex. 9. Une pièce de monnaie est lancée deux fois et l’on choisit Ω = P, F }2 . On considère les
événements A « les deux lancers ne donnent pas le même résultat » et B « le deuxième lancer donne face ». • Si la pièce est parfaitement équilibrée, on munit l’univers Ω de la probabilité uniforme. On 1 1 1 obtient P(A) = , P(B) = et A∩B = {(P, F )} , donc P(A∩B) = : les événements A 2 2 4 et B sont indépendants. 3 • Si la pièce est pipée et qu’elle tombe sur pile avec une probabilité de , on obtient alors : 4
1 3 1 · + · 4 4 4 1 1 3 P(B) = P {(F, F )} + P {(P, F )} = · + · 4 4 4 3 1 3 P(A ∩ B) = P ({(P, F )}) = · = �= P(A) P(B). 4 4 16 P(A) = P {(P, F )} + P {(F, P )} =
3 3 = , 4 8 1 1 = , 4 4
Les événements A et B ne sont pas indépendants.
Exo 30.13
Remarque Mis à part le cas où l’on construit l’espace probabilisé pour qu’ils le soient, il n’est pas toujours facile de prédire si deux événements sont indépendants. 1121
Chapitre 30. Conditionnement — Indépendance Proposition 8 Si A et B sont deux événements de (Ω, P) indépendants , alors les événements A et B sont indépendants. Démonstration page 1130
Remarque On peut déduire de cette proposition que, si A est un événement de probabilité 1 , il est indépendant de tout événement B . En effet A est de probabilité nulle donc A et B sont indépendants, comme nous l’avons déjà vu. On en déduit que A et B sont indépendants, en appliquant la proposition précédente à A et B .
2
Indépendance d’une famille d’événements
Définition 4 Des événements A1 , . . . , An de (Ω, P) sont dits mutuellement indépendants (ou simplement, indépendants) si, pour tout sous-ensemble non vide I de [[1, n]], on a: P(Ai ). P Ai = i∈I
i∈I
Remarques • L’indépendance de n événements ne dépend pas de l’ordre de ces événements.
C’est une notion très forte qui demande de vérifier 2n − 1 égalités (autant que de parties non vides I de [[1, n]]). Il est rare qu’on ait à les vérifier directement. Soit l’indépendance des événements fait partie des hypothèses ; elle modélise des expériences aléatoires aux résultats indépendants. Soit elle est la conséquence de l’indépendance, connue, d’autres événements. • Si les événements A1 , . . . , An sont mutuellement indépendants alors, pour tous indices 1 i1 < · · · < ip n, où p ∈ [[1, n]], les événements Ai1 , . . . , Aip sont indépendants. • Si les événements A1 , . . . , An sont mutuellement indépendants, alors ils sont deux à deux indépendants, comme on le voit en prenant pour I un ensemble à deux éléments. Mais la réciproque est fausse, comme le montre l’exemple suivant.
Ex. 10. On lance deux dés équilibrés et l’on considère les événements A « le premier dé amène un nombre pair », B « le second dé amène un nombre pair » et C « les deux dés amènent des nombres de même parité ». On a : P(A) = P(B) = P(C) =
1 1 , puis P(A ∩ B) = P(A ∩ C) = P(B ∩ C) = . 2 4
Les événements A , B et C sont donc indépendants deux à deux. Mais :
P A ∩ B ∩ C = P(A ∩ B) =
1 �= P(A) P(B) P(C), 4
donc A , B et C ne sont pas mutuellement indépendants.
1122
III Variables aléatoires indépendantes Remarque Il résulte de la proposition 8 de la page précédente que, si les événements A1 , . . . , An sont deux à deux indépendants, les événements B1 , . . . , Bn , où chaque Bi (pour 1 i n) est Ai ou Ai , sont également deux à deux indépendants. Nous allons voir que cela est vrai également pour l’indépendance mutuelle. Proposition 9 Si les événements A1 , . . . , An sont mutuellement indépendants, alors les événements B1 , . . . , Bn , où chaque Bi (pour 1 i n) est Ai ou Ai , sont également mutuellement indépendants. Principe de démonstration.
Démonstration page 1130 On commence par traiter le cas où Bi = Ai pour tous les i
de [[1, n]] , sauf un.
III 1
Variables aléatoires indépendantes Indépendance de deux variables aléatoires
Définition 5 Deux variables aléatoires X et Y sur (Ω, P), à valeurs dans E et F respectivement, sont dites indépendantes si, pour toute partie A de E et toute partie B de F , les événements {X ∈ A} et {Y ∈ B} sont indépendants, c’est-à-dire vérifient : P {X ∈ A} ∩ {Y ∈ B} = P(X ∈ A) P(Y ∈ B). Notation
Exo 30.14
La relation « X et Y sont indépendantes » se note X ⊥ ⊥Y.
Proposition 10 Deux variables aléatoires X et Y sur l’espace probabilisé (Ω, P) à valeurs dans E et F respectivement sont indépendantes si, et seulement si, pour tout (x, y) ∈ E×F , les événements {X = x} et {Y = y} sont indépendants, c’est-à-dire vérifient : P {X = x} ∩ {Y = y} = P(X = x) P(Y = y).
Démonstration page 1131 Une des implications est évidente. Pour la réciproque, on écrit par exemple {X ∈ A} , où A ⊂ E , comme réunion d’événements de la forme {X = x} .
Principe de démonstration.
Remarque Dans le cas de variables aléatoires indépendantes, la donnée des lois marginales permet donc de connaître la loi conjointe. Proposition 11 Soit X et Y deux variables aléatoires sur (Ω, P). Il y a équivalence entre : (i) X ⊥ ⊥Y ;
(ii) pour tout y ∈ Y (Ω) tel que P Y = y = � 0 , la loi de X sachant {Y = y} est égale à la loi de X .
Démonstration page 1131
1123
Chapitre 30. Conditionnement — Indépendance Remarques • Soit X et Y deux variables aléatoires indépendantes. Si : ∀x ∈ X(Ω) P(X = x) �= 0
et
alors, pour tout (x, y) ∈ X(Ω) × Y (Ω) :
∀y ∈ Y (Ω)
P(Y = y) �= 0,
P ((X, Y ) = (x, y)) = P(X = x) P(Y = y) �= 0, et donc a fortiori (X, Y ) = (x, y) �= ∅ . Dans ce cas (X, Y )(Ω) = X(Ω) × Y (Ω).
• La notion d’indépendance n’est pas une notion ensembliste. Elle dépend de la probabilité choisie. Comme le montre l’exemple suivant, l’indépendance de deux variables de Bernoulli est simple à vérifier. Ex. 11. Deux variables aléatoires X et Y , définies sur le même espace probabilisé, suivant des lois de Bernoulli, sont indépendantes si, et seulement si, les événements {X = 1} et {Y = 1} sont indépendants. Justifions-le. • Si les variables X et Y sont indépendantes, il résulte de la définition qu’en particulier les événements {X = 1} et {Y = 1} sont indépendants.
• Supposons réciproquement que les événements {X = 1} et {Y = 1} soient indépendants. D’après la proposition 8 de la page 1122, les événements : {X = 1} et {Y = 1},
{X = 1} et {Y = 1},
{X = 1} et {Y = 1}
sont indépendants. Mais {X = 1} = {X = 0} ainsi que {Y = 1} = {Y = 0} , donc les événements : {X = 0} et {Y = 1},
{X = 1} et {Y = 0},
{X = 0} et {Y = 0}
sont indépendants. Pour tout (x, y) ∈ X(Ω) × Y (Ω) , les événements {X = x} et {Y = y} sont indépendants, donc les variables X et Y sont indépendantes.
Fonctions de variables indépendantes Proposition 12 Soit X et Y deux variables aléatoires indépendantes sur (Ω, P). Alors, pour toutes fonctions f définie sur X(Ω) et g définie sur Y (Ω), on a f (X) ⊥ ⊥ g(Y ).
Démonstration page 1132
Ex. 12. Si X ⊥ ⊥ Y alors, pour tous entiers naturels non nuls m et n , on a X m ⊥ ⊥ Y n. Point méthode Connaissant la loi de deux variables aléatoires indépendantes X et Y , on peut en déduire la loi de toute variable aléatoire Z fonction de X et Y . Pour tout z ∈ Z(Ω), on écrit {Z = z} comme réunion d’événements de la forme {X = x} ∩ {Y = y}. 1124
III Variables aléatoires indépendantes Ex. 13. Soit X et Y deux variables aléatoires indépendantes sur (Ω, P) , telles que X(Ω) et Y (Ω) soient inclus dans IN . On a aussi (X + Y )(Ω) ⊂ IN et, pour tout k ∈ (X + Y )(Ω) , comme X et Y sont à valeurs dans IN , l’événement {X + Y = k} est réalisé s’il existe i ∈ [[0, k]] tel que X = i et Y = k − i . On a donc : {X + Y = k} = {X = i} ∩ {Y = k − i}, 0ik
d’où l’on déduit, par indépendance de X et Y : P(X + Y = k) =
Exo 30.15
k i=0
2
P ({X = i} ∩ {Y = k − i}) =
k i=0
P (X = i) P (Y = k − i) .
Indépendance de n variables aléatoires
Définition 6 Soit X1 , . . . , Xn des variables aléatoires définies sur (Ω, P), à valeurs dans E1 , . . . , En respectivement. Ces variables aléatoires sont dites mutuellement indépendantes si, pour toutes parties A1 ⊂ E1 , . . . , An ⊂ En , on a : n P(Xi ∈ Ai ). P {X1 ∈ A1 } ∩ · · · ∩ {Xn ∈ An } = i=1
Remarques • On dit souvent indépendantes au lieu de mutuellement indépendantes.
• L’indépendance d’un n-uplet de variables aléatoires ne dépend pas de l’ordre de ces variables. • On ne demande pas que les événements {X1 ∈ A1 }, . . . , {Xn ∈ An } soient mu tuellement indépendants. En effet, l’égalité P P(Xi ∈ Ai ) {Xi ∈ Ai } = i∈I
i∈I
n’est demandée que pour I = [[1, n]]. Cette indépendance sera une conséquence (cf.corollaire 16 de la page suivante).
• Une suite finie (X1 , . . . , Xn ) de variables aléatoires indépendantes sert à modéliser n épreuves aléatoires indépendantes, la variable Xk représentant le résultat de la k -ième épreuve (pour l’existence de telles suites, voir page 1128). Proposition 13 Les variables aléatoires X1 , . . . , Xn sur (Ω, P), à valeurs dans E1 , . . . , En respectivement, sont mutuellement indépendantes si, et seulement si, on a, pour tout nuplet (x1 , . . . , xn ) ∈ E1 × · · · × En : n P {X1 = x1 } ∩ · · · ∩ {Xn = xn } = P(Xi = xi ). i=1
Démonstration page 1132
Principe de démonstration. Généraliser la démonstration faite pour deux variables (proposition 11 de la page 1123).
1125
Chapitre 30. Conditionnement — Indépendance Proposition 14 Si (X1 , . . . , Xn ) est une famille de variables aléatoires sur (Ω, P), mutuellement indépendantes, alors toute sous-famille est formée de variables mutuellement indépendantes. Démonstration page 1132
Principe de démonstration.
On applique la définition de l’indépendance de X1 , . . . , Xn , en prenant Ai = Xi (Ω) si Xi n’appartient pas à la sous-famille.
Corollaire 15 Si les variables aléatoires X1 , . . . , Xn sont mutuellement indépendantes, alors elles sont indépendantes deux à deux. Remarque La réciproque est fausse. 1 2 et Z = |X − Y | . Étudions l’indépendance deux à deux et l’indépendance mutuelle des variables X , Y et Z . La variable Z est encore de Bernoulli et :
Ex. 14. Soit X et Y deux variables indépendantes suivant la loi de Bernoulli de paramètre
P Z = 1 = P {X = 1} ∩ {Y = 0} + P {X = 0} ∩ {Y = 1} = par indépendance de X et Y . On a d’autre part :
P {X = 1} ∩ {Z = 1} = P {X = 1} ∩ {Y = 0} =
1 1 1 + = , 4 4 2
1 =P X=1 P Z=1 , 4
ce qui suffit à montrer que les variables de Bernoulli X et Z sont indépendantes (cf. exemple 11 de la page 1124). Il en est de même de Y et Z . 1 Or P({X = 1} ∩ {Y = 1} ∩ {Z = 1}) = 0 �= , donc les variables X , Y et Z ne sont pas 8 mutuellement indépendantes, bien qu’elles soient deux à deux indépendantes.
Corollaire 16 Si les variables aléatoires X1 , . . . , Xn , à valeurs dans E1 , . . . , En respectivement, sont mutuellement indépendantes, alors, pour toutes parties A1 ⊂ E1 , . . . , An ⊂ En , les événements {X1 ∈ A1 }, . . . , {Xn ∈ An } sont indépendants. Démonstration.
Si I est une partie non vide de [[1, n]] , alors d’après la proposition 14, (Xi )i∈I est une famille de variables aléatoires mutuellement indépendantes et par définition : P
i∈I
{Xi ∈ Ai }
=
i∈I
P(Xi ∈ Ai ).
Cela montre l’indépendance des événements {X1 ∈ A1 } , . . . , {Xn ∈ An } .
1126
III Variables aléatoires indépendantes Les propriétés démontrées pour deux variables aléatoires se généralisent à n variables aléatoires. Proposition 17 Soit (X1 , . . . , Xn ) un n-uplet de variables aléatoires sur (Ω, P), mutuellement indépendantes. Si pour tout i ∈ [[1, n]], la fonction fi est définie sur Xi (Ω), les variables aléatoires f1 (X1 ), , . . . , fn (Xn ) sont mutuellement indépendantes. Démonstration page 1133
Remarque La proposition précédente peut se généraliser à des variables aléatoires fonctions de plusieurs variables aléatoires Xk (pour 1 k n). Commençons par le cas de deux fonctions. Proposition 18 Soit (X1 , . . . , Xn ) un n-uplet de variables aléatoires sur (Ω, P), mutuellement indépendantes, et 1 p < n. Si f et g sont des fonctions de p variables et n − p variables respectivement telles que f (X1 , . . . , Xp ) et g(Xp+1 , . . . , Xn ) soient définies, alors f (X1 , . . . , Xp ) et g(Xp+1 , . . . , Xn ) sont indépendantes Démonstration page 1133
Ex. 15. Si X1 , . . . , Xn sont indépendantes et 1 p < n , alors X1 +· · ·+Xp et Xp+1 +· · ·+Xn sont indépendantes.
Ce qui précède peut se généraliser à plus de deux fonctions. Proposition 19 (Lemme des coalitions) Soit (X1 , . . . , Xn ) un n-uplet de variables aléatoires sur (Ω, P), mutuellement indépendantes, k ∈ IN∗ , ainsi que I1 , . . . , Ik des sous-ensembles non vides et disjoints de [[1, n]]. Pour tout j entre 1 et k , on considère une variable aléatoire Yj qui est une fonction des variables Xi pour i ∈ Ij . Alors les variables Y1 , . . . , Yk sont mutuellement indépendantes. Démonstration.
On montre que les k variables (Xi )i∈I1 , (Xi )i∈I2 , . . . , (Xi )i∈Ik sont mutuellement indépendantes, comme dans la proposition 18. On en déduit que Y1 , Y2 , . . . , Yn sont mutuellement indépendantes, d’après la proposition 17.
Ex. 16. Si X, Y, Z et T sont des variables indépendantes, les variables XY et ZT sont indépendantes, les variables X, Y + Z et T 2 sont indépendantes.
1127
Chapitre 30. Conditionnement — Indépendance Remarque Si X1 , . . . , Xn d’une part et Y1 , . . . , Yn d’autre part sont des variables aléatoires indépendantes sur un même espace probabilisé, telles que Xi ∼ Yi pour tout i ∈ [[1, n]], alors (X1 , . . . , Xn ) ∼ (Y1 , . . . , Yn ). En effet, si, pour 1 i n, Xi est à valeurs dans Ei , on a, pour tout (x1 , . . . , xn ) ∈ E1 × · · · × En : P ((X1 , . . . , Xn ) = (x1 , . . . , xn )) =
n �
P(Xi = xi ) =
n �
P(Yi = xi )
i=1
i=1
= P ((Y1 , . . . , Yn ) = (x1 , . . . , xn )) .
On déduit alors de la proposition 11 de la page 1092 que si f est une application définie sur E1 × · · · × En , alors f (X1 , . . . , Xn ) et f (Y1 , . . . , Yn ) ont même loi. En particulier si X1 , . . . , Xn , Y1 , . . . , Yn sont à valeurs dans C, on a : X1 + · · · + Xn ∼ Y1 + · · · + Yn . Variables aléatoires indépendantes de lois prescrites • Cas de deux variables
Considérons deux lois L1 et L2 , sur les ensembles finis E1 et E2 , et détermi(1)
(2)
nées par les distributions de probabilité (px )x∈E1 et (px )x∈E2 , respectivement. Montrons que l’on peut construire un espace probabilisé et deux variables aléatoires X1 et X2 sur cet espace, indépendantes, de lois L1 et L2 respectivement. On a : � � � � � (2) = 1 × 1 = 1. p(1) p(1) p(2) x py = x y x∈E1
(x,y)∈E1 ×E2
y∈E2
On peut donc, d’après le théorème 6 de la page 1089, munir l’univers Ω = E1 × E2 de la probabilité P définie par : �� �� (2) ∀(x, y) ∈ E1 × E2 P (x, y) = p(1) x py . On considère les variables aléatoires sur Ω : X1 :
Ω −→ E1 (x, y) − � → x
et
X2 :
Ω −→ E2 (x, y) − � → y.
La variable X1 est à valeurs dans E1 et, pour tout x ∈ E1 , on a : {X1 = x} = {(x, y) | y ∈ E2 },
donc : P(X1 = x) =
�
y∈E2
P
� � �� �� (2) (1) (1) (x, y) = p(1) p(2) x py = px y = px . y∈E2
y∈E2
La loi de X1 est donc L1 . On montre de même que celle de X2 est L2 . Enfin, on a, pour tout (x, y) ∈ E1 × E2 : �� �� (2) P(X1 = x, X2 = y) = P (x, y) = p(1) x py = P(X1 = x) P(X2 = y),
donc les variables aléatoires X1 et X2 sont indépendantes. 1128
III Variables aléatoires indépendantes • Généralisation à n variables
Pour n ∈ IN∗ , cette construction se généralise à n lois L1 , . . . , Ln . Avec les mêmes notations, on prend Ω = E1 × · · · × En , muni de la probabilité P définie par : (n) ∀(x1 , . . . , xn ) ∈ E1 × · · · × En P (x1 , . . . , xn ) = p(1) x 1 · · · px n . Pour k ∈ [[1, n]], notons Xk la projection de Ω sur Ek . Alors Xk a pour loi Lk et les variables X1 , . . . , Xn sont indépendantes.
En particulier, pour toute loi L et n ∈ IN∗ , il existe des variables aléatoires indépendantes X1 , . . . , Xn de même loi L. Il existe par exemple des variables de Bernoulli X1 , . . . , Xn , indépendantes, de même paramètre p, ce qui modélise une suite finie d’épreuves indépendantes à deux issues notées 1 et 0 (épreuves de Bernoulli).
3
Somme de variables indépendantes de même loi de Bernoulli
Théorème 20 Soit n ∈ IN∗ . Si X1 , . . . , Xn sont des variables aléatoires mutuellement indépendantes, suivant toutes la loi de Bernoulli de paramètre p, alors la variable aléaExo toire X1 + · · · + Xn suit la loi binomiale de paramètre (n, p). 30.16
Démonstration page 1133
Remarque Comme nous l’avons vu page 1128, sous les hypothèses du théorème précédent, X1 , . . . , Xn modélisent n épreuves indépendantes à deux issues (1 et 0 ), la probabilité d’obtenir 1 étant p. La somme X1 + · · · + Xn , c’est-à-dire le nombre de 1 , suit donc la loi B(n, p). Ainsi, le nombre de piles dans une suite de n lancers indépendants d’une pièce équilibrée suit donc la loi B(n, p). De même le nombre de boules rouges obtenues dans une suite de n tirages avec remise dans une urne contenant une proportion p de boules rouges suit la loi B(n, p). Corollaire 21 (Stabilité de la loi binomiale pour la somme) Soit k ∈ IN∗ . Si X1 , . . . , Xk sont des variables aléatoires mutuellement indépendantes, telles que, pour tout i ∈ [[1, k]], Xi suive la loi binomiale de paramètre (ni , p), alors X1 + · · · + Xk suit la loi binomiale de paramètre (n1 + · · · + nk , p) . Démonstration page 1134 On pose n = n1 + · · · + nk et on considère n variables de Bernoulli indépendantes de paramètre p .
Principe de démonstration.
1129
Chapitre 30. Conditionnement — Indépendance
Démonstrations Théorème 1
Montrons que PA est une probabilité sur Ω .
•
L’application PA est bien définie car P(A) �= 0 . Pour tout événement B , on a B ∩ A ⊂ A , donc P(B ∩ A) P(A) et par suite 0 PA (B) 1 .
•
On a PA (Ω) =
•
Soit B et B ′ deux événements incompatibles. Les événements B ∩ A et B ′ ∩ A sont également incompatibles et donc, par additivité de P :
P(A) P(Ω ∩ A) = = 1. P(A) P(A)
P (B ∪ B ′ ) ∩ A = P (B ∩ A) ∪ (B ′ ∩ A) = P(B ∩ A) + P(B ′ ∩ A). On en déduit :
P (B ∪ B ′ ) ∩ A P(B ∩ A) P(B ′ ∩ A) = + = PA (B) + PA (B ′ ). PA (B ∪ B ) = P(A) P(A) P(A) ′
Théorème 3
Pour tout entier k ∈ [[1, n − 1]] , on a A1 ∩ . . . ∩ An−1 ⊂ A1 ∩ . . . ∩ Ak , d’où P(A1 ∩ . . . ∩ Ak ) P(A1 ∩ . . . ∩ An−1 ) > 0.
Toutes les probabilités conditionnelles sont donc définies. Il suffit alors d’écrire : P(A1 ) P(A2 | A1 ) · · · P(An | A1 ∩ . . . ∩ An−1 ) = P(A1 )
n
P (Ak | A1 ∩ · · · ∩ Ak−1 )
k=2
P A1 ∩ · · · ∩ Ak−1
k=2
n P A1 ∩ · · · ∩ Ak−1 ∩ Ak = P(A1 )
= P A1 ∩ · · · ∩ An−1 ∩ An ,
car tous les termes se simplifient deux à deux à part le dernier.
Proposition 8 Si A et B sont indépendants, alors on a P(A ∩ B) = P(A) P(B) . De l’égalité P(A ∩ B) = P(B) − P(A ∩ B) , on déduit alors :
P(A ∩ B) = P(B) − P(A) P(B) = 1 − P(A) P(B) = P(A) P(B), ce qui montre que A et B sont indépendants. Proposition 9 •
On étudie d’abord le cas où il existe k ∈ [[1, n]] tel que Bk = Ak et Bi = Ai si i �= k . Soit I une partie non vide de [[1, n]] .
∗
Si k ∈ / I , alors P
∗
Si k ∈ I , on note que :
i∈I
Bi
i∈I
Ai ∪
=P
i∈I
Ai
i∈I
Bi
=
=
P(Ai ) =
i∈I
i∈I\{k}
P(Bi ) .
i∈I
Ai ∩ (Ak ∪ Bk ) =
et comme cette union est disjointe : P
i∈I
1130
Bi
=P
i∈I\{k}
Ai − P
i∈I
Ai .
i∈I\{k}
Ai ,
Démonstrations Par la mutuelle indépendance des événements A1 , . . . , An , on obtient : P
i∈I
Bi
=
i∈I\{k}
P(Ai ) −
= 1 − P(Ak )
•
P(Ai )
i∈I
P(Ai ) = P(Ak )
i∈I\{k}
P(Ai ) =
P(Bi ).
i∈I
i∈I\{k}
Ainsi les événements B1 , . . . , Bn sont mutuellement indépendants. Pour le cas général, on utilise le résultat précédent et on raisonne par récurrence finie sur le nombre d’indices k entre 1 et n tels que Bk = Ak .
Proposition 10 • Si X et Y sont indépendantes, on obtient, en prenant A = {x} et B = {y} dans la définition de l’indépendance : P({X = x} ∩ {Y = y}) = P(X = x) P(Y = y) . •
Démontrons la réciproque. Soit A ⊂ E et B ⊂ F . Les ensembles X(Ω) et Y (Ω) sont finis donc il en est de même de leurs sous-ensembles A′ = A ∩ X(Ω) et B ′ = B ∩ Y (Ω) . On a : {X ∈ A} = {X ∈ A′ } =
x∈A′
{X = x}
On en déduit : {X ∈ A} ∩ {Y ∈ B} =
{Y ∈ B} = {Y ∈ B ′ } =
et
x∈A′ y∈B ′
{X = x} ∩ {Y = y}.
y∈B ′
{Y = y}.
Par incompatibilité des événements, puis utilisation de l’hypothèse, on a alors :
P {X ∈ A} ∩ {Y ∈ B} = =
x∈A′ y∈B ′
P X=x P Y =y
x∈A′ y∈B ′
= Comme P(X ∈ A) =
x∈A′
P {X = x} ∩ {Y = y}
P X=x
x∈A′
P Y =y
y∈B ′
P X = x et P(Y ∈ B) =
y∈B ′
.
P Y = y , on a donc :
P {X ∈ A} ∩ {Y ∈ B} = P(X ∈ A) P(Y ∈ B). Les variables X et Y sont donc indépendantes. Montrons l’équivalence entre (i) et (ii) .
Proposition 11 •
P X =x|Y =y = •
Supposons que (i) soit vérifié. Soit y ∈ Y (Ω) tel que P Y = y tout x ∈ X(Ω) , par indépendance de X et Y :
�= 0 . On a, pour
P(X = x)P(Y = y) P({X = x} ∩ {Y = y}) = = P(X = x). P(Y = y) P(Y = y)
La loi de X sachant {Y = y} est égale à la loi de X , donc (ii) est vérifié. Supposons que (ii) soit vérifié. Soit y ∈ Y (Ω) .
∗ ∗
Si P(Y = y) = 0, alors {Y = y} est indépendant de {X = x} pour tout x ∈ X(Ω) . Sinon on a, pour tout x ∈ X(Ω) :
P {X = x} ∩ {Y = y} = P X = x | Y = y P (Y = y) = P (X = x) P (Y = y) . Les variables aléatoires X et Y sont indépendantes, d’après la proposition 10 de la page 1123.
1131
Chapitre 30. Conditionnement — Indépendance Proposition 12 Si f et g sont à valeurs dans E et F respectivement, alors, pour toute partie A de E et toute partie B de F , on a, en utilisant l’indépendance de X et de Y :
�
�
�
�
P {f (X) ∈ A} ∩ {g(Y ) ∈ B} = P {X ∈ f −1 (A)} ∩ {Y ∈ g −1 (B)}
�
� �
= P X ∈ f −1 (A) P Y ∈ g −1 (B)
�
� �
�
= P f (X) ∈ A P g(Y ) ∈ B . Ainsi f (X) et g(Y ) sont indépendantes.
�
Proposition 13 •
Supposons X1 , . . . , Xn mutuellement indépendantes. Soit (x1 , . . . , xn ) ∈ E1 × · · · × En . En appliquant la définition de l’indépendance avec, pour tout i ∈ [[1, n]] , Ai = {xi } , on obtient : P ({X1 = x1 } ∩ · · · ∩ {Xn = xn }) =
•
n �
P(Xi = xi ).
i=1
Réciproquement, supposons que l’on ait : ∀(x1 , . . . , xn ) ∈ E1 × · · · × En
P ({X1 = x1 } ∩ · · · ∩ {Xn = xn }) =
n �
P(Xi = xi ).
i=1
Pour tout i ∈ [[1, n]] , on considère Ai ⊂ Ei ; on pose A′i = Ai ∩ Xi (Ω) et on écrit : {Xi ∈ Ai } = {Xi ∈ A′i } = En posant A′1 × · · · × A′n = B , on obtient :
�
1in
{Xi ∈ Ai } =
�
(x1 ,...,xn )∈B
�
xi ∈A′i
�
{Xi = xi }.
�
1in
�
{Xi = xi }
.
On a une réunion finie d’événements incompatibles. On en déduit : P
�
�
1in
�
{Xi ∈ Ai }
=
�
P
(x1 ,...,xn )∈B
=
�
(x1 ,...,xn )∈B
=
�
1in
�
�
�
�
1in
�
�
{Xi = xi }
�
P (Xi = xi )
1in
xi ∈A′i
P (Xi = xi ) =
�
1in
P (Xi ∈ Ai ) .
Les variables aléatoires X1 , . . . , Xn sont donc mutuellement indépendantes. Proposition 14 On suppose que, pour tout i ∈ [[1, n]] , Xi est à valeurs dans Ei . Soit I une partie non vide de [[1, n]] et pour i ∈ I , une partie Ai de Ei . Si, pour i ∈ / I , on pose Ai = Xi (Ω) , de telle sorte que {Xi ∈ Ai } = Ω , on a alors : P
1132
�
�
i∈I
�
{Xi ∈ Ai }
=P
�
n �
i=1
�
{Xi ∈ Ai }
.
Démonstrations Par indépendance mutuelle de X1 , . . . , Xn , on obtient : P
i∈I
=
{Xi ∈ Ai }
n i=1
/ I. car P (Xi ∈ Ai ) = 1 si i ∈
P (Xi ∈ Ai ) =
i∈I
P (Xi ∈ Ai ) ,
Ainsi (Xi )i∈I est une famille de variables aléatoires mutuellement indépendantes. Proposition 17 Soit (y1 , . . . , yn ) ∈ f (X1 )(Ω) × · · · × f (Xn )(Ω) . On a :
P {f1 (X1 ) = y1 } ∩ · · · ∩ {fn (Xn ) = yn } = P
et, par indépendance des variables X1 , . . . , Xn , on obtient :
X1 ∈ f1−1 ({y1 }) ∩ · · · ∩ Xn ∈ fn−1 ({yn })
P {f1 (X1 ) = y1 } ∩ · · · ∩ {fn (Xn ) = yn } =
n i=1
P Xi ∈
fi−1 ({yi })
=
n
P fi (Xi ) = yi .
i=1
Les variables aléatoires f1 (X1 ), . . . , fn (Xn ) sont donc mutuellement indépendantes. Proposition 18 • Les variables aléatoires (X1 , . . . , Xp ) et (Xp+1 , . . . , Xn ) sont indépendantes. En effet, on a, pour tout (x1 , . . . , xn ) ∈ X1 (Ω) × · · · × Xn (Ω) :
(X1 , . . . , Xp ) = (x1 , . . . , xp ) ∩ (Xp+1 , . . . , Xn ) = (xp+1 , . . . , xn )
P
= P X1 = x1 , . . . , Xn = xn
=
n
P Xk = xk
k=1
=
p
P(Xk = xk )
k=1
n
P(Xk = xk )
k=p+1
= P (X1 , . . . , Xp ) = (x1 , . . . , xp ) P (Xp+1 , . . . , Xn ) = (xp+1 , . . . , xn ) , •
car X1 , . . . , Xp d’une part, Xp+1 , . . . , Xn d’autre part, sont indépendantes. On en déduit que f (X1 , . . . , Xp ) et g(Xp+1 , . . . , Xn ) sont indépendantes, d’après la proposition 12 de la page 1124.
Théorème 20 La variable aléatoire X = X1 +· · ·+Xn est à valeurs dans [[0, n]] et, pour k ∈ [[0, n]] , l’événement {X = k} est réalisé si exactement k variables aléatoires parmi X1 , . . . , Xn prennent la valeur 1 . On a donc : {X = k} =
I⊂[[1,n]] card (I)=k
i∈I
{Xi = 1} ∩
i∈I /
{Xi = 0} .
Par indépendance des variables Xi , on a, pour I ⊂ [[1, n]] , de cardinal k : P
i∈I
{Xi = 1} ∩
i∈I /
{Xi = 0}
Comme {X = k} est la réunion de
=
n k
P(Xi = 1)
i∈I
i∈I /
P(Xi = 0) = pk (1 − p)n−k .
événements incompatibles (autant que de choix de I
de cardinal k inclus dans [[1, n]] ), tous de probabilité pk (1 − p)n−k , on obtient : P(X = k) =
n k p (1 − p)n−k . k
1133
Chapitre 30. Conditionnement — Indépendance Corollaire 21 Soit n = n1 + · · · + nk . Considérons n variables aléatoires Y1 , . . . , Yn sur un même espace probabilisé, indépendantes, suivant toutes la loi de Bernoulli de paramètre p . Posons ensuite Z =
n
Yi , puis :
i=1
Z1 =
n1 i=1
Xi , Z2 =
n2
Yi , . . . , Zk =
i=n1 +1
n
Yi
i=n1 +···+nk−1 +1
(on regroupe les n1 premières variables Yi , puis les n2 suivantes, . . . , puis les nk dernières). On a alors Z = Z1 + · · · + Zk . On peut déduire du théorème 20 de la page 1129 que Z suit la loi B(n, p) , mais aussi, puisque des variables extraites d’une famille de variables indépendantes sont indépendantes, que, pour j ∈ [[1, k]] , la variable aléatoire Zj , somme de nj variables de Bernoulli indépendantes de paramètre p , suit la loi B(nj , p) . Les variables X1 , . . . , Xk d’une part et Z1 , . . . , Zk d’autre part (d’après le lemme des coalitions) sont indépendantes. De plus, pour tout j ∈ [[1, k]] , on a Xj ∼ Zj . On en déduit (cf. remarque de la page 1128) que :
X1 + · · · + Xk ∼ Z1 + · · · + Zk .
Autrement dit, X1 + · · · + Xk a même loi que Z , c’est-à-dire suit la loi B(n, p) .
1134
Exercices
S’entraîner et approfondir Conditionnement 30.1 On considère une famille de deux enfants. On suppose que chaque enfant a une chance sur deux d’être une fille. Quelle est la probabilité que les deux enfants soient des filles sachant que l’aîné est une fille ? Quelle est la probabilité que les deux enfants soient des filles sachant qu’il y a au moins une fille ?
→1116
30.2 Une urne contient n boules dont r 3 rouges, indiscernables au toucher. On tire trois boules successivement et sans remise de cette urne. Quelle est la probabilité que les trois boules tirées soient rouges ?
→1117
30.3 Le fonctionnement d’un appareil au cours du temps obéit aux règles suivantes : • s’il fonctionne à la date n − 1 ( n ∈ IN∗ ), il a la probabilité a de fonctionner à la date n ; • s’il est en panne à la date n − 1 ( n ∈ IN∗ ), il a la probabilité b d’être en panne à la date n , où (a, b) est un couple de réels de ]0, 1[ . On suppose que l’appareil est en état de marche à la date 0 . Pour n ∈ IN , on note Mn l’événement « l’appareil est en état de marche à la date n » et pn la probabilité de Mn . 1. Déterminer une relation de récurrence vérifiée par (pn )n∈IN . 2. Calculer pn , pour tout n ∈ IN , ainsi que la limite de la suite (pn )n∈IN .
→1118
30.4 Un laboratoire fabrique un alcootest et les essais montrent que : • 1% des personnes contrôlées sont en état d’ébriété ; • si une personne en état d’ébriété se fait tester, le test est positif 95 fois sur 100 ; • si une personne qui n’est pas en état d’ébriété se fait tester, le test est négatif 98 fois sur 100 .
→1119
1. On teste une personne et le résultat est positif. Quelle est la probabilité que cette personne soit en état d’ébriété ? 2. On teste une personne et le résultat est négatif. Quelle est la probabilité que cette personne soit en fait en état d’ébriété ? 3. Déterminer la probabilité que le résultat donné par l’appareil soit faux. 30.5 Lors d’une interrogation, un étudiant se trouve face à une question dont m réponses possibles sont proposées et une seule est correcte. Soit l’étudiant connaît la réponse à la question, soit il choisit au hasard une réponse parmi les m proposées. La probabilité que cet étudiant connaisse la réponse à la question est p ∈ ]0, 1[ . Sachant que l’étudiant a répondu correctement à la question posée, quelle est la probabilité qu’il ait répondu en connaissant la bonne réponse ?
→1119
30.6 Un bit est un symbole informatique élémentaire valant soit 0 , soit 1 . Un canal de transmission transmet des bits selon le modèle suivant : il transmet fidèlement un bit avec probabilité p et de façon erronée avec probabilité (1 − p) où 0 < p < 1 . Un bit traverse n canaux de ce type successivement, et l’on suppose que chaque canal fonctionne indépendamment des autres. On note x0 le bit initial. Pour n ∈ IN , on note xn le bit après la traversée de n canaux et pn la probabilité que xn = x0 . 1. Déterminer une relation entre pn−1 et pn , pour n 1 . 2. En déduire l’expression de pn en fonction de n et p . 3. Déterminer la limite de la suite (pn )n∈IN .
1135
Chapitre 30. Conditionnement — Indépendance 30.7 Urne de Pólya Une urne contient initialement r 1 boules rouges et b 1 boules blanches. On effectue des tirages successifs d’une boule, en remettant après chaque tirage la boule tirée dans l’urne avec en plus c 1 boules de la même couleur. Pour tout n 1 , on note Rn l’événement « la n -ième boule tirée est rouge ». 1. On note pn (r, b) la probabilité d’obtenir une boule rouge au n -ième tirage, quand l’urne contient initialement r boules rouges et b boules blanches. Montrer que : ∀n 2
pn (r, b) =
b r pn−1 (r + c, b) + pn−1 (r, b + c). r+b r+b
2. En déduire que, pour tout n ∈ IN∗ , on a P(Rn ) =
r · r+b
30.8 Soit n un entier naturel non nul, p et p′ des réels appartenant à ]0, 1[ . On considère deux variables aléatoires X et Y à valeurs dans [[0, n]] . On suppose que X suit la loi B(n, p) et que, pour tout k ∈ [[0, n]] , la loi de Y conditionnelle à {X = k} est B(k, p′ ) . 1. Déterminer la loi du couple (X, Y ) . 2. Déterminer la loi de Y .
30.9 Soit n dans IN∗ , Z et X deux variables aléatoires à valeurs dans [[0, n]] . On suppose que, pour tout entier k ∈ [[0, n]] la loi de X conditionnelle à {Z = k} est la loi uniforme sur [[0, k]] . 1. Déterminer la loi du couple (Z, X) , puis la loi de X . 2. Comparer les lois de X et de Z − X .
30.10 Soit N et n des entiers naturels, avec n 2 . On considère une urne contenant N + 1 boules numérotées de 0 à N . On y effectue n tirages avec remise. On définit la suite de variables aléatoires (Xk )k∈[[1,n]] de la manière suivante : • X1 est la variable aléatoire certaine égale à 1 ; • pour p 2 , la variable aléatoire Xp vaut 1 si le numéro obtenu au p -ième tirage n’a pas déjà été obtenu au cours des tirages précédents et 0 dans le cas contraire. 1. Donner la loi de X2 . 2. Déterminer, pour 1 p n , la loi de Xp . On pourra considérer la variable aléatoire Yp égale au numéro de la boule tirée lors du p -ième tirage. 3. Pour 1 i < j n déterminer la loi de Xi Xj . 30.11 Un secrétaire effectue n appels téléphoniques vers n personnes distinctes ( n 2 ). Pour chaque appel, la probabilité d’obtenir le correspondant demandé est p ∈ ]0, 1[ . On note X la variable aléatoire égale au nombre de correspondants obtenus. 1. Quelle est la loi de X ? 2. Après ses n recherches, le secrétaire appelle une deuxième fois, et dans les mêmes conditions, chacun des n − k correspondants qu’il n’a pas réussi à joindre la première fois. Soit Y le nombre de correspondants obtenus dans la deuxième série d’appels et Z = X + Y , le nombre total de correspondants obtenus. (a) Déterminer la loi conditionnelle de Y sachant {X = k} , pour tout k ∈ [[0, n]] . En déduire la loi conjointe de X et Y . (b) Montrer que Z suit une loi binomiale que l’on précisera.
1136
Exercices 30.12 On dispose de deux boîtes A et B , de deux boules noires et de deux boules rouges. Au départ, chaque urne contient deux des quatre boules. À chaque étape, on tire une boule de chacune des boîtes et on les échange. Soit X0 le nombre de boules noires placées initialement dans A et Xn le nombre de boules noires dans A après n étapes. On pose, pour tout n ∈ IN : pn = P(Xn = 0), qn = P(Xn = 1)
et
rn = P(Xn = 2).
1. Déterminer la loi de X0 si, au départ, les boules sont placées au hasard dans les deux boîtes. Dans la suite, X0 est quelconque. 2. Montrer qu’il existe M ∈ M3 (IR) telle que : ∀n ∈ IN
pn+1 qn+1 rn+1
3. Montrer que la matrice M est semblable à D = Diag 1, 0, − inversible telle que M = P DP −1 .
=M
pn qn rn
.
1 . On note P une matrice 2
p0 a 4. On pose b = P −1 q0 . Exprimer pn , qn et rn en fonction de a , b , c et n . En c r0 déduire que les suites (pn )n∈IN , (qn )n∈IN et (rn )n∈IN convergent. Déterminer leurs limites respectives p , q et r (on pourra remarquer que p + q + r = 1 ). Commenter.
Indépendance 30.13 Une urne contient 20 boules blanches et 20 boules noires. On y effectue n ( n 2 ) tirages →1121 successifs avec remise. On note A l’événement « au cours des tirages, on a obtenu des boules de chacune des couleurs » et B l’événement « au cours des tirages, on a obtenu au plus une boule blanche ». Étudier l’indépendance des événements A et B . 30.14 Soit X et Y deux variables aléatoires sur (Ω, P) . On suppose que X est constante. Étudier →1123 l’indépendance de X et Y . 30.15 Soit X et Y deux variables aléatoires indépendantes sur (Ω, P) , suivant la loi uniforme →1125 sur [[1, n]] . Déterminer la loi de X + Y . 30.16 Soit (X1 , . . . , Xn ) un n -uplet de variables aléatoires indépendantes et de même loi à valeurs →1129 dans E et x un élément de E . On note Nx la variable aléatoire égale au nombre de variables Xk égales à x , c’est-à-dire définie par : ∀ω ∈ Ω Déterminer la loi de Nx .
Nx (ω) = card {k ∈ [[1, n]] : Xk (ω) = x} .
30.17 Soit (A1 , A2 , . . . , An ) un n -uplet d’événements indépendants et p ∈ [[1, n − 1]] . Montrer que les événements A1 ∩ · · · ∩ Ap et Ap+1 ∩ · · · ∩ An sont indépendants. Montrer qu’il en est de même de A1 ∪ · · · ∪ Ap et Ap+1 ∪ · · · ∪ An et de A1 ∩ · · · ∩ Ap et Ap+1 ∪ · · · ∪ An .
1137
Chapitre 30. Conditionnement — Indépendance 30.18 Soit n 2 . On choisit au hasard un entier compris entre 1 et n . Pour p ∈ [[1, n]] , on note Ap l’événement : « le nombre choisi est divisible par p ». 1. Calculer P(Ap ) pour tout p ∈ [[1, n]] diviseur de n . 2. Montrer que si p1 , p2 , . . . , pr sont les diviseurs premiers distincts de n , alors les événements Ap1 , Ap2 , . . . , Apr sont mutuellement indépendants. 3. On désigne par ϕ la fonction indicatrice d’Euler : ∀n ∈ IN∗ r
En déduire que
ϕ(n) 1 = 1− n pi i=1
ϕ(n) = card {k ∈ [[1, n]] : k ∧ n = 1} .
.
30.19 Soit (X, Y ) un couple de variables aléatoires de l’espace probabilisé (Ω, P) . On suppose que X(Ω) = {x1 , . . . , xn } et Y (Ω) = {y1 , . . . , yp } . Montrer que X ⊥ ⊥ Y si, et seulement si, la matrice :
A = P({X = xi } ∩ {Y = yj }) donnant la loi conjointe de (X, Y ) est de rang 1 .
1in 1jp
30.20 On lance n fois une pièce, la probabilité d’obtenir pile à chaque lancer étant p ∈ ]0, 1[ . 1. Quelle est la probabilité d’obtenir le premier pile au n -ième lancer ? 2. Pour k ∈ [[1, n]] , quelle est la probabilité d’obtenir le k -ième pile au n -ième lancer ? 30.21 Soit p et q deux nombres réels tels que 0 < p < q < 1 , X1 , . . . , Xn des variables aléatoires indépendantes de Bernoulli de paramètre p et Y1 , . . . , Yn des variables aléatoires indépendantes de Bernoulli de paramètre q . On pose : d(q, p) = q ln
q p
+ (1 − q) ln
1. Montrer que, pour tout x ∈ {0, 1} , on a :
P(X1 = x) = exp −x ln P(Y1 = x)
q p
1−q 1−p
− (1 − x) ln
.
1−q 1−p
2. Pour tout x ∈ {0, 1}n tel que x1 + · · · + xn > qn , montrer que :
.
P(X1 = x1 , . . . , Xn = xn ) exp (−nd(q, p)) . P(Y1 = x1 , . . . , Yn = xn )
3. En déduire que : P(X1 + · · · + Xn > nq) exp (−nd(q, p)) . 30.22 Promenade aléatoire dans ZZ Soit N ∈ IN∗ et X1 , . . . , XN des variables aléatoires indépendantes toutes de même loi définie par P(X1 = −1) = P(X1 = 1) = 12 · Pour 1 n N , on pose Sn = 1. Soit n ∈ [[1, N ]] . Déterminer la loi de Sn . Préciser P(Sn = 0) .
n
Xk .
k=1
2. Soit n ∈ [[1, N ]] . Montrer que P(S1 �= 0, . . . , Sn �= 0) = 2P(S1 > 0, . . . , Sn > 0) .
1138
Solutions des exercices
Solutions des exercices 30.1 Chaque composition de la famille peut se représenter par un couple d’éléments de l’ensemble {F, G} , le premier élément du couple représentant le sexe de l’aîné, le second le sexe du second enfant. On a donc Ω = {F, G}2 que l’on munit de la probabilité uniforme. On considère les événements A « l’aîné est une fille », B « les deux enfants sont des filles » et C « il y a au moins une fille ». On remarque que ces événements ont une probabilité non nulle. • La première probabilité demandée est : PA (B) =
P(B) P(A ∩ B) = = P(A) P(A)
1 4 1 2
=
1 · 2
• La seconde probabilité demandée est : PC (B) =
1 P(B) P(B) P(C ∩ B) = = = 4 P(C) P(C) 1− 1 − P(C)
1 4
=
1 , 3
car C est l’événement « les deux enfants sont des garçons ». 30.2 Pour 1 i 3 , notons Ri l’événement « la i -ème boule tirée est rouge ». La probabilité recherchée est la probabilité de l’événement R1 ∩ R2 ∩ R3 . Sous réserve que ces probabilités conditionnelles soient définies, on peut écrire par la formule des probabilités composées : P(R1 ∩ R2 ∩ R3 ) = P(R1 ) P(R2 | R1 ) P(R3 | R1 ∩ R2 ).
Calculons successivement ces probabilités. Comme les boules sont indiscernables au toucher, nous utilisons la probabilité uniforme. On a donc : r P(R1 ) = · n Si la première boule tirée est rouge, comme les tirages se font sans remise, il reste n − 1 boules dans l’urne dont r − 1 rouges. On a donc : P(R2 | R1 ) =
r(r − 1) r−1 puis P(R2 ∩ R1 ) = �= 0. n−1 n(n − 1)
Nous pouvons donc considérer la probabilité conditionnelle sachant R1 ∩ R2 . Si les deux premières boules sont rouges, il reste avant le troisième tirage n − 2 boules dans l’urne dont r − 2 rouges, donc : P(R3 | R1 ∩ R2 ) =
r(r − 1)(r − 2) r−2 puis P(R1 ∩ R2 ∩ R3 ) = · n−2 n(n − 1)(n − 2)
30.3 1. Pour déterminer une relation de récurrence entre pn−1 et pn , on applique la formule des probabilités totales : P(Mn ) = P(Mn | Mn−1 ) P(Mn−1 ) + P(Mn | Mn−1 ) P(Mn−1 ).
Par hypothèse :
P(Mn | Mn−1 ) = a
et
P(M n | Mn−1 ) = b,
d’où P(Mn | Mn−1 ) = 1 − b . On obtient donc :
pn = apn−1 + (1 − b)(1 − pn−1 ) = (a + b − 1)pn−1 + 1 − b.
1139
Chapitre 30. Conditionnement — Indépendance 2. La suite (pn )n∈IN est donc une suite arithmético-géométrique. 1−b ( a + b �= 2 car a et b sont des réels de ]0, 1[ ). Sa limite éventuelle est ℓ = 2−a−b La suite (pn − ℓ)n∈IN est une suite géométrique de raison a + b − 1 . Par hypothèse, on a p0 = 1 et donc, pour tout n ∈ IN , pn − ℓ = (a + b − 1)n (p0 − ℓ) , c’est-à-dire : 1−a 1−b + (a + b − 1)n · 2−a−b 2−a−b 1−b · Comme a + b − 1 ∈ ]−1, 1[ , la suite (pn )n∈IN converge vers 2−a−b pn =
30.4 On note T l’événement « l’alcootest donne un résultat positif » et E l’événement « la personne testée est en état d’ébriété ». Les hypothèses se traduisent par : P(E) = 0,01, P(T | E) = 0,95
et
P(T | E) = 0,98.
1. On applique la formule de Bayes et la formule des probabilités totales pour le dénominateur : P(E) P(T | E) 0,01 × 0,95 P(E | T ) = = ≈ 0,324. 0,01 × 0,95 + 0,99 × 0,02 P(E) P(T | E) + P(E) P(T | E) 2. On obtient de même : P(E | T ) =
0,01 × 0,05 P(E) P(T | E) = ≈ 5 · 10−4 . 0,01 × 0,05 + 0,99 × 0,98 P(E) P(T | E) + P(E) P(T | E)
3. L’événement F « le résultat du test est faux » est la réunion des événements incompatibles T ∩ E et T ∩ E , donc : P(F ) = P(T ∩ E) + P(T ∩ E) = P(E) P(T | E) + P(E) P(T | E)
= 0,99 × 0,02 + 0,01 × 0,05 ≈ 0,020.
30.5 Notons C l’événement « l’étudiant connaît la réponse » et V « l’étudiant a répondu correctement à la question ». Nous cherchons ici P(C | V ) . D’après la formule de Bayes et la formule des probabilités totales au dénominateur, on a : P(V | C) P(C) pm 1.p , = = 1 (m − 1)p + 1 P(V | C) P(C) + P(V | C) P(C) 1.p + (1 − p) m avec les données de l’énoncé. P(C | V ) =
30.6 On note An l’événement « xn = x0 ». 1. Pour n 1 , la formule des probabilités totales donne : pn = P(An ) = P(An−1 ) P(An | An−1 ) + P(An−1 ) P(An | An−1 ) = pn−1 p + (1 − pn−1 )(1 − p) = (2p − 1)pn−1 + 1 − p. 2. La suite (pn )n∈IN est arithmético-géométrique.
1 1 , donc pn − est une 2 2 n∈IN 1 1 suite géométrique de raison 2p − 1 , de premier terme p0 − = · On obtient : 2 2 1 1 n ∀n ∈ IN pn = + (2p − 1) . 2 2 1 3. On a, par hypothèse, 0 < p < 1 donc −1 < 2p − 1 < 1 , donc lim pn = · n→+∞ 2 Le point fixe de l’application x �→ (2p − 1)x + 1 − p est
1140
Solutions des exercices 30.7 1. Soit r et b dans IN∗ . On suppose que l’urne contient initialement r boules rouges et b boules blanches. On applique la formule des probabilités totales avec (R1 , R1 ) comme système complet d’événements :
P(Rn ) = P R1 P Rn | R1 + P R1 P Rn | R1 .
r b , P R1 = et, par définition, P(Rn ) = pn (r, b) . r+b r+b Déterminons les probabilités conditionnelles. Si l’événement R1 est réalisé, l’urne contient après le premier tirage r + c boules rouges et b boules blanches et il s’agit de tirer une boule rouge n−1 tirages plus tard. Autrement dit : P(Rn | R1 ) = pn−1 (r + c, b). On a P(R1 ) =
On montre de la même façon : P(Rn | R1 ) = pn−1 (r, b + c) . On obtient donc : pn (r, b) =
r b pn−1 (r + c, b) + pn−1 (r, b + c). r+b r+b
2. On démontre par récurrence sur n ∈ IN∗ , la propriété : Hn : ∀(r, b) ∈ (IN∗ )2
pn (r, b) =
r · r+b
La propriété H1 est évidente. Supposons que Hn−1 (avec n 2 ) soit vérifiée. On a alors, pour tout (r, b) ∈ (IN∗ )2 , en utilisant l’hypothèse de récurrence : pn (r, b) = =
b r pn−1 (r + c, b) + pn−1 (r, b + c) r+b r+b r(r + c) + br r+c b r r r + = = · r+br+c+b r+br+b+c (r + b)(r + b + c) r+b
La propriété Hn est vérifiée, ce qui termine la récurrence. On a, en particulier, pour tout n ∈ IN∗ , P(Rn ) = pn (r, b) =
r · r+b
30.8 1. Par définition, on a, pour (j, k) ∈ [[0, n]]2 :
P(X = k, Y = j) = P(Y = j | X = k) P(X = k) =
On simplifie. Pour 0 j k :
0
k
p (1 −
j
P(X = k, Y = j) =
′j
n k
2. On obtient, pour j ∈ [[0, n]] : P(Y = j) =
n
P(X = k, Y = j) =
k=0
Un calcul classique donne
k j
=
k
p (1 − p)
n−k
si
j>k
si
j k.
k−j k (pp′ )j (1 − p′ )p (1 − p)n−k . j
n n k k=j
n k
p′ )k−j nk
k
n j
k−j
j
(pp′ )j (1 − p′ )p
si j k (cf. exercice 11 page 1060),
n−j k−j
(1 − p)n−k .
1141
Chapitre 30. Conditionnement — Indépendance et donc : P(Y = j) =
=
=
n k−j n n−j (pp′ )j (1 − p′ )p (1 − p)n−k j k−j k=j
n−j
n−j i n (pp′ )j (1 − p′ )p (1 − p)n−j−i j i i=0
n (pp′ ) j
j
(1 − p′ )p + 1 − p
Ainsi Y suit la loi binomiale B(n, pp′ ) .
n−j
=
n (pp′ )j (1 − pp′ )n−j . j
30.9 1. On pose, pour tout k ∈ [[0, n]] , pk = P Z = k . Pour (i, k) ∈ [[0, n]]2 , on a :
P (Z, X) = (k, i) = P(Z = k) P(X = i | Z = k) = Pour i ∈ [[0, n]] , on a :
P(X = i) =
n
P (Z, X) = (k, i) =
k=0
pk k+1
0
n pk k=i
si i k sinon.
k+1
·
2. Comme X Z , Z − X est aussi à valeurs dans [[0, n]] . Pour i ∈ [[0, n]] , on a : P(Z − X = i) =
n k=0
P(Z − X = i, Z = k) = =
n k=0
P(Z = k, X = k − i)
n pk k=i
k+1
= P(X = i).
Les variables aléatoires X et Z − X ont donc même loi.
N · N +1 2. La variable Yp suit la loi uniforme sur [[0, N ]] . La formule des probabilités totales donne :
30.10 1. La variable aléatoire X2 suit la loi de Bernoulli de paramètre
P(Xp = 1) =
N k=0
N 1 P(Xp = 1 | Yp = k). P(Yp = k) P(Xp = 1 | Yp = k) = N +1 k=0
Or si {Yp = k} est réalisé, alors {Xp = 1} est réalisé si les (p − 1) premiers tirages sont tous effectués parmi les N boules différentes de la boule numéro k . N p−1 On obtient P(Xp = 1 | Yp = k) = , puis : N +1 P(Xp = 1) =
N 1 (N + 1) N +1 N +1
p−1
=
N N +1
Ainsi Xp est une variable aléatoire de Bernoulli de paramètre
1142
p−1
N N +1
.
p−1
.
Solutions des exercices 3. Soit (i, j) ∈ [[1, n]]2 , tel que i < j . La variable aléatoire Xi Xj suit une loi de Bernoulli de paramètre P(Xi Xj = 1) = P(Xi = 1, Xj = 1) . La famille ({Yi = k, Yj = ℓ})(k,ℓ)∈[[0,N]]2 est un système complet d’événements et, pour 1 , car les variables (Y1 , . . . , Yn ) sont tout couple (k, ℓ) , on a P (Yi = k, Yj = ℓ) = (N + 1)2 indépendantes (les tirages sont effectués avec remise). On en déduit : P(Xi = 1, Xj = 1) =
n n k=0 ℓ=0
P {Xi = 1, Xj = 1} | {Yi = k, Yj = ℓ}
1 · (N + 1)2
• Si k = ℓ , on a P {Xi = 1, Xj = 1} | {Yi = k, Yj = ℓ} = 0 . • Si k �= ℓ et si {Yi = k, Yj = ℓ} est réalisé, alors {Xi = 1, Xj = 1} est réalisé si les i−1 premiers tirages ne font apparaître ni la boule numéro k , ni la boule numéro ℓ et si la boule numéro ℓ n’apparaît pas lors des j − i − 1 tirages du rang i + 1 au rang j − 1 . On a donc :
P {Xi = 1, Xj = 1} | {Yi = k, Yj = ℓ} =
N − 1 i−1 N N +1
·
N +1
(N − 1)i−1 N j−i−1 = · (N + 1)j−2
j−i−1
On en déduit : P(Xi = 1, Xj = 1) =
N N (N − 1)i−1 N j−i−1 k=0 ℓ=0 ℓ�=k
(N +
1)j
=
(N − 1)i−1 N j−i , (N + 1)j−1
puisque la somme contient N (N + 1) termes.
30.11 1. On fait l’hypothèse que les résultats des différents appels sont indépendants, donc X suit la loi binomiale de paramètre (n, p) . 2. (a) La variable aléatoire Y est à valeurs dans [[0, n]] . La loi conditionnelle de Y sachant {X = k} est la loi binomiale de paramètre (n − k, p) . En effet, il reste n − k correspondants à joindre dans les mêmes conditions que dans la première série d’appels. On en déduit que, pour tout (k, ℓ) ∈ [[0, n]]2 : P(X = k, Y = ℓ) = P(X = k) P(Y = ℓ | X = k) =
n k
0
pk (1 − p)n−k
n−k ℓ
pℓ (1 − p)n−k−ℓ
si si
ℓ n−k ℓ > n − k.
Dans le cas ℓ n − k , on simplifie pour obtenir : P(X = k, Y = ℓ) =
n! pk+ℓ (1 − p)2(n−k)−ℓ . k! ℓ! (n − k − ℓ)!
1143
Chapitre 30. Conditionnement — Indépendance (b) La variable Z est à valeurs dans [[0, n]] et, pour tout i ∈ [[0, n]] : P(Z = i) =
i � k=0
=
= =
P(X = k, Y = i − k) =
� �
n i p (1 − p)2(n−i) i
� �
i � k=0
n! pi (1 − p)2(n−k)−i+k k!(i − k)!(n − i)!
�� � i
k=0
i (1 − p)i−k k
n i p (1 − p)2(n−i) (2 − p)i d’après la formule du binôme i
� �
� �n−i n (p(2 − p))i (1 − p)2 . i
En remarquant que 1 − p(2 − p) = (1 − p)2 , on peut conclure que Z suit la loi binomiale de paramètre (n, p(2 − p)) . 30.12 1. On choisit deux boules parmi quatre que l’on place dans la boîte A , les deux autres � � 4 = 6 choix possibles. boules étant placées dans la boîte B . Il y a 2 1 On obtient p0 = (il faut placer les deux boules rouges dans A : il y a un cas favorable) 6 1 2 et de même r0 = · On en déduit q0 = 1 − p0 − r0 = · 6 3 2. Soit n ∈ IN . On applique la formule des probabilités totales avec le système complet d’événements ({Xn = 0}, {Xn = 1}, {Xn = 2}) . On obtient : pn+1 = pn P(Xn+1 = 0 | Xn = 0) + qn P(Xn+1 = 0 | Xn = 1) + rn P(Xn+1 = 0 | Xn = 2). On a : • P(Xn+1 = 0 | Xn = 0) = P(Xn+1 = 0 | Xn = 2) = 0 , car si la boîte A contient 0 ou 2 boules noires, elle en contiendra une après échange ; 1 • P(Xn+1 = 0 | Xn = 1) = , car si la boîte A contient une boule noire, il faut 4 échanger cette boule noire avec la boule rouge de l’autre boîte. 1 Ainsi pn+1 = qn . En raisonnant de la même façon, on obtient : 4 1 1 qn+1 = pn + qn + rn et rn+1 = qn . 2 4 0 1/4 0 La matrice M cherchée est donc 1 1/2 1 . 0 1/4 0
3. Soit u l’endomorphisme de IR3 canoniquement associé à M . On cherche une base (e1 , e2 , e3 ) de IR3 , dans laquelle la matrice de u est D , c’est-à-dire vérifiant : 1 u(e1 ) = e1 , u(e2 ) = 0 et u(e3 ) = − e3 . 2 En résolvant M X = X , où X ∈ M3,1 (IR) , on voit que e1 = (1, 4, 1) convient. On trouve de même e2 = (1, 0, −1) et e3 = (1, −2, 1) . On montre facilement que (e1 , e2 , e3 ) est libre donc est une base de IR3 . La matrice de u dans cette base est D . � � 1 1 1 −1 On a donc M = P DP , avec P = 4 0 −2 . 1 −1 1
1144
Solutions des exercices
4. En notant Yn la matrice colonne
pn qn rn
, on a Yn+1 = M Yn .
On en déduit que, pour tout entier naturel n , on a Yn = M n Y0 = P Dn P −1 Y0 . a −1 On a P Y0 = b . On obtient, après calcul : c pn a + (−1/2)n c a n n qn = Yn = P Diag 1, 0, (−1/2) b = 4a − 2(−1/2) c . a + (−1/2)n c c rn Les suites (pn ) , (qn ) et (rn ) convergent respectivement vers a , 4a et a . De plus, ({Xn = 0}, {Xn = 1}, {Xn = 2}) est un système complet d’événements, donc on a pn + qn + rn = 1 , pour tout n ∈ IN . Par passage à la limite, on obtient a + 4a + a = 1 1 1 2 1 et donc a = · On a donc p = , q = et r = · 6 6 3 6 On voit que, lorsque n tend vers +∞ , la loi de Xn tend vers la loi obtenue quand on place les boules au hasard dans les deux boîtes. 30.13 Le nombre de boules blanches et le nombre de boules noires tirées suivent chacun la loi B n, 12 . On considère l’événement A « au cours des tirages, on a obtenu seulement des boules blanches ou seulement des boules noires ». On obtient : 1 1 P(A) = 1 − P(A) = 1 − 2 n = 1 − n−1 · 2 2 L’événement B est réalisé si on tire zéro ou une boule blanche. On a donc :
n
n+1 1 + 1n = · 2n 2 2n Enfin, A ∩ B est l’événement « au cours des tirages, on a obtenu une boule blanche exactement ». On a donc P(A ∩ B) = 2nn · P(B) =
Les événements A et B sont donc indépendantes si, et seulement si, n−1
n 2n
= 1−
1 2n−1
· n+1 , 2n
= n + 1 . Cette égalité n’est pas vérifiée pour n = 2 ; elle l’est pour n = 3 c’est-à-dire 2 et, pour n 4 , on obtient, par la formule du binôme : 2n−1 = (1 + 1)n−1 > 1 +
n−1 1
+
n−1 n−1
= n + 1.
Les événements A et B sont donc indépendants si, et seulement si, n = 3 . 30.14 Il existe a tel que X(Ω) = {a} . On a alors pour tout y ∈ Y (Ω) :
P ({X = a} ∩ {Y = y}) = P (Ω ∩ {Y = y}) = P (Y = y) = P(X = a) P(Y = y).
Les variables X et Y sont indépendantes.
30.15 On a (X + Y )(Ω) = [[2, 2n]] et, pour tout k ∈ [[2, 2n]] : P(X + Y = k) =
n i=1
P(X = i) P(Y = k − i) =
1 card {i ∈ [[1, n]] : k − i ∈ [[1, n]]} , n2
car si k − i ∈ / [[1, n]] , alors P(Y = k − i) = 0 . On cherche donc les couples (i, k − i) tels que 1 i n et 1 k − i n , c’est-à-dire tel que k − n i k − 1 . k−1 • Si k n + 1 , cela équivaut à 1 i k − 1 et P(X + Y = k) = · n2 2n − k + 1 · • Si k n + 2 , cela équivaut à k − n i n et P(X + Y = k) = n2
1145
Chapitre 30. Conditionnement — Indépendance 30.16 On remarque que Nx =
n
1{Xk =x} .
k=1
Les variables X1 , . . . , Xn étant indépendantes, les variables 1{X1 =x} , . . . , 1{Xn =x} sont également indépendantes, d’après la proposition 17 de la page 1127. Pour tout k ∈ [[1, n]] , 1{Xk =x} est une variable de Bernoulli de paramètre P(Xk = x) , ce qui est égal à p = P(X1 = x) car les variables aléatoires X1 , . . . , Xn suivent la même loi. On a donc une somme de variables de Bernoulli indépendantes et de même loi. Ainsi Nx suit la loi binomiale de paramètre (n, p) . 30.17 • On a, par définition de l’indépendance de n événements :
P (A1 ∩ · · · ∩ Ap ) ∩ (Ap+1 ∩ · · · ∩ An ) = P =
n
Ai
i=1
n
P(Ai )
i=1
=
p
P(Ai )
i=1
n
P(Ai )
i=p+1
= P(A1 ∩ · · · ∩ Ap ) P (Ap+1 ∩ · · · ∩ An ) , donc (A1 ∩ · · · ∩ Ap ) et (Ap+1 ∩ · · · ∩ An ) sont indépendants.
• D’après la proposition 9 de la page 1123, les événements (A1 , A2 , . . . , An ) sont indépendants donc, en utilisant le premier point, A1 ∩ · · · ∩ Ap et Ap+1 ∩ · · · ∩ An sont indépendants, c’est-à-dire A1 ∪ · · · ∪ Ap et Ap+1 ∪ · · · ∪ An sont indépendants. Toujours d’après la proposition 9 de la page 1123, on en déduit que A1 ∪ · · · ∪ Ap et Ap+1 ∪ · · · ∪ An sont indépendants. • D’après la proposition 9 de la page 1123, les événements (A1 , . . . , Ap , Ap+1 , . . . , An ) sont indépendants donc, d’après le premier point, A1 ∩ · · · ∩ Ap = A1 ∪ . . . ∪ Ap et Ap+1 ∩ · · · ∩ An sont indépendants. On en déduit que A1 ∪ · · · ∪ Ap et Ap+1 ∩ · · · ∩ An sont indépendants. 30.18 1. On modélise l’expérience aléatoire, par l’univers Ω = [[1, n]] , muni de la probabilité uniforme. Les éléments de Ap sont les entiers de la forme kp , avec k ∈ IN∗ et kp n , n n 1 n soit 1 k · Par hypothèse est entier donc card (Ap ) = et P(Ap ) = · p p p p 2. Si I est une partie non vide de [[1, r]] , alors
Api est l’ensemble des entiers de [[1, n]]
i∈I
divisibles par tous les pi , pour i ∈ I . Les pi sont des entiers premiers distincts, donc premiers entre eux : un entier est divisible par chaque pi si, et seulement s’il est divisible par p = pi . On a donc Api = Ap . On en déduit, d’après la première question : i∈I
P
i∈I
A pi
i∈I
= P (Ap ) =
1 1 1 = = P(Api ). = p p pi i i∈I
i∈I
i∈I
Les événements Ap1 , Ap2 , . . . , Apr sont donc mutuellement indépendants.
1146
Solutions des exercices 3. Les éléments de [[1, n]] qui sont premiers avec n sont ceux qui ne sont divisibles par aucun r
des entiers p1 , . . . , pr , c’est-à-dire qui appartiennent à
A pi .
i=1
Les événements Ap1 , . . . , Apr sont indépendants car les événements Ap1 , . . . , Apr le sont. On en déduit : ϕ(n) = n
card
A pi
i∈I
=P
n
r
A pi
i=1
r
=
P A pi =
i=1
r i=1
1 1− pi
.
30.19 • Supposons X ⊥ ⊥Y. Alors, pour tout (i, j) ∈ [[1, n]] × [[1, p]] , on a :
P {X = xi } ∩ {Y = yj } = P(X = xi ) P(Y = yj ) et donc, pour tout i ∈ [[1, n]] , la i -ème ligne de A est :
P(X = xi ) P(Y = y1 )
P(Y = yp ) .
...
Toutes les lignes sont donc proportionnelles à prouve que A est de rang inférieur ou égal à 1 . somme de ses coefficients est égale à 1 . En effet,
P(Y = y1 ) . . . P(Y = yp ) , ce qui D’autre part, A est non nulle car la {X = xi } ∩ {Y = yj } 1in est un 1jp
système complet d’événements. Donc rg(A) = 1 . • Réciproquement, supposons A de rang 1 . Alors les lignes de A sont toutes proportion nelles à une certaine ligne L = ℓ1 . . . ℓp . Comme la somme des coefficients de A vaut 1 , la somme des éléments de L est non nulle. On peut donc, quitte à diviser L par cette somme, supposer que
p
ℓj = 1 . Les lignes de A sont alors c1 L, . . . , cn L ,
j=1
avec (c1 , . . . , cn ) ∈ IRn .
Soit (i, j) ∈ [[1, n]] × [[1, p]] . On a alors P {X = xi } ∩ {Y = yj } = ci ℓj et : P(X = xi ) =
p j=1
p
n
P {X = xi } ∩ {Y = yj } =
Par suite, la somme des ci vaut 1 et pour tout j ∈ [[1, p]] : P(Y = yj ) =
n i=1
P {X = xi } ∩ {Y = yj } =
On a finalement P {X = xi } ∩ {Y = yj } que X ⊥ ⊥Y.
ci ℓj = ci .
j=1
ci ℓj = ℓj .
i=1
= P(X = xi ) P(Y = yj ) , ce qui prouve
30.20 On modélise l’expérience par une suite (Xi )1in de variables de Bernoulli de paramètre p , indépendantes, où Xi est la variable indicatrice de l’événement « pile au i -ème lancer ». 1. L’événement A1 « le premier pile est obtenu au n -ième lancer » s’écrit : A1 = {X1 = 0} ∩ · · · ∩ {Xn−1 = 0} ∩ {Xn = 1}.
On a donc, par indépendance des variables Xi :
P(A1 ) = P(X1 = 0) · · · P(Xn−1 = 0)P(Xn = 1) = (1 − p)n−1 p.
1147
Chapitre 30. Conditionnement — Indépendance 2. L’événement Ak « le k -ième pile est obtenu au n -ième lancer » est réalisé si le n -ième lancer est un pile et si dans les n − 1 premiers lancers on a obtenu k − 1 piles. On a donc : Ak = {X1 + · · · + Xn−1 = k − 1} ∩ {Xn = 1}. Par le lemme des coalitions, X1 + · · · + Xn−1 et Xn sont indépendantes. On a donc : P(Ak ) = P(X1 + · · · + Xn−1 = k − 1) P(Xn = 1) =
n−1 (1 − p)n−k pk−1 × p = k−1
n−1 (1 − p)n−k pk , k−1
car X1 + · · · + Xn−1 suit la loi binomiale de paramètre (n − 1, p) .
30.21 1. Vérification immédiate pour x = 0 et x = 1 . 2. Les variables X1 , . . . , Xn d’une part, Y1 , . . . , Yn d’autre part, étant indépendantes, on a, d’après la question 1 : n
P(Xi = xi ) P(X1 = x1 , . . . , Xn = xn ) = P(Y1 = x1 , . . . , Yn = xn ) P(Yi = xi ) i=1
=
n i=1
= exp
exp
Comme q > p , la fonction x �→ −x ln de plus,
n
−
− xi ln
n
xi ln
i=1
q p
− (1 − xi ) ln
q p
−
−(n − x) ln
q p
n−
1−q 1−p
n
1−q 1−p
xi
i=1
ln
1−q 1−p
est décroissante sur IR ;
xi > nq , donc :
i=1
P(X1 = x1 , . . . , Xn = xn ) q 1−q − (n − nq) ln exp −nq ln P(Y1 = x1 , . . . , Yn = xn ) p 1−p Ce dernier terme étant égal à exp (−nd(q, p)) , on a l’inégalité voulue.
.
3. Notons K = (x1 , . . . , xn ) ∈ {0, 1}n : x1 + · · · + xn > nq . On a alors : {X1 + · · · + Xn > nq} = {Y1 + · · · + Yn > nq} =
(x1 ,...,xn )∈K
(x1 ,...,xn )∈K
{X1 = x1 , . . . , Xn = xn }
et
{Y1 = x1 , . . . , Yn = xn }.
On en déduit, en utilisant l’inégalité de la question précédente : P(X1 + · · · + Xn > nq) =
P(X1 = x1 , . . . , Xn = xn )
(x1 ,...,xn )∈K
exp (−nd(q, p))
P(Y1 = x1 , . . . , Yn = xn ),
(x1 ,...,xn )∈K
= exp (−nd(q, p)) P(Y1 + · · · + Yn > nq).
On a, a fortiori, P(X1 + · · · + Xn > nq) exp (−nd(q, p)) .
1148
.
Solutions des exercices 30.22 1. On remarque que, pour k ∈ [[1, N ]] , la variable Yk = paramètre
1 · 2
1+Xk 2
suit la loi de Bernoulli de
Comme Y1 , . . . , Yn sont indépendantes, car fonctions de variables indépen-
dantes, la variable Tn =
n
Yk =
k=1
Sn +n 2
suit la loi binomiale de paramètre n,
1 2
.
On a Sn = 2Tn − n . L’ensemble des valeurs prises par Tn est [[0, n]] , donc l’ensemble des valeurs prises par Sn sont {2n − k | k ∈ [[0, n]]} , c’est-à-dire l’ensemble des entiers r ∈ [[−n, n]] de même parité que n . Pour un tel entier r , on obtient donc :
P(Sn = r) = P Tn =
n+r 2
=
n r+n 2
n 1 2
.
Si r ∈ [[−n, n]] n’a pas même parité que n , alors P(Sn = r) = 0 .
On a en particulier P(Sn = 0) =
n 1 n n 2
2
si n est pair et P(Sn = 0) = 0 si n est
impair. 2. Pour tout k , on a Sk+1 = Sk ± 1 . La suite (Sk ) ne peut donc passer d’une valeur strictement positive à une valeur strictement négative sans prendre la valeur 0 . On a donc : P(S1 �= 0, . . . , Sn �= 0) = P(S1 > 0, . . . , Sn > 0) + P(S1 < 0, . . . , Sn < 0). Nous allons montrer que P(S1 > 0, . . . , Sn > 0) = P(S1 < 0, . . . , Sn < 0) . Pour cela, il suffit de montrer que (S1 , . . . , Sn ) et (−S1 , . . . , −Sn ) ont même loi. Notons f l’application de IRn dans IRn définie par : ∀(x1 , x2 , . . . , xn ) ∈ IRn
f (x1 , x2 , . . . , xn ) = (x1 , x1 + x2 , . . . , x1 + · · · + xn ).
On a alors (S1 , . . . , Sn ) = f (X1 , . . . , Xn ) et (−S1 , . . . , −Sn ) = f (−X1 , . . . , −Xn ) .
On veut montrer que (S1 , . . . , Sn ) ∼ (−S1 , . . . , −Sn ) . D’après la proposition 11 de la page 1092, il suffit de démontrer que (X1 , . . . , Xn ) ∼ (−X1 , . . . , −Xn ) . Cela résulte de l’indépendance des variables X1 , . . . , Xn et du fait que leur loi commune est symétrique. En effet, on a, pour tout (ε1 , . . . , εn ) ∈ {−1, 1}n : P (X1 = ε1 , . . . , Xn = εn ) =
n
k=1
P(Xk = εk ) =
n
k=1
P(Xk = −εk )
= P (X1 = −ε1 , . . . , Xn = −εn ) = P (−X1 = ε1 , . . . , −Xn = εn ) .
On a donc P(S1 �= 0, . . . , Sn �= 0) = 2 P(S1 > 0, . . . , Sn > 0) .
1149
Chapitre 31 : Espérance Variance
I
Espérance d’une variable aléatoire . . . . . . . . . Définition . . . . . . . . . . . . . . . . . . . . . . . Espérance des lois usuelles . . . . . . . . . . . . . . Propriétés de l’espérance . . . . . . . . . . . . . . Formule de transfert . . . . . . . . . . . . . . . . . Espérance d’un produit de variables indépendantes II Variance . . . . . . . . . . . . . . . . . . . . . . . . . 1 Définition . . . . . . . . . . . . . . . . . . . . . . . 2 Propriétés de la variance . . . . . . . . . . . . . . . 3 Variance des lois usuelles . . . . . . . . . . . . . . 4 Écart-type . . . . . . . . . . . . . . . . . . . . . . . III Covariance — Variance d’une somme . . . . . . . 1 Définition, calcul . . . . . . . . . . . . . . . . . . . 2 Propriétés de la covariance . . . . . . . . . . . . . 3 Variance d’une somme de variables aléatoires . . . 4 Variables aléatoires décorrélées . . . . . . . . . . . IV Inégalités probabilistes . . . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 3 4 5
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
1152 1152 1153 1153 1155 1156 1156 . 1156 . 1157 . 1157 . 1158 1158 . 1158 . 1159 . 1159 . 1161 1163 1164 1169
. . . . .
Espérance Variance
31
Dans tout le chapitre, (Ω, P) désigne un espace probabilisé fini.
Exo 31.1
I
Espérance d’une variable aléatoire
1
Définition
Définition 1 L’espérance d’une variable aléatoire complexe X définie sur (Ω, P) est le complexe : xP X = x . E(X) = x∈X(Ω)
Remarques • L’espérance d’une variable aléatoire ne dépend que de sa loi : deux variables aléatoires de même loi ont même espérance. • L’espérance est la moyenne des valeurs prises par X , pondérée par les probabilités que X prenne ces valeurs. Certains auteurs parlent d’ailleurs de moyenne au lieu d’espérance. On peut aussi dire que c’est la valeur que l’on attend en moyenne quand on réalise l’expérience aléatoire. Si l’expérience consiste par exemple à tirer des boules dans une urne, on pourra se voir demander : quel est le nombre moyen de boules rouges tirées ? La réponse attendue est l’espérance de la variable aléatoire qui représente le nombre de boules rouges tirées. • Si X est une variable aléatoire réelle, alors E(X) ∈ IR. Ex. 1. On lance deux dés. Soit X la variable aléatoire égale à la somme des chiffres apparus. k−1 On a P(X = k) = E(X) = 2
.
36 13−k 36
si si
k ∈ [[1, 6]] (cf. exemple 14 page 1091). On en déduit : k ∈ [[7, 13]]
1 1 1 5 1 5 1 1 1 1 1 +3 +4 +5 +6 +7 +8 + 9 + 10 + 11 + 12 = 7. 36 18 12 9 36 6 36 9 12 18 36
I Espérance d’une variable aléatoire
2
Espérance des lois usuelles
Proposition 1 Pour tout complexe a, l’espérance de la variable aléatoire réelle certaine égale à a est a. Démonstration. On a X(Ω) = {a} et P X = a = 1 et donc E(X) = a P X = a = a. Remarque Le résultat subsiste si X est presque sûrement constante, c’est-à-dire s’il existe a tel que P(X = a) = 1 . En effet, pour x ∈ X(Ω) \ {a} , on a x P(X = x) = 0 . Proposition 2 Soit a et b des entiers tels que a b . Si la variable aléatoire X suit la loi uniforme sur [[a, b]], alors E(X) = a+b 2 ·
Démonstration page 1164
Remarque En particulier, si X suit la loi uniforme sur [[1, n]], alors E(X) =
n+1 · 2
Proposition 3 Si la variable aléatoire X suit la loi de Bernoulli de paramètre p, alors E(X) = p. En particulier, pour tout événement A, on a E(1A ) = P(A). Démonstration page 1164
Ex. 2. Si X et Y sont deux variables de Bernoulli, XY est une variable de Bernoulli donc : E(XY ) = P(XY = 1) = P ({X = 1} ∩ {Y = 1}) .
Proposition 4 Si la variable aléatoire X suit la loi binomiale de paramètre (n, p), alors E(X) = np. Principe de démonstration.
3
Utiliser l’égalité k
Propriétés de l’espérance
n k
n−1
=n
k−1
Démonstration page 1164 , pour tout k ∈ [[1, n]] .
La formule suivante, peu utilisée dans la pratique, permet des démonstrations très simples des propriétés de l’espérance. Lemme 5 Si X une variable aléatoire complexe sur (Ω, P), alors : P({ω})X(ω). E(X) = ω∈Ω
Principe de démonstration.
Démonstration page 1164 On regroupe les termes de la somme selon la valeur de X(ω) .
1153
Chapitre 31. Espérance — Variance Linéarité Exo 31.2 Exo 31.3
Théorème 6 (Linéarité de l’espérance) L’application qui, à une variable aléatoire complexe, associe son espérance est une forme linéaire. Autrement dit, si X et Y sont deux variables aléatoires complexes sur (Ω, P), et λ un complexe, on a : E(X + Y ) = E(X) + E(Y )
et
E(λ X) = λ E(X). Démonstration page 1164
Remarque En particulier, si X est une variable aléatoire complexe et (a, b) ∈ C2 : E(aX + b) = E(aX) + b = a E(X) + b.
Point méthode La linéarité de l’espérance est très utile pour calculer l’espérance d’une variable dont on ne connaît pas la loi ou dont la loi a une expression compliquée, mais qu’on peut décomposer en somme de variables aléatoires dont on sait calculer l’espérance, qui sont le plus souvent des variables indicatrices. Ex. 3. (Problème des rencontres) Une urne contient n boules numérotées de 1 à n . On les extrait successivement sans remise. On dit qu’il y a rencontre au i -ème tirage si la boule tirée porte le numéro i . Déterminons le nombre moyen de rencontres. Il s’agit de calculer l’espérance de la variable X égale au nombre de rencontres. Pour tout i , on note Xi la variable qui prend la valeur 1 s’il y a rencontre au i -ème tirage, et 0 sinon. On obtient : (n − 1)! 1 = , E(Xi ) = P(Xi = 1) = n! n car il y a n! tirages possibles et (n − 1)! tirages pour lesquels la boule i est tirée au i -ème tirage ; en effet, les n − 1 autres boules sont tirées dans un ordre quelconque. Il est clair que X =
n
Xi donc, par linéarité, E(X) =
n
E(Xi ) = n
i=1
i=1
1 = 1. n
Définition 2 Toute variable aléatoire complexe d’espérance nulle est dite centrée. Proposition 7 Pour toute variable aléatoire complexe X , la variable aléatoire X − E(X) est une variable aléatoire centrée appelée variable aléatoire centrée associée à X . Démonstration. Notons que E(X) est un complexe que l’on considère comme la variable aléatoire constante ω → � E(X) ; celle-ci a pour espérance E(X) . Par linéarité, on a :
E X − E(X) = E(X) − E(X) = 0.
Inégalité triangulaire
Proposition 8 (Inégalité triangulaire) Si X est une variable aléatoire complexe, alors |E(X)| E (|X|). Principe de démonstration. 1154
Démonstration page 1164 Utiliser le lemme 5 de la page précédente.
I Espérance d’une variable aléatoire Positivité Dans cette section, les variables aléatoires sont réelles. Proposition 9 (Positivité de l’espérance) Soit X une variable aléatoire réelle positive ou nulle sur (Ω, P). Alors on a : 1. E(X) 0 ; 2. de plus, E(X) = 0 si, et seulement si, P(X = 0) = 1 ; on dit, dans ce cas, que la variable X est presque sûrement nulle. Démonstration page 1165
Remarque Si E(X) = 0 , on ne peut pas assurer que X = 0 , car un événement peut être différent de ∅ et avoir une probabilité nulle. Proposition 10 (Croissance de l’espérance) Soit X et Y deux variables aléatoires réelles sur le même espace probabilisé (Ω, P). Si X Y , alors E(X) E(Y ). Démonstration.
Par linéarité de l’espérance E(Y − X) = E(Y ) − E(X) . La variable aléatoire Y − X est positive donc, d’après la proposition 9, E(Y − X) 0 , d’où E(X) E(Y ) .
4
Exo 31.4 Exo 31.5
Formule de transfert
Théorème 11 (Formule de transfert) Si X est une variable aléatoire sur (Ω, P) et f une application de X(Ω) dans C , alors l’espérance de f (X) est donnée par : f (x) P X = x . E f (X) = x∈X(Ω)
Démonstration page 1165
Principe de démonstration. Utiliser l’expression de la loi de f (X) donnée dans la proposition 10 de la page 1092.
Remarques • L’intérêt de la formule de transfert est qu’elle permet le calcul de l’espérance de f (X) sans qu’il y ait besoin de déterminer sa loi. Il suffit de connaître celle de X . • La formule s’applique en particulier quand X est un couple ou un n-uplet de variables aléatoires. Le calcul de l’espérance du produit de deux variables aléatoires en donne un premier exemple.
1155
Chapitre 31. Espérance — Variance Ex. 4. Soit X et Y deux variables aléatoires complexes sur l’espace probabilisé (Ω, P) . Pour calculer E(X Y ) , on peut écrire X Y = f (Z) , où Z = (X, Y ) et f : (x, y) �→ xy . En appliquant la formule de transfert à f (Z) , on obtient : E(X Y ) = E(f (Z)) =
f (z)P(Z = z) =
z∈Z(Ω)
(x,y)∈Z(Ω)
f (x, y) P (X, Y ) = (x, y) .
Comme P (X, Y ) = (x, y) = 0 si (x, y) ∈ X(Ω) × Y (Ω) \ Z(Ω) , on en déduit : E(X Y ) =
(x,y)∈X(Ω)×Y (Ω)
5
x y P X = x, Y = y .
Espérance d’un produit de variables indépendantes
Théorème 12 Soit X et Y deux variables aléatoires complexes, indépendantes, sur (Ω, P). On a alors E(X Y ) = E(X) E(Y ). Démonstration page 1165
Cette propriété se généralise à n variables aléatoires indépendantes. Proposition 13 Si X1 , . . . , Xn sont des variables aléatoires complexes mutuellement indépendantes sur (Ω, P), alors : n n Xk = E(Xk ). E k=1
k=1
Démonstration page 1166
II 1
Variance Définition
Définition 3
2 La variance d’une variable aléatoire réelle X est le réel V(X) = E X − E(X) .
Remarques
2 • L’expression X − E(X) est bien une variable aléatoire, car E(X) désigne ici la variable aléatoire constante égale à E(X).
• La variance est l’espérance du carré de la distance entre les valeurs de X et l’espérance de X . La variance mesure donc la dispersion de X autour de E(X). • On aurait pu songer à prendre E |X − E(X)| comme paramètre de dispersion, mais la valeur absolue donne des calculs beaucoup moins agréables que le carré. Ex. 5. La variance d’une variable constante est nulle. En effet, si la variable X est constante égale à a , on a E(X) = a et V(X) = E (X − a)2 = E(0) = 0 . Les valeurs prises par X ne sont pas du tout dispersées ! 1156
II Variance Exo 31.6 Exo 31.7
Proposition 14 (Formule de Kœnig-Huygens) Soit X une variable aléatoire réelle. La variance de X est donnée par la formule : 2 V(X) = E(X 2 ) − E(X) .
Démonstration page 1166
Exo 31.8
Point méthode Lorsque l’on calcule une variance par un calcul direct en connaissant la loi, on utilise presque toujours la formule de de Kœnig-Huygens et non la définition qui entraîne des calculs compliqués. Remarque La formule de Kœnig-Huygens peut être aussi utilisée pour calculer E(X 2 ) quand on connaît l’espérance et la variance de X .
2
Propriétés de la variance
Proposition 15 • Pour toute variable aléatoire réelle X , on a V(X) 0 .
• On a V(X) = 0 si, et seulement s’il existe m ∈ IR tel que P X = m = 1 , c’est-à-dire si, et seulement si, X est presque sûrement constante.
Démonstration page 1166
Proposition 16 Si (a, b) est un couple de réels et X une variable aléatoire réelle, on a : V(aX + b) = a2 V(X). Démonstration page 1166
3
Variance des lois usuelles
Proposition 17 Exo 31.9
Si la variable X suit la loi uniforme sur [[1, n]], alors V(X) =
n2 − 1 · 12
Démonstration page 1166
Proposition 18 Si la variable aléatoire X suit la loi de Bernoulli de paramètre p, alors sa variance est V(X) = p (1 − p). Démonstration.
On obtient, par la formule de Kœnig-Huygens :
V(X) = E(X 2 ) − E(X)
2
= E(X) − E(X)
2
= p − p2 = p(1 − p).
Remarque La valeur maximale de la variance d’une variable de Bernoulli est obte1 1 et est égal à · nue lorsque le paramètre vaut 2 4 1157
Chapitre 31. Espérance — Variance Proposition 19 Si la variable aléatoire X suit la loi binomiale de paramètre (n, p), alors sa variance est V(X) = np(1 − p). Principe de démonstration.
4
Démonstration page 1167 Commencer par calculer E X(X − 1) .
Point méthode Comme on l’a vu dans le calcul de la variance de la loi binomiale, il est parfois préférable, plutôt que de calculer directement E(X 2 ), de calculer d’abord E X(X + 1) ou E X(X − 1) et d’en tirer E(X 2 ) par linéarité.
Écart-type
Définition 4 L’écart-type d’une variable aléatoire réelle X est le réel σ(X) =
V(X).
Remarque On prend la racine carrée de la variance pour des raisons d’homogénéité ; ainsi, l’écart-type s’exprime dans les mêmes unités que les valeurs prises par la variable aléatoire. Définition 5 Une variable aléatoire réelle X telle que E(X) = 0 et σ(X) = 1 est dite centrée réduite. Proposition 20 Si X est une variable aléatoire réelle dont la variance n’est pas nulle, la variable X − E(X) est une variable centrée réduite, appelée variable aléaaléatoire X ∗ = σ(X) toire centrée réduite associée à X .
Démonstration page 1167
III 1
Covariance — Variance d’une somme Définition, calcul
Définition 6 Soit X et Y deux variables aléatoires réelles sur le même espace probabilisé (Ω, P). On appelle covariance de X et Y , le réel noté Cov(X, Y ) défini par : Cov(X, Y ) = E X − E(X) Y − E(Y ) .
Remarques • Cette définition a un sens car X − E(X) Y − E(Y ) est une variable aléatoire réelle. C’est la variable f (X, Y ), où f : (x, y) �−→ x − E(X) y − E(Y ) . • La covariance de X et Y est l’espérance du produit des variables centrées associées à X et Y .
1158
III Covariance — Variance d’une somme Proposition 21 (Formule de Kœnig-Huygens) Soit X et Y deux variables aléatoires réelles sur (Ω, P). La covariance de X et Y est donnée par la formule : Cov(X, Y ) = E(X Y ) − E(X) E(Y ).
Démonstration page 1167
Ex. 6. Si la variable X est constante, égale à a , on a Cov(X, Y ) = 0 puisqu’alors : E(XY ) = E(aY ) = aE(Y ) = E(X) E(Y ).
Remarque L’exemple 4 de la page 1156 indique comment calculer E(X Y ) à partir de la loi conjointe de X et Y .
2
Propriétés de la covariance
Théorème 22 Soit X , X ′ , Y et Y ′ des variables aléatoires réelles sur (Ω, P) et λ un réel. On a : 1. Cov(X, X) = V(X) 0 ; 2. Cov(X, Y ) = Cov(Y, X) ; 3. Cov(X + X ′ , Y ) = Cov(X, Y ) + Cov(X ′ , Y ), Cov(λX, Y ) = λCov(X, Y ) ; 4. Cov(X, Y + Y ′ ) = Cov(X, Y ) + Cov(X, Y ′ ), Cov(X, λY ) = λCov(X, Y ). Démonstration page 1167
Remarques • L’application (X, Y ) �−→ Cov(X, Y ) est une forme bilinéaire, symétrique et positive sur l’espace vectoriel des variables aléatoires réelles sur (Ω, P). • L’application (X, Y ) �→ Cov(X, Y ) n’est pas un produit scalaire, car V(X) = 0 n’implique pas X = 0 . En effet, V(X) = 0 équivaut à X est presque sûrement constante (cf. proposition 15 de la page 1157). • L’utilisation de la bilinéarité peut éviter des calculs de covariance souvent pénibles. Ex. 7. Si X et Y sont deux variables aléatoires sur (Ω, P) , a et b deux réels, on a : Cov(X + a, Y + b) = Cov(X, Y ) + Cov(a, Y ) + Cov(X, b) + Cov(a, b) = Cov(X, Y ), car la covariance est nulle si l’une des variables aléatoires est constante (cf. exemple 6).
3
Variance d’une somme de variables aléatoires
Théorème 23 Soit X et Y des variables aléatoires réelles sur (Ω, P). On a : V(X + Y ) = V(X) + V(Y ) + 2 Cov(X, Y ). Démonstration page 1168
1159
Chapitre 31. Espérance — Variance Remarques • On en déduit, en utilisant le théorème 22 de la page précédente, que : ∀(a, b) ∈ IR2
V(aX + bY ) = V(aX) + V(bY ) + 2Cov(aX, bY ) = a2 V(X) + b2 V(Y ) + 2ab Cov(X, Y ).
Exo 31.19
• La formule permet aussi de calculer la covariance de X et Y à partir des variances de X , Y et X + Y . Par récurrence, on généralise le théorème précédent au cas de n variables aléatoires. Théorème 24 Pour toute famille (X1 , . . . , Xn ) de n variables aléatoires réelles sur (Ω, P), la variance de X1 + · · · + Xn est donnée par : V(X1 + · · · + Xn ) =
n
V(Xk ) + 2
Cov(Xi , Xj ).
1i 0 P |X − E(X)| ε · ε2 Principe de démonstration.
Démonstration page 1168 Utiliser l’inégalité de Markov (théorème 28).
Remarques • Comme |X − E(X)| ε est l’événement contraire de |X − E(X)| < ε , l’inégalité de Bienaymé-Tchebychev peut encore s’écrire : V(X) ∀ε > 0 P |X − E(X)| < ε > 1 − · ε2
• L’inégalité de Bienaymé-Tchebychev est une inégalité de concentration : elle fournit une majoration de la probabilité que X s’écarte de son espérance. Ex. 11. Soit X1 , . . . , Xn des variables aléatoires réelles indépendantes de même loi, d’espén
rance m et de variance v . On pose Sn = en déduit E donne :
Sn n
Xk . On a alors E(Sn ) = nm et V(Sn ) = nv . On
k=1
=
E(Sn ) n
= m et V ∀ε > 0
Sn n
=
S n
P
n
V(Sn ) n2
=
v · n
L’inégalité de Bienaymé-Tchebychev
− m ε
v · nε2
On en déduit que P Snn − m ε tend vers 0 quand n tend vers +∞ : la variable Snn tend à se concentrer autour de la valeur m . Considérons par exemple une suite de n épreuves indépendantes telle que, pour chaque épreuve, la probabilité qu’un certain événement A soit réalisé est p . Pour 1 k n , on note Xk la variable indicatrice de l’événement « A est réalisé à la k -ième épreuves ». On obtient des variables aléatoires indépendantes qui suivent la loi B(p) . Alors, avec les notations précédentes, on a m = p et la variable aléatoire Snn est égale à la fréquence avec laquelle l’événement A s’est réalisé parmi les n épreuves. Cette fréquence est proche de p pour les grandes valeurs de n . Ce résultat conforte l’intuition qui voit dans une probabilité une fréquence. Si, par exemple, on lance un dé un grand nombre de fois, 1 apparaîtra à peu près dans 61 des lancers.
1163
Chapitre 31. Espérance — Variance
Démonstrations Proposition 2 Si X ∼ U([[a, b]]) , on obtient, en utilisant la formule donnant la somme des termes consécutifs d’une suite arithmétique : E(X) =
b
k P(X = k) =
k=a
b (b − a + 1)(a + b) a+b 1 1 · = · k= b−a+1 b−a+1 2 2 k=a
Si X ∼ B(p) , on a E(X) = 0 P(X = 0) + 1 P(X = 1) = p .
Proposition 3
La variable indicatrice de l’événement A est une variable de Bernoulli de paramètre P(A) , d’où le résultat. Proposition 4 Si X ∼ B(n, p) , on obtient, en utilisant l’égalité k nk = n n−1 , valable pour k−1 tout k ∈ [[1, n]] , et la formule du binôme : E(X) =
n n k
k
k=0
k
p (1 − p)
n−k
=
n n−1 n
k=1
=n
k−1
pk (1 − p)n−k
n−1 n−1 j=0
pj+1 (1 − p)n−1−j
j
= np p + 1 − p
n−1
= np.
Lemme 5 Soit x ∈ X(Ω) . On considère tous les termes de la somme vérifiant X(ω) = x , c’està-dire ω ∈ {X = x} . En les sommant, on obtient :
ω∈{X=x}
car on a {X = x} =
x P({ω}) = x
P({ω}) = x P(X = x),
ω∈{X=x}
{ω} . Comme les ensembles {X = x} , pour x variant dans X(Ω) ,
ω∈{X=x}
forment une partition de Ω , on en déduit :
P ({ω}) X(ω) =
ω∈Ω
Théorème 6
P({ω})X(ω) =
x∈X(Ω) ω∈{X=x}
x P(X = x) = E(X).
x∈X(Ω)
En appliquant le lemme 5 de la page 1153, on obtient :
E(X + Y ) =
(X + Y )(ω)P ({ω}) =
ω∈Ω
(X(ω) + Y (ω)) P ({ω})
ω∈Ω
=
X(ω)P ({ω}) +
et de même : E(λX) =
(λX)(ω)P ({ω}) =
λ X(ω)P ({ω}) = λ
ω∈Ω
ω∈Ω
Y (ω)P ({ω}) = E(X) + E(Y ),
ω∈Ω
ω∈Ω
Proposition 8
X(ω)P ({ω}) = λE(X).
ω∈Ω
On a, d’après le lemme 5 de la page 1153, E(X) =
P({ω})X(ω) et donc, par
ω∈Ω
inégalité triangulaire :
E(X) P({ω}) X(ω) = P({ω}) X(ω) = E |X| , ω∈Ω
ω∈Ω
la dernière égalité résultant encore du lemme 5 de la page 1153 appliqué à |X| .
1164
Démonstrations Proposition 9 1.
Comme X est une variable aléatoire positive, on a x 0 pour tout x ∈ X(Ω) . On en déduit :
E(X) =
xP(X = x) 0.
x∈X(Ω)
2.
Si, de plus, E(X) = 0 alors, pour tout x ∈ X(Ω) , on a xP(X = x) = 0 et donc P(X = x) = 0 si x �= 0 . Ainsi P(X = 0) = 1 − P(X = x) = 1 . x∈X(Ω)\{0}
Réciproquement, si P(X = 0) = 1 , alors P(X = x) = 0 pour tout x ∈ X(Ω) \ {0}
et E(X) =
xP(X = x) = 0 .
x∈X(Ω)
Théorème 11
On sait, d’après la proposition la proposition 10 de la page 1092, que : ∀y ∈ f (X)(Ω)
P(f (X) = y) =
P(X = x).
x∈f −1 ({y})
On obtient, par définition de l’espérance :
E f (X) =
y P(f (X) = y) =
y∈f (X)(Ω)
y∈f (X)(Ω)
=
y∈f (X)(Ω)
y
P(X = x)
x∈f −1 ({y})
f (x) P(X = x) .
x∈f −1 ({y})
Les ensembles f −1 ({y}) , pour y ∈ f (X)(Ω) , forment une partition de X(Ω) , car chaque élément de X(Ω) a une image unique y par f . On en déduit :
E f (X) =
Théorème 12
f (x) P X = x .
x∈X(Ω)
Comme on l’a vu dans l’exemple 4 de la page 1156, la formule de transfert donne :
E(X Y ) =
x y P X = x, Y = y .
(x,y)∈X(Ω)×Y (Ω)
Comme X et Y sont indépendantes, on a, pour tout (x, y) ∈ X(Ω) × Y (Ω) :
P X = x, Y = y = P X = x P Y = y . On obtient : E(X Y ) =
(x,y)∈X(Ω)×Y (Ω)
=
x∈X(Ω)
xy P X = x P Y = y
xP X = x
y∈Y (Ω)
y P(Y = y)
= E(X) E(Y ).
1165
Chapitre 31. Espérance — Variance Proposition 13 On fait une démonstration par récurrence sur n . La propriété est évidente pour n = 1 et a déjà été démontrée pour n = 2 dans le théorème 12 de la page 1156. Supposons que la propriété soit vraie au rang n et considérons X1 , . . . , Xn , Xn+1 des variables indépendantes. Alors, les variables X1 , . . . , Xn sont également indépendantes donc : E
n
Xk
k=1
=
n
E(Xk ),
k=1
par hypothèse de récurrence. D’autre part, d’après le lemme des coalitions, Xn+1 est indépendante de X1 X2 · · · Xn ; en utilisant la propriété pour deux variables, on trouve : E
n+1 k=1
Proposition 14
Xk
=E
Comme :
n
Xk
k=1
E(Xn+1 ) =
X − E(X)
2
on obtient, par linéarité de l’espérance :
2
+ E(X)
2
= E(X 2 ) − E(X) .
n
E(Xk )
k=1
n+1
E(Xn+1 ) =
E(Xk ).
k=1
2
= X 2 − 2E(X) X + E(X) ,
V(X) = E(X 2 ) − 2E E(X) X + E (E(X))2 = E(X 2 ) − 2 E(X)
2
car E(X)
2
est une variable aléatoire constante
Proposition 15 2 La variance est positive, car c’est l’espérance de la variable positive X − E(X) . •
Si V(X) = 0 , alors X −E(X)
2
est une variable aléatoire réelle positive qui admet une espé-
rance nulle. D’après la proposition 9 de la page 1155, on en déduit P Comme :
X − E(X)
•
2
=0
X −E(X)
= {X − E(X) = 0} = {X = E(X)},
2
on obtient P(X = E(X)) = 1 . Donc X est égale à E(X) presque sûrement. Réciproquement s’il existe m ∈ IR tel que P(X = m) = 1 , alors E(X) = m et : P
donc V(X) = E Proposition 16
X − E(X)
X − E(X)
2
2
= 0 = P X − m = 0 = 1,
= 0.
On sait déjà que E(aX + b) = a E(X) + b . On obtient :
2
(aX + b − E(aX + b))2 = a2 X − E(X) .
Par linéarité de l’espérance, on en déduit :
V(aX + b) = E a2 (X − E(X))2 = a2 E (X − E(X))2 = a2 V(X). Proposition 17
Si X ∼ U([[1, n]]) , on a : E(X 2 ) =
n k=1
puis, par la formule de Kœnig-Huygens : V(X) = E(X 2 ) − E(X)2 =
1166
k2 P X = k =
n k2 k=1
n
=
(n + 1)(2n + 1) , 6
(n + 1)2 (n + 1)(2n + 1) n2 − 1 − = · 6 4 12
= 0 = 1.
Démonstrations Proposition 19 Soit X qui suit B(n, p) . Pour calculer V(X) , il est plus simple de cal culer d’abord E X(X − 1) , plutôt que directement E X 2 . On utilise l’égalité, valable pour k ∈ [[2, n]] : k(k − 1) D’après la formule de transfert, on a :
E X(X − 1) =
n k=0
n k
= n(n − 1)
n−2 . k−2
n
n k n−2 k k(k − 1) p (1 − p)n−k = n(n − 1) p (1 − p)n−k k k−2 k=2
= n(n − 1)p
2
2
n−2 n−2 j=0
j
pj (1 − p)n−2−j ,
et donc, par la formule du binôme, E X(X − 1) = n(n − 1)p . Comme X 2 = X(X − 1) + X , on en déduit : E X 2 = E X(X − 1) + E(X) = n(n − 1)p2 + np,
puis, par la formule de Kœnig-Huygens :
V(X) = E X 2 − E(X)2 = n(n − 1)p2 + np − n2 p2 = np(1 − p).
Proposition 20
On écrit X ∗ =
E(X) 1 X− , fonction affine de X . Par linéarité on a : σ(X) σ(X) E(X ∗ ) =
E(X) E(X) − = 0. σ(X) σ(X)
D’après la proposition 16 de la page 1157, on a : 1 V(X ∗ ) = V(X) = 1. σ(X)2 Par suite, X ∗ est une variable aléatoire centrée réduite. Proposition 21
On écrit :
X − E(X)
Y − E(Y ) = XY − XE(Y ) − Y E(X) + E(X) E(Y )
et l’on obtient, par linéarité de l’espérance : Cov(X, Y ) = E
X − E(X)
Y − E(Y )
= E(XY ) − E(Y )E(X) − E(X) E(Y ) + E(X) E(Y ) = E(X Y ) − E(Y ) E(X).
Théorème 22 1. On a Cov(X, X) = V(X) 0 , par définition. 2. La symétrie est évidente. 3. Par linéarité de l’espérance, on obtient :
Cov(X + X ′ , Y ) = E (X + X ′ )Y − E(X + X ′ )E(Y )
= E(XY ) + E(X ′ Y ) − E(X) + E(X ′ ) E(Y ) = E(XY ) − E(X)E(Y ) + E(X ′ Y ) − E(X ′ )E(Y ) = Cov(X, Y ) + Cov(X ′ , Y ), et de même : 4.
Cov(λX, Y ) = E(λXY ) − E(λX)E(Y ) = λE(XY ) − λE(X)E(Y ) = λCov(X, Y ).
C’est une conséquence immédiate des deux points précédents.
1167
Chapitre 31. Espérance — Variance
Théorème 23
On obtient, par bilinéarité et symétrie : V(X + Y ) = Cov(X + Y, X + Y ) = Cov(X, X) + Cov(X, Y ) + Cov(Y, X) + Cov(Y, Y ) = V(X) + V(Y ) + 2Cov(X, Y ).
Théorème 27
On sait (cf.théorème 24 de la page 1160) que : V(X1 + · · · + Xn ) =
n
V(Xk ) + 2
k=1
Cov(Xi , Xj ).
1i 0 . • Si X(ω) a , on a 1{Xa} (ω) = 1 a X(ω) • Dans le cas contraire, on a 1{Xa} (ω) = 0 , car X est une positive et a > 0 . a X , et par croissance et linéarité de l’espérance : Ainsi, 1{Xa} a
Théorème 28
Montrons que 1{Xa}
P(X a) = E(1{Xa} ) E
2
X a
=
E(X) · a
Théorème 29 La variable X − E(X) est positive et possède une espérance égale à V(X) . D’après l’inégalité de Markov, on a pour tout ε > 0 : P
X − E(X)
Comme les événements |X − E(X)| ε on en déduit l’inégalité voulue.
1168
et
2
ε2
V(X) · ε2
(X − E(X))2 ε2
sont égaux, puisque ε > 0 ,
Exercices
S’entraîner et approfondir Espérance - Variance 31.1 Soit Z une variable aléatoire à valeurs dans C . Montrer que E(Z) = E(Z) . →1152
31.2 Une urne contient N boules dont b blanches. On en tire simultanément n ( 1 n N ) et l’on considère la variable aléatoire X égale au nombre de boules blanches obtenues. Déterminer l’espérance de X .
→1154
31.3 Soit n et r deux entiers naturels non nuls. On considère r boules et n tiroirs. On place au hasard chacune des r boules dans l’un des n tiroirs. On note V la variable aléatoire égale au nombre de tiroirs restés vides ; on fixe un tiroir et on note T la variable aléatoire égale au nombre de boules placées dans ce tiroir. Déterminer l’espérance des variables T et V .
→1154
31.4 Soit n ∈ IN∗ et X une variable aléatoire suivant la loi uniforme sur [[1, n]] . Déterminer l’espérance de (X − 1)2 et de exp(X) .
→1155
31.5 Soit X et Y deux variables aléatoires indépendantes, de même loi. Calculer E (|X − Y |) :
→1155
1. lorsque X ∼ B(p) ;
2. lorsque X ∼ U([[1, n]]) .
31.6 Soit λ ∈ IR+ , n ∈ IN∗ et X une variable aléatoire à valeurs dans [[1, n]] telle que :
→1157
∀k ∈ [[1, n]]
P(X = k) = λk.
Déterminer λ , E(X) et V(X) . On admettra que
n
k=1
k3 =
n2 (n + 1)2 · 4
31.7 Soit (a, b) ∈ IR2 tel que a b et X une variable aléatoire à valeurs dans [a, b] .
→1157
Montrer que V(X)
(b−a)2 · 4
Indication. On remarquera que (X − a)(X − b) 0 . 31.8 Soit X1 , . . . , Xn des variables indépendantes, toutes d’espérance m et de variance 1 . →1157
Déterminer l’espérance et la variance de
n
Xk .
k=1
31.9 Soit a et b des entiers tels que a b . Déterminer la variance d’une variable aléatoire X qui suit la loi uniforme sur [[a, b]] , en utilisant la variance de la loi uniforme sur [[1, n]] ( n ∈ IN∗ ).
→1157
31.10 Soit X une variable aléatoire réelle sur un espace probabilisé fini. Déterminer le minimum de la fonction ϕ : IR −→ IR m �−→ E (X − m)2 .
1169
Chapitre 31. Espérance — Variance 31.11 Une urne contient n boules blanches et n boules noires. On tire toutes les boules successivement sans remise. Soit X la variable aléatoire prenant pour valeur le rang de la dernière boule noire tirée. Déterminer la loi de X et son espérance. Indication. On pourra montrer que, pour (m, n) ∈ IN2 , on a
k
m+n k=n
n
=
m+n+1 n+1
.
31.12 Une urne contient n boules numérotées de 1 à n , que l’on tire successivement, sans remise. Pour 1 i n , on note ui le numéro de la i -ème boule tirée. On considère la variable aléatoire X qui à tout tirage fait correspondre le plus grand entier k tel que u1 < u2 < · · · < uk . 1. Déterminer la loi de la variable aléatoire X . 2. Montrer que E (X) =
n
P (X k) . Déterminer E(X) .
k=1
31.13 Formule du crible Soit A1 , A2 , . . . , An des événements d’un espace probabilisé (Ω, P) . 1. Montrer que 1 − 1A1 ∪···∪An = 2. En déduire que 1A1 ∪···∪An =
n
i=1 n
(1 − 1Ai ) .
(−1)k−1
k=1
1i1 1 .
Somme d’une famille sommable
Cas des familles réelles − Soit (ai )i∈I une famille de réels. Soit i ∈ I ; posons a+ i = |ai | + ai et ai = |ai | − ai . + − + − Ce sont deux réels positifs tels que ai = ai − ai et |ai | = ai + ai . En particulier, on a les relations :
∀i ∈ I
0 a+ i |ai |
et
∀i ∈ I
0 a− i |ai |
qui montrent, d’après la proposition 3 de la page 1191, que si (ai )i∈I est sommable, − alors il en est de même de (a+ i )i∈I et (ai )i∈I . On peut donc poser la définition suivante. 1194
II Familles sommables de nombres complexes Définition 3 (Somme d’une famille réelle sommable) Soit (ai )i∈I une famille sommable de réels. La somme de la famille (ai )i∈I est le réel : ai = a+ a− i − i . i∈I
i∈I
i∈I
Remarque Évidemment, cette définition prolonge la définition de la somme d’une − famille de réels positifs, puisque si ai 0 , on a a+ i = ai et ai = 0 . Cas des familles complexes Soit (ak )k∈I une famille de complexes. Les relations : et ∀k ∈ I ∀k ∈ I 0 Re(ak ) |ak |
0 Im(ak ) |ak |
montrent, d’après la proposition 3 de la page 1191, que si (ak )k∈I est sommable, alors il en est de même de Re(ak ) k∈I et Im(ak ) k∈I . On peut donc poser la définition suivante. Définition 4 (Somme d’une famille complexe sommable) Soit (ak )k∈I une famille sommable de complexes. La somme de la famille (ak )k∈I est le complexe : ak = Re(ak ) + i Im(ak ). k∈I
k∈I
k∈I
Remarque Évidemment, cette définition prolonge la définition de la somme d’une famille de réels.
3
Propriétés
On peut, en utilisant les parties positives et négatives, généraliser les propriétés concernant les familles sommables de nombres réels positifs à n’importe quelles familles sommables de réels puis, à l’aide des parties réelles et imaginaires à n’importe quelles familles sommables de nombres complexes. Proposition 10 Soit (an )n∈IN une suite complexe. La famille (an )n∈IN est sommable si, et seulement si, la série an est absolument convergente et l’on a alors : +∞ an = an . n∈IN
n=0
Démonstration page 1207
Proposition 11 Étant donné une bijection σ d’un ensemble J sur I , une famille (ai )i∈I est sommable si, et seulement si, la famille (aσ(j) )j∈J est sommable et l’on a alors : ai = aσ(j) . i∈I
j∈J
Démonstration page 1208
1195
Chapitre 32. Familles sommables Corollaire 12 (Commutativité) Étant donné une permutation σ de I , une famille (ai )i∈I est sommable si, et seulement si, la famille (aσ(i) )i∈I est sommable et l’on a alors : ai = aσ(i) . i∈I
i∈I
Lemme 13 Soit (ai )i∈I une famille sommable.Pour tout réel ε > 0 , il existe une partie finie F de I telle que pour toute partie finie J de I contenant F , on ait : a − a i i ε. i∈I
i∈J
Démonstration page 1208
Ex. 7. Soit (ai )i∈I une famille sommable. En appliquant le lemme à une suite (εn )n∈IN de réels strictement positifs tendant vers 0 , on peut trouver une suite (Jn )n∈IN de parties finies de I telle que : lim
n→+∞
ai =
i∈Jn
ai .
i∈I
Ex. 8. Soit (ai )i∈I et (bi )i∈I deux familles sommables ainsi qu’une suite (εn )n∈IN de réels strictement positifs tendant vers 0 . Soit n ∈ IN . Grâce au lemme, on peut trouver une partie
ai εn pour toute partie J finie contenant Fn . De finie Fn de I telle que ai − i∈I i∈J même, il existe une partie finie Gn de I telle que bi − bi εn pour toute partie J finie i∈I
i∈J
contenant Gn . En prenant Jn = Fn ∪ Gn , on a alors :
ai − ai εn i∈I
ce qui donne :
lim
n→+∞
bi − bi εn
et
i∈Jn
i∈Jn
ai =
ai
i∈I
et
i∈I
lim
n→+∞
i∈Jn
bi =
i∈Jn
bi .
i∈I
Grâce à ces résultats, et en utilisant l’inégalité triangulaire pour les sommes finies et leur linéarité, on obtient, par passage à la limite, les deux résultats suivants. Proposition 14 (Inégalité triangulaire) Si (ai )i∈I est une famille sommable, on a : |ai |. ai i∈I
i∈I
Démonstration. Grâce à l’exemple 8 ci-dessus, nous pouvons fixer une suite (Jn )n∈IN de parties finies de I telle que lim ai = ai et lim |ai | = |ai | . n→+∞ i∈J
1196
n
i∈I
n→+∞ i∈J
n
i∈I
II Familles sommables de nombres complexes L’inégalité triangulaire sur les sommes finies donne alors, pour tout n ∈ IN :
ai |ai | i∈Jn
i∈Jn
et il suffit de passer à la limite pour obtenir le résultat.
Proposition 15 (Linéarité de la somme) Soit (ai )i∈I et (bi )i∈I deux familles sommables ainsi que λ et µ deux scalaires. Alors la famille (λ ai + µ bi )i∈I est sommable et l’on a : (λ ai + µ bi ) = λ ai + µ bi . i∈I
i∈I
i∈I
Démonstration.
La sommabilité de la famille s’obtient grâce à l’inégalité λ ai + µ bi |λ| |ai | + |µ| |bi | .
La généralisation de la fin de l’exemple 8 nous fournit une suite (Jn )n∈IN de parties finies de I telle que : lim
n→+∞
i∈Jn
ai =
ai
i∈I
lim
n→+∞
bi =
i∈Jn
et
bi
i∈I
lim
n→+∞
(λ ai +µ bi ) =
i∈Jn
(λ ai +µ bi ).
i∈I
Par linéarité des sommes finies, on obtient, pour tout n ∈ IN :
(λ ai + µ bi ) = λ
i∈Jn
ai + µ
i∈Jn
bi .
i∈Jn
En passant à la limite dans cette égalité, on obtient le résultat annoncé.
Théorème 16 (Sommation par paquets) Soit (Iλ )λ∈Λ un recouvrement disjoint de I . Étant donné une famille sommable (ai )i∈I de nombres complexes : • pour tout λ ∈ Λ , la famille (ai )i∈Iλ est sommable de somme notée σλ ;
Exo 32.3
• la famille (σλ )λ∈Λ est sommable ; • ai = σλ = ai . i∈I
λ∈Λ
λ∈Λ
i∈Iλ
Ex. 9. Soit r ∈ [0, 1[ et θ ∈ IR .
Démonstration (non exigible) page 1208
Montrons la sommabilité et calculons la somme de r |n| einθ
n∈Z Z
.
• Calculons la somme en utilisant la partition suivante : ZZ = IN ∪ ZZ∗− , ce qui permet de se ramener à la somme de deux séries géométriques dont la raison est de module r < 1 . Si la famille est sommable, ou si elle est réelle positive, le théorème de sommation par paquets permet d’écrire :
n∈Z Z
r |n| einθ =
+∞ n=0
r n einθ +
+∞
r n e−inθ
n=1
1 r e−iθ 1 − r2 = + = · 1 − r eiθ 1 − r e−iθ 1 − 2r cos θ + r 2
1197
Chapitre 32. Familles sommables
• Pour justifier ce calcul, il suffit donc de montrer la sommabilité de la famille un (r, θ) où un (r, θ) = r |n| einθ , pour tout n ∈ ZZ .
n∈Z Z
,
Comme un (r, θ) = r |n| = un (r, 0) pour tout n ∈ ZZ , pour montrer la sommabilité de la famille, il suffit de montrer que la famille
un (r, 0)
n∈Z Z
est sommable. Puisqu’il s’agit
d’une famille réelle positive, on peut calculer sa somme (éventuellement infinie) en utilisant n’importe quelle partition de ZZ . Le calcul précédent est donc valide et donne :
r |n| =
n∈Z Z
1+r 1 − r2 < +∞, = 1 − 2r + r 2 1−r
ce qui montre la sommabilité de la famille un (r, 0)
de un (r, θ)
n∈Z Z
.
n∈Z Z
et par conséquent également celle
Ex. 10. Soit a et b deux nombres complexes. Retrouvons la formule ea+b = ea eb en utilisant seulement la relation ez =
+∞ n=0
binôme de Newton donne :
ea+b =
zn n!
donnée à la proposition 9 de la page 617. La formule du
+∞ (a + b)n n=0
n!
n=0 k=0
Introduisons donc I = (n, k) ∈ IN2 : k n ∀(n, k) ∈ I
un,k =
+∞ n k n−k n a b
=
n!
k
·
et la famille (un,k )(n,k)∈I définie par :
n k
ak bn−k ak bn−k = · n! k! (n − k)!
Sous réserve de sommabilité de la famille (un,k )(n,k)∈I , on a, par le théorème de sommation par paquets : +∞ n
un,k =
n=0 k=0
un,k =
+∞ +∞
un,k ,
k=0 n=k
(n,k)∈I
ce qui donne, en mettant en facteur dans la somme interne ce qui ne dépend pas de n puis en y effectuant le changement d’indice [p = n − k] : +∞ n n=0 k=0
un,k =
+∞ k=0
+∞ ak bn−k k! (n − k)! n=k
=
+∞ k=0
+∞ a k bp k! p! p=0
=
+∞ +∞ ak bp k=0
k!
p=0
p!
·
On retrouve ainsi finalement ea+b = ea eb . Remarquons que ces calculs sont automatiquement justifiés lorsque a et b sont des réels positifs puisqu’alors (un,k )(n,k)∈I est une famille réelle positive. Dans le cas général, la famille est sommable puisque, d’après ce que l’on vient de remarquer, en remplaçant a et b par leurs modules : |un,k | = e|a|+|b| < +∞. (n,k)∈I
Cela justifie donc les calculs effectués ci-dessus.
1198
III Application aux sommes doubles Point méthode Comme on l’a fait dans les exemples précédents, pour appliquer le théorème de sommation par paquets à une famille (ai )i∈I , on commence souvent par calculer la somme proposée en utilisant une certaine partition, puis l’on justifie le résultat trouvé en calculant la somme de la famille |ai | i∈I , souvent en utilisant la même partition. La première partie de cette méthode se rédige souvent sous la forme : « calculons formellement la somme. . . ».
Exo 32.4
III 1
Application aux sommes doubles Théorème de Fubini
On s’intéresse ici à des familles indexées par un produit cartésien. On considère donc deux ensembles I et J et des familles de nombres complexes indexées par I × J . Théorème 17 (Théorème de Fubini) Soit (ai,j )(i,j)∈I×J une famille de nombres complexes. Si les ai,j sont des réels positifs ou si la famille est sommable, on a : ai,j = ai,j = ai,j . i∈I
j∈J
j∈J
(i,j)∈I×J
i∈I
Démonstration.
C’est une conséquence des théorèmes de sommation par paquets (c’est-àdire le théorème 9 de la page 1193 et le théorème 16 de la page 1197). En utilisant les deux partitions de I × J : I ×J =
i∈I
{i} × J =
I × {j} ,
j∈J
la somme de la famille sommable (ai,j )(i,j)∈I×J est égale à chacune des deux doubles sommes.
Remarques • En particulier, lorsque la famille est réelle positive et non sommable, les trois termes sont égaux à +∞. • Lorsque I = J = IN, on peut reformuler ce résultat en termes de séries : si une famille (ap,q )(p,q)∈IN2 de nombres complexes est sommable, on a : +∞ +∞ p=0
q=0
ap,q
=
+∞ +∞ q=0
p=0
ap,q ,
chacune des séries intervenant dans ces sommes étant absolument convergente. Ex. 11. Soit z ∈ C tel que |z| < 1 . Montrons l’égalité : +∞ n=1
+∞
zn z 2k−1 = · (−1)k−1 2n 1+z 1 − z 2k−1 k=1
1199
Chapitre 32. Familles sommables Chacune des deux séries converge absolument, puisque :
zn n ∼ |z| 1 + z 2n
2n−1 z 2n−1 1 − z 2n−1 ∼ |z|
et
mais ce qui suit le prouve également. Pour n ∈ IN∗ fixé, on a :
|z| < 1,
avec
+∞ +∞ +∞ 2n k zn n k n(2k+1) = z −z = (−1) z = (−1)k−1 z n(2k−1) . 1 + z 2n k=0
k=0
k=1
Considérons donc la somme double :
(−1)k−1 z n(2k−1)
(n,k)∈(IN∗ )2
et montrons que la famille (−1)k−1 z n(2k−1) • pour n fixé, la série
k1
n(2k−1)
|z|
σn =
(n,k)∈(IN∗ )2
est sommable :
est convergente puisque |z|2n < 1 , de somme : +∞ k=1
|z|n(2k−1) =
|z|n 1 − |z|2n
(somme d’une série géométrique de raison |z|2n et de premier terme |z|n ),
• la famille (σn ) est sommable puisque σn ∼ |z|n , avec |z| < 1 . Donc la famille est bien sommable et le théorème de Fubini donne : +∞ n=1
zn = 1 + z 2n =
(−1)k−1 z n(2k−1)
(n,k)∈(IN∗ )2 +∞
(−1)k−1
k=1
+∞
z 2k−1
n=1
n
=
+∞
(−1)k−1
k=1
z 2k−1 , 1 − z 2k−1
toutes les séries intervenant dans ces égalités étant absolument convergentes.
Attention L’hypothèse de positivité ou de sommabilité de la famille est essentielle. On trouvera à l’exercice 32.10 un exemple où l’interversion des sommes change la valeur du résultat. Point méthode Pour montrer cette sommabilité, on utilise généralement que l’une des deux sommes : |ai,j | ou |ai,j | i∈I
Exo 32.5
j∈J
j∈J
i∈I
est finie (en utilisant la version réelle positive du théorème de Fubini).
1200
III Application aux sommes doubles Proposition 18 (Distributivité généralisée) Soit (ai )i∈I et (bj )j∈J deux familles de nombres complexes. On a : ai b j = ai bj i∈I
(i,j)∈I×J
j∈J
sous l’une des deux hypothèses suivantes : • les ai et bj sont des réels positifs,
• les familles (ai )i∈I et (bj )j∈J sont sommables, auquel cas on a également sommabilité de la famille (ai bj )(i,j)∈I×J . Démonstration page 1209
Principe de démonstration. Cela revient à justifier les égalités suivantes : a i bj =
=
a i bj
i∈I
(i,j)∈I×J
j∈J
ai
=
bj
i∈I
j∈J
ai
bj .
i∈I
j∈J
Remarques • On généralise facilement par récurrence ce résultat au produit d’un nombre fini de familles sommables. Plus formellement, soit p ∈ IN∗ , I1 , . . . , Ip des ensembles (1) (p) et ai1 i1 ∈I1 , . . . , aip ip ∈Ip des familles sommables. Alors :
(1) ai1
(i1 ,...,ip )∈I1 ×···×Ip
(p) · · · aip
=
(1) ai1
i1 ∈I1
···
(p) aip
ip ∈Ip
.
• Lorsque les familles sont réelles positives, le résultat subsiste même sans hypothèse de sommabilité, le résultat s’obtenant par des calculs dans [0, +∞] (on rappelle la convention 0 × (+∞) = 0 pour le cas où l’une des familles est nulle). Ex. 12. Soit I l’ensemble des entiers naturels non nuls n’admettant que 2 , 3 et 5 comme diviseurs premiers. Montrons la sommabilité et calculons la somme de la famille : (an )n∈I
où
∀n ∈ I
an =
(−1)n · n
L’application (p, q, r) �→ 2p 3q 5r donne une bijection de IN3 sur I (théorème de décomposition en facteurs premiers) que l’on va utiliser pour faire un changement d’indice. Sommabilité. Comme |an | = 1/n , on a :
n∈I
|an | =
1 n∈I
n
=
(p,q,r)∈IN3
1 = 2p 3q 5r
+∞ +∞ +∞ 1 1 1 p=0
2p
q=0
3q
r=0
5r
,
la dernière égalité provenant de la distributivité généralisée, justifiée par la convergence (absolue) de ces trois séries géométriques. On en déduit
n∈I
|an | < +∞ , autrement dit que la famille est sommable.
1201
Chapitre 32. Familles sommables Somme. Soit (p, q, r) ∈ IN3 .
p
En remarquant que 3q 5r est impair, on a (−1)2 butivité généralisée :
an =
(p,q,r)∈IN3
n∈I
+∞
p
(−1)2 = 2p 3q 5r
p=0
3q 5r
p
= (−1)2 , donc, toujours par distri-
p
(−1)2 2p
+∞ +∞ 1 1 q=0
3q
r=0
5r
·
p
Comme (−1)2 est égal à 1 pour tout p ∈ IN∗ et à −1 pour p = 0 , on a : +∞ p (−1)2 p=0
2
= −1 +
2p
+∞ 1 p=1
2p
=0
donc
an = 0.
n∈I
Cas de IN2 , produit de Cauchy
Les théorèmes suivants sont des conséquences du théorème de sommation par paquets. Théorème 19 Soit (ap,q )(p,q)∈IN2 une suite double de nombres complexes. On a :
ap,q =
+∞
n=0
(p,q)∈IN2
ap,q
p+q=n
sous l’une des deux hypothèses suivantes : • les ap,q sont des réels positifs,
Exo 32.6
• la famille (ap,q )(p,q)∈IN2 est sommable, la série de terme général σn =
p+q=n
étant alors absolument convergente. Bien entendu, la notation
p+q=n
et peut aussi se noter
n
ap,q
ap,q signifie la somme sur (p, q) ∈ IN2 : p + q = n
ak,n−k .
k=0
Démonstration.
Il s’agit du théorème de sommation par paquets à l’aide de la partition suivante de IN2 : IN2 =
n∈IN
IN
(p, q) ∈ IN2 : p + q = n .
∆n
• Le cas réel positif est une conséquence immédiate du théorème 9 de la page 1193. • Dans le cas d’une famille sommable il s’agit du théorème 16 de la page 1197 qui donne, en particulier, la sommabilité de (σn )n∈IN et donc la convergence σn . absolue de la série
1202
∆0
∆1
∆2
∆3
∆4 IN
III Application aux sommes doubles Ex. 13. Soit α ∈ IR . Étudions la sommabilité sur IN2 de la suite double : ap,q = Pour n ∈ IN , on a : σn =
p+q=n
1 · (p + q + 1)α
1 1 n+1 1 = = = · α (p + q + 1) (n + 1)α (n + 1)α (n + 1)α−1 p+q=n
On a donc, par positivité des ap,q :
+∞
(p,q)∈IN2
1 1 = · α (p + q + 1) nα−1 n=1
En particulier, la famille est sommable si, et seulement si,
+∞
σn < +∞ , c’est-à-dire si, et
n=0
seulement si, α > 2 .
Théorème 20 (Produit de Cauchy) Soit an et bn deux séries complexes absolument convergentes. La série de terme général : ap b q , p+q=n
appelée produit de Cauchy de an et bn , converge absolument, et l’on a : +∞ +∞ +∞ ap b q . an bn = n=0
p+q=n
n=0
n=0
Démonstration page 1209
Principe de démonstration. Il suffit de montrer que la famille (ap bq )(p,q)∈IN2 est sommable et d’appliquer le théorème 19 de la page précédente et la proposition 18 de la page 1201.
Ex. 14. Sachant que pour |z| < 1 on a : +∞
n 1 z , = 1−z n=0
la série étant absolument convergente, on en déduit : 1 = (1 − z)2
+∞ n=0
z
n
2
=
+∞ n=0
p+q=n
p
z z
q
=
+∞
(n + 1) z n .
n=0
Attention Dans le théorème 20, l’hypothèse de convergence absolue des deux séries est essentielle, comme le montre l’exercice 32.14. Nous verrons néanmoins dans l’exercice 32.13 que la convergence d’une des deux séries et la convergence absolue de l’autre suffisent. 1203
Chapitre 32. Familles sommables
3
Pour aller plus loin : définition de l’exponentielle complexe
Le but de cette partie est de donner une définition rigoureuse des fonctions sinus et cosinus, via une autre définition de l’exponentielle complexe. Définition 5 Posons, pour tout z ∈ C : exp(z) =
+∞ n z · n! n=0
On définit ainsi une fonction exp : C → C appelée exponentielle complexe. Démonstration.
Montrons la convergence absolue de cette série.
Soit z ∈ C . Posons un = ∀n n0
zn n!
|un |
; En prenant n0 ∈ IN tel que n0 2|z| , on a : 1 |un−1 | 2
donc
∀n n0
|un |
1 |un0 |, 2n−n0
ce qui donne la relation un = O(2−n ) et donc la convergence absolue de à une série géométrique.
un par comparaison
Proposition 21 ∀(a, b) ∈ C2 Démonstration.
exp(a + b) = exp(a) exp(b).
Soit (a, b) ∈ C2 . Les deux séries
donc par produit de Cauchy, on a exp(a) exp(b) =
an
+∞
n=0
cn =
a p bq
p+q=n
et donc
+∞ n=0
cn =
+∞ n=0
(a+b)n n!
1 = p! q! n!
p+q=n
n!
et
bn n!
convergent absolument,
cn , où, pour tout n ∈ IN :
(a + b)n n · a p bq = n! p
= exp(a + b) .
Définition 6 On appelle cosinus et sinus les deux fonctions définies respectivement par : ∀x ∈ IR cos x = Re exp(ix) et sin x = Im exp(ix) .
La relation de la proposition 21 permet de montrer facilement les formules d’addition : cos(a + b) = cos(a) cos(b) − sin(a) sin(b)
sin(a + b) = sin(a) cos(b) + cos(a) sin(b).
D’autre part, il est immédiat que les complexes exp(ix) et exp(−ix) sont conjugués l’un de l’autre, ce qui donne les parité/imparité des fonctions cosinus/sinus. Comme exp(ix) exp(−ix) = exp(0) = 1 , on en déduit exp(ix) = 1 , ce qui donne la relation cos2 (x) + sin2 (x) = 1 . 1204
III Application aux sommes doubles Lemme 22 Pour tout z ∈ C, on a : lim
t→0
exp(tz) − 1 = z. t
Démonstration page 1209
Proposition 23 Pour tout z ∈ C , la fonction ϕz : t �→ exp(tz) est solution sur IR de l’équation différentielle y ′ = zy . Démonstration.
Soit z ∈ C . Montrons la dérivabilité de ϕz et la relation ϕ′z = z ϕz .
Soit t ∈ IR et h ∈ IR∗ . On a :
exp(tz) exp(hz) − exp(tz) ϕz (t + h) − ϕz (t) = h h exp(hz) − 1 = exp(tz) h −→ exp(tz) z = z ϕz (t) h→0
(d’après la proposition 21)
(lemme 22).
En appliquant ce résultat avec z = 1 puis z = i , on en déduit les deux résultats suivants : Corollaire 24 La restriction à IR de la fonction exponentielle est dérivable, égale à sa dérivée. Corollaire 25 Les fonction sinus et cosinus sont dérivables et vérifient, pour tout x ∈ IR : sin′ (x) = cos(x)
et
cos′ (x) = − sin(x).
1205
Chapitre 32. Familles sommables
Démonstrations Proposition 2 •
+∞
an = sup n∈IN
n=0
•
n
Soit n ∈ IN . Comme [[0, n]] est une partie finie de IN , on a n
ap
p=0
ap
p=0
ap . On en déduit :
p∈IN
(∗)
an .
n∈IN
Soit J une partie finie de IN . Il existe n ∈ IN tel que J ⊂ [[0, n]] , et donc :
ap
p∈J
On en déduit :
n
+∞
ap
p=0
ap .
p=0
+∞
an
n∈IN
(∗∗)
an .
n=0
Des deux inégalités (∗) et (∗∗) on en déduit que les deux sommes sont égales et donc, en particulier, simultanément finies. Proposition 4 Notons S et S ′ les sommes (éventuellement infinies) respectivement des familles (ai )i∈I et (aσ(j) )j∈J . •
Pour toute partie finie J ′ de J , l’ensemble I ′ = σ(J ′ ) est une partie finie de I . Donc, par changement d’indice dans une somme finie, σ réalisant une bijection de J ′ sur I ′ :
aσ(j) =
j∈J ′
•
ai S.
i∈I ′
On en déduit S ′ S . Remarquons qu’en notant (bj )j∈J = (aσ(j) )j∈J , on a (ai )i∈I = (bσ −1 (i) )i∈I et σ −1 est une
bijection de I sur J . On déduit donc de ce qui précède l’inégalité inverse S S ′ . D’où l’égalité des sommes et donc l’équivalence annoncée.
Proposition 6 • Soit (ai )i∈I et (bi )i∈I deux familles de réels positifs, ainsi que λ et µ deux réels positifs. On commence par montrer l’inégalité :
(λ ai + µ bi ) λ
i∈I
ai + µ
bi .
i∈I
i∈I
Soit J une partie finie de I . Par linéarité des sommes finies puis par définition de la somme d’une famille, on a (compatibilité de la relation d’ordre avec les opérations de [0, +∞] ) :
(λ ai + µ bi ) = λ
i∈J
•
En prenant µ = 0 , on obtient
i∈I
ai + µ
i∈J
λ ai λ
i∈J
ai .
bi λ
ai + µ
i∈I
bi .
i∈I
i∈I
L’inégalité inverse étant évidente lorsque λ est nul, on peut supposer λ > 0 . L’inégalité que l’on vient d’obtenir, appliquée à la famille (λ ai )i∈I et au réel 1/λ , donne λ ai , ai λ1
soit λ
i∈I
•
ai
i∈I
i∈I
λ ai après multiplication par le réel positif λ .
i∈I
D’où le deuxième point de la proposition. (ai + bi ) ai + En prenant maintenant λ = µ = 1 , on obtient l’inégalité bi .
1206
i∈I
i∈I
i∈I
Démonstrations •
L’inégalité inverse est évidente si
(ai + bi ) = +∞ . On peut donc supposer cette somme
i∈I
finie, ainsi donc que les deux autres sommes, puisque 0 ai ai + bi et 0 bi ai + bi . Soit ε > 0 . Par caractérisation de la borne supérieure, il existe une partie finie J1 de I ai ai − ε/2 . De même, il existe une partie finie J2 de I telle telle que
que
i∈J1
bi
i∈J2
i∈I
(ai + bi )
i∈I
duit
(ai + bi ) =
(ai + bi )
i∈I
(ai + bi )
i∈I
ai +
i∈I
ai +
i∈J
i∈J
Cette inégalité
i∈I
bi − ε/2 . En posant J = J1 ∪ J2 , on a alors :
bi
i∈J
ai +
i∈I
i∈I
bi .
ai +
i∈J1
bi
i∈J2
ai +
i∈I
i∈I
bi − ε.
bi − ε étant vraie pour tout ε > 0 , on en dé-
i∈I
Lemme 8 Posons (bi )i∈I∪J et (ci )i∈I∪J définies par : (bi , ci ) = (ai , 0)
si i ∈ I
(bi , ci ) = (0, ai )
et
si i ∈ J
(il n’y a pas d’ambiguïté dans ces définition, puisque I et J sont disjoints). Par définition, les familles et (bi )i∈I∪J et (ci )i∈I∪J sont positives et l’on a ai = bi + ci pour ai = bi + ci d’après la proposition 6 de la page 1192. tout i ∈ I ∪ J . Donc i∈I∪J
i∈I∪J
i∈I∪J
bi =
première égalité, c’est-à-dire
i∈I∪J
bi =
On conclut en remarquant que
i∈I∪J
i∈I
i∈I
L’inégalité
•
Si K est une partie finie de I ∪ J , on a
i∈I∪J
ci =
i∈I∪J
ai . Montrons par exemple la
i∈J
bi , puisque bi = ai pour tout i ∈ I .
•
bi
ai et
bi provient de la proposition 7 de la page 1192.
i∈I
bi =
i∈K
bi
i∈K∩I
bi . Donc
i∈I
bi
i∈I∪J
bi .
i∈I
Théorème 9 • Soit Γ une partie finie de Λ . Par récurrence à partir du lemme précédent, on obtient :
σλ =
λ∈Γ
D’où l’inégalité
σλ
λ∈Λ
•
i∈
ai .
Iλ
λ∈Γ
ai d’après la proposition 7 de la page 1192.
i∈I
Montrons l’autre inégalité. Soit J une partie finie de I . Il n’existe qu’un nombre fini de λ ∈ Λ tels que J ∩ Iλ soit non vide ; désignons-les par λ1 , λ2 , . . . , λp . Alors :
ai =
i∈J
i∈J ∩Iλ1
On a donc l’inégalité :
ai + · · · +
ai
i∈I
i∈J ∩Iλp
a i σλ 1 + σλ 2 + · · · + σ λ p
σλ .
λ∈Λ
σλ .
λ∈Λ
Proposition 10 • L’équivalence est le résultat de la proposition 2 de la page 1191 appliqué à |an | . • On a alors, d’abord pour une suite réelle sommable :
n∈IN
an =
n∈IN
a+ n −
n∈IN
a− n =
+∞ n=0
a+ n −
+∞ n=0
a− n =
+∞ n=0
− (a+ n − an ) =
+∞
an .
n=0
1207
Chapitre 32. Familles sommables •
Ensuite, pour une suite complexe sommable, en utilisant le résultat précédent et les propriétés des séries complexes :
an =
n∈IN
Re(an ) + i
n∈IN
Im(an ) =
n∈IN
+∞
Re(an ) + i
n=0
+∞
Im(an ) =
n=0
+∞
an .
n=0
Proposition 11 • L’équivalence est le résultat de la proposition 4 de la page 1191 appliqué à |ai | . • On a alors, pour une famille sommable réelle :
i∈I
ai =
a+ i −
i∈I
a− i =
i∈I
j∈J
a+ σ(j) −
a− σ(j) =
j∈J
j∈J
− (a+ σ(j) − aσ(j) ) =
aσ(j) ,
j∈J
puis de même pour une famille sommable complexe en utilisant parties réelles et imaginaires. Lemme 13 Soit ε > 0 . Cas des familles réelles positives. Supposons (ai )i∈I ∈ (IR+ )I . Par définition de la somme d’une famille sommable positive, on peut trouver une partie finie F de I telle que
ai
i∈F
ai
i∈I
− ε . Par positivité de la famille, on a donc, pour toute
partie J de I contenant F (finie ou non, d’ailleurs) :
ai
i∈I
−ε
ai
i∈F
ai
i∈J
ai .
i∈I
Cela donne le résultat annoncé. Cas des familles réelles. Supposons (ai )i∈I ∈ IRI . Par sommabilité de la famille (ai )i∈I , − les familles (a+ i )i∈I et (ai )i∈I sont sommables et l’on peut donc, par le premier cas, trouver + deux parties finies F et F − de I telles que, pour toute partie finie J + contenant F + et toute partie finie J − contenant F − :
+ ε + ai a − i 2 i∈J +
i∈I
Prenons alors F = F de I contenant F :
− ε − a − ai · i 2
et
+
i∈J −
i∈I
−
∪ F . C’est une partie finie de I telle que, pour toute partie finie J
+ + − − ai ai = ai − ai − ai − ai − i∈I
i∈J
i∈I
i∈J
i∈I
i∈J
+ + − − ai − ai ε. ai − ai + i∈I
i∈J
i∈I
i∈J
Cas des familles complexes. On procède de même en appliquant le cas précédent aux familles Re(ak ) k∈I et Im(ak ) k∈I et à ε/2 .
Théorème 16 • Soit λ ∈ Λ . La famille (ai )i∈Iλ est sommable comme sous-famille de la famille som mable (ai )i∈I . Par inégalité triangulaire, sa somme σλ vérifie : |σλ | |ai | . •
La sommabilité de (ai )i∈I , c’est-à-dire de |ai |
i∈Iλ
i∈I
, donne donc, avec le théorème de som-
mation par paquets des familles positives (théorème 9 de la page 1193), la sommabilité de (σλ )λ∈Λ .
1208
Démonstrations •
Cas des familles réelles. Soit (ai )i∈I une famille sommable réelle. + − Par définition, on a ai = ai − ai . Le théorème de sommation par paquets des i∈I
i∈I
i∈I
familles réelles positives donne donc :
ai =
i∈I
λ∈Λ i∈Iλ
D’autre part, pour tout λ ∈ Λ , on a somme sur Λ :
ai =
λ∈Λ i∈Iλ
Donc
ai =
i∈I
λ∈Λ
i∈Iλ
a+ i
ai =
i∈Iλ
−
a+ i −
λ∈Λ i∈Iλ
i∈Iλ
a− i
i∈Iλ
a− i .
a+ i −
=
a− i , donc par linéarité de la
i∈Iλ
λ∈Λ i∈Iλ
a+ i −
a− i .
λ∈Λ i∈Iλ
ai .
λ∈Λ i∈Iλ
Cas des familles complexes. On procède de la même façon en utilisant les parties réelles et imaginaires. Proposition 18
Pour simplifier les notations, posons A =
ai et B =
i∈I
•
Commençons par un calcul formel :
(i,j)∈I×J
•
a i bj =
i∈I
a i bj
j∈J
=
ai
i∈I
bj .
j∈J
bj
= A B.
(∗)
j∈J
Dans le cas où les ai et les bj sont des réels positifs, le calcul est valide (sommation ai bj est finie par paquets pour une famille positive) et montre que la somme (i,j)∈I×J
puisque A < +∞ et B < +∞ par sommabilité des deux familles (ai )i∈I et (bj )j∈J . •
Dans le cas général, en appliquant cela aux familles positives
|ai |
i∈I
et |bj |
j∈J
, on en
déduit la sommabilité de (ai bj )(i,j)∈I×J ce qui justifie la sommation par paquets utilisée dans la première égalité de (∗) .
Théorème 20
Pour tout p ∈ IN , la famille (|ap bq |)q∈IN est sommable de somme : αp = |ap |
+∞ q=0
|bq |.
La famille (αp )p∈IN est alors sommable puisque proportionnelle à la famille prouve la sommabilité de la famille (ap bq )(p,q)∈IN2 et donc le théorème. Lemme 22
Soit z ∈ C et t �= 0 . On a
|ap |
p∈IN
. Cela
+∞ +∞ exp(tz) − 1 zn zn tn−1 tn−2 · = =z+t t n! n! n=1
n=2
+∞ +∞ exp(tz) − 1 |z|n |z|n − z |t| |t| Si l’on suppose |t| 1 , cela donne |t|n−2 où A t n! n! n=2 n=2 A zn
est un réel (par convergence absolue de la série
n!
) indépendant de t .
Le résultat s’ensuit.
1209
Chapitre 32. Familles sommables
S’entraîner et approfondir 32.1 Soit (un )n∈IN une suite décroissante tendant vers 0 . →1193
et
k1
+∞
un =
En utilisant la relation ∀n ∈ IN
(uk−1 − uk ) , montrer que les séries
k=n+1
k (uk−1 − uk ) à termes positifs ont même somme (finie ou non).
un
32.2 1. Soit (an )n∈ZZ une famille de réels positifs. Montrer les égalités : →1193
an =
n∈Z Z
+∞
an +
n=0
+∞
a−n = a0 +
n=1
+∞
(an + a−n ) = lim
n=1
n→+∞
n
ap .
p=−n
2. En déduire que la famille (an )n∈ZZ est sommable si, et seulement si, on a l’une des propriétés équivalentes suivantes :
(i) les séries a et a−n convergent, n (ii) la série (an + a−n ) converge,
(iii) la suite
n
ap
p=−n
32.3 Calculer →1197
+∞ (−1)n−1
n2
n=1
possède une limite finie lorsque n tend vers +∞ .
n∈IN
·
Indication. On pourra utiliser l’exemple 4 de la page 1193. 32.4 En utilisant la famille (z pq )(p,q)∈(IN∗ )2 et les deux partitions : →1199
(IN∗ )2 =
p∈IN∗
{p} × IN∗ =
n∈IN∗
montrer, pour tout z ∈ C tel que |z| < 1 , l’égalité : +∞ p=1
(p, q) ∈ (IN∗ )2 : pq = n ,
+∞
zp = d(n) z n 1 − zp n=1
où d(n) désigne le nombre de diviseurs positifs de l’entier naturel n non nul. Ces deux sommations par paquets sont justifiées lorsque z est un réel appartenant à l’intervalle [0, 1[ puisque la famille est alors réelle positive. La première donne un résultat fini, car le terme général de la série obtenue est équivalent à z p qui est bien le terme général d’une série (géométrique) convergente. Par conséquent la famille (z pq )(p,q)∈(IN∗ )2 est sommable pour tout z ∈ C tel que |z| < 1 puisque l’on a |z pq | = |z|pq .
On en déduit donc, pour tout z tel que |z| < 1 , la convergence absolue des deux séries
p1
zp 1−z p
et
d(n) z n ainsi que l’égalité de leurs sommes.
n1
32.5 Sommabilité et somme de →1200
1210
(−1)p qp
. p2 q2
Exercices 32.6 Soit α ∈ IR∗+ .
→1202
1. Montrer :
∀(p, q) ∈ IR2+
2−α (p + q)α pα + q α 2(p + q)α .
2. En déduire une condition nécessaire et suffisante pour que la famille soit sommable.
1 pα +q α
(p,q)∈(IN∗ )2
32.7 Soit z un nombre complexe de module strictement inférieur à 1 . 1. Montrer que la famille (z 2p+3q )(p,q)∈IN2 est sommable et calculer sa somme S(z) . 2. Montrer que S(z) =
+∞ n=0
dn z n , où, pour tout n ∈ IN , dn est le nombre de façons
d’écrire n = 2p + 3q , avec (p, q) ∈ IN2 .
32.8 Montrer l’existence et donner la valeur de S =
(p,q)∈IN2
(−1)p+q · 2p 3q (p + q + 1)
On pourra utiliser le résultat suivant (cf. exercice 13.8 de la page 516) : ∀x ∈ [0, 1[
+∞ (−1)n xn+1 n=0
32.9 Soit (αn )n∈IN∗ une suite positive telle que la série terme général : uk = k
+∞ n=k
est convergente, et calculer sa somme.
⋆ 32.10 Soit la suite double up,q =
= ln(1 + x).
n+1
αn converge. Montrer que la série de
αn n(n + 1)
2(p − q) · (p + q + 1)(p + q + 2)(p + q + 3)
1. Vérifier que up,q = (2q+3)
1 1 −(2q+1) − p+q+2 p+q+3
2. Montrer l’existence des sommes suivantes et les calculer :
+∞ +∞ q=0
p=0
up,q
,
+∞ +∞ p=0
up,q
q=0
et
+∞ n=0
1 1 − p+q+1 p+q+2
up,q
p+q=n
·
.
3. La famille (up,q )(p,q)∈IN2 est-elle sommable ? 32.11 Soit (an )n1 une suite convergente de limite nulle.
∆n ln(n) converge Pour n dans IN∗ , on pose ∆n := an − an+1 . On suppose que la série an absolument. Montrer que la série converge et exprimer sa somme comme la somme n d’une autre série.
1211
Chapitre 32. Familles sommables ⋆ 32.12 Montrer l’existence et calculer S =
p∧q=1
1 , la somme étant étendue à tous les couples p2 q 2
d’entiers naturels non nuls et premiers entre eux. On admettra les égalités suivantes : +∞ 1
n2
n=1
=
π2 6
+∞ 1
et
n4
n=1
=
π4 · 90
∗ 2
Indication. Utiliser la partition suivante de (IN ) : (IN∗ )2 =
Ad = (p, q) ∈ (IN∗ )2 : p ∧ q = d .
où
Ad
d∈IN∗
⋆⋆ 32.13 Théorème de Maertens an une série absolument convergente et bn une série convergente. Soit Montrer que la série de terme général cn =
ap bq est convergente et que :
p+q=n
+∞
an
n=0
+∞
bn
n=0
=
+∞ n=0
a p bq
p+q=n
.
Indication. En notant (An )n∈IN et (Bn )n∈IN les suites des sommes partielles des séries an et bn , ainsi que A et B leurs sommes, on pourra écrire : respectives n p=0
32.14 Pour n ∈ IN , soit an =
(−1)n √ n+1
cp − An B =
et cn =
Étudier la convergence des séries
n p=0
ap (Bn−p − B).
ap aq .
p+q=n
an et
cn .
32.15 Produit de Dirichlet de deux séries an et bn deux séries absolument convergentes. Pour n ∈ IN∗ , on pose : 1. Soit n1
n1
cn =
ad bn/d
d|n
(la somme est étendue à tous les diviseurs positifs de n ). Montrer que la série
cn est absolument convergente et que l’on a :
n1
+∞ n=1
an
+∞
bn
n=1
=
+∞
cn .
n=1
2. Soit α > 1 . Si N (n) désigne le nombre de diviseurs de n ∈ IN∗ , montrer que la série de terme général N (n)/nα converge et déterminer sa somme en fonction de : ζ(α) =
+∞ 1 n=1
1212
nα
·
Exercices 32.16 Soit (Jn )n∈IN une suite croissante de parties de I dont la réunion est égale à I . 1. Montrer qu’une famille (ai )i∈I de réels positifs est sommable si, et seulement si, la suite
ai
i∈Jn
est convergente.
n∈IN
2. Soit (ai )i∈I une famille de nombres complexes sommable. Montrer que la suite
i∈Jn
ai
est convergente et que l’on a :
n∈IN
ai = lim
n→+∞
i∈I
ai .
i∈Jn
⋆⋆ 32.17 Soit α un réel strictement positif et (pk )k∈IN∗ la suite croissante des nombres premiers : p1 = 2 , p2 = 3 , p3 = 5 . . . Pour N ∈ IN∗ , on note AN l’ensemble des entiers naturels dont les diviseurs premiers sont tous dans {p1 , . . . , pN } . 1. Montrer que
N i=1
2. En déduire que :
1 1 = pour tout N ∈ IN∗ . 1 nα 1 − pα i
n∈AN
lim
N→+∞
N i=1
+∞
1 1 = 1 nα 1 − pα i
n=1
(on pourra utiliser le résultat de l’exercice 32.16). 1 converge si, et seulement si, α > 1 . 3. Montrer que pα n
1213
Chapitre 32. Familles sommables
Solutions des exercices 32.1 Par télescopage, puisque (un ) tend vers 0 , on a ∀n ∈ IN +∞
un =
n=0
+∞ n=0
+∞
+∞
un =
(uk−1 − uk )
k=n+1
(uk−1 − uk ) , et donc :
k=n+1
.
Considérons l’ensemble I = (k, n) ∈ IN2 : k > n et la famille réelle positive (an,k )(n,k)∈I définie par : ∀(n, k) ∈ I an,k = uk−1 − uk . Nous allons utiliser deux partitions de I : I=
∆n = (n, k) | k > n
Γk
avec, pour k ∈ IN∗ fixé,
Γk = (n, k) | n < k .
k∈IN∗
k
Pour tout n ∈ IN , on a :
avec, pour n ∈ IN fixé,
n∈IN
I=
∆n
∆1
+∞
an,k =
(uk−1 − uk ) = un
Γ4
k=n+1
(n,k)∈∆n
et donc, à l’aide de la première partition :
an,k =
n∈IN
(n,k)∈I
an,k =
(n,k)∈Γk
k−1 n=0
an,k
(n,k)∈∆n
Pour tout k ∈ IN∗ , on a :
=
+∞
un .
n=0
n
(uk−1 − uk ) = k (uk−1 − uk ).
Donc, à l’aide de la deuxième partition :
(n,k)∈I
an,k =
k∈IN∗
an,k
(n,k)∈Γk
D’où l’égalité annoncée. Les séries à termes positifs même nature.
=
+∞ k=1
k (uk−1 − uk ).
un et
k1
k (uk−1 − uk ) sont donc de
32.2 1. Les deux premières égalités proviennent du théorème de sommation par paquets en uti {−n, n} . La dernière vient du fait que les lisant les deux partitions ZZ = IN ∪ ZZ∗− = n∈IN
sommes partielles de la série
n1
(an + a−n ) sont
n
p=−n
ap − a0 .
2. Pour l’équivalence entre la sommabilité et les propriétés (i) et (ii) , on utilise le résultat de la question précédente et le fait qu’une somme de deux éléments de [0, +∞] est finie si, et seulement s’ils sont tous les deux finis. L’équivalence (ii) ⇔ (iii) est immédiate.
1214
Solutions des exercices 32.3 La série converge absolument, donc la famille est sommable. Utilisons les résultats de l’exemple 4 de la page 1193 en séparant les termes d’indice pair de ceux d’indice impair :
(−1)n−1 n2
n∈IN∗
=
k∈IN
1 π2 π2 1 π2 − = · − = 2 2 (2k + 1) (2k) 8 24 12 ∗ k∈IN
32.4 Soit z ∈ C tel que |z| < 1 . Commençons par des calculs formels en utilisant des sommations par paquets. En utilisant la première partition proposée par l’énoncé :
z pq =
(p,q)∈(IN∗ )2
+∞ +∞ p=1
z pq
q=1
=
zp . 1 − zp
p=1
∗ 2
+∞
Puis, en notant Dn = (p, q) ∈ (IN ) : pq = n remarquons que card Dn = d(n) puisque l’application d �→ (d, n/d) est évidemment une bijection de l’ensemble des diviseurs positifs de n sur Dn . Cela donne :
z
pq
=
(p,q)∈(IN∗ )2
+∞ n=1
z
pq
(p,q)∈Dn
=
+∞ n=1
1
(p,q)∈Dn
zn =
+∞
d(n) z n .
n=1
32.5 • Commençons par montrer la sommabilité de la famille en montrant : +∞ +∞ 1 q=2
Pour tout q 2 , la série
p
p=2
qp
< +∞.
q −p est une série géométrique de raison q −1 ∈ ]0, 1[ , donc
absolument convergente, et de somme : σq =
+∞ 1 p=2
Comme σq ∼
1 q2
, la série
qp
=
1/q 2 1 = · 1 − 1/q q(q − 1)
σq est convergente, ce qui prouve le résultat.
q
• On fait le même calcul pour trouver la somme, la série géométrique étant maintenant de raison −1/q . Cela donne : +∞ +∞ (−1)p q=2
p=2
qp
=
+∞ (−1/q)2 q=2
1 + 1/q
=
+∞ q=2
1 1 = , q(q + 1) 2
la dernière égalité provenant, par télescopage, de la relation
1 q(q+1)
=
1 q
−
1 · q+1
32.6 1. Soit (p, q) ∈ IR2+ . En majorant p et q chacun par p + q , on obtient l’inégalité de droite. Puis, en remplaçant, dans cette inégalité, p , q et α respectivement par pα , q α et 1/α , on obtient : p + q = (pα )1/α + (q α )1/α 2(pα + q α )1/α
soit
(p + q)α 2α (pα + q α ),
d’où l’inégalité de gauche.
1215
Chapitre 32. Familles sommables 2. On obtient, à l’aide de ces inégalités : 1 2 Donc
(p,q)∈(IN∗ )2
1
pα +q α
1 (p + q)α
pα
(p,q)∈(IN∗ )2
1 2α + qα
1 · (p + q)α
(p,q)∈(IN∗ )2
est sommable si, et seulement si,
(p,q)∈(IN∗ )2
1 (p+q)α
(p,q)∈(IN∗ )2
l’est.
Par positivité, on peut utiliser le théorème de sommation par paquets à l’aide du recou (p, q) ∈ (IN∗ )2 : p + q = n : vrement disjoint (IN∗ )2 = n∈IN∗
(p,q)∈(IN∗ )2
+∞
1 = σn (p + q)α
où
σn =
1p,qn p+q=n
n=1
On en déduit que la série et seulement si, α > 2 .
n−1 1 1 = ∼ α−1 · (p + q)α nα n
σn converge si, et seulement si, α − 1 > 1 , c’est-à-dire si,
32.7 1. Comme |z| < 1 , les séries géométriques
z 2p et
p
z 3q sont absolument convergentes.
q
La distributivité généralisée (proposition 18 de la page 1201) donne alors la sommabilité de la famille (z 2p+3q )(p,q)∈IN2 et sa somme : S(z) =
+∞ p=0
2. Pour n ∈ IN , notons In = disjointes deux à deux et
z 2p ×
+∞
1 1 × · 1 − z2 1 − z3
z 3q =
q=0
(p, q) ∈ IN2 : 2p + 3q = n . Ce sont des parties de IN2
In = IN2 . Le théorème de sommation par paquets donne
n∈IN
donc : S(z) =
+∞ n=0
z
2p+3q
(p,q)∈In
=
n=0
= Cela prouve, au passage, que la série
32.8 Pour (p, q) ∈ IN2 , notons up,q =
2p
+∞
(p,q)∈In
z
n
+∞
(card In ) z n =
n=0
dn z
n
+∞
dn z n .
n=0
converge absolument.
(−1)p+q · (p + q + 1)
3q
• On a la majoration |up,q | 2−p 3−q et la famille (2−p 3−q )(p,q)∈IN2 est sommable d’après la proposition 18 de la page 1201 (distributivité généralisée) puisque les séries −p −q géométriques 2 et 3 sont absolument convergentes. On en déduit que la famille (up,q )(p,q)∈IN2 est sommable. • Pour la somme, calculons, pour n ∈ IN : σn =
p+q=n
1216
up,q =
n p=0
(−1)n · (n + 1)
2p 3n−p
Solutions des exercices Cette dernière somme est constituée des termes consécutifs d’une suite géométrique de raison 3/2 , ce qui donne, après calcul : σn =
3
(−1)n n+1
2n
−
2 3n
=
1
6(−1)n n+1
2n+1
En utilisant le résultat rappelé, on obtient donc :
1 2
S = 6 ln 1 +
32.9 Considérons l’ensemble :
− ln 1 +
1 3
1
−
3n+1
·
= 12 ln 3 − 18 ln 2.
I = (k, n) ∈ (IN∗ )2 : k n
et la famille réelle positive :
αn k n(n + 1)
(∗)
.
(k,n)∈I
Nous allons utiliser deux partitions de I : I=
n1
I=
avec, pour n ∈ IN∗ fixé,
∆n
avec, pour k ∈ IN∗ fixé,
Γk
k1
• Pour tout n ∈ IN∗ , la famille σn =
k
n
k
k=1
αn n(n + 1)
∆n = (k, n) | k n
Γk = (k, n) | n k .
est finie et sa somme vaut :
(k,n)∈∆n
n αn αn αn = · k= n(n + 1) n(n + 1) 2 k=1
• Par le théorème de sommation par paquets, en utilisant la partition (∆n )n∈IN∗ , on obtient donc :
k
+∞ αn 1 αn . = n(n + 1) 2 n=1
(k,n)∈I
• En utilisant cette fois-ci la partition (Γk )k∈IN∗ , on a :
+∞
k
(k,n)∈I
• Finalement
+∞
uk =
k=1
et la convergence de la série
αn = uk . n(n + 1)
(k,n)∈I
k=1
k
+∞ αn 1 αn = n(n + 1) 2
αn entraîne celle de
n=1
uk .
1217
Chapitre 32. Familles sommables 32.10 1. Soit (p, q) ∈ IN2 . En effectuant une décomposition en éléments simples de la fraction 2(X − q) rationnelle , on obtient : (X + q + 1)(X + q + 2)(X + q + 3) 2(p − q) 2q + 1 2q + 2 2q + 3 =− +2 − , (p + q + 1)(p + q + 2)(p + q + 3) p+q+1 p+q+2 p+q+3 puis, en écrivant 2(2q + 2) = (2q + 3) + (2q + 1) : up,q = (2q + 3)
1 1 − p+q+2 p+q+3
− (2q + 1)
2. • On obtient, par télescopage, que, à q fixé, la série αq =
+∞
up,q =
p=0
La série télescopique
1 1 − p+q+1 p+q+2
·
up,q est convergente de somme :
p
2q + 1 1 1 2q + 3 − = − · q+2 q+1 q+1 q+2
αq est donc convergente de somme 1 , ce qui donne :
+∞ +∞ q=0
• Enfin, pour tout n :
up,q =
up,q
p=0
• Puisque uq,p = −up,q , on a donc aussi :
= 1.
+∞ +∞ p=0
up,q
q=0
= −1 .
2 (p − q) (n + 1)(n + 2)(n + 3) p+q=n
p+q=n
et cette dernière somme est nulle puisque, par le changement d’indice (p, q) = (q, p) , elle est égale à son opposé. Cela donne : +∞
up,q = 0.
n=0 p+q=n
3. Ainsi, la famille (up,q )(p,q)∈IN2 n’est pas sommable, sinon les trois sommes seraient égales. Remarque Cet exercice montre que l’on ne peut pas supprimer la condition de sommabilité (ou de positivité) dans le théorème de Fubini.
32.11 La suite (an )n1 est convergente, donc la série télescopique
n1
∀n ∈ IN∗
+∞
∆p = a n .
p=n
Écrivons donc formellement la somme de la série considérée : +∞ an n=1
1218
n
=
+∞ +∞ ∆p n=1
p=n
n
·
∆n converge. On a de plus :
Solutions des exercices Montrons la sommabilité de la famille
�
∆p n
�
; le théorème de sommation par paquets
1np
donnera alors la convergence absolue de la série
� |∆p | �
Par positivité de la famille
n
� |∆p | n
1np
=
1np
� an n
, on a, avec un résultat éventuellement infini :
� p � +∞ � � |∆p | p=1
·
=
n
n=1
+∞ � p=1
�
|∆p |
p � 1
n
n=1
� �� �
�
·
Hp
L’équivalent classique Hp ∼ ln p (voir l’exemple 17 de la page 621) montre que les séries à � � |∆p | Hp et |∆p | ln p sont de même nature. L’hypothèse de convergence termes positifs absolue de la série
bilité de la famille
�
∆n ln n permet donc de prouver
1np
� |∆p | � n
�
1np
|∆p | n
< +∞ et donc la somma-
qui donne donc la convergence (absolue) de la série
et permet d’intervertir les deux sommes : +∞ � an n=1
n
=
32.12 Puisque la série
� +∞ � +∞ � � ∆p n=1
�
n
p=n
=
� p � +∞ � � ∆p p=1
n=1
n
=
+∞ � p=1
�
∆p
p � 1 n=1
converge, de somme S2 = π 2 /6 , la famille
1 n2
S22
�
n
�
1 p2 q 2
=
+∞ �
� an n
∆p H p .
p=1
�
(p,q)∈(IN∗ )2
est som-
mable de somme (distributivité généralisée). On en déduit en particulier la sommabilité � 1 � . de la sous-famille p2 q2 p∧q=1
�
Calculons la somme
(p,q)∈(IN∗ )2
1 p2 q 2
en utilisant la partition de (IN∗ )2 proposée par l’énoncé.
Comme la famille est positive, le calcul sera justifié par le théorème 9 de la page 1193. Soit d ∈ IN∗ . L’application réciproque
Ad (p, q)
(IN∗ )2 (p, q)
−→ �−→
A1 (p/d, q/d).
�
1 = p2 q 2
(IN∗ )2 (dp, dq)
−→ �−→
induit une bijection de A1 sur Ad de
Par changement d’indice, on en déduit :
(p,q)∈Ad
En notant S =
�
(p,q)∈A1
�
Finalement, S =
1 p2 q 2
π2 6
�2
�
(p,q)∈A1
1 1 = 4 (dp)2 (dq)2 d
�
(p,q)∈A1
1 · p2 q 2
, on en déduit :
=
π 4 /36 5 = · π 4 /90 2
�
d∈IN∗
�
(p,q)∈Ad
� S π4 1 = = S · p2 q 2 d4 90 ∗ d∈IN
1219
Chapitre 32. Familles sommables 32.13 On a : n
ck =
a p bq =
p+qn
k=0
n
ap
p=0
p=0
cp − An B =
bq
=
q=0
d’où la relation donnée dans l’indication : n
n−p
n p=0
n
ap Bn−p
p=0
ap (Bn−p − B).
Il suffit alors de prouver que le membre de droite tend vers 0 pour avoir la convergence de cn et montrer : la série +∞
cn = lim An B = A B = n→+∞
n=0
+∞
ap
p=0
+∞ bq
.
q=0
La suite (Bn − B) tend vers 0 par hypothèse et est en particulier bornée. Notons alors M = sup |Bn − B| et A′ = n∈IN
convergente).
+∞
n=0
|an | (la série
an est supposée absolument
Soit ε > 0 . Il existe un entier n1 tel que |Bk − B| ε/(A′ + 1) , pour tout k n1 . Soit n n1 . Coupons la somme en deux : n p=0
n−n1
ap (Bn−p − B) =
p=0
ap (Bn−p − B) +
Xn
• Pour tout p ∈ [[0, n − n1 ]] , on a n − p n1 , donc : n−n1
|Xn | • D’autre part : |Yn |
n
p=n−n1 +1
n
p=n−n1 +1
M
p=0
p=n−n1 +1
ap (Bn−p − B) .
Yn
p=0
|ap | ε A′ .
|ap | Bn−p − B M |ap |
+∞
p=n−n1 +1
|ap | −→ 0 n→+∞
(reste d’une série convergente).
Il existe donc un rang n2 à partir duquel M
+∞ p=n−n1 +1
Finalement, pour n n0 = max(n1 , n2 ) , on a :
|ap | ε/(A′ + 1) .
n ε A′ ε + ′ = ε. ap (Bn−p − B) |Xn | + |Yn | ′ A +1 A +1 p=0
Cela achève la démonstration.
1220
n−n1
|ap | Bn−p − B ε
n
Solutions des exercices 32.14 • La série
an converge d’après le théorème des séries alternées (théorème 8 de la
page 616) puisque la suite • On a cn = (−1)n
p+q=n
√
√1 n+1
est décroissante et tend vers 0 . n∈IN
1 (p+1)(q+1)
, pour tout n ∈ IN .
L’étude sur [0, n] de la fonction t �→ (t + 1)(n − t + 1) montre qu’elle admet un maximum en n/2 qui vaut ( n+2 )2 , et l’on a donc : 2 |cn | =
La série
n p=0
1
(p + 1)(n − p + 1)
n p=0
cn diverge donc grossièrement.
2(n + 1) 2 = −→ 2. n+2 n + 2 n→+∞
32.15 1. En utilisant la partition suivante de (IN∗ )2 : (IN∗ )2 =
(p, q) : p q = n
n∈IN∗
on obtient par le théorème de sommation par paquets, puisque les séries
an et
n1
convergent absolument, que la série de terme général :
ad bn/d =
est absolument convergente et que l’on a : an
n=1
+∞
bn
n=1
2. En écrivant, pour tout n ∈ IN∗ , N (n) = obtient : +∞ N (n) n=1
nα
=
+∞ n=1
1
p q=n
nα
=
+∞ n=1
bn
n1
a p bq
pq=n
d|n
+∞
=
+∞ n=1
1=
a p bq
pq=n
.
1 et en posant an = bn =
p q=n
p|n
a p bq
p q=n
=
+∞ n=1
an
+∞ n=1
bn
1 nα
, on
= ζ(α)2 .
32.16 Notons I0 = J0 et In = Jn \ Jn−1 pour tout n ∈ IN∗ . Les In sont des parties disjointes deux à deux et leur réunion est égale à I . Dans les deux questions, on peut donc appliquer les théorèmes de sommation par paquets à la famille (In )n∈IN . Soit (ai )i∈I une famille de réels positifs ou une famille sommable de nombres complexes. ai existent et l’on remarque que : Alors les sommes σn = i∈In
∀n ∈ IN
i∈Jn
ai =
n
(∗)
σp
p=0
puisque Jn est la réunion disjointes de I0 , . . . , In . 1. Une famille (ai )i∈I de réels positifs est sommable si, et seulement si, la famille (σn )n∈IN est sommable, c’est-à-dire si, et seulement si, la série à terme général positif σn n
converge, ce qui donne l’équivalence annoncée d’après la relation (∗) .
1221
Chapitre 32. Familles sommables 2. Si la famille (ai )i∈I est sommable, alors, par le théorème de sommation par paquets σn est (théorème 16 de la page 1197), la famille (σn )n∈IN également, donc la série convergente et :
i∈I
ai =
σn = lim
n→+∞
n∈IN
n
σp = lim
n→+∞
p=0
ai .
i∈Jn
32.17 1. C’est la généralisation de l’exemple 12 de la page 1201. En écrivant :
on a :
1
n∈AN
nα
AN = pk1 1 · · · pkNN (k1 , . . . , kN ) ∈ INN , =
1
(k1 ,...,kN )∈INN
pk1 1 · · · pkNN
=
k1
Cela donne bien la relation demandée : N i=1
+∞
1 k1 p =0 1
···
+∞
k1 =0
1 pk1 1
·
1 1 = · 1 nα 1 − pα i
n∈AN
par changement d’indice puis distributivité généralisée. 2. La suite (AN )N∈IN∗ est une suite croissante de parties de IN∗ dont la réunion est égale à IN∗ . D’après le résultat de l’exercice 32.16 appliqué à la famille de réels positifs (1/nα )n∈IN∗ , on en déduit : lim
N→+∞
1
n∈AN
nα
=
1
n∈IN∗
nα
=
+∞ 1 n=1
nα
,
d’où le résultat demandé d’après la question précédente. 3. On en déduit que
N i=1
vers ζ(α) =
+∞ 1 n=1
nα
1 tend vers +∞ lorsque N tend vers +∞ si α 1 et 1 − p1α i
< +∞ si α > 1 .
On en déduit, par composition avec la fonction logarithme, que la série
i1
converge si, et seulement si, α > 1 et comme − ln(1 − converge si, et seulement si, α > 1 .
1222
1 ) pα i
∼
1 pα i
− ln(1 −
0 , que la série
1 ) pα i
i1
1 pα i
Chapitre 33 : Fonctions de deux variables I
un ouvert de IR2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
1224 . 1224 . 1225 1227 . 1227
Fonctions de classe C 1 . . . . . . . . . . . . . Gradient . . . . . . . . . . . . . . . . . . . . . III Dérivation des fonctions composées . . . . . 1 Composition avec une fonction d’une variable 2 Première règle de la chaîne . . . . . . . . . . 3 Dérivée selon un vecteur . . . . . . . . . . . . 4 Deuxième règle de la chaîne . . . . . . . . . . IV Extrema . . . . . . . . . . . . . . . . . . . . . . Démonstrations . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. 1230 . 1232 1233 . 1233 . 1233 . 1235 . 1236 1237 1240 1245
II
Fonctions continues sur 1 Ouverts de IR2 . . . 2 Fonctions continues Fonctions de classe C 1 . 1 Dérivées partielles . 2 3
Fonctions de deux variables
33
I
Fonctions continues sur un ouvert de IR2
1
Ouverts de IR2
On munit IRn de la norme euclidienne canonique : �·� :
IRn (x1 , . . . , xn )
−→ IR �−→ x21 + · · · + x2n .
Définition 1 Soit p ∈ IRn et r > 0 . On appelle boule ouverte de centre p et de rayon r la partie : B(p, r) = z ∈ IRn : �z − p� < r .
Terminologie Ce chapitre considérera exclusivement le cas n = 2 . Dans ce cas, la boule ouverte B(p, r) est appelée disque ouvert de centre p et de rayon r , et notée D(p, r).
Exo 33.1 Exo 33.2
Définition 2 Soit U une partie de IR2 . On dit que U est un ouvert de IR2 si : ∀p ∈ U
∃r > 0 D(p, r) ⊂ U.
Ex. 1. Montrons que le demi-plan H = (x, y) ∈ IR2 : x > 0 Soit p = (a, b) ∈ H . On a donc a > 0 .
est un ouvert de IR2 .
Montrons D(p, a) ⊂ H , ce qui conclura. Soit z = (x, y) ∈ D(p, a) .
On a (x − a)2 (x − a)2 + (y − b)2 = �z − p�2 < a2 , d’où l’encadrement −a < x − a < a . Il s’ensuit x > 0 , donc z ∈ H .
a
(a, b)
H
I Fonctions continues sur un ouvert de IR2 Ex. 2. Montrons que le disque unité ouvert D (0, 0), 1 est un ouvert
de IR2 . Soit p ∈ D (0, 0), 1 . On a donc �p� < 1 .
r
Posons r = 1 − �p� . On a bien r > 0 , et l’on va montrer l’inclusion D(p, r) ⊂ D(0, 1) , ce qui conclura. Soit z ∈ D(p, r) . On a �z� �p� + �z − p� d’après l’inégalité triangulaire, d’où �z� < �p� + 1 − �p� = 1 , ce qui prouve z ∈ D(0, 1) . On montrerait de la même façon que tout disque ouvert est un ouvert de IR2 .
(0, r/2) r
2
D(0, 1)
La droite ∆ = (x, y) ∈ IR2 : y = 0
Ex. 3.
(0, 0)
(a, b)
∆
n’est pas un ouvert
de IR2 . Soit r > 0 . Le disque ouvert D (0, 0), r contient le point (0, r/2) , qui n’appartient pas à ∆ . On en déduit qu’aucun disque ouvert de centre (0, 0) n’est inclus dans ∆ , ce qui montre que ∆ n’est pas un ouvert de IR2 .
Fonctions continues
Dans toute cette section, U désigne un ouvert non vide de IR2 . (a, b, f (a, b))
Étant donné une fonction f : U → IR et un point p = (a, b) ∈ U , on notera indifféremment f (p) ou f (a, b) la valeur de f en ce point. On peut représenter graphiquement une fonction f : U → IR par son graphe : Γf = x, y, f (x, y) (x, y) ∈ U , qui est une partie de U × IR, et donc de IR3 .
z
(a, b, 0)
y
x
Définition 3 Soit f : U → IR une fonction et p ∈ U .
• On dit que la fonction f est continue en p si : ∀ε > 0 ∃η > 0 ∀z ∈ U �z − p� η =⇒ f (z) − f (p) ε . • On dit que f est continue si elle est continue en tout point de U .
Remarque Si f : U → IR est une fonction telle que f (p) = 0 , l’hypothèse de continuité en p est : ∀ε > 0 ∃η > 0 ∀z ∈ U �z − p� η =⇒ f (z) ε . On pourra traduire cette hypothèse en disant que f (z) tend vers 0 quand z tend vers p, ce que l’on notera f (z) −→ 0 . z→p
1225
Chapitre 33. Fonctions de deux variables
Ex. 4. Montrons la continuité de f :
IR2 (x, y)
−→ �−→
IR x − 2y.
Soit p = (a, b) ∈ IR2 . Soit ε > 0 . Posons η = ε/3 . Soit z = (x, y) ∈ U tel que �z − p� η .
On a alors |x − a| = (x − a)2 (x − a)2 + (y − b)2 = �z − p� η . De même, |y − b| η . On en déduit, par l’inégalité triangulaire, que :
f (z) − f (p) |x − a| + 2|y − b| 3η ε,
ce qui montre la continuité de f en p . On a donc montré que f était continue sur IR2 . Ex. 5. Soit θ ∈ C 0 (IR, IR) ; posons f :
IR2 (x, y)
−→ �−→
IR θ(x).
Montrons que f est continue. Soit p = (a, b) ∈ IR2 et ε > 0 .
Par continuité de θ , on peut trouver δ > 0 tel que ∀x ∈ IR
|x − a| δ =⇒ θ(x)−θ(a) ε .
Soit (x, y) ∈ D(p, δ) . On a alors (x − a)2 (x − a)2 + (y − b)2 δ 2 , d’où |x − a| δ , ce qui implique θ(x) − θ(a) ε et donc f (x, y) − f (a, b) ε , ce qui conclut.
En particulier, cet exemple (et son analogue pour les fonctions dépendant uniquement de y ) montre que les fonctions (x, y) �→ x et (x, y) �→ y sont continues. Quand on disposera de théorèles généraux pour la continuité, ces exemples suffiront à montrer la continuité de toute fonction qui s’obtient à partir de celles-ci par combinaison linéaire et produit. C’est notamment le cas de la fonction de l’exemple précédent.
Remarque La définition de la continuité pour les fonctions de deux variables étant le calque de celle vue au chapitre 10, on obtient les mêmes théorèmes généraux concernant les opérations avec essentiellement les mêmes démonstrations. On montre notamment que la somme, le produit et, si le dénominateur ne s’annule pas, le quotient de deux fonctions continues définies sur U sont continus. Nous allons nous contenter d’énoncer les résultats concernant les trois façons de composer une fonction de deux variables et une ou plusieurs fonction(s) d’une variable. Proposition 1 Soit f : U → IR, I un intervalle contenant f (U ) et θ : I → IR.
Si f est continue en p ∈ U et que θ est continue en f (p), alors la composée θ ◦f est continue en p.
Principe de démonstration.
Démonstration page 1240 Il suffit de revenir aux définitions.
Proposition 2 Soit f : U → IR, I un intervalle d’intérieur non vide ainsi que γ1 et γ2 deux fonctions de I dans IR telles que γ : t �→ γ1 (t), γ2 (t) soit à valeurs dans U . Si γ1 et γ2 sont continues en a ∈ I , et que f est continue en γ(a), alors la composée f ◦ γ : t �→ f γ1 (t), γ2 (t) est continue en a.
Démonstration page 1240 Il suffit de revenir aux définitions, après avoir remarqué que les inégalités |α1 − α2 | η/2 et |β1 − β2 | η/2 entraînent (α1 , β1 ) − (α2 , β2 ) η .
Principe de démonstration.
1226
II Fonctions de classe C 1
Proposition 3
Soit f : U → IR, V un ouvert de IR2 et ϕ, ψ : V → IR deux fonctions telles que la fonction Φ : z �→ ϕ(z), ψ(z) soit à valeurs dans U . Si ϕ et ψ sont continues en p ∈ V , et que f est continue en ϕ(p), ψ(p) , alors la composée f ◦ Φ : z �→ f ϕ(z), ψ(z) est continue en p.
Démonstration page 1240
Principe de démonstration.
II
La démonstration est identique à la précédente.
Fonctions de classe C 1
Dans toute cette section, U désigne un ouvert non vide de IR2 et f une fonction de U dans IR.
1
Dérivées partielles
Étant donné un point p = (a, b) ∈ U , on considère les ensembles : et D2 = y ∈ IR : (a, y) ∈ U D1 = x ∈ IR : (x, b) ∈ U et les applications partielles :
ϕ1 : D1 −→ IR x �−→ f (x, b)
et ϕ2 : D2 y
Comme U est ouvert, on peut trouver r > 0 tel que D(p, r) ⊂ U . On a alors les inclusions : ]a − r, a + r[ ⊂ D1
et
−→ IR �−→ f (a, y). (a, b)
D1
D2
]b − r, b + r[ ⊂ D2 .
Notons que D1 et D2 peuvent ne pas être des intervalles, mais que cela n’a guère d’importance puisque la discussion est ici locale : seul ce qui se passe au voisinage de a ∈ D1 et b ∈ D2 nous intéresse.
U
Définition 4 Soit p = (a, b) ∈ U .
• Si l’application partielle ϕ1 est dérivable en a, on dit que f admet une première dérivée partielle en (a, b) et l’on pose : ∂1 f (a, b) = ϕ′1 (a). • Si l’application partielle ϕ2 est dérivable en b , on dit que f admet une deuxième dérivée partielle (a, b) et l’on pose :
Exo 33.4
∂2 f (a, b) = ϕ′2 (a).
1227
Chapitre 33. Fonctions de deux variables Remarque On utilise en pratique une notation plus parlante. Pour une fonction f : (x, y) �→ f (x, y), on note plutôt : ∂f (a, b) = ∂2 f (a, b), ∂y
∂f (a, b) = ∂1 f (a, b) et ∂x
en s’adaptant aux noms des variables apparaissant dans la définition de f . Par exemple, les dérivées partielles de la fonction f : (r, θ) �→ r cos θ sont données par : ∀(s, ω) ∈ IR2
∂f (s, ω) = cos ω ∂r
∂f (s, ω) = −s sin ω. ∂θ
et
Cette notation est potentiellement ambiguë, car les variables apparaissant dans la définition de f sont en fait des variables muettes, mais elle ne pose guère de problème à l’usage.
Ex. 6. Soit (α, β, γ) ∈ IR3 . On considère la fonction (affine) : f:
IR2 (x, y)
−→ �−→
IR. α x + β y + γ.
Le graphe de cette fonction est le plan d’équation z = α x + β y + γ . Pour tout b ∈ IR , l’application partielle ϕ1 : x �→ f (x, b) = α x + β b + γ est (affine donc) dérivable, de dérivée ϕ′1 : x �→ α . Le cas de l’autre application partielle étant complètement analogue, f admet des dérivées partielles en tout point de IR2 : ∀(a, b) ∈ IR2
∂f (a, b) = α ∂x
∂f (a, b) = β. ∂y
et
Ex. 7. On considère l’ouvert H = (x, y) ∈ IR2 : x > 0
et la fonction f :
H (x, y)
−→ �−→
IR. xy
• Pour tout b ∈ IR , l’application partielle ϕ1 : x �→ xb est dérivable sur IR∗+ , de dérivée ϕ′1 : x �→ b xb−1 , donc f admet une première dérivée partielle en tout point de H : ∀(a, b) ∈ H
∂f (a, b) = b ab−1 . ∂x
• Pour tout a > 0 , l’application partielle ϕ2 : y �→ ay = exp y ln(a)
est dérivable sur IR ,
de dérivée ϕ′2 : y �→ ln(a) exp y ln(a) = ln(a) ay , donc f admet une deuxième dérivée partielle en tout point de H : ∀(a, b) ∈ H
1228
∂f (a, b) = ln(a) ab . ∂y
Proposition 4 Soit f et g deux fonctions de U dans IR, et p ∈ U .
II Fonctions de classe C 1
• Si f et g admettent des dérivées partielles en p, alors f + g également, avec : ∂f ∂g ∂(f + g) (p) = (p) + (p) ∂x ∂x ∂x
∂(f + g) ∂f ∂g (p) = (p) + (p). ∂y ∂y ∂y
et
• Si f et g admettent des dérivées partielles en p, alors f g également, avec : ∂f ∂g ∂(f g) (p) = (p) g(p) + f (p) (p) ∂x ∂x ∂x
∂(f g) ∂f ∂g (p) = (p) g(p) + f (p) (p). ∂y ∂y ∂y
et
Démonstration page 1240 Via les applications partielles, on se ramène aux théorèles généraux pour les fonctions d’une variable.
Principe de démonstration.
Attention L’existence des dérivées partielles, même en tout point de U , n’entraîne pas la continuité de f . Ex. 8. Considérons la fonction : f:
IR2
−→
(x, y)
�−→
IR �
xy x2 + y 2 0
si (x, y) �= (0, 0) si (x, y) = (0, 0).
• Soit b ∈ IR . ∗ Si b �= 0 , l’application partielle ϕ1 : x �→ f (x, b) =
xb est dérivable sur IR , et l’on x 2 + b2
obtient :
∀a ∈ IR
∂f b(b2 − a2 ) · (a, b) = 2 ∂x (a + b2 )2
∗ Si b = 0 , l’application partielle ϕ1 : x �→ f (x, 0) = 0 est dérivable, et : ∀a ∈ IR
∂f (a, 0) = 0. ∂x
• Par symétrie, on obtient que f admet une deuxième dérivée partielle et : ∀(a, b) ∈ IR2
2 a(a − b2 )
∂f (a, b) = (a2 + b2 )2 ∂y 0
• Pourtant, on a, pour tout t ∈ IR∗ , f (t, t) = ∀t ∈ IR
si a �= 0 si a = 0.
t2 1 = , donc : t2 + t2 2
f (t, t) =
�
1/2 0
si t �= 0 si t = 0.
Cela montre que t �→ f (t, t) est discontinue en 0 . La contraposée de la proposition 2 de la page 1226 entraîne donc que f est discontinue en (0, 0) .
1229
Chapitre 33. Fonctions de deux variables
2
Fonctions de classe C 1
Si la fonction f admet des dérivés partielles en tout point de U , on peut considérer ∂f ∂f et comme des fonctions définies sur U . ses dérivées partielles ∂x ∂y Définition 5 La fonction f est dite de classe C 1 si elle admet des dérivées partielles en tout ∂f ∂f et sont continues. point de U et que les fonctions ∂x ∂y Notation On note C 1 (U, IR) ou, plus simplement, C 1 (U ) l’ensemble des fonctions de classe C 1 définies sur U .
Ex. 9. Une fonction constante étant évidemment continue, la fine (x, y) �→ α x + β y + γ de l’exemple 6 de la page 1228 est de classe C 1 . Ex. 10. Soit θ ∈ C 1 (IR, IR) ; posons f :
IR2 (x, y)
−→ �−→
fonction
af-
IR θ(x).
Pour tout (a, b) ∈ IR2 :
• la première application partielle est x �→ f (x, b) = θ(x) , c’est-à-dire θ elle-même ; • la deuxième application partielle est y �→ f (a, y) = θ(a) , constante.
On en déduit que f admet des dérivées partielles : ∀(a, b) ∈ IR2
∂f (a, b) = θ′ (a) ∂x
et
∂f (a, b) = 0. ∂y
∂f ∂f et étant continues (la première d’après l’exemple 5 de la page 1226, ∂x ∂y la seconde de façon évidente), on en déduit que f ∈ C 1 (IR2 , IR) .
Les deux fonctions
Ex. 11. Reprenons l’exemple 7 de la page 1228 de la fonction f : (x, y) �→ xy , définie sur le demi-plan H = (x, y) ∈ IR2 : x > 0 , dont on a calculé les dérivées partielles : ∂f : ∂x
H (a, b)
−→ �−→
IR b ab−1
et
∂f : ∂y
H (a, b)
−→ �−→
IR ln(a) ab .
L’exemple 5 de la page 1226 montre que les fonctions (a, b) �→ ln(a) et (a, b) �→ b − 1 sont continues sur H . Il en va alors de même de leur produit (a, b) �→ (b − 1) ln(a) puis, d’après la proposition 1 de la page 1226, de (a, b) �→ exp (b − 1) ln(a) = ab−1 . Il en va donc de même ∂f ∂f de par produit, et l’on procède de même pour la deuxième dérivée partielle · ∂x ∂y Ses dérivées partielles étant continues sur H , la fonction f est de classe C 1 .
1230
II Fonctions de classe C 1 IR2
−→
(x, y)
�−→
Ex. 12. Considérons à nouveau la fonction f :
IR �
xy x2 + y 2 0
si (x, y) �= (0, 0) si (x, y) = (0, 0),
dont on a calculé les dérivées partielles : ∀(a, b) ∈ IR2
2 b(b − a2 )
si b �= 0
∂f (a, b) = (a2 + b2 )2 ∂x 0
si b = 0
et
2 a(a − b2 )
∂f (a, b) = (a2 + b2 )2 ∂y 0
si a �= 0 si a = 0.
∂f 1 ∂f (0, t) = donc la dérivée partielle n’est pas continue en (0, 0) , ∂x t ∂x et la fonction f n’est donc pas de classe C 1 . Pour tout t ∈ IR∗ , on a
Théorème 5 (Développement limité à l’ordre 1 ) Soit f ∈ C 1 (U, IR) et p = (a, b) ∈ U . Il existe alors une fonction ε : U → IR telle que ε(z) −→ 0 et pour tout (x, y) ∈ U : z→p
f (x, y) = f (a, b) + (x − a)
� � ∂f ∂f (a, b) + (y − b) (a, b) + ε(x, y) �(x, y) − (a, b)�. ∂x ∂y
Démonstration (non exigible) page 1241
Remarques • Le théorème précédent affirme que la fonction affine : (x, y) �→ f (a, b) +
∂f ∂f (a, b) (x − a) + (a, b) (y − b) ∂x ∂y
approche au premier ordre la fonction f au voisinage du point (a, b). En particulier, le plan d’équation : z = f (a, b) +
∂f ∂f (a, b) (x − a) + (a, b) (y − b), ∂x ∂y
qui est le graphe de cette fonction affine, est le plan tangent du graphe de la fonction f en (a, b), c’est-àdire de la surface d’équation z = f (x, y). � � � • En notant Up = z − p � z ∈ U , on peut réécrire l’égalité du théorème sous la forme : � � ∂f ∂f (a, b) + k (a, b) + ε(h, k) �(h, k)�, ∀(h, k) ∈ Up f (a + h, b + k) = f (a, b) + h ∂x ∂y où ε : Up → IR est une fonction telle que ε(z) −→ 0 . z→0
Notation On peut écrire de manière plus condensée le résultat précédent sous la forme d’un développement limité à l’ordre 1 : �� �� ∂f ∂f (a, b) + k (a, b) + o �(h, k)� . f (a + h, b + k) = f (a, b) + h ∂x ∂y 1231
Chapitre 33. Fonctions de deux variables Corollaire 6 Soit f ∈ C 1 (U, IR). Alors f est continue. Démonstration.
Avec les notations du théorème, on obtient, pour tout (a, b) ∈ U : h
donc f (a + h, b + k)
∂f ∂f −→ 0, (a, b) + k (a, b) + ε(h, k) (h, k) ∂x ∂y (h,k)→(0,0) −→
(h,k)→(0,0)
f (a, b) , ce qui montre que f est continue en (a, b) .
Proposition 7 Soit (f, g) ∈ C 1 (U, IR)2 .
Alors la somme f + g et le produit f g sont des fonctions de classe C 1 .
Démonstration page 1242 On applique la proposition 4 de la page 1229 et l’on vérifie que les dérivées partielles obtenues sont continues.
Principe de démonstration.
Remarques • Dans le cas particulier d’une fonction g constante, on obtient que, pour tout λ ∈ IR, le produit λ f est de classe C 1 .
• On obtient ainsi que C 1 (U, IR) est à la fois un sous-espace vectoriel et un sousanneau de l’ensemble F (U, IR) des fonctions définies sur U .
3
Gradient
Définition 6 Soit f ∈ C 1 (U, IR). Le gradient de f est l’application : ∇f :
U
−→ IR2
(a, b) �−→ ∇f (a, b) =
∂f ∂f (a, b), (a, b) . ∂x ∂y
Remarque Géométriquement, ∇f (a, b) ∈ IR2 est le vecteur du plan dont les coor∂f ∂f (a, b) et (a, b). Le gradient est alors un champ de vecteurs, données sont ∂x ∂y c’est-à-dire une application dont les valeurs sont des vecteurs. Ex. 13. La fonction affine f : (x, y) �→ α x + β y + γ a un gradient constant : ∀(x, y) ∈ IR2
∇f (x, y) = (α, β).
On peut alors réécrire la fonction sous la forme f : z �→ ( ∇f (0, 0) | z ) + γ . Le gradient (ou plutôt, son unique valeur) joue donc pour les fonctions affines IR2 → IR le rôle du coefficient directeur d’une fonction affine IR → IR .
Réécriture du développement limité à l’ordre 1 Soit f ∈ C 1 (U, IR) et p ∈ U . Il existe alors une fonction ε : U → IR telle que ε(z) −→ 0 et pour tout z ∈ U : z→p
f (z) = f (p) + ( ∇f (z) | z − p ) + ε(z) �z − p�. 1232
III Dérivation des fonctions composées
III
Dérivation des fonctions composées
Dans toute cette section, U désigne un ouvert non vide de IR2 et I désigne un intervalle d’intérieur non vide.
1
Composition avec une fonction d’une variable
Proposition 8 Soit f ∈ C 1 (U, IR), I un intervalle contenant f (U ) et θ ∈ C 1 (I, IR). Alors θ ◦ f est une fonction de classe C 1 , avec, pour tout p ∈ U : ∂f ∂(θ ◦ f ) (p) = θ′ f (p) (p) ∂x ∂x
Exo 33.5
et
∂f ∂(θ ◦ f ) (p) = θ′ f (p) (p). ∂y ∂y
Démonstration page 1242 Via les applications partielles, on se ramène au théorème de dérivation des fonctions composées pour les fonctions d’une variable.
Principe de démonstration.
Remarques • En utilisant pour θ la fonction inverse, on obtient par exemple que l’inverse d’une fonction de classe C 1 qui ne s’annule pas est encore de classe C 1 .
• D’après la proposition 7 de la page ci-contre, on en déduit que si f et g sont de classe C 1 et si g ne s’annule pas, alors le quotient f /g est encore de classe C 1 .
2
Exo 33.6
Première règle de la chaîne
Théorème 9 Soit f ∈ C 1 (U, IR) et (γ1 , γ2 ) ∈ C 1 (I, IR)2 . On suppose que la fonction γ : t �→ γ1 (t), γ2 (t) est à valeurs dans U . Alors f ◦ γ : t �→ f γ1 (t), γ2 (t) est de classe C 1 et l’on a, pour tout a ∈ I : (f ◦ γ)′ (a) =
∂f ∂f γ(a) γ1′ (a) + γ(a) γ2′ (a). ∂x ∂y
Démonstration page 1242 La fonction γ1 étant dérivable en a , on a le développement limité γ1 (t) = γ1 (a) + (t − a) γ ′ (a) + (t − a) η1 (t) et son analogue pour γ2 . On peut les « composer » avec le développement limité de f obtenu dans le théorème 5 de la page 1231 pour montrer que f ◦ γ est dérivable et obtenir l’expression de sa dérivée.
Principe de démonstration.
Ex. 14. Soit u ∈ C 1 (IR, IR∗+ ) et v ∈ C 1 (IR, IR) ; considérons w : t �→ u(t)v(t) .
Il serait possible de montrer que w : t �→ exp v(t) ln u(t) est de classe C 1 et de calculer sa dérivée en revenant aux techniques de calcul sur les fonctions d’une variable. Pour se familiariser avec le théorème, faisons-le plutôt à l’aide de la première règle de la chaîne. On a vu à l’exemple 7 de la page 1228 que la fonction : f:
H (x, y)
−→ �−→
IR xy
1233
Chapitre 33. Fonctions de deux variables est de classe C 1 et que ses dérivées partielles sont données par : ∀(a, b) ∈ H
∂f (a, b) = b ab−1 ∂x
et
∂f (a, b) = ln(a) ab . ∂y
Or, pour tout t ∈ IR , on a w(t) = f (u(t), v(t)) .
D’après la première règle de la chaîne, on a w ∈ C 1 (IR, IR) et : ∀t ∈ IR
w′ (t) =
∂f ∂f u(t), v(t) u′ (t) + u(t), v(t) v ′ (t) ∂x ∂y
= u′ (t) v(t) u(t)v(t)−1 + v ′ (t) ln u(t) u(t)v(t) =
u′ (t) v(t) + v ′ (t) ln u(t) u(t)
Ex. 15. Soit f ∈ C 1 (IR2 , IR) une fonction telle que ∀(x, y) ∈ IR2
u(t)v(t) . f (x, y) = f (y, x) .
Fixons a ∈ IR . Pour tout t ∈ IR , on a alors f (a, t) = f (t, a) . Posons γ1 (t) = a et γ2 (t) = t , on a alors f (a, t) = f γ1 (t), γ2 (t) , ce qui donne :
∂f ∂f ∂f d f (a, t) = γ1′ (t) (a, t) + γ2′ (t) (a, t) = (a, t). dt ∂y ∂x ∂y =0
De la même façon : On obtient donc :
=1
∂f d (t, a) . f (t, a) = dt ∂x ∀t ∈ IR
∂f ∂f (a, t) = (t, a). ∂y ∂x
∂f ∂f (x, y) = (y, x) , ce qui permet, ayant calculé en tout ∂x ∂y point l’une des deux dérivées partielles, d’en déduire l’autre.
On a ainsi montré ∀(x, y) ∈ IR2
Remarques • Avec les mêmes notations que dans le théorème, on peut écrire de façon concise la dérivée de f ◦ γ à l’aide du gradient de f : ∀a ∈ I (f ◦ γ)′ (a) = ∇f γ(a) γ ′ (a) , où l’on a noté γ ′ (a) = γ1′ (a), γ2′ (a) . • On appelle ligne de niveau d’une fonction f : IR2 → IR, une partie de IR2 d’équation f (x, y) = c, pour un certain c ∈ IR.
1234
III Dérivation des fonctions composées Si la fonction γ paramètre une ligne de niveau, c’est-à-dire si la composée f ◦ γ est constante, ′ on obtient l’égalité ∇f γ(a) γ (a) = 0 , c’est-à-dire que le gradient ∇f γ(a) est orthogonal au vecteur dérivé γ ′ (a) qui dirige la tangente au point γ(a) de la ligne de niveau. On dit que le gradient ∇f est orthogonal aux lignes de niveau. Le dessin ci-contre montre le gradient d’une certaine fonction f (ou plutôt, quelques-unes de ses valeurs) et une ligne de niveau : on perçoit qu’une particule se déplaçant le long de la ligne de niveau aurait à tout moment un vecteur vitesse orthogonal au gradient de f au point où elle se trouve. Ex. 16. La fonction f : (x, y) �→ (x2 + y 2 )2 possède des dérivées partielles : ∀(a, b) ∈ IR2
∂f (a, b) = 4a (a2 + b2 ) ∂x
et
∂f (a, b) = 4b (a2 + b2 ). ∂y
Ces dérivées partielles étant continues, on obtient que f ∈ C 1 (IR2 , IR) . Le gradient de f est donné par :
∇f : (a, b) �→ 4a (a2 + b2 ), 4b (a2 + b2 ) = 4(a2 + b2 ) (a, b). On obtient bien que ∇f (a, b) est radial, c’est-à-dire colinéaire à (a, b) . Il est donc bien orthogonal aux lignes de niveau (a, b) ∈ IR2 : f (a, b) = c , qui sont ici les cercles centrés en 0 .
3
Dérivée selon un vecteur
Proposition 10 Soit f ∈ C 1 (U, IR), p ∈ U et v = (h, k) ∈ IR2 . L’application ϕv : t �→ f (p + t v) est définie au voisinage de 0 , dérivable en 0 , de dérivée : ϕ′v (0) = h
∂f ∂f (p) + k (p) = ( ∇f (p) | v ). ∂x ∂y
On note Dv f (p) = ϕ′v (0) cette dérivée, et on l’appelle dérivée de f en p selon le vecteur v .
Démonstration page 1244
Principe de démonstration. On applique simplement la première règle de la chaîne aux fonctions affines x : t �→ a + t h et y : t �→ b + t k , où (a, b) = p . Ex. 17. Si v = (1, 0) , on a Dv f (p) =
∂f ∂f (p) . De même, si w = (0, 1) , on a Dw f (p) = (p) . ∂x ∂y
1235
Chapitre 33. Fonctions de deux variables Remarques • Comme les applications partielles ϕ1 et ϕ2 utilisées dans la définition des dérivées partielles, l’application ϕv correspond, lorsque v �= 0 , à la fonction f « le long de la droite » passant par p et dirigée par v . La notion de dérivée selon un vecteur généralise donc celle de dérivée partielle, en ne faisant plus jouer de rôle particulier aux droites parallèles aux axes de coordonnées. • Si v est un vecteur unitaire, l’inégalité de Cauchy-Schwarz donne : � � � � � � �Dv f (p)� = �( ∇f (p) | v )� �∇f (p)�.
En outre, la dérivée Dv f (p) est alors maximale (resp. minimale) si ∇f (p) est � � positivement (resp. négativement) colinéaire à v : elle vaut dans ce cas ±�∇f (p)� .
Le gradient de f en p pointe donc dans la direction dans laquelle f croît le plus vite (qui est aussi, en sens inverse, celle où elle décroît le plus vite). Cela correspond à la direction de plus grande pente sur le graphe Γf .
4
Deuxième règle de la chaîne
Théorème 11 Soit f ∈ C 1 (U, IR). Soit V un ouvert non vide de IR2 et (ϕ, ψ) ∈ C 1 (V, IR)2 un couple de fonctions tel que l’application Φ : (x, y) �→ (ϕ(x, y), ψ(x, y)) soit à valeurs dans U . Alors l’application composée : f ◦Φ:
Exo 33.7
V −→ IR� � (x, y) �−→ f ϕ(x, y), ψ(x, y)
est de classe C 1 , et vérifie : � � � � � ∂1 (f ◦ Φ)(p) = ∂1 f Φ(p) ∂1 ϕ(p) + ∂2 f Φ(p) ∂1 ψ(p) ∀p ∈ V � � � � ∂2 (f ◦ Φ)(p) = ∂1 f Φ(p) ∂2 ϕ(p) + ∂2 f Φ(p) ∂2 ψ(p).
Démonstration page 1244 La première règle de la chaîne permet de montrer que les applications partielles de F sont de classe C 1 et donne les formules pour les dérivées partielles.
Principe de démonstration.
� � Remarque Si l’on note f : (x, y) �→ f (x, y) et Φ : (u, v) �→ ϕ(u, v), ψ(u, v) , ces formules deviennent, selon la notation usuelle : � ∂ϕ � ∂ψ ∂(f ◦ Φ) ∂f � ∂f � (p) = Φ(p) (p) + Φ(p) (p) ∂u ∂x ∂u ∂y ∂u ∀p ∈ V � � � � ∂(f ◦ Φ) (p) = ∂f Φ(p) ∂ϕ (p) + ∂f Φ(p) ∂ψ (p). ∂v ∂x ∂v ∂y ∂v Ex. 18. Soit f ∈ C 1 (IR2 , IR) . On considère F : (u, v) �→ f (u + uv, u − uv 2 ) . • La fonction ϕ : (u, v) �→ u + uv est de classe C 1 et vérifie : ∀(a, b) ∈ IR2
1236
∂ϕ (a, b) = 1 + b ∂u
et
∂ϕ (a, b) = a. ∂v
IV Extrema • La fonction ψ : (u, v) �→ u − uv 2 est de classe C 1 et vérifie : ∂ψ (a, b) = 1 − b2 ∂u
∀(a, b) ∈ IR2
et
∂ψ (a, b) = −2ab. ∂v
On en déduit que F ∈ C 1 (IR2 , IR) et que, pour tout (a, b) ∈ IR2 : ∂F ∂f ∂f (a, b) = (1 + b) (a + ab, a − ab2 ) + (1 − b2 ) (a + ab, a − ab2 ) ∂u ∂x ∂y ∂f ∂F ∂f (a, b) = a (a + ab, a − ab2 ) − 2ab (a + ab, a − ab2 ). ∂v ∂x ∂y
IV
Extrema
Dans toute cette section, U désigne un ouvert non vide de IR2 . Définition 7 Soit X une partie non vide de IR2 , f : X → IR une fonction et p ∈ X . • On dit que f admet un maximum en p si ∀z ∈ X
f (z) f (p).
• On dit que f admet un maximum local en p si :
∃η > 0 ∀z ∈ X ∩ D(p, η) f (z) f (p).
• On définit de même les notions de minimum et de minimum local.
• On dit que f admet un extremum en p si f admet un maximum ou un minimum en p. On définit de même la notion d’extremum local. Remarque Pour insister sur la distinction avec les extrema locaux, les extrema sont parfois appelés extrema globaux. IR2 −→ IR étant clairement positive, et nulle en (0, 0) , (x, y) �−→ x2 + y 2 elle admet un minimum en (0, 0) . En revanche, elle n’est pas majorée, donc n’admet pas de maximum. Ex. 20. Soit g : IR2 −→ IR (x, y) �−→ (x2 + y 2 )2 − (x2 + y 2 ). Ex. 19. La fonction f :
Soit (x, y) ∈ IR2 ; notons r = �(x, y)� . On a alors f (x, y) = r4 − r 2 = r 2 (r 2 − 1) .
En particulier, on voit que, pour tout (x, y) ∈ D (0, 0), 1 , on a f (x, y) 0 = f (0, 0) , ce qui montre que f admet en (0, 0) un maximum local. En revanche, comme r 4 − r 2 −→ +∞ , la fonction f n’est pas majorée, donc elle n’admet en r→+∞
particulier pas de maximum global. Ex. 21. Soit h :
IR2 (x, y)
−→ �−→
IR exp(x).
Cette fonction est minorée (par 0 ) mais n’admet pas de minimum : si h admettait un minimum en (a, b) , on en déduirait que la fonction d’une variable x �→ exp(x) admettrait un minimum en a , ce qui est impossible.
1237
Chapitre 33. Fonctions de deux variables Définition 8 Soit f ∈ C 1 (U, IR) et p ∈ U . On dit que p est un point critique pour f si
∂f ∂f (p) = (p) = 0 . ∂x ∂y
Remarque Autrement dit, le point p est critique si, et seulement si, ∇f (p) = (0, 0). Théorème 12 Soit f ∈ C 1 (U, IR) et p ∈ U .
Si p admet un extremum local en p, alors p est un point critique de f .
Démonstration page 1244 Via les applications partielles, on se ramène au théorème correspondant pour les fonctions d’une variable.
Principe de démonstration.
Remarques • On voit que, même si le théorème est énoncé dans le cadre d’une fonction globalement de classe C 1 , la démonstration n’utilise en fait que l’existence des dérivées partielles en p. • Le théorème concernant les fonctions d’une variable exigeait que l’extremum local fût atteint en un point de l’intérieur de l’intervalle. Dans le théorème précédent, cette hypothèse est rendue superflue par le fait que U soit un ouvert de IR2 : le point p est pour ainsi dire automatiquement dans son intérieur. Attention Comme dans le cas des fonctions d’une variable, la réciproque du théorème est fausse : une fonction n’admet pas nécessairement d’extremum local en chacun de ses points critiques. Ex. 22. Considérons la fonction : f:
IR2 (x, y)
−→ �−→
IR x3 + y 3 .
On vérifie directement que f admet des dérivées partielles : ∀(a, b) ∈ IR2
∂f (a, b) = 3a2 ∂x
et
∂f (a, b) = 3b2 . ∂y
En particulier, l’origine (0, 0) est un point critique. Comme f (x, 0) est strictement positif dès que x ∈ IR∗+ , on voit que (0, 0) n’est pas un maximum local. De même, f (x, 0) est strictement négatif dès que x ∈ IR∗− , donc (0, 0) n’est pas un minimum local.
Point méthode Pour étudier les extrema (locaux ou globaux) d’une fonction f ∈ C 1 (U, IR), • on trouve ses points critiques en résolvant les équations Exo 33.14
∂f ∂f (a, b) = (a, b) = 0 ; ∂x ∂y
• pour chaque point critique (a, b), on cherche à déterminer (soit au voisinage de (a, b), soit globalement) le signe de f (x, y) − f (a, b). 1238
IV Extrema
Ex. 23. La fonction f : (x, y) �→ x2 + y 2 est de classe C 1 par opérations. Ses dérivées partielles sont données par : ∀(a, b) ∈ IR2
∂f (a, b) = 2a ∂x
et
∂f (a, b) = 2b. ∂y
Ainsi, un point (a, b) ∈ IR2 est critique si, et seulement si, 2a = 2b = 0 : le seul point critique est l’origine (0, 0) . Il ne peut donc y avoir aucun extremum local à l’exception de (0, 0) , dont on a déjà vu qu’il s’agissait d’un minimum (global). Ex. 24. Soit h :
IR2 (x, y)
−→ �−→
IR x2 − y 2 .
La fonction f est de classe C 1 par opérations, et ses dérivées partielles sont données par : ∀(a, b) ∈ IR2
∂h (a, b) = 2a ∂x
et
∂h (a, b) = −2b, ∂y
donc l’origine (0, 0) est l’unique point critique de la fonction h . Or, pour tout x ∈ IR∗ , h(x, 0) = x2 > 0 et pour tout y ∈ IR∗ , h(0, y) = −y 2 < 0 donc le point critique (0, 0) n’est ni un maximum local, ni un minimum local. La fonction h ne possède donc aucun extremum local.
1239
Chapitre 33. Fonctions de deux variables
Démonstrations Supposons f continue en p et θ continue en f (p) . Soit ε > 0 .
Proposition 1
Comme θ est continue en f (p) , on peut trouver η > 0 tel que :
∀t ∈ I
Comme f est continue en p , on peut trouver δ > 0 tel que : ∀z ∈ U
�z − p� δ =⇒ f (z) − f (p) η .
Soit maintenant z ∈ U tel que �z − p� δ .
|t − f (p)| η =⇒ θ(t) − θ f (p) ε .
On a alors f (z) − f (p) η , d’où θ f (z) − θ f (p) ε , ce qui conclut.
Proposition 2
Supposons γ1 et γ2 continues en a et f continue en p = γ(a) . Soit ε > 0 .
Comme f est continue en p , on peut trouver η > 0 tel que : ∀z ∈ U
�z − p� η =⇒ f (z) − f (p) ε .
Comme γ1 et γ2 sont continues en a , on peut trouver δ > 0 tel que :
γ1 (t) − γ1 (a) η/2 ∀t ∈ I |t − a| δ =⇒ γ2 (t) − γ2 (a) η/2.
Pour tout t ∈ I tel que |t − a| δ , on a alors :
γ(t) − p = (γ1 (t) − γ1 (a))2 + (γ2 (t) − γ2 (a))2 η 2 /4 + η 2 /4 η. Pour un tel t , on a donc f γ(t) − f p ε , ce qui conclut.
Proposition 3
Supposons ϕ et ψ continues en p et f continue en Φ(p) . Soit ε > 0 .
Comme f est continue en Φ(p) , on trouve η > 0 tel que :
z − Φ(p) η =⇒ f (z) − f Φ(p) ε .
∀z ∈ U
Exactement comme dans la démonstration précédente, la continuité de ϕ et ψ nous permet de trouver δ > 0 tel que : ∀w ∈ V On obtient alors : ∀w ∈ V ce qui conclut. Proposition 4
�w − p� δ =⇒ Φ(w) − Φ(p) η .
Supposons que f et g admettent des dérivées partielles en p = (a, b) .
On note D1 = x ∈ IR : (x, b) ∈ U , et : ϕ1 : D1 x
−→ �−→
IR f (x, b)
et
γ1 : D1 x
les applications partielles de f et g , respectivement.
1240
�w − p� δ =⇒ f Φ(w) − f Φ(p) ε ,
−→ �−→
IR g(x, b)
Démonstrations La somme f + g et le produit f g définissent des applications partielles : σ1 : D1 x
−→ �−→
IR (f + g)(x, b) = f (x, b) + g(x, b)
π1 : D1 x
−→ �−→
IR (f g)(x, b) = f (x, b) g(x, b),
de sorte que l’on a simplement σ1 = ϕ1 + γ1 et π1 = ϕ1 γ1 . Puisque f et g admettent des dérivées partielles en p , les applications partielles ϕ1 et γ1 sont dérivables en a . On en déduit qu’il en va de même de leur somme et de leur produit, et l’on obtient : ∂(f + g) ∂f ∂g (a, b) = σ1′ (a) = ϕ′1 (a) + γ1′ (a) = (a, b) + (a, b) ∂x ∂x ∂x ∂(f g) ∂g ∂f (a, b) = π1′ (a) = ϕ′1 (a) γ1 (a) + ϕ1 (a) γ1′ (a) = (a, b) g(a, b) + f (a, b) (a, b). ∂x ∂x ∂x On procède de même pour la deuxième dérivée partielle. ∂f ∂f (0, 0) = (0, 0) = 0 , ∂x ∂y puisqu’on peut se ramener à ce cas en considérant la fonction auxiliaire :
Théorème 5
On traite le cas particulier où p = (0, 0) , f (0, 0) = 0 et
(h, k) �→ f (a + h, b + k) −
�
f (a, b) + h
�
∂f ∂f (a, b) + k (a, b) . ∂x ∂y
Comme U est ouvert, on peut trouver r > 0 tel que D(0, r) ⊂ U . On définit alors ε : U → IR par :
�f (x, y)� ε(x, y) = �(x, y)� 0
Par construction, on a ∀(x, y) ∈ U
si (x, y) �= (0, 0) si (x, y) = (0, 0).
�
�
f (x, y) = ε(x, y) �(x, y)� et il reste à montrer ε(z) −→ 0 . z→0
Soit δ > 0 . Par continuité des dérivées partielles de f , on peut trouver η > 0 tel que : ∀(s, t) ∈ U
� � �(s, t)� η =⇒
�
� � � ∂f � δ � (s, t)� ∂x
2
et
� � � � ∂f � δ . � (s, t)� ∂x
Quitte à réduire η , on peut supposer η < r . � � Soit maintenant (s, t) ∈ U tel que �(s, t)� η . Les segments joignant (s, t) à (0, t) et (0, t) à (0, 0) , respectivement, sont entièrement constitués de points (σ, τ ) tels � � que �(σ, τ )� η . Ainsi, ils sont inclus dans D(0, r) , et donc également dans U .
•
•
(s, t)
2
(0, t) (0, 0)
La fonction ϕ1 : σ �→ f (σ, t) est dérivable (sur un intervalle contenant 0 et s ) et sa ∂f dérivée σ �→ (σ, t) est de valeur absolue majorée par δ/2 . D’après l’inégalité des accrois∂x � � δ |s| · sements finis, on en déduit que ϕ1 est (δ/2) -lipschitzienne, d’où �f (s, t) − f (0, t)� 2 Pour les mêmes raisons, la fonction ϕ2 : τ �→ f (0, τ ) est (δ/2) -lipschitzienne sur un intervalle � � � � δ |t| · contenant 0 et t , donc �f (0, t)� = �f (0, t) − f (0, 0)� 2
1241
Chapitre 33. Fonctions de deux variables On en déduit que :
f (s, t) f (s, t) − f (0, t) + f (0, t) δ |s| + |t| δ (s, t), 2 en utilisant que |s| (s, t) et |t| (s, t) . Cela montre ε(s, t) δ , et conclut.
Proposition 7 • On a obtenu à la proposition 4 de la page 1229 que f + g admettait des dérivées partielles : ∂(f + g) ∂f ∂g = + ∂x ∂x ∂x
•
et
∂(f + g) ∂f ∂g = + · ∂y ∂y ∂y
La somme de deux fonctions continues étant continue, ces dérivées partielles sont continues, et l’on a bien f + g ∈ C 1 (U, IR) . De même, le produit f g admet des dérivées partielles : ∂(f g) ∂f ∂g = g+f ∂x ∂x ∂x
et
∂(f g) ∂f ∂g = g+f · ∂y ∂y ∂y
Les dérivées partielles apparaissant dans les termes de droite sont continues par opérations, et les fonctions f et g le sont en vertu du corollaire 6 de la page 1232. Par somme et produit, les ∂(f g) ∂(f g) dérivées partielles et sont donc continues, ce qui montre que f g ∈ C 1 (U, IR) . ∂x ∂y Proposition 8 On reprend les notations de la démonstration précédente. Supposons que f admette des dérivées partielles en p et que θ soit dérivable en f (p) . La composée θ ◦ f définit une application partielle : κ1 : D1 x
−→ �−→
IR (θ ◦ f )(x, b) = θ f (x, b) ,
de telle sorte que κ1 = θ ◦ ϕ1 . On en déduit que κ1 est dérivable en a et l’on obtient :
∂f ∂(θ ◦ f ) (a, b) = κ′1 (a) = θ′ ϕ1 (a) ϕ′1 (a) = θ′ f (a, b) (a, b). ∂x ∂x
∂(θ ◦ f ) ∂f = (θ′ ◦ f ) . ∂x ∂x Comme θ est de classe C 1 , la dérivée θ′ est continue. La fonction f étant continue d’après le corollaire 6 de la page 1232, on obtient que θ′ ◦ f est continue d’après la proposition 1 de la page 1226. ∂(θ ◦ f ) ∂f étant continue par hypothèse, on en déduit, par produit, que La dérivée partielle ∂x ∂x est continue. On procède alors exactement de même pour la deuxième dérivée partielle, ce qui conclut. On peut réécrire ce résultat comme une égalité de fonctions :
Théorème 9 Soit a ∈ I . Comme γ1 et γ2 sont dérivables en a , on peut trouver deux fonctions η1 et η2 : I → IR tendant vers 0 en a et telles que : ∀t ∈ I
γ1 (t) = γ1 (a) + (t − a) γ1′ (a) + (t − a) η1 (t) γ2 (t) = γ2 (a) + (t − a) γ2′ (a) + (t − a) η2 (t).
Posons p = γ(a) = γ1 (a), γ2 (a) , qui appartient à U . Le théorème 5 de la page 1231 donne une fonction ε : U → IR telle que ε(z) −→ 0 et : ∀(x, y) ∈ U
1242
z→p
f (x, y) = f (p) + x − γ1 (a)
∂f
∂x
(p) + y − γ2 (a)
∂f
∂y
(p) + ε(x, y) (x, y) − p.
Démonstrations Soit maintenant t ∈ I . On a :
�
�
�
f γ1 (t), γ2 (t) = f (p) + γ1 (t) − γ1 (a)
�
= f (p) + (t −
a) γ1′ (a)
�
� ∂f
∂x
�
(p) + γ2 (t) − γ2 (a)
+ (t − a) η1 (t)
� ∂f
∂x
(p)
+ (t − a) γ2′ (a) + (t − a) η2 (t)
= f (p) + (t − a)
�
γ1′ (a)
� ∂f
� ∂f
∂y
�
∂y
�
�
��
(p) + ε γ1 (t), γ2 (t) �γ(t) − p�
∂f ∂f (p) + γ2′ (a) (p) + (t − a) θ(t), ∂x ∂y
où l’on a défini la fonction : θ: I
−→
t
�−→
Montrons que ε(γ(t)) •
IR ∂f
�
�
�γ(t) − p� ∂f (p) η1 (t) + (p) η2 (t) + ε(γ(t)) ∂x ∂y t−a 0
� � �γ(t) − p� t−a
−→ 0 . t→a
�
�
�
�
�
si t �= a si t = a.
�
Pour tout (h, k) ∈ IR2 , on a �(h, k)� �(h, 0)� + �(0, k)� |h| + |k| par l’inégalité triangulaire, donc :
�� � � �γ(t) − p� � �� �� γ1 (t) − γ1 (a) �� �� γ2 (t) − γ2 (a) �� � �+� �. � �� � � � t−a t−a � t−a � �
Comme le terme de droite converge vers |γ1′ (a)| + |γ2′ (a)| , il est borné au voisinage de a , et il en va alors de même du terme de gauche. •
La proposition 2 de la page 1226 entraîne que ε(γ(t)) −→ 0 .
Par produit, on a donc ε(γ(t))
� � �γ(t) − p� t−a
t→a
−→ 0 . t→a
Puisque η1 et η2 tendent vers 0 en a , on en déduit que θ(t) −→ 0 . t→a
Cela montre que f ◦ γ : t �→ f (γ1 (t), γ2 (t)) est dérivable en a , de dérivée : (f ◦ γ)′ (a) = γ1′ (a)
∂f ∂f (p) + γ2′ (a) (p), ∂x ∂y
ce qui équivaut à la formule annoncée. On a donc montré l’égalité de fonctions : (f ◦ γ)′ =
� ∂f
∂x
◦γ
�
γ1′ +
�
∂f ◦γ ∂y
�
�
��
�
(p) + ε γ1 (t), γ2 (t) �γ(t) − p�
γ2′ .
La continuité des dérivées partielles et la proposition 2 de la page 1226 entraînent que les deux ∂f ∂f ◦ γ et ◦ γ sont continues, ce qui entraîne la continuité de (f ◦ γ)′ et montre fonctions ∂x ∂y que f ◦ γ ∈ C 1 (I, IR) .
1243
Chapitre 33. Fonctions de deux variables Proposition 10 •
Comme U est ouvert, on peut trouver r > 0 tel que D(p, r) ⊂ U .
Si v �= 0 , on a, pour tout t ∈ IR tel que |t|
cos(x)} .
33.2 Soit p = (a, b) ∈ IR2 et r > 0 . Montrer que la partie suivante (appelée disque fermé de centre p et de rayon r ) n’est pas un ouvert de IR2 :
→1224
A = z ∈ IR2 : �z − p� r . 33.3 1. Soit I un ensemble quelconque et (Ui )i∈I une famille d’ouverts de IR2 . Montrer que leur union Ui est un ouvert de IR2 . i∈I
2. Soit U et V deux ouverts de IR2 . Montrer que U ∩ V est un ouvert de IR2 .
3. Pour tout n ∈ IN∗ , on considère Un =
(x, y) ∈ IR2 : |y|
0 .
On a (0, 0) �∈ D(p, r) , car p − (0, 0) = r . Cela montre D(p, r) ⊂ IR2 \ {(0, 0)} .
3. Soit p = (a, b) ∈ ]0, 1[2 ; posons r = min{a, 1 − a, b, 1 − b} > 0 . Montrons D(p, r) ⊂ ]0, 1[2 . Soit z = (x, y) ∈ D(p, r) .
2
On a (x − a)2 (x − a)2 + (y − b)2 = (x, y) − (a, b) < r 2 , donc |x − a| < r par stricte croissance de la fonction racine carré, ce qui donne a − r < x < a + r .
En particulier, les inégalités r a et r 1 − a montrent : 0 a − r < x < a + r 1,
ce qui donne x ∈ ]0, 1[ . On montre de la même façon y ∈ ]0, 1[ , ce qui donne z ∈ ]0, 1[2 , et conclut.
4. Notons U = (x, y) ∈ IR2 : y > cos(x) ; soit p = (a, b) ∈ U . b − cos(a) > 0 . Par continuité de la fonc2 tion cosinus, on peut trouver η > 0 tel que : Notons ε =
∀x ∈ IR
ε
|x − a| η =⇒ cos(x) − cos(a) ε .
ε
Soit r = min{η, ε} > 0 . Montrons D(p, r) ⊂ U . Soit z = (x, y) ∈ D(p, r) .
Comme dans la question précédente, on obtient : |x − a| < r η
et
|y − b| < r ε.
En particulier, la première inégalité entraîne que cos(x) − cos(a) ε , ce qui donne :
y − cos(x) > (b − ε) − (cos(a) + ε) = b − cos(a) − 2ε 0,
et montre z ∈ U . 33.2 Considérons q = (a + r, b) .
Comme �q − p� = r , on a q ∈ A . On va montrer qu’aucun disque ouvert centré en q n’est inclus dans A . Soit s > 0 . Considérons le point z = (a + r + s/2, b) . • Comme �z − q� = s/2 < s , on a bien z ∈ D(q, s) .
• Comme �z − p� = r + s/2 > r , on a z �∈ A . Cela montre que le disque D(q, s) n’est pas inclus dans A , et conclut.
1248
s
r p
q
z
η
Solutions des exercices 33.3 1. Soit p ∈
�
i∈I
Ui . On peut donc trouver i0 ∈ I tel que p ∈ Ui0 .
Comme Ui0 est un ouvert de IR2 , on peut trouver r > 0 tel que D(p, r) ⊂ Ui0 .
A fortiori, on a donc D(p, r) ⊂
�
Ui , ce qui conclut.
i∈I
2. Soit p ∈ U ∩ V . On a donc p ∈ U et p ∈ V .
Comme U est ouvert, on peut trouver r ′ > 0 tel que D(p, r ′ ) ⊂ U . De même, on peut trouver r ′′ > 0 tel que D(p, r ′′ ) ⊂ U .
Posons r = min{r ′ , r ′′ } > 0 . On a donc les inclusions D(p, r) ⊂ D(p, r ′ ) ⊂ U et, de même, D(p, r) ⊂ D(p, r′′ ) ⊂ V , donc D(p, r) ⊂ U ∩ V , ce qui conclut. 3. On montre comme dans l’exemple 1 de la page 1224 que, pour tout a ∈ IR et tout b ∈ IR , les demi-plans :
�
(x, y) ∈ IR2 : y > a}
�
(x, y) ∈ IR2 : y < b}
et
sont des ouverts de IR2 . D’après la question précédente, il en va de même de leur intersection :
�
�
�
(x, y) ∈ IR2 : y > a} ∩ (x, y) ∈ IR2 : y < b} = (x, y) ∈ IR2 : a < y < b}.
En appliquant cette propriété à a = −
de IR2 . En revanche,
�
Un =
n∈IN∗
1 1 et b = , on obtient que Un est un ouvert n n
�
�
(x, 0) � x ∈ IR
montré dans l’exemple 3 de la page 1225.
�
n’est pas un ouvert de IR2 , comme on l’a
33.4 On trouve : ∀(a, b) ∈ IR × IR∗+
1 ∂f1 (a, b) = ∂x b
et
∂f1 a (a, b) = − 2 ; ∂y b
∀(a, b) ∈ IR∗+ × IR∗+
1 ∂f2 (a, b) = − 2 2 ∂x a b
∀(a, b) ∈ IR∗+ × IR∗+
∂f3 (a, b) = ln(ab) + 1 ∂x
∀(a, b) ∈ IR2
et
∂f2 2 (a, b) = − 3 ; ∂y ab et
∂f3 a (a, b) = ; ∂y b
∂f � 2 � � 2 � 4 −a 2 −a 2 ∂x (a, b) = 2a e cos a + b − e sin a + b � � ∂f4 (a, b) = 2b e−a cos a2 + b2 . ∂y
33.5 • L’application partielle ν1 : x �→ N (x, 0) = |x| n’étant pas dérivable en 0 , la fonction N n’admet pas de première dérivée partielle en 0 . Il en va de même pour la deuxième dérivée partielle. • L’application N 2 : (x, y) �→ x2 + y 2 appartient clairement à C 1 (IR2 , IR) , par opérations, avec : ∀(a, b) ∈ IR2
∂(N 2 ) (a, b) = 2a ∂x
�
Il s’ensuit que sa restriction à IR2 \ (0, 0) à valeurs dans IR∗+ .
�
et
∂(N 2 ) (a, b) = 2b. ∂y
est encore de classe C 1 . Elle est par ailleurs
1249
Chapitre 33. Fonctions de deux variables D’après la proposition 8 de la page 1233, la fonction racine carrée étant de classe C 1 √ sur IR∗+ , on en déduit que la restriction de N = N 2 à IR2 \ (0, 0) est de classe C 1 , avec :
∀(a, b) ∈ IR2 \ (0, 0)
a ∂N (a, b) = √ 2 ∂x a + b2
et
b ∂N (a, b) = √ · 2 ∂y a + b2
33.6 La fonction θ est de classe C 1 d’après la première règle de la chaîne. Pour tout t ∈ IR , on a :
θ′ (t) = 2t
∂f 2 3 ∂f 2 3 (t , t ) + 3t2 (t , t ). ∂x ∂y
33.7 1. On applique la deuxième règle de la chaîne aux fonctions ϕ : (x, y) �→ y et ψ : (x, y) �→ x . Ces fonctions étant de classe C 1 , on a u1 ∈ C 1 (IR2 , IR) . Pour tout (a, b) ∈ IR2 , on a :
∂ψ ∂ϕ (a, b) = (a, b) = 0 ∂x ∂y
et
∂ϕ ∂ψ (a, b) = (a, b) = 1, ∂y ∂x
donc :
∂ϕ ∂ψ ∂u1 ∂f ∂f ϕ(a, b), ψ(a, b) ϕ(a, b), ψ(a, b) (a, b) = (a, b) + (a, b) ∂x ∂x ∂x ∂y ∂x =
∂f (b, a). ∂y
De la même façon :
∂ϕ ∂ψ ∂u1 ∂f ∂f ϕ(a, b), ψ(a, b) ϕ(a, b), ψ(a, b) (a, b) = (a, b) + (a, b) ∂y ∂x ∂y ∂y ∂y =
∂f (b, a). ∂x
2. On applique la première règle de la chaîne à g : x �→ x (qui va jouer le rôle des deux fonctions g et h ). Puisque g est de classe C 1 , on a u2 ∈ C 1 (IR, IR) , et l’on a, pour tout a ∈ IR : u′2 (a) = =
∂f ∂f g(a), g(a) g ′ (a) + g(a), g(a) g ′ (a) ∂x ∂y ∂f ∂f (a, a) + (a, a). ∂x ∂y
Notons que l’on aurait pu également appliquer la proposition 10 de la page 1235 au point p = (0, 0) et au vecteur v = (1, 1) . 3. D’après l’exemple 10 de la page 1230 et la question précédente, on obtient que la fonction ψ : (x, y) �→ f (x, x) = u2 (x) est de classe C 1 et, pour tout (a, b) ∈ IR2 : ∂f ∂f ∂ψ (a, b) = u′2 (a) = (a, a) + (a, a) ∂x ∂x ∂y
1250
et
∂ψ (a, b) = 0. ∂y
Solutions des exercices La fonction ϕ : (x, y) �→ y étant également de classe C 1 , on peut appliquer la deuxième règle de la chaîne et obtenir que u3 ∈ C 1 (IR2 , IR) avec, pour tout (a, b) ∈ IR2 :
∂ϕ ∂ψ ∂f ∂f ∂u3 ϕ(a, b), ψ(a, b) ϕ(a, b), ψ(a, b) (a, b) = (a, b) + (a, b) ∂x ∂x ∂x ∂y ∂x
et
∂f = b, f (a, a) ∂y
∂f ∂f (a, a) + (a, a) ∂x ∂y
∂ϕ ∂ψ ∂f ∂f ∂u3 (a, b) = (a, b) + (a, b) ϕ(a, b), ψ(a, b) ϕ(a, b), ψ(a, b) ∂y ∂x ∂y ∂y ∂y =
∂f b, f (a, a) . ∂x
4. On applique la première règle de la chaîne à la fonction u3 et à g : x �→ x (qui joue le rôle des deux fonctions g et h ). On a donc u4 ∈ C 1 (IR, IR) et, pour tout a ∈ IR : u′4 (a) = =
∂u3 ∂u3 g(a), g(a) g ′ (a) + g(a), g(a) g ′ (a) ∂x ∂y ∂f a, f (a, a) ∂y
∂f ∂f (a, a) + (a, a) ∂x ∂y
33.8 1. • Notons g la restriction de f à l’ouvert IR2 \ (0, 0) 2
+
∂f a, f (a, a) . ∂x
de IR2 . En tant que quotient de
la fonction (x, y) �→ x y par la fonction ne s’annulant pas (x, y) �→ x4 + y 2 , toutes deux de classe C 1 , la fonction g est de classe C 1 . D’après la proposition 10 de la page 1235, la fonction g admet des dérivées en tout point de IR2 \ (0, 0) , selon tout vecteur. Or, pour tout p ∈ IR2 \ (0, 0) et
tout vecteur v ∈ IR2 , la fonction ϕv : t �→ f (p + t v) coïncide au voisinage de 0 avec t �→ g(p + t v) , dont on vient de rappeler qu’elle est dérivable en 0 . D’après le caractère local de la dérivabilité, on en déduit que ϕv est également dérivable en 0 . • Il reste à montrer que f admet des dérivées en (0, 0) selon tout vecteur. Soit v = (h, k) ∈ IR2 . ∗ Si h = 0 ou k = 0 , la fonction ϕv : t �→ f (t v) est identiquement nulle, donc dérivable en 0 . ∗ Supposons donc h �= 0 et k �= 0 . On a alors, pour tout t �= 0 : ϕv (t) − ϕv (0) h2 k h2 −→ = 2 4 , t t h + k2 t→0 k ce qui montre que ϕv est dérivable en 0 . 2. On procède comme dans l’exemple 8 de la page 1229. Pour tout t ∈ IR , on a : 2
f (t, t ) =
1/2 0
si t �= 0 si t = 0.
Comme les fonctions t �→ t et t �→ t2 sont continues, le fait que t �→ f t, t2 ne soit pas continue en 0 montre que f n’est pas continue en 0 , en utilisant la contraposée de la proposition 2 de la page 1226.
1251
Chapitre 33. Fonctions de deux variables 33.9 1. Soit (a, b) ∈ IR2 . On va montrer f (a, b) = f (0, 0) , ce qui conclura.
D’après la première règle de la chaîne, la fonction ϕ : t �→ f (ta, tb) est de classe C 1 , avec : ∀t ∈ IR
ϕ′ (t) =
∂f ∂f (ta, tb) a + (ta, tb) b = 0, ∂x ∂y
ce qui montre que ϕ est constante. En particulier, ϕ(1) = ϕ(0) , ce qui montre f (a, b) = f (0, 0) . 2. Soit U = IR∗ × IR ; définissons : f:
U
−→
(x, y)
�−→
IR
0 1
si x < 0 si x > 0.
Il est clair que la fonction f n’est pas constante. Pourtant, quel que soit p = (a, b) ∈ U , la fonction f est constante sur un disque centré ∂f ∂f en p , ce qui montre que (p) = (p) = 0 , c’est-à-dire ∇f (p) = 0 . ∂x ∂y 33.10 Le sens réciproque de cette équivalence est l’exemple 10 de la page 1230. ∂f = 0 et posons : Supposons maintenant ∂y h : IR x
−→ �−→
IR f (x, 0).
Cette fonction est de classe C 1 en vertu de la première règle de la chaîne. Il reste à montrer que : ∀(x, y) ∈ IR2
f (x, y) = h(x).
Soit (x, y) ∈ IR2 .
D’après la première règle de la chaîne (appliquée à la fonction constante g : t �→ x et à la fonction affine h : t �→ t ), la fonction : ϕ : IR t
−→ �−→
IR f (x, t)
est de classe C 1 sur un intervalle, et elle vérifie, pour tout b ∈ IR : ϕ′ (b) =
∂f ∂f g(b), h(b) g ′ (b) + g(b), h(b) h′ (b) = 0. ∂x ∂y =0
=0
On en déduit que ϕ est constante, donc ϕ(y) = ϕ(0) , d’où f (x, y) = f (x, 0) = h(x) . 33.11 1. D’après la deuxième règle de la chaîne, on a, pour tout (s, ω) ∈ IR2 :
∂f ∂f ∂g (s, ω) = s cos(ω), s sin(ω) cos(ω) + s cos(ω), s sin(ω) sin(ω) ∂r ∂x ∂y
1252
∂f ∂f ∂g (s, ω) = s cos(ω), s sin(ω) −s sin(ω) + s cos(ω), s sin(ω) s cos(ω) . ∂θ ∂x ∂y
Solutions des exercices 2. Montrons que f est radiale si, et seulement si, g est constante sur toutes les droites de la forme {r} × IR . • Supposons f radiale et soit r ∈ IR . ∗ Si r �= 0 , pour tout θ ∈ IR , les points r cos(0), r sin(0) et r cos(θ), r sin(θ) sont situés sur le même cercle centré en 0 , de rayon |r| . On en déduit :
g(r, θ) = f r cos(θ), r sin(θ) = f r cos(0), r sin(0) = g(r, 0). ∗ Si r = 0 , on a, pour tout θ ∈ IR :
g(0, θ) = f (0, 0) = g(0, 0). Dans tous les cas, on a montré que g était constante sur la droite {r} × IR . • Supposons que g soit constante sur toutes les droites de la forme {r} × IR . On en déduit que, pour tout r > 0 , la fonction θ �→ f r cos(θ), r sin(θ) est constante, c’est-à-dire que f est constante sur tous les cercles centrés en 0 , ce qui conclut la preuve de l’équivalence annoncée. D’après l’exercice 33.10 de la page 1246, on en déduit que f est radiale si, et seulement ∂g si, est la fonction nulle, et la question précédente conclut. ∂θ
33.12 La fonction f est homogène de poids k si, et seulement si, pour tout (a, b) ∈ IR2 \ (0, 0) , la fonction : ϕa,b : IR∗+ t
−→ �−→
IR t−k f (ta, tb)
est constante. Par multiplication et d’après la première règle de la chaîne, cette fonction est de classe C 1 sur l’intervalle IR∗+ . Sa constance est donc équivalente à l’annulation de sa dérivée.
Soit (a, b) ∈ IR2 \ (0, 0)
et t ∈ IR∗+ . D’après la première règle de la chaîne, on a :
ϕ′a,b (t) = −k t−k−1 f (ta, tb) + t−k
a
∂f ∂f (ta, tb) + b (ta, tb) . ∂x ∂y
Donc f est homogène de poids k si, et seulement si : 2
∀(a, b) ∈ IR \ (0, 0)
∀t ∈
IR∗+
∂f ∂f (ta, tb) + b (ta, tb) t a ∂x ∂y
= k f (ta, tb).
Cette condition est équivalente à la relation (E) de l’énoncé : dans le sens direct, on applique la condition précédente à t = 1 ; dans le sens réciproque, on applique la condition (E) à ta et tb .
1253
Chapitre 33. Fonctions de deux variables 33.13 1. Supposons que
∂f ∂f −2 = 0 . Posons : ∂x ∂y g:
IR2 (x, y)
−→ �−→
IR f (x + y, x − 2y).
Remarquons déjà que l’on a, pour quatre nombres réels x, y, ξ, η , l’équivalence :
�
x+y =ξ x − 2y = η
⇐⇒
x = 2ξ + η 3
y = ξ − η, 3
comme on le voit en résolvant le système linéaire. Cela nous permet d’exprimer à son tour f en fonction de g : ∀(x, y) ∈ IR2
f (x, y) = g
�
2x + y x − y , 3 3
�
.
La deuxième règle de la chaîne (appliquée aux fonctions affines ϕ : (x, y) �→ x + y et ψ : (x, y) �→ x − 2y , toutes deux de classe C 1 ) montre que g est de classe C 1 et donne notamment, pour tout (a, b) ∈ IR2 , la dérivée partielle :
� ∂ϕ � ∂ψ ∂g ∂f � ∂f � ϕ(a, b), ψ(a, b) ϕ(a, b), ψ(a, b) (a, b) = (a, b) + (a, b) ∂y ∂x ∂y ∂y ∂y =
� � ∂f � ∂f � ϕ(a, b), ψ(a, b) − 2 ϕ(a, b), ψ(a, b) = 0. ∂x ∂y
D’après l’exercice 33.10 de la page 1246, on peut trouver une fonction h1 ∈ C 1 (IR, IR) telle que, pour tout (x, y) ∈ IR2 , g(x, y) = h1 (x) . En posant h : x �→ h1 (x/3) (qui reste évidemment de classe C 1 ), on obtient : ∀(x, y) ∈ IR2
f (x, y) = g
�
2x + y x − y , 3 3
�
= h1
�
2x + y 3
�
= h(2x + y).
Réciproquement, si h ∈ C 1 (IR, IR) , la proposition 8 de la page 1233 montre que l’application g : (x, y) �→ h(2x + y) est de classe C 1 sur IR2 et que : ∀(a, b) ∈ IR2
� � ∂g ∂g (a, b) − 2 (a, b) = h′ (2a + b) × 2 − 2 h′ (2a + b) × 1 = 0. ∂x ∂y
2. La fonction g0 : (x, y) �→
x2 est de classe C 1 et vérifie : 2
∀(a, b) ∈ IR2
∂g0 (a, b) = a ∂x
et
∂g0 (a, b) = 0, ∂y
donc elle vérifie la condition de l’énoncé. Ainsi, par linéarité, une fonction g ∈ C 1 (IR2 , IR) vérifie la condition de l’énoncé si, et seulement si, la différence g − g0 vérifie la condition de la question précédente.
On en déduit que les fonctions cherchées sont exactement les fonctions de la forme : (x, y) �→ quand h décrit C 1 (IR, IR) .
1254
x2 + h(2x + y), 2
Solutions des exercices 33.14 1. On a ∀(a, b) ∈ IR2
∂f1 (a, b) = − sin(a) ∂x
∂f1 (a, b) = 2b, ∂y
et
�
�
�
donc les points critiques de f1 forment l’ensemble (k π, 0) � k ∈ ZZ . D’après le théorème 12 de la page 1238, les extrema locaux de f1 sont à chercher parmi ces points.
• Si k ∈ ZZ est pair, k π est un maximum local de la fonction cosinus. Le point (k π, 0) n’est alors ni un maximum local (car f1 (k π, ε) > f1 (k π, 0) pour tout ε > 0 ) ni un minimum local (car f1 (k π + ε, 0) < f (k π, 0) pour tout ε ∈ ]0, 2π[ ). Ce point critique n’est donc pas un extremum local. • Si k ∈ ZZ est impair, on a f (k π, 0) = −1 . Or, pour tout (x, y) ∈ IR2 , on a f1 (x, y) = cos(x) + y 2 −1 , donc ce point critique est un minimum global.
2. On a : ∀(a, b) ∈ IR2
∂f2 (a, b) = 3 e3a b2 + ea b ∂x
Soit (a, b) un point critique de f . On a
et
∂f2 (a, b) ∂x
∂f2 (a, b) = 2 e3a b + ea . ∂y
�
�
= b 3 e3a b + ea , donc b = 0
ou 3 e3a b + ea . Dans les deux cas, c’est contradictoire avec l’égalité 2 e3a b + ea = 0 (dans le deuxième cas, par soustraction, on aurait également b = 0 ). On en déduit que f2 n’a pas de point critique, et donc pas d’extremum global. 3. On a : ∀(a, b) ∈ IR2
∂f3 (a, b) = 6a − 2b − 8 ∂x
∂f3 (a, b) = −2a + 6b + 8. ∂y
et
Après résolution du système linéaire, on trouve un seul point critique : (1, −1) , en lequel la fonction vaut −8 . Pour tout (h, k) ∈ IR2 , on a alors après calcul : f3 (1 + h, −1 + k) + 8 = 3h2 − 2hk + 3k2 . On peut mettre cette expression sous forme canonique :
�
f3 (1 + h, −1 + k) + 8 = 3 h − d’où l’on déduit que : ∀(h, k) ∈ IR2
k 3
�2
+
8 2 k 0, 3
f3 (1 + h, −1 + k) f (1, −1)
et f3 admet donc un minimum en son unique point critique (1, −1) .
4. On a :
∀(a, b) ∈ IR2
� � ∂f4 ∂x (a, b) = Arctan(b) exp a Arctan(b) ∂f4 (a, b) = ∂y
� � a exp a Arctan(b) . 2 1+b
On en déduit facilement que le seul point critique de f4 est l’origine (avec f4 (0, 0) = 1 ). Or, pour tout (a, b) ∈ IR2 , on voit que f4 (a, b) − 1 est du même signe que a Arctan(b) , c’est-à-dire du signe de a b . On en déduit que l’origine n’est pas un extremum local. La fonction f4 n’a donc pas d’extremum local.
1255
Chapitre 33. Fonctions de deux variables 33.15 1. D’après l’exemple 10 de la page 1230, les fonctions (x, y) �→ x , (x, y) �→ ex , etc. sont toutes de classe C 1 . D’après la proposition 7 de la page 1232, il en va de même de f . Pour tout (a, b) ∈ IR2 , on calcule les dérivées partielles : ∂f (a, b) = eb + b ea ∂x
et
∂f (a, b) = a eb + ea . ∂y
Un point critique (a, b) doit donc vérifier eb + b ea = a eb + ea = 0 , d’où l’on déduit : 0 = a eb + a b ea = a b ea − ea = (a b − 1)ea , d’où l’on tire b = 1/a , puis ea + a e1/a = 0 . Or, la fonction h : t �→ et + t e1/t s’annule en −1 , est manifestement strictement positive sur IR∗+ , et sa dérivée : h′ : t �→ et + e1/t −
1 1/t e t
est strictement positive sur IR∗− , ce qui montre que h est strictement croissante sur IR∗− .
Ainsi, l’unique point d’annulation de h est en −1 .
∂f ∂f (−1, −1) = (−1, −1) = 0 , on obtient ∂x ∂y que (−1, −1) est le seul point critique de f . Comme il est par ailleurs clair que
2. Pour t ∈ IR , posons :
t
ϕ(t) = f (t, t) = 2t et ϕ
ψ(t) = f (t, −1) = t e−1 − et ainsi que α = f (−1, −1) = ϕ(−1) = ψ(−1) .
−∞
−1
+∞
α α
ψ
Une étude rapide des fonctions ϕ et ψ donne les variations ci-contre. Ainsi : • la fonction ϕ prend des valeurs strictement supérieures à ϕ(−1) en des points arbitrairement proches de −1 , ce qui montre que ϕ n’admet pas de maximum local en −1 . A fortiori, f n’admet pas de maximum local en (−1, −1) ; • la fonction ψ prend des valeurs strictement inférieures à ψ(−1) en des points arbitrairement proches de −1 , ce qui montre que ψ n’admet pas de minimum local en −1 . A fortiori, f n’admet pas de minimum local en (−1, −1) . L’unique point critique de f n’étant pas un extremum local, on en déduit que f n’a pas d’extremum local, en vertu du théorème 12 de la page 1238.
33.16 Soit p un point critique de f . Soit q ∈ IR2 et posons v = q − p . D’après la première règle de la chaîne, la fonction : ϕ : IR x
−→ �−→
IR f (p + t v)
est de classe C 1 , avec : ∀t ∈ IR
1256
ϕ′ (t) = ( ∇f (p + t v) | v ).
Solutions des exercices En particulier, pour tout t > 0 , on a : 1 ( ∇f (p + t v) | t v ) t 1 = ∇f (p + t v) − ∇f (p) (p + t v) − p 0. t
ϕ′ (t) =
On en déduit que la fonction ϕ est croissante sur IR+ , d’où f (p) = ϕ(0) ϕ(1) = f (q) . Cela étant valable pour tout q ∈ IR , on en déduit que p est un minimum de f . 33.17 1. La fonction f est de classe C 1 par opérations et l’on a, pour tout (a, b) ∈ IR2 : ∂f (a, b) = 8a3 − 6ab ∂x
et
∂f (a, b) = 2b − 3a2 . ∂y
• Ces formules montrent déjà clairement que (0, 0) est un point critique de f . ∂f • Réciproquement, soit (a, b) ∈ IR2 un point critique de f . Comme (a, b) = 2b−3a2 , ∂y 3 on obtient b = a2 . On a alors : 2
∂f ∂f 3 (a, b) = a, a2 = −a3 , ∂x ∂x 2 donc a = 0 , d’où l’on tire b = 0 . L’origine (0, 0) est donc bien le seul point critique de f . • La fonction t �→ f (0, t) = t2 est strictement positive sur IR∗+ , donc f n’admet pas de maximum, même local, en (0, 0) . 2. Soit v = (h, k) ∈ IR2 . On a f (tv) = (tk − t2 h2 )(tk − 2t2 h2 ) . Remarquons que f (0) = 0 . • Si k �= 0 , on a f (tv) ∼ t2 k2 , donc t �→ f (tv) est positive au voisinage de 0 . t→0
• Si k = 0 , on a f (tv) = 2t4 h4 0 .
Dans tous les cas, on obtient que t �→ f (tv) admet en 0 un minimum local.
3. Considérons λ ∈ ]1, 2[ et θ : t �→ f (t, λt2 ) . Pour tout t ∈ IR∗ , on a :
f (t, λt2 ) = (λt2 − t2 )(λt2 − 2t2 ) = (λ − 1)(λ − 2) t4 < 0,