312 9 2MB
French Pages 241 [240] Year 2010
CALCUL DIFFÉRENTIEL ET ÉQUATIONS DIFFÉRENTIELLES Exercices et problèmes corrigés
Dominique Azé, Guillaume Constans, Jean-Babtiste Hiriart-Urruty Collection dirigée par Daniel Guin
17, avenue du Hoggar Parc d’activités de Courtabœuf, BP 112 91944 Les Ulis Cedex A, France
Illustration de couverture : Transfert à faible poussée d’un satellite vers une orbite géostationnaire, par J.-B. Caillau, J. Gergaud et J. Noailles (ENSEEIHTToulouse).
Imprimé en France
ISBN : 978-2-7598-0413-9 Tous droits de traduction, d’adaptation et de reproduction par tous procédés réservés pour tous pays. Toute reproduction ou représentation intégrale ou partielle, par quelque procédé que ce soit, des pages publiées dans le présent ouvrage, faite sans l’autorisation de l’éditeur est illicite et constitue une contrefaçon. Seules sont autorisées, d’une part, les reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective, et d’autre part, les courtes citations justifiées par le caractère scientifique ou d’information de l’œuvre dans laquelle elles sont incorporées (art. L. 122-4, L. 122-5 et L. 335-2 du Code de la propriété intellectuelle). Des photocopies payantes peuvent être réalisées avec l’accord de l’éditeur. S’adresser au : Centre français d’exploitation du droit de copie, 3, rue Hautefeuille, 75006 Paris. Tél. : 01 43 26 95 35. c 2010, EDP Sciences, 17, avenue du Hoggar, BP 112, Parc d’activités de Courtabœuf, 91944 Les Ulis Cedex A
TABLE DES MATIÈRES
Avant-Propos
vii
Abréviations et Notations 1
Énoncés 1.1 Calcul différentiel sur des espaces de matrices. Transformation de Legendre-Fenchel . . . . . . . . . . . . . . . . . . . . . . . 1.2 Caractérisation d’un opérateur gradient (lemme de Poincaré) 1.3 Convexité et différentiabilité . . . . . . . . . . . . . . . . . . 1.4 Un théorème de Rolle approché. Différentiation d’applications radiales. Un système différentiel linéaire . . . . . . . . . . . . 1.5 Différentielle d’une fonctionnelle intégrale. Calcul différentiel sur des fonctions à valeurs matricielles . . . . . . . . . . . . . 1.6 Opérateurs de Nemycki . . . . . . . . . . . . . . . . . . . . . 1.7 Différentiabilité (et caractère C 1 ) via les différentielles partielles. Calcul différentiel (basique, Théorème des accroissements finis) . . . . . . . . . . . . . . . . . . . . 1.8 Dérivée de t −→ exp((1 − t)A) exp(tB). Formules de Taylor sur la fonction déterminant. Conditions d’extrémalité du deuxième ordre sur un espace de Hilbert . . . . . . . . . . 1.9 Conditions nécessaires d’optimalité du premier ordre en l’absence de différentiabilité . . . . . . . . . . . . . . . . . 1.10 Méthode de descente le long du gradient . . . . . . . . . . . 1.11 Conditions nécessaires d’optimalité en présence de contraintes d’inégalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.12 Différentielle de Gâteaux. Multiplicateurs de Lagrange . . . .
xi 1 . .
1 3 5
.
7
. 9 . 11
. 12
. 13 . 16 . 18 . 20 . 23
Calcul différentiel et équations différentielles
iv
1.13
Minimisation d’une fonction convexe sous une contrainte d’inégalité convexe . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.14
Minimisation d’une fonction convexe sur un polyèdre convexe de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.15
Détermination et nature des points critiques d’une fonction. Différentiation de l’application exponentielle . . . . . . . . . . 29
1.16
Calcul différentiel d’ordre supérieur. Différentielle d’ordre 2 d’une application composée . . . . . . . . . . . . . . . . . . . . 31
1.17
Résolution d’équations par la méthode de Newton I . . . . . . 33
1.18
Résolution de l’équation f (x) = 0 par la méthode de Newton II. Minimisation d’une fonction convexe par la méthode du gradient . . . . . . . . . . . . . . . . . . . . 35
1.19
Un théorème de Rolle pour les fonctions à valeurs vectorielles. Un problème de maximisation. Sensibilité des racines simples d’un polynôme . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.20
Conditions d’optimalité exprimées à l’aide du cône tangent à l’ensemble des contraintes. Applications à un problème variationnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.21
Problème variationnel de minimisation d’une fonctionnelle du Calcul des variations . . . . . . . . . . . . . . . . . . . . . . 43
1.22
Calcul différentiel d’ordre 2 sur un espace de matrices. Surjectivité de la normale unitaire à une hypersurface compacte de Rn . Ensemble des solutions possibles d’une équation différentielle scalaire linéaire d’ordre n . . . . . 45
1.23
Descente continue le long du gradient. Projection sur une surface de R3 . . . . . . . . . . . . . . . . . . . . . . . 47
1.24
Une surface conique de R3 . Monotonie des solutions d’équations différentielles scalaires autonomes. Une équation différentielle vectorielle linéaire . . . . . . . . . . . . . . . . . . 49
1.25
Un problème aux limites par le Théorème des fonctions implicites. Équations différentielles linéaires à coefficients périodiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
1.26
Du Théorème des fonctions implicites au Théorème de Cauchy-Lipschitz . . . . . . . . . . . . . . . . . . . . . . . . 53
1.27
Intégrales premières. Utilisation du Théorème des fonctions implicites. Une équation aux dérivées partielles . . . . . . . . . 54
Table des matières
1.28
1.29 1.30
1.31 1.32
1.33
1.34
1.35 1.36
2
Différentiabilité de la fonction distance à un ensemble. Une équation différentielle scalaire non linéaire du deuxième ordre. Système différentiel linéaire où les valeurs propres de A(t) ne dépendent pas de t . . . . . . . . . . . . . . . . . . Équations différentielles scalaires. Équation différentielle vectorielle linéaire à coefficients périodiques . . . . . . . . . . . Distance de l’origine à une courbe de R3 . Comportement asymptotique des solutions d’une équation différentielle scalaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Équation différentielle y = xy 2 . Comportement asymptotique des solutions d’une équation différentielle linéaire vectorielle Formule de Thermodynamique sur les dérivées partielles. Équation différentielle x = t sin x. Équation différentielle linéaire à coefficients périodiques . . . . . . . . . . . . . . . . . Équations différentielles non linéaires. Comportement asymptotique des solutions d’une équation différentielle linéaire sous la condition de Liapounov . . . . . . . . . . . . . Une équation différentielle scalaire autonome. Calcul de la hauteur d’une courbe. Différentiation de la fonction déterminant . . . . . . . . . . . . . . . . . . . . . . . . . . . . Équations différentielles avec retard . . . . . . . . . . . . . . . Méthodes d’approximation de solutions d’équations différentielles . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Solutions 2.1 Calcul différentiel sur des espaces de matrices. Transformation de Legendre-Fenchel . . . . . . . . . . . . . . . . . . . . . . . 2.2 Caractérisation d’un opérateur gradient (lemme de Poincaré) 2.3 Convexité et différentiabilité . . . . . . . . . . . . . . . . . . 2.4 Un théorème de Rolle approché. Différentiation d’applications radiales. Un système différentiel linéaire . . . . . . . . . . . . 2.5 Différentielle d’une fonctionnelle intégrale. Calcul différentiel sur des fonctions à valeurs matricielles . . . . . . . . . . . . . 2.6 Opérateurs de Nemycki . . . . . . . . . . . . . . . . . . . . . 2.7 Différentiabilité (et caractère C 1 ) via les différentielles partielles. Calcul différentiel (basique, Théorème des accroissements finis) . . . . . . . . . . . . . . . . . . . . 2.8 Dérivée de t −→ exp((1 − t)A) exp(tB). Formules de Taylor sur la fonction déterminant. Conditions d’extrémalité du deuxième ordre sur un espace de Hilbert . . . . . . . . . .
56 59
60 63
65
68
70 72 74 77
. 77 82 . 85 . 88 . 92 . 98
. 99
. 104 v
Calcul différentiel et équations différentielles
2.9 2.10 2.11 2.12 2.13 2.14 2.15 2.16 2.17 2.18
2.19
2.20
2.21 2.22
2.23 2.24
2.25
vi
Conditions nécessaires d’optimalité du premier ordre en l’absence de différentiabilité . . . . . . . . . . . . . . . . . Méthode de descente le long du gradient . . . . . . . . . . . Conditions nécessaires d’optimalité en présence de contraintes d’inégalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . Différentielle de Gâteaux. Multiplicateurs de Lagrange . . . . Minimisation d’une fonction convexe sous une contrainte d’inégalité convexe . . . . . . . . . . . . . . . . . . . . . . . . Minimisation d’une fonction convexe sur un polyèdre convexe de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Détermination et nature des points critiques d’une fonction. Différentiation de l’application exponentielle . . . . . . . . . Calcul différentiel d’ordre supérieur. Différentielle d’ordre 2 d’une application composée . . . . . . . . . . . . . . . . . . . Résolution d’équations par la méthode de Newton I . . . . . Résolution de l’équation f (x) = 0 par la méthode de Newton II. Minimisation d’une fonction convexe par la méthode du gradient . . . . . . . . . . . . . . . . . . . Un théorème de Rolle pour les fonctions à valeurs vectorielles. Un problème de maximisation. Sensibilité des racines simples d’un polynôme . . . . . . . . . . . . . . . . . . . . . . . . . . Conditions d’optimalité exprimées à l’aide du cône tangent à l’ensemble des contraintes. Applications à un problème variationnel . . . . . . . . . . . . . . . . . . . . . . . . . . . Problème variationnel de minimisation d’une fonctionnelle du Calcul des variations . . . . . . . . . . . . . . . . . . . . . Calcul différentiel d’ordre 2 sur un espace de matrices. Surjectivité de la normale unitaire à une hypersurface compacte de Rn . Ensemble des solutions possibles d’une équation différentielle scalaire linéaire d’ordre n . . . . Descente continue le long du gradient. Projection sur une surface de R3 . . . . . . . . . . . . . . . . . . . . . . Une surface conique de R3 . Monotonie des solutions d’équations différentielles scalaires autonomes. Une équation différentielle vectorielle linéaire . . . . . . . . . . . . . . . . . Un problème aux limites par le Théorème des fonctions implicites. Équations différentielles linéaires à coefficients périodiques . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. 110 . 112 . 116 . 119 . 122 . 126 . 132 . 136 . 140
. 144
. 147
. 153 . 158
. 163 . 166
. 170
. 174
Table des matières
2.26 2.27 2.28
2.29 2.30
2.31 2.32
2.33
2.34
2.35 2.36
Du Théorème des fonctions implicites au Théorème de Cauchy-Lipschitz . . . . . . . . . . . . . . . . . . . . . . . . Intégrales premières. Utilisation du Théorème des fonctions implicites. Une équation aux dérivées partielles . . . . . . . . . Différentiabilité de la fonction distance à un ensemble. Une équation différentielle scalaire non linéaire du deuxième ordre. Système différentiel linéaire où les valeurs propres de A(t) ne dépendent pas de t . . . . . . . . . . . . . . . . . . Équations différentielles scalaires. Équation différentielle vectorielle linéaire à coefficients périodiques . . . . . . . . . . . Distance de l’origine à une courbe de R3 . Comportement asymptotique des solutions d’une équation différentielle scalaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Équation différentielle y = xy 2 . Comportement asymptotique des solutions d’une équation différentielle linéaire vectorielle Formule de Thermodynamique sur les dérivées partielles. Équation différentielle x = t sin x. Équation différentielle linéaire à coefficients périodiques . . . . . . . . . . . . . . . . . Équations différentielles non linéaires. Comportement asymptotique des solutions d’une équation différentielle linéaire sous la condition de Liapounov . . . . . . . . . . . . . Une équation différentielle scalaire autonome. Calcul de la hauteur d’une courbe. Différentiation de la fonction déterminant . . . . . . . . . . . . . . . . . . . . . . . . . . . . Équations différentielles avec retard . . . . . . . . . . . . . . . Méthodes d’approximation de solutions d’équations différentielles . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliographie
178 180
184 189
191 195
200
205
207 214 218 223
vii
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
AVANT-PROPOS
Le module d’enseignement intitulé « calcul différentiel-équations différentielles » figure dans les formations de mathématiques au niveau L3 des licences de mathématiques. Il a la réputation d’être difficile, de manière injustifiée nous semble-t-il, car il est certainement moins abstrait que la Topologie générale ou la Théorie de la mesure enseignées au même niveau, et possède un aspect « mathématiques qui fonctionnent » qui fait son attrait et qu’il s’agit d’exploiter. Le présent ouvrage s’adresse aux étudiants. C’est un recueil de devoirs, au sens premier de ce vocable, c’est-à-dire de travaux à effectuer, en temps limité ou chez soi, seul ou à plusieurs. Les devoirs –du moins lorsqu’on n’abandonne pas trop vite devant les difficultés– ont pour objectif de faire progresser dans la maîtrise du savoir et du savoir-faire qui vont avec le sujet ; bref, ici comme dans les autres modules, « on progresse en mathématiques en faisant. . . » La plupart des problèmes et exercices proposés sont originaux (mentionnons a contrario l’exercice 2 de 1.19 pris dans [12], 1.35 issu de [14] et de parties de 1.18 et de 1.27 adaptées de [5]). La durée estimée pour la plupart des devoirs proposés est de 3 heures. Certes, nous avons renoncé à ces devoirs à l’ancienne constitués d’un long problème en plusieurs parties, culminant en un résultat tangible de synthèse ; il s’agira davantage pour nous d’un ensemble de deux ou trois exercices indépendants, traitant de chapitres différents du programme. Les thèmes traités suivent grosso modo le déroulement d’un programme standard de module « Calcul différentiel-Équations différentielles » (cf. infra), avec au fur et à mesure qu’on avance, un retour sur les chapitres passés, bref une progression en spirale qui nous est chère, plutôt qu’une progression linéaire. La plupart –sinon tous– les devoirs proposés dans le présent recueil ont été posés durant les dix dernières années sous forme d’examens intermédiaires ou terminaux en temps limité, ou à rendre rédigés après y avoir travaillé chez soi. Ils ont parfois été reconstitués ou légèrement modifiés, ce qui a inévitablement introduit des perturbations voire de légères erreurs. Voyons avec quelques commentaires le programme couvert.
Calcul différentiel et équations différentielles
Calcul différentiel. Dans certaines universités, ce thème fait seul l’objet d’un module séparé en licence de mathématiques. Le calcul différentiel est né au xviie siècle de la nécessité de résoudre des problèmes d’optimisation (ou d’extremum selon une terminologie plus ancienne) ; la forme élaborée qui est présentée dès les premiers chapitres du programme date de la fin du xixe siècle et du début du xxe . – Fonctions différentiables. Différentiation de fonctions composées. Différentielles partielles. – Théorème des accroissements finis ou des valeurs moyennes. Suites et séries de fonctions différentiables. – Différentielles d’ordre supérieur ; fonctions de classe C p . Formules de Taylor. La différentiation des fonctions de deux ou trois variables, vue en premier cycle universitaire, est une aide importante dans l’assimilation de ce qui n’en est qu’une généralisation. Ne pas sous-estimer la difficulté, réelle, qu’engendre la notion de différentielle d’ordre supérieur (d’ordre deux en fait). Dans « calcul différentiel » il y a « calcul »..., on attend donc de l’étudiantlecteur qu’il ne soit pas dérouté dès que des calculs lui sont proposés. – Théorèmes d’inversion locale, des fonctions implicites. Applications aux conditions d’optimalité du premier et du deuxième ordre : problèmes d’optimisation sans contrainte, problèmes avec contraintes du type égalité (dans ce cas, conditions du premier ordre uniquement), Théorème des multiplicateurs de Lagrange. – Introduction aux sous-variétés de Rn (cas particulier des courbes de R2 et R3 , et des surfaces de R3 ). Sous-espace (vectoriel, affine) tangent, normal. représentations locales par des équations ou des paramétrisations. – Introduction aux problèmes variationnels. C’est typiquement du calcul différentiel sur des fonctions exprimées sous forme d’intégrales. On se permet d’insister par le biais de quelques exercices ; en effet, à partir d’exemples modélisant des situations d’applications (en Mécanique, Physique), on montre comment les concepts et résultats acquis permettent de résoudre des problèmes posés ou, à défaut, de mieux les cerner. – Équations différentielles. – Théorèmes de Cauchy-Lipschitz, solutions maximales, dépendance des conditions initiales et des paramètres, intégrales premières. x
Avant-Propos
– Équations différentielles vectorielles linéaires (ou systèmes différentiels). Résolvantes. Wronskien. – Méthode de variation des constantes ; équations différentielles linéaires scalaires à coefficients constants. Voilà un domaine où l’on peut être touffu et prolixe à l’excès. Nous mettons l’accent sur deux points : les équations différentielles vectorielles sont posées dans R2 ou R3 , rarement au-delà, jamais en dimension infinie ; nous insistons volontairement sur les équations différentielles linéaires, pas seulement parce que la théorie et les calculs y sont plus agréables et complets, mais aussi en raison de leur importance dans l’approximation du non-linéaire. Pour cette partie, nous pensons qu’une connaissance des équations différentielles, telles que présentées dans un bon cours de Mathématiques spéciales, est un objectif amplement suffisant. – Introduction à l’analyse numérique des équations différentielles. Cette partie du programme figure habituellement plutôt dans les cours d’Analyse numérique du même niveau de formation ; seuls deux devoirs sont proposés ici. Sur un semestre d’enseignement, la 1e partie (Calcul différentiel) occupe les deux tiers, la 2e partie le tiers restant. En volume horaire de cours magistral, il faut compter 36-40 heures pour couvrir ce programme ; quant aux séances dirigées d’exercices, un minimum de 45-50 heures est nécessaire. Cet ouvrage fut publié pour la première fois aux éditions Dunod en octobre 2002, mais il n’est plus disponible depuis 2007. Ainsi, pour répondre à une demande de collègues et étudiants, une nouvelle édition a été envisagée. Nous remercions les éditions EDP Sciences, notament notre collègue D. Guin (directeur de la collection Enseignement Sup-Mathématiques), d’avoir accueilli ce projet.
xi
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
ABRÉVIATIONS ET NOTATIONS
:= : égal par définition (utilisé de temps en temps). cf. : confer, signifie « se reporter à ». i.e. : id est, signifie « c’est-à-dire ». log ou ln : logarithme népérien. arctan : arctangente. tan : tangente. sinh (resp. cosh, tanh : sinus (resp. cosinus, tangente) hyperbolique. R+ ou R+ : ensemble des réels ≥ 0. ∗ R+ : ensemble des réels strictements positifs. ∗ ou R+ {1, · · · , n} ou [1, n] : ensemble des entiers compris entre 1 et n. t ↓ 0 (resp. t ↑ 0) t tend vers 0 par valeurs strictement positives (resp. strictement négatives). ¯ r) (resp. B(x, r)) : boule fermée (resp. ouverte) de centre x et de rayon r. B(x, ¯r (x) et Br (x). On utilisera aussi B idE ou IE : application identité de l’ensemble E. x(·) : fonction et application sont des appellations utilisées indifféremment ; ici la notation est pour suggérer que x est une fonction. f|A : restriction de l’application f : E −→ F à la partie A ⊂ E. ·, · ou (· | ·) : notation générique pour un produit scalaire ; ·, · est plus volontiers utilisé dans l’espace des matrices (de manière à distinguer ce qui est relatif aux matrices et aux vecteurs). Df (x) (resp. Dp f (x)) : pour une application f différentiable en x (resp. p fois différentiable en x), Df (x) (resp. Dp f (x)) désigne la différentielle première
Calcul différentiel et équations différentielles
(resp. p-ième) de f en x. Si la variable est réelle (et notée t), on utilise la notation f (t) (resp. f p (t)) pour la dérivée première (resp. p-ième) de f en t (ce sont des éléments de l’ensemble d’arrivée et non des applications linéaires). ∇f (x) : Si (H, ·, · ) est un espace de Hilbert et si f est différentiable en x, ∇f (x) désigne le vecteur gradient de f en x (dépendant donc du produit scalaire ·, · ). ∂f ou ∂i f (x) : (fonction) dérivée partielle de f : O ⊂ Rn −→ R par rapport ∂xi à la i-ème variable xi . Di f (x) : différentielle partielle par rapport à la i-ème variable. ∇2 f (x) : matrice Hessienne d’une fonction f : O ⊂ Rn −→ R deux fois différentiable en x. Jf (x) ou Jf (x) : matrice Jacobienne d’une application f : O ⊂ Rn −→ Rm différentiable en x. o(h) : notation générique pour désigner une fonction de h de la forme hε(h) avec limh→0 ε(h) = 0. ϕd (t) (resp. ϕg (t)) : dérivée à droite (resp. à gauche) de la fonction (de la variable réelle) ϕ. C 0 (I, E) ou C(I, E) espace normé E.
: ensemble des fonctions continues sur I à valeurs dans un
C p (I, E) : ensemble des fonctions p fois continûment dérivables sur I à valeurs dans un espace normé E. C 1 par morceaux sur [a, b] : qualification d’une fonction continue f : [a, b] −→ R telle qu’il existe a = x0 < x1 < · · · < xn = b telle que f soit la restriction d’une fonction de classe C 1 sur chaque [xi , xi+1 ]. Mm,n (R) : ensemble des matrices (m, n) (m lignes et n colonnes) à coefficients réels ; Mn (R) est une abréviation de Mn,n (R). [aij ]
: matrice dont le terme de i-ème ligne j-ème colonne est aij .
: sous-ensemble de Mn (R) constitué des matrices symétriques. Tr (A) ou tr (A) : trace de la matrice A ∈ Mn (R) i.e. Tr (A) = ni=1 aii .
Sn (R) AT
: matrice transposée de la matrice A ∈ Mm,n (R).
det(A) ou det A : déterminant de la matrice A ∈ Mn (R). cof (A) : matrice des cofacteurs de A ∈ Mm,n (R) (on dit aussi comatrice de A), i.e. celle dont le terme (i, j) est (−1)i+j det(Aij ), où Aij est la matrice obtenue en enlevant de A sa i-ème ligne et sa j-ème colonne. xiv
Abréviations et Notations
Vect (d1 , · · · , dq ) ou [d1 , · · · , dq ] teurs d1 , · · · , dq .
: sous-espace vectoriel engendré par les vec-
Sauf indication contraire Rn est muni de sa base canonique ; ainsi à A ∈ Mm,n (R) est canoniquement associée une application linéaire de Rn dans Rn . (R) est celui qui à x = (x1 , · · · , xn ) ∈ L’isomorphisme canonique de Rn dans M ⎛ n,1⎞ x1 ⎜ ⎟ Rn associe la matrice unicolonne u = ⎝ ... ⎠. On identifie alors Rn et Mn,1 (R) xn par cet isomorphisme. Si, par exemple, u et v sont des vecteurs de Rn , alors uv T T est la matrice (n, nn) de terme général ui vj alors que u v est la matrice (1, 1) (un scalaire donc) i=1 ui vi . L(E, F ) : ensemble des applications linéaires continues de l’espace normé E dans l’espace normé F ; L(E) est une abréviation pour L(E, E). Isom (E, F ) : ensemble des isomorphismes topologiques de l’espace normé E dans l’espace normé F ; Isom (E) est une abréviation pour Isom (E, E). Ln (E; F ) ou Ln (E n ; F ) E n dans F .
: ensemble des applications multilinéaires continues de
D’une manière générale, la règle est de se servir de notations d’un usage courant en Mathématiques et cohérentes à l’intérieur d’un même exercice.
xv
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
1 ÉNONCÉS
1.1. Calcul différentiel sur des espaces de matrices. Transformation de Legendre-Fenchel Durée : 3 heures EXERCICE 1 Soit E := Mm,n (R) structuré en espace euclidien grâce au produit scalaire (A, B) ∈ E × E → A, B := Tr (AT B). Pour une fonction f : U ⊂ E −→ R définie sur un ouvert U de E et différentiable en X ∈ U , on désigne par ∇f (X) le gradient de f en X (∇f (X) est donc une matrice ici). 1) Soit A fixé dans E et fA : E −→ R définie par X −→ fA (X) := Tr (AT X). Dire pourquoi fA est différentiable en tout X ∈ E et calculer ∇fA (X). 2) On suppose que m = n. Soit A ∈ E := Mn (R), soit U l’ensemble ouvert des matrices inversibles de E et soit gA : U ⊂ E −→ R définie par X −→ gA (X) := Tr (X −1 A). Montrer que gA est différentiable en tout X ∈ U et déterminer ∇gA (X). (On rappelle que l’application f1 : X ∈ U −→ f1 (X) := X −1 est différentiable sur U avec Df1 (X)H = −X −1 HX −1 pour tout X ∈ U et H ∈ E.) 3) Soit a ∈ Rn , U et E comme dans la question précédente et ha : U ⊂ E −→ R définie par X −→ ha (X) := X −1 a, a ,
Chapitre 1. Énoncés
où ., . désigne le produit scalaire canonique dans Rn . Montrer que ha est différentiable en tout X ∈ U et déterminer ∇ha (X). Au fur et à mesure qu’on avancera dans la résolution des questions posées, on vérifiera la cohérence des résultats obtenus en se référant au cas particulier où m = n = 1. EXERCICE 2 Soit (H, ., . ) un espace de Hilbert réel ; on note . la norme hilbertienne associée au produit scalaire ., . (c’est-à-dire . = ., . ). Soit f : H −→ R ⎧ ⎪ 12 (y2 − 1) si y ≥ 1, ⎨ définie par f (y) := ⎪ ⎩ 0 si y < 1. 1) a) Soit a ∈ H de norme égale à 1. Montrer que f n’est pas différentiable en a. b) Montrer que f est différentiable sur chacun des ouverts {y ∈ H : y < 1} et {y ∈ H : y > 1}. 2) a) On définit pour tout x ∈ H la fonction θx : y ∈ H −→ θx = x, y − f (y). Montrer que θx est majorée sur H et que sa borne supérieure sur H est dans R+ . Cela permet de définir la fonction g : x ∈ E −→ g(x) := sup {x, y − f (y)}. y∈H
Déterminer g(0). b) On désigne désormais par S la sphère-unité de H, c’est-à-dire S = {y ∈ H : y = 1}. Déterminer supy∈S {x, y − f (y)}. c) Montrer que si x > 1, alors supy∈H\S {x, y − f (y)} est atteint en un point que l’on précisera. En déduire la valeur de g(x) en fonction de x. d) Montrer que si 0 < x < 1, alors supy∈H {x, y − f (y)} est atteint en un point de S. Donner alors l’expression de g(x). 3) Montrer que g est de classe C 1 sur H \ {0}. Exprimer la différentielle h ∈ H −→ Dg(x)h de g en x ∈ H \ {0}. La fonction g est-elle deux fois différentiable en a ∈ S ? Indications : Noter la « symétrie sphérique » de f , cela aide grandement. La notion d’application de classe C 1 et celle d’application deux fois différentiable n’interviennent qu’à la toute dernière question. 2
1.2. Caractérisation d’un opérateur gradient (lemme de Poincaré)
1.2. Caractérisation d’un opérateur gradient (lemme de Poincaré) Durée : 3 heures Soit U un ouvert d’un espace de Banach E. On note E ∗ l’ensemble L(E, R) des formes linéaires continues sur E et l’on note pour ϕ ∈ E ∗ , x ∈ E, ϕ, x = ϕ(x). On dit que A ∈ L(E, E ∗ ) est symétrique si, pour tout u, v ∈ E on a Au, v = Av, u . On note C(U, E ∗ ) l’ensemble des applications continues de U dans E ∗ . Un élément f ∈ C(U, E ∗ ) est dit un opérateur gradient s’il existe une fonction F ∈ C 1 (U, R) telle que DF (x) = f (x) pour tout x ∈ U . On dit alors que F est une primitive de f . Dans la suite, on supposera que U est un ouvert convexe contenant l’origine. Étant donné f ∈ C 1 (U, E ∗ ), on considère les propriétés suivantes : i) f est un opérateur gradient. ii) Pour tout a ≤ b et pour toute application de classe C 1 par morceaux b f (x(t)), x (t) dt ne dépend que des valeurs x(b) et x : [a, b] → U , l’intégrale a
x(a).
iii) Pour tout x, y ∈ U , on a 1 1 (f (sy), y − f (sx), x ) ds = f (sy + (1 − s)x), y − x ds. 0
0
iv) Df (x) ∈ L(E, E ∗ ) est symétrique pour tout x ∈ U . 1) Montrez que i) implique ii). 2) Montrez que ii) implique iii). On pourra utiliser les deux chemins z1 (s) = sy + (1 − s)x, s ∈ [0, 1] et z2 (s) = (1 − s)x pour s ∈ [0, 1], z2 (s) = (s − 1)y pour s ∈ [1, 2]. 3) On suppose que iii) est vérifiée.
a) On pose, pour x ∈ U , F (x) =
1
f (sx), x ds. Montrez que pour tout
0
h ∈ E et pour tout τ ∈ R assez petit pour que x + τ h ∈ U , on a 1 f (x + sτ h), h ds F (x + τ h) − F (x) = τ 0
3
Chapitre 1. Énoncés
(utiliser iii)). En déduire que F (x + th) − F (x) = f (x), h . t→0 t lim
b) Soit h ∈ E tel que x + h ∈ U . On pose g(t) = F (x + th). Déduire de a) que g est de classe C 1 sur [0, 1] et que g (t) = f (x + th), h . En déduire que l’on a 1 f (x + sh) − f (x), h ds F (x + h) − F (x) − f (x), h = 0
et que F est de classe C 1 avec DF = f . En déduire alors que DF (x) est symétrique. 4) On suppose que iv) est vérifiée. On pose, pour tout x ∈ U 1 f (tx), x dt. F (x) = 0
a) Montrez que, pour x + h ∈ U , 1 1 f (tx + th), h dt + f (tx + th) − f (tx), x dt. F (x + h) − F (x) = 0
0
b) Montrez que 1 t 1 d f (tx + sh), x ds dt f (tx + th) − f (tx), x dt = 0 0 0 ds 1 t = Df (tx + sh)h, x ds dt 0 0 1 t Df (tx + sh)x, h ds dt = 0 0 1 1 = Df (tx + sh)x, h dt ds 0 s 1 f (x + sh) − f (sx + sh), h ds. = 0
(On justifiera soigneusement chaque étape du calcul.) c) Déduire de a) et b) que F (x + h) − F (x) =
1
f (x + sh), h ds,
0
puis que F est de classe C 1 sur U avec DF = f . 4
1.3. Convexité et différentiabilité
5) On suppose que E = Rn . Étant donnée une application f : U −→ Rn de classe C 1 définie sur un ouvert U ⊂ Rn , on introduit rot f : U −→ Mn (R) ∂fi ∂fj par ((rot f )(x))i,j = (x) − (x). Donner alors une condition nécessaire et ∂xj ∂xi suffisante (exprimée avec rot f ) pour que f soit un opérateur gradient dans le cas où U est convexe.
1.3. Convexité et différentiabilité Durée : 3 heures Dans la suite ., . désigne le produit scalaire usuel dans Rd et . la norme euclidienne associée. Soit f : Rd −→ R une fonction différentiable. On notera Df (x) ∈ L(Rd , R) sa différentielle en x ∈ Rd , et ∇f (x) ∈ Rd le gradient défini par ∇f (x), u = Df (x)(u) pour tout u ∈ Rd . On notera D 2 f (x) ∈ L2 (Rd ; R) la différentielle seconde de f et ∇2 f (x) ∈ Md (R) la matrice Hessienne, de telle sorte que D 2 f (x)(u, v) = ∇2 f (x)u, v . On dit qu’une fonction f : U −→ R définie sur une partie convexe U ⊂ Rd est convexe si pour tout x, y ∈ U et pour tout t ∈ [0, 1] on a f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y). 1) question préliminaire. Soit f : Rd −→ R une fonction continue telle que limx→+∞ f (x) = +∞. Montrez que f atteint son minimum sur Rd . (On pourra considérer a ∈ R tel que inf x∈Rd f (x) < a et r > 0 tel que f (y) ≥ a pour tout |y| ≥ r, et observer que inf x∈Rd f (x) = inf x≤r f (x).) 2) Soit U ⊂ Rd un ouvert convexe. a) Soit f : U −→ R une fonction convexe différentiable sur U . Montrer que l’on a f (y) ≥ f (x) + ∇f (x), y − x pour tout x, y ∈ U. (1.1) (On pourra considérer t−1 (f (x + t(y − x)) − f (x)) pour t ∈]0, 1].) b) On suppose qu’une fonction f : U −→ R différentiable sur U vérifie (1.1). Montrez que f est convexe. (On pourra écrire (1.1) avec x = xt = tx + (1 − t)y). 3) Soit U ⊂ Rd un ouvert convexe. a) Soit f : U −→ R une fonction convexe différentiable sur U . Montrer que l’on a ∇f (y) − ∇f (x), y − x ≥ 0 pour tout x, y ∈ U. (1.2) 5
Chapitre 1. Énoncés
b) Soit f : U −→ R une fonction de classe C 1 . Montrez que pour tout x, y ∈ U on a 1 f (y) − f (x) = ∇f (x + t(y − x)), y − x dt. (1.3) 0
En déduire que si f vérifie (1.2), alors f vérifie (1.1) et est convexe. 4) Soit U ⊂ Rd un ouvert convexe. a) Soit f : U −→ R une fonction convexe deux fois différentiable sur U . Montrer que l’on a ∇2 f (x)w, w ≥ 0 pour tout x ∈ U et w ∈ Rd .
(1.4)
(On pourra montrer, en utilisant (1.2), que la fonction t −→ ∇f (x + tw), w est définie et croissante sur un intervalle de la forme [−η, η], η > 0 et calculer sa dérivée en 0.) b) Soit f : U −→ R une fonction de classe C 2 vérifiant (1.4). Montrez, en utilisant un développement de Taylor, que f vérifie (1.1) puis que f est convexe. À titre d’exemple, en déduire que la fonction f : R∗+ × R∗+ :−→ R définie par f (x, y) = x log x + y log y − (x + y) log(x + y) est convexe sur R∗+ × R∗+ . 5) Soit f : Rd −→ R une fonction de classe C 1 . On suppose qu’il existe c > 0 tel que pour tout x, y ∈ U , t ∈ [0, 1], c f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y) − t(1 − t)x − y2 . 2
(1.5)
Montrez que f − 2c · 2 est convexe et que ∇f (y) − ∇f (x), y − x ≥ cy − x2 pour tout x, y ∈ U.
(1.6)
Montrez alors, en utilisant (1.3), que pour tout x, y ∈ U on a c f (y) − f (x) ≥ ∇f (x), y − x + y − x2 . 2 En déduire que limx→+∞ f (x) = +∞ et que f atteint son minimum en un unique x∗ ∈ Rd . 6
1.4. Un théorème de Rolle approché. Différentiation d’applications radiales...
1.4. Un théorème de Rolle approché. Différentiation d’applications radiales. Un système différentiel linéaire Durée : 3 heures EXERCICE 1 Considérons Rn muni du produit scalaire standard noté ·, · et de la norme asso¯ r) −→ R continue sur la boule fermée B(0, ¯ r) et différentiable ciée ·. Soit f : B(0, sur la boule ouverte B(0, r). On suppose qu’il existe ε > 0 tel que (H)
|f (x)| ≤ ε pour tout x vérifiant x = r.
On se propose de démontrer le résultat suivant : (C)
ε Il existe x ¯ ∈ B(0, r) tel que ∇f (¯ x) ≤ . r
1) Montrer sur un exemple que le résultat annoncé est optimal, au sens que l’on ne peut faire mieux que ε/r pour la majoration de ∇f (¯ x) dans l’énoncé (C). ¯ r) −→ R définie par On introduit la fonction auxiliaire g : B(0, f (x) 2 x2 . g(x) = 2 − r ε ¯ r) et que cette borne 2) a) Vérifier que g est bornée inférieurement sur B(0, g(x). inférieure est atteinte. On pose pour la suite μ = minx∈B(0,r) ¯ b) Vérifiez que μ ≤ 0. c) Montrer que g est différentiable sur B(0, r) et déterminer ∇g(x) pour x ∈ B(0, r). 3) On suppose μ = 0. a) Montrer que g(0) = f (0) = 0 et que
x |f (x)| ¯ r). ≤ pour tout x ∈ B(0, ε r
d ∇f (0), d ε ≤ pour tout d ∈ Rn , et que ∇f (0) ≤ . ε r r ¯ 4) On suppose μ < 0. Montrer que les x ¯ minimisant g sur B(0, r) sont nécessaiε rement dans B(0, r), et qu’en de tels points on a ∇f (¯ x) ≤ . r b) En déduire que
7
Chapitre 1. Énoncés
EXERCICE 2 1) Soit E un espace vectoriel normé réel et soit α : U −→ R une application différentiable de U , ouvert de E, dans R. Soit ϕ l’application de U dans E définie par x ∈ U −→ ϕ(x) = α(x)x. Montrer que ϕ est différentiable sur U et calculer sa différentielle en tout point de U . 2) On suppose ici que E est un espace de Hilbert, on note ·, · le produit scalaire sur E et · la norme associée. Soit U = E \ {0} et f : U −→ E définie par x ∈ U −→ f (x) =
x . x2
a) Déduire de la question précédente que f est différentiable sur U et donner l’expression de sa différentielle en tout point de U . b) Montrez que f est une bijection de U sur U . Montrez que f est un C ∞ difféomorphisme de U sur U . Déterminer [Df (x)]−1 ∈ Isom (E). EXERCICE 3 On considère le système différentiel suivant sur I =]0, +∞[ : ⎧ 1 2 ⎪ ⎪ ⎨x (t) = t x(t) − t2 y(t), (EDL)0 ⎪ ⎪ ⎩ y (t) = 2x(t). t . t t2
1 1) On pose M (t) =
2
a) Vérifier que M (t) est une matrice fondamentale de (EDL)0 . b) En déduire l’expression de la solution du problème de Cauchy suivant : ⎧ ⎪ ⎨(EDL)0 (C)
⎪ ⎩
x(t0 ) = x0 , y(t0 ) = y0 ,
où t0 ∈ I et (x0 , y0 ) ∈ R2 . On écrira le résultat sous la forme x(t) x == R 0 , t ∈]0, +∞[, y0 y(t) 8
1.5. Différentielle d’une fonctionnelle intégrale. Calcul différentiel...
où R est une matrice (dépendant de t et t0 ) que l’on écrira de la manière la plus simple et la plus lisible possible. 2) Résoudre le problème de Cauchy suivant ⎧ 1 2 ⎪ ⎪ ⎪x (t) = t x(t) − t2 y(t) + t ⎪ ⎪ ⎪ ⎪ ⎨ (Cc ) y (t) = 2x(t) + t2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ x(1) = 0, y(1) = 0.
1.5. Différentielle d’une fonctionnelle intégrale. Calcul différentiel sur des fonctions à valeurs matricielles Durée : 3 heures EXERCICE 1 Soit E := C [0, 1], R . Pour 1 ≤ p < +∞, on introduit 1 1 p |f (t)|p dt , f ∈ E −→ f p := 0
et, pour p = +∞, f ∈ E −→ f ∞ := max |f (t)|. t∈[0,1]
On rappelle que · p (1 ≤ p < +∞) et · ∞ sont des normes sur E. 1) Soient 1 ≤ p < +∞ et 1 ≤ q < +∞. Les normes · p et · q sontelles équivalentes ? Les normes .p et .∞ sont-elles équivalentes ? (Justifier vos réponses.) 2) Soit g ∈ E et Lg : E −→ R définie comme suit : 1 f ∈ E −→ Lg (f ) := f (t)g(t) dt. 0
Montrer que Lg est linéaire et continue de (E, .p ) dans R et déterminer sa norme Lg associée. 3) Soit J :=]α, β[ et ϕ : J −→ R une fonction de classe C 1 . On pose Ω = {f ∈ E : f (x) ∈ J pour tout x ∈ [0, 1]}, 1 ϕ[f (t)] dt. θ : f ∈ Ω −→ θ(f ) = 0
9
Chapitre 1. Énoncés
a) Montrer que Ω est un ouvert de (E, .∞ ). b) Montrer que θ est différentiable en tout point f de Ω et déterminer sa différentielle Dθ(f ) en f . c) On suppose à présent que J = R et ϕ est deux fois dérivable sur R. En supposant ϕ bornée sur J, montrer que θ est encore différentiable en f ∈ E lorsque E est muni de la norme .2 . EXERCICE 2 Soit E = Mn (C) et Ω l’ensemble des matrices inversibles de E. 1) Soit A : R −→ E une application différentiable et S : R −→ Ω une application de classe C 1 . On suppose : −1 (1.7) S(t) A(t)S(t) = A(0) pour tout t ∈ R. a) Indiquer pourquoi les valeurs propres de A(t) ne dépendent pas de t. b) Mettre en évidence une application continue B : R −→ E telle que : A (t) = A(t)B(t) − B(t)A(t) pour tout t ∈ R.
(1.8)
2) Soit A : R −→ E une application différentiable telle qu’il existe B : R −→ E continue vérifiant (1.8). On se propose de démontrer que les valeurs propres de A(t) ne dépendent pas de t. a) Préliminaires. Soit C ∈ E, dont les valeurs propres (complexes) sont notées λ1 , · · · , λn . Montrer : k
Tr (C ) =
n
λki pour tout k ∈ N∗ .
(1.9)
i=1
Soit C et D ∈ E telles que : Tr (C k ) = Tr (Dk ) pour tout k ∈ {1, · · · , n}.
(1.10)
Montrer qu’alors C et D ont les mêmes valeurs propres. Indication : penser aux identités de Newton et aux fonctions symétriques élémentaires des racines d’un polynôme. k b) Pour k ∈ N∗ calculer la dérivée de t −→ A(t) et en déduire que la trace k de A(t) est constante. Déduire alors le résultat escompté, à savoir : les valeurs propres de A(t) ne dépendent pas de t. 10
1.6. Opérateurs de Nemycki
1.6. Opérateurs de Nemycki Durée : 2 heures Soit X l’espace vectoriel des fonctions x : [a, b] −→ R continues sur [a, b], muni de la norme de la convergence uniforme sur [a, b] notée · ∞ . On se donne une fonction g : Ω −→ R définie sur un ouvert Ω de R × R contenant [a, b] × R et vérifiant les propriétés suivantes : (i) g est continue sur [a, b] × R ; (ii) Pour tout u ∈ [a, b], l’application partielle v −→ g(u, v) est dérivable en u ∂g (u, v), est uniformément continue sur [a, b] × R. et sa dérivée en v, notée ∂v On se donne également une fonction N : [a, b] × [a, b] −→ R supposée continue sur [a, b] × [a, b]. À chaque x ∈ X on associe la fonction notée F (x) et définie sur [a, b] comme suit : ∀t ∈ [a, b],
b
N (t, s)g(s, x(s)) ds.
[F (x)](t) := a
1) Vérifier que F (x) est continue sur [a, b]. 2) On se propose dans cette question de démontrer que l’application de X dans X qui à x associe F (x) est différentiable sur X, et de calculer sa différentielle en tout x0 ∈ X. Étant donné x0 ∈ X on pose Lx0 : h ∈ X −→ Lx0 (h), fonction qui à t associe [Lx0 (h)](t) :=
b
N (t, s) a
∂g (s, x0 (s))h(s) ds. ∂v
(a) Montrez que Lx0 est une application linéaire continue de X dans X. (b) Dire pourquoi on a ceci : pour tout s ∈ [a, b], il existe ϑ(s) ∈]0, 1[ tel que g(s, x0 (s) + h(s)) − g(s, x0 (s)) = h(s)
∂g (s, x0 (s) + ϑ(s)h(s)). ∂v 11
Chapitre 1. Énoncés
On pose pour alléger l’écriture α(s) = h(s)
∂g ∂g (s, x0 (s) + ϑ(s)h(s)) − h(s) (s, x0 (s)). ∂v ∂v
(c) Montrez que pour tout ε > 0, il existe δ > 0 tel que (h∞ ≤ δ) =⇒ (|α(s)| ≤ ε|h(s)| pour tout s ∈ [a, b]). En déduire que si h∞ ≤ δ : F (x0 + h) − F (x0 ) − Lx0 (h)∞ ≤ max |N (t, s)|ε(b − a)h∞ . s,t∈[a,b]
Conclusion ?
1.7. Différentiabilité (et caractère C 1 ) via les différentielles partielles. Calcul différentiel (basique, Théorème des accroissements finis) Durée : 3 heures EXERCICE 1 Pour f ∈ C 0 (R, R)), on note f 0 = supx∈R |f (x)|, et pour f ∈ C 1 (R, R), on pose f 1 = f 0 + f 0 . On considère E0 = {f ∈ C 0 (R, R) : f 0 < +∞} et E1 = {f ∈ C 1 (R, R) : f 1 < +∞}. (E0 , .0 ) et (E1 , .1 ) sont des espaces vectoriels normés réels. On définit Φ : E0 × R −→ R (f, x) −→ Φ(f, x) = f (x). 1) Vérifier que Φ est continue sur E0 × R. 2) a) Montrer que les différentielles partielles de Φ existent sur E1 × R et les calculer en (f0 , x0 ) ∈ E1 × R. b) Montrer que Φ est de classe C 1 sur E1 × R. c) Donner la différentielle de Φ en tout (f0 , x0 ) ∈ E1 × R. 12
1.8. Dérivée de t −→ exp((1 − t)A) exp(tB). Formules de Taylor sur la fonction...
EXERCICE 2 Soit H un espace de Hilbert dont le produit scalaire et la norme déduite sont notées ·, · et · respectivement. Soit g : H −→ H une application différentiable sur H telle qu’il existe k ∈]0, 1[ avec Dg(x) ≤ k pour tout x ∈ H (où · désigne la norme, déduite de · , des applications linéaires continues de H dans H). On pose f = idH + g. 1) a) Montrer : f (x) − f (y) ≥ (1 − k)x − y pour tout (x, y) ∈ H × H. En déduire que f est injective et que f (x) −→ +∞ quand x −→ +∞. b) Ayant indiqué pourquoi f est différentiable sur H, vérifier : Df (x)h, h ≥ (1 − k)h2 pour tout (x, h) ∈ H × H. 2) Soit y ∈ H fixé et u : H −→ R définie par : u(x) = f (x) − y2 pour tout x ∈ H. Montrer que u est différentiable sur H et calculer Du(x) en tout x ∈ H. 3) On suppose désormais que H est de dimension finie. a) Montrer qu’il existe x0 ∈ H tel que u(x0 ) = inf x∈H u(x). b) Montrer que f (x0 ) = y. c) Que peut-on en déduire pour f ?
1.8. Dérivée de t −→ exp((1 − t)A) exp(tB). Formules de Taylor sur la fonction déterminant. Conditions d’extrémalité du deuxième ordre sur un espace de Hilbert Durée : 4-5 heures EXERCICE 1 Soit A ∈ Mn (R), B ∈ Mn (R). On définit θ : R −→ Mn (R) t −→ θ(t) = e(1−t)A .etB 13
Chapitre 1. Énoncés
1) a) Montrer que θ est dérivable sur R et déterminer θ (t), t ∈ R. b) En déduire
e −e = A
B
1
e(1−t)A (A − B)etB dt.
(1.11)
0
2) Soit · une norme sur Mn (R) et B une partie bornée de Mn (R). Montrer qu’il existe L > 0 tel que eA − eB ≤ LA − B pour tout A, B dans B.
(1.12)
EXERCICE 2 Soit E = Mn (R), structuré en espace euclidien grâce au produit scalaire U, V = Tr (U T V ). On considère la fonction déterminant sur E, i.e. la fonction f : E −→ R qui à M ∈ E associe f (M ) = det M . 1) a) Montrer que pour tout M et N dans E, n 1 k D f (M ) (N, · · · , N ) . f (M + N ) = f (M ) + k! k=1
(1.13)
k fois
b) En déduire que pour tout A, B ∈ E : 1 1 Dn−p f (B) (A, · · · , A) = Dp f (A) (B, · · · , B) p! (n − p)! n−p fois
(1.14)
p fois
si p ∈ {1, · · · , n − 1} ; f (A) =
1 n D f (B) (A, · · · , A) . n!
(1.15)
n fois
En déduire que det A = o(An−1 ). 2) Applications. Dans ce qui suit cof A désigne la matrice des cofacteurs de A (appelée aussi comatrice de A). a) On suppose que n = 2. Montrez que pour tout A et B dans M2 (R),
14
cof A, B = cof B, A ,
(1.16)
det(A + B) = det A + cof A, B + det B.
(1.17)
1.8. Dérivée de t −→ exp((1 − t)A) exp(tB). Formules de Taylor sur la fonction...
b) On suppose que n = 3. Montrez que pour tout A et B dans M3 (R), det(A + B) = det A + cof A, B + cof B, A + det B.
(1.18)
c) Déterminer Dk f pour tout k ∈ N∗ , dans le cas où n = 2 ou n = 3. Indications : Pour la première question on pourra utiliser librement les résultats suivants : – Si f : X · · × X −→ R est multilinéaire continue, alors f est C ∞ . × · n fois
– Si f : Y −→ R est C ∞ et homogène de degré n (i.e. f (ty) = tn f (y) pour tout t ∈ R et y ∈ Y ), alors pour tout k ∈ {1, · · · , n}, D k f est homogène de degré n − k. – Pour obtenir (1.14) et (1.15), on pourra partir de (1.13) avec M = A et N = tB, où t ∈ R. EXERCICE 3
2 On considère l’espace vectoriel des suites de réels (xn )n≥1 telles que ∞ n=1 xn < +∞. On structure Een espace de Hilbert réel grâce au produit scalaire (x, y) ∈ E × E −→ x, y = +∞ n=1 xn yn . 1) Montrer que pour toute suite (xn )n≥1 élément de E, la série de terme général x2n − x3n est convergente. n On considère dorénavant l’application f : E −→ R définie par x = (xn )n≥1 ∈ E −→ f (x) :=
+∞ 2 x
n
n=1
n
− x3n .
2) a) Montrer que f est C ∞ sur E. b) Déterminer Df (x) en tout x ∈ E et vérifier que 0 est un point critique de f , c’est-à-dire Df (0) = 0. 3) a) Déterminer D 2 f (x) en tout x ∈ E et vérifier la propriété suivante : D2 f (0)(d, d) > 0 pour tout d ∈ E \ {0}.
(1.19)
b) On considère ε > 0 et l’on définit x = (xn )n≥1 par xn0 = 2ε et xn = 0 si n = n0 , où l’on a choisi n0 ∈ N∗ tel que n0 > 2/ε. Montrez que f (x) < 0 = f (0). En déduire que 0 n’est pas un minimum local de f . Conclusion ? 15
Chapitre 1. Énoncés
1.9. Conditions nécessaires d’optimalité du premier ordre en l’absence de différentiabilité Durée : 3 heures On note respectivement ., . et . le produit scalaire et la norme usuels de Rn . Soient m ∈ N∗ et f1 , · · · , fm : Rn −→ R des fonctions différentiables sur Rn . On pose pour tout x ∈ Rn f (x) = max{f1 (x), f2 (x), · · · , fm (x)}. On pourra utiliser sans le justifier le fait que f est continue dès que les fi , i = 1, · · · , m le sont, et aussi qu’une fonction continue ψ : Rn −→ R telle que limx→∞ ψ(x) = +∞ atteint son minimum sur Rn . Première partie 1) Donnez un exemple simple d’une fonction de R dans R qui s’écrit comme un max de deux fonctions différentiables sur R et qui n’est pas différentiable sur tout R. On suppose dans toute la suite que f (.) atteint un minimum local en un point x∗ . On cherche alors diverses conditions nécessaires d’optimalité vérifiées par ce point. Étant donnée une fonction différentiable g : Rn −→ R, pour tout x ∈ Rn , ⎛ ∂g ⎞ on désigne par ∇g(x) ∈
Rn
⎜ le vecteur gradient défini par ∇g(x) = ⎝
∂x1 (x)
.. .
⎟ ⎠.
∂g ∂xn (x)
Pour tout d ∈ Rn , on note (εi (d, ·))1≤i≤m les fonctions définies au voisinage de 0 dans R telles que fi (x∗ + td) = fi (x∗ ) + t∇fi (x∗ ), d + tεi (d, t). avec limt→0 εi (d, t) = 0. Pour tout x ∈ Rn on pose I(x) = {i ∈ [1, m] : f (x) = fi (x)}. 2) a) Montrez que pour tout i ∈ I(x∗ ), d ∈ Rn , t > 0, on a f (x∗ + td) ≥ f (x∗ ) + t∇fi (x∗ ), d + tε(d, t) où ε(d, t) = min{ε1 (d, t), · · · , εm (d, t)}. En déduire que f (x∗ + td) ≥ f (x∗ ) + t max ∇fi (x∗ ), d + tε(d, t). i∈I(x∗ )
b) Montrez qu’il existe un voisinage V de x∗ tel que I(x) ⊂ I(x∗ ) pour tout x∈V. 16
1.9. Conditions nécessaires d’optimalité du premier ordre en l’absence...
c) En utilisant b), montrez que pour tout d ∈ Rn et pour t > 0 assez petit on a, pour tout it ∈ I(x∗ + td), f (x∗ + td) = f (x∗ ) + t∇fit (x∗ ), d + tεit (d, t). En déduire que pour tout d ∈ Rn et pour t > 0 assez petit f (x∗ + td) ≤ f (x∗ ) + t max ∇fi (x∗ ), d + tE(d, t), i∈I(x∗ )
où E(d, t) = max{ε1 (d, t), · · · , εm (d, t)}. d) Déduire de ce qui précède que l’on a pour tout d ∈ Rn lim t−1 (f (x∗ + td) − f (x∗ )) = max ∇fi (x∗ ), d . i∈I(x∗ )
t↓0
Montrez alors que pour tout d ∈ Rn , on a maxi∈I(x∗ ) ∇fi (x∗ ), d ≥ 0. 3) Soit ϕ : Rn −→ R une fonction différentiable et minorée. Pour tout ε > 0 montrez qu’il existe xε ∈ Rn tel que ϕ(xε ) + εxε ≤ ϕ(x) + εx pour tout x ∈ Rn . Montrez alors que pour tout x ∈ Rn , on a ϕ(xε ) − ϕ(x) ≤ εxε −x. En déduire que pour tout d ∈ Rn et t > 0 on a t−1 (ϕ(xε +td)−ϕ(xε )) ≥ −εd, puis que ∇ϕ(xε ), d ≥ −εd et enfin que ∇ϕ(xε ) ≤ ε. 4) On pose pour tout d ∈ Rn , ϕ(d) = i∈I(x∗ ) exp ∇fi (x∗ ), d . a) Déduire de 2) d) que ϕ(d) ≥ 1 pour tout d ∈ Rn . b) Déduire de 3) que pour tout k ∈ N∗ il existe dk ∈ Rn tel que 1 ∇ϕ(dk ) = exp ∇fi (x∗ ), dk ∇fi (x∗ ) ≤ . k ∗ i∈I(x )
Observant que
j∈I(x∗ ) exp
∇fj (x∗ ), dk ≥ 1, montrez que
1 λi,k ∇fi (x∗ ) ≤ , k ∗ i∈I(x )
∗ où λi,k = exp ∇fi (x∗ ), dk j∈I(x∗ ) exp ∇fj (x ), dk
−1
≥ 0 vérifie
λi,k = 1.
i∈I(x∗ )
17
Chapitre 1. Énoncés ∗ c) Soit i ∈ I(x∗ ). Montrez que la suite de réels (λi,k )k∈N est bornée. En ) ∗ de R tels que déduire qu’il existe des éléments (λ i + i∈I(x ) i∈I(x∗ ) λi = 1 et ∗ ) = 0. λ ∇f (x i i∈I(x∗ ) i
Deuxième partie Soient f0 , g1 , · · · , gk des fonctions différentiables sur Rn . On considère un minimum local de f0 sur l’ensemble S = {x ∈ Rn : g1 (x) ≤ 0, · · · , gk (x) ≤ 0}, i.e. il existe un voisinage V de x∗ tel que f0 (x) ≥ f0 (x∗ ) pour tout x ∈ S ∩ V . 5) a) On pose pour tout x ∈ Rn f (x) = max{g0 (x), g1 (x), · · · , gk (x)}, où g0 (x) = f0 (x) − f0 (x∗ ). Montrez que x∗ est un minimum local de f (.). On pose Iac (x∗ ) = {i ∈ [1, k] : gi (x∗ ) = 0} et on suppose Iac (x∗ ) non vide. Montrez que I(x∗ ) défini comme en 1) est égal à {0} ∪ Iac (x∗ ) où I(x) = {i ∈ [1, k] : f (x) = gi (x). Déduire alors de 4) l’existence de réels positifs λ0 , (λi )i∈Iac (x∗ ) non tous nuls tels que λi ∇gi (x∗ ) = 0. λ0 ∇f0 (x∗ ) + i∈Iac (x∗ )
Montrez que λ0 = 0 si les vecteurs ∇g1 (x∗ ), · · · , ∇gk (x∗ ) sont linéairement indépendants. b) Que se passe-t-il si Iac (x∗ ) = ∅ ?
1.10. Méthode de descente le long du gradient Durée : 2-3 heures Dans la suite X désigne un espace de Hilbert muni de son produit scalaire ·, · et de sa norme · . Soit f : X −→ R une fonction de classe C 1 sur X. On notera ∇f (x) le gradient de la fonction f en x, et on supposera que l’application ∇f : X −→ X est Lipschitzienne de constante de Lipschitz k ∈ R+ . On pose mf = inf X f ; on suppose que mf est fini et que f (x) − mf ≤ ∇f (x)2 pour tout x ∈ X. 18
1.10. Méthode de descente le long du gradient
1) Soit x0 ∈ X. Montrez que, pour tout x ∈ X, on a f (x) − f (x0 ) =
1
0
∇f (x0 + t(x − x0 )) − ∇f (x0 ), x − x0 dt +∇f (x0 ), x − x0 .
On choisit x0 ∈ X et on définit une suite (xn )n∈N ⊂ X par xn+1 = xn − n ∇f (xn ) pour tout n ∈ N, où (n )n∈N ⊂ R∗+ . 2) Montrez que si 0 < n ≤ k1 , on a f (xn+1 ) − f (xn ) ≤ −n
∇f (xn )2 pour tout n ∈ N, 2
(on pourra utiliser 1)). 3) Montrez que
n )(f (xn ) − mf ), 2 (on pourra observer que f (xn+1 ) − f (xn ) = (f (xn+1 ) − mf ) − (f (xn ) − mf )). En déduire, supposant que 0 < ¯ ≤ n ≤ k1 , que l’on a f (xn+1 ) − mf ≤ (1 −
f (xn ) − mf ≤ q n (f (x0 ) − mf ), avec q = 1 − 2¯ , puis que
lim f (xn ) = mf .
n→∞
4) Montrez que xn+1 − xn 2 ≤ 2n (f (xn ) − f (xn+1 )) ≤ 2n (f (xn ) − mf ). ! n 2(f (x0 )−mf ) . Montrez alors que la En déduire que xn+1 − xn ≤ cq 2 , avec c = k ¯ ∈ X tel que f (¯ x) = mf . suite (xn )n∈N converge vers un certain x 5) On note argmin f l’ensemble (non vide) des x ∈ X tels que f (x) = mf . Montrez √ que ¯ x − x0 ≤ c(1 − q)−1 . En déduire que d2 (x, argmin f ) ≤ δ(f (x) − mf ) pour tout x ∈ X, avec δ =
2√ , k(1− q)2
où d(x, argmin f ) = inf z∈argmin f x − z. 19
Chapitre 1. Énoncés
6) Soit f : Rn −→ R une fonction de classe C 2 telle qu’il existe x0 ∈ X avec f (x) ≥ f (x0 ) + x − x0 2 pour tout x ∈ X. Montrez que ∇f (x0 ) = 0 et que D2 f (x0 )(u, u) ≥ 2u2 pour tout u ∈ X. En déduire l’existence d’un voisinage U de x0 et de κ > 0 tels que κ∇f (x) ≥ x − x0 pour tout x ∈ U. En déduire l’existence d’une constante K ≥ 0 et d’un voisinage U de x0 tels que f (x) − mf ≤ K∇f (x)2 pour tout x ∈ U.
1.11. Conditions nécessaires d’optimalité en présence de contraintes d’inégalité Durée : 3 heures Dans la suite ., . désigne le produit scalaire usuel dans Rm . Soit f : Rp −→ R une fonction différentiable. On notera Df (x) ∈ L(Rp , R) sa différentielle en x ∈ Rp et ∇f (x) ∈ Rp le gradient défini par : ∇f (x), u = Df (x)(u) pour tout u ∈ Rp . Étant donnée une application linéaire A ∈ L(Rp , Rq ) on note A∗ ∈ L(Rq , Rp ) sa transposée définie par : pour tout v ∈ Rp et w ∈ Rq , A∗ (w), v = w, A(v) . On utilisera dans la suite le fait que (ker A)⊥ = Im A∗ et que A∗ est injective si A est surjective. On introduit l’ensemble TC (a) ⊂ Rp des vecteurs tangents à un sous-ensemble C ⊂ Rp en a ∈ C par : u ∈ TC (a) si et seulement si il existe un intervalle ouvert I 0 et x : I −→ C dérivable en 0 telle que x(0) = a, x(I) ⊂ C et x (0) = u. 1) On considère une application de classe C 1 , g : Rp −→ Rq , et on pose C = g−1 (0) = {x ∈ Rp : g(x) = 0}. a) Soit a ∈ C. Montrez que TC (a) ⊂ ker Dg(a). b) On suppose de plus que Dg(a) est surjective. Soit v ∈ ker Dg(a), on introduit F : R × Rq −→ R définie par F (t, w) = g(a + tv + Dg(a)∗ (w)). Montrez que D2 F (0, 0) = Dg(a) ◦ Dg(a)∗ et que cette application linéaire est bijective. En déduire l’existence d’un intervalle ouvert I 0 et de w : I −→ Rq telle que w(0) = a et g(a + tv + Dg(a)∗ (w(t))) = 0 pour tout t ∈ I. 20
1.11. Conditions nécessaires d’optimalité en présence de contraintes...
Montrez que w (0) = 0. On pose x(t) = a + tv + Dg(a)∗ (w(t)) ; montrez que x(.) est à valeurs dans C et que x (0) = v. En déduire que v ∈ TC (a) et donc que TC (a) = ker Dg(a). 2) On suppose que la fonction différentiable f : Rp −→ R admet un minimum local sur C = g−1 (0) en un point a ∈ C (i.e. il existe un voisinage U de a dans Rp tel que f (x) ≥ f (a) pour tout x ∈ C ∩ U ). On suppose aussi que Dg(a) est surjective. Soit v ∈ ker Dg(a) = TC (a) tel que v = x (0), où x : I −→ C avec I intervalle ouvert contenant 0. Observant que f ◦ x admet un minimum local en 0, montrez que Df (a)(v) = 0. En déduire que ∇f (a) ∈ (ker Dg(a))⊥ . En déduire l’existence de λ ∈ Rq unique tel que ∇f (a) + Dg(a)∗ (λ) = 0, soit ∇f (a) +
q
λi ∇gi (a) = 0.
i=1
3) Soit f : R2 −→ R et g : R2 −→ R définies par f (x, y) = x2 + y 2 et g(x, y) = (x − 1)3 − y 2 . Représenter graphiquement l’ensemble C = g−1 (0) et vérifier que le point a = (1, 0) réalise le minimum de f sur C. Montrez qu’il ne peut exister λ ∈ R tel que ∇f (a) + λ∇g(a) = 0. Qu’est-ce qui empêche le résultat de la question 2) de s’appliquer ? 4) On considère une application de classe C 1 , g : Rp −→ Rq et on pose C = {x ∈ Rp : g(x) ≤ 0} où g(x) ≤ 0 signifie gi (x) ≤ 0 pour tout i ∈ [1, q]. On suppose que la fonction différentiable f : Rp −→ R admet un minimum local sur C en un point a ∈ C. On pose Jac = {i ∈ [1, q] : gi (a) = 0}, on suppose que Jac est non vide et on numérote les contraintes gi de telle sorte que Jac = [1, q∗ ] pour un certain q∗ ∈ [1, q]. On introduit gac : Rp −→ Rq∗ par gac (x) = (g1 (x), · · · , gq∗ (x)). On suppose que Dgac (a) ∈ L(Rp , Rq∗ ) est surjective. 21
Chapitre 1. Énoncés
a) On pose Cac = {x ∈ Rp : gac (x) = 0}. Montrez qu’il existe un voisinage U ⊂ Rp de a tel que (gq∗ +1 (x), · · · , gq (x)) < 0 pour tout x ∈ U. En déduire que f admet un minimum local sur Cac en a. b) Déduire de 4) et de a) l’existence d’un λ∗ ∈ Rq∗ tel que ∇f (a) + Dgac (a)∗ (λ∗ ) = 0. On se propose de démontrer que λ∗i ≥ 0 pour tout i ∈ [1, q∗ ]. 5) Supposons que l’un des réels λ∗i est strictement négatif, par exemple λ∗1 < 0 et on suppose que Jac = {1}. a) On pose di = Dgac (a)∗ (ei ) = ∇gi (a) ∈ Rp , i ∈ [1, q∗ ]. Montrez que les vecteurs d1 , · · · , dq∗ sont linéairement indépendants. En déduire l’existence d’un vecteur v ∈ Rp tel que d1 , v < 0 et v ∈ Vect (d2 , · · · , dq∗ )⊥ où Vect (d2 , · · · , dq∗ ) désigne le sous-espace vectoriel de Rp engendré par les vecteurs d2 , · · · , dq∗ . Montrez que ∇f (a), v = −λ∗1 d1 , v < 0. b) Montrez qu’il existe un intervalle ouvert I 0 et x : I −→ Rp tel que x(0) = a, g2 (x(t)) ≤ 0, · · · , gq∗ (x(t)) ≤ 0 et x (0) = v. Montrez que g1 (x(t)) < 0 pour t > 0 assez petit. En déduire que ∇f (a), v = (f ◦ x) (0) ≥ 0, ce qui est contradictoire. c) On suppose que Jac = {1}. Posant v = −d1 , montrez que ∇f (a), v < 0 et que f (a + tv) ≥ f (a) pour t > 0 petit et aboutir à une contradiction. d) Que se passe-t-il si Jac = ∅. Énoncer alors de manière claire et précise ce qui a été démontré à partir de la question 4). 22
1.12. Différentielle de Gâteaux. Multiplicateurs de Lagrange
1.12. Différentielle de Gâteaux. Multiplicateurs de Lagrange Durée : 3 heures EXERCICE Soit f : U −→ F une application définie sur un ouvert U d’un espace de Banach E à valeurs dans un espace de Banach F. Soit a ∈ U et u ∈ E. On pose (a) . On dit que f est Gquand cette limite existe, df (a)(u) = limt→0 f (a+tu)−f t différentiable en a ∈ U si df (a)(u) existe pour tout u ∈ E et si l’application df (a) ∈ L(E, F ). 1) Montrez que f différentiable en a ∈ U implique f G-différentiable en a et que df (a) = Df (a). 2) Montrez que si f est G-différentiable en tout point du segment S = {a + tu : t ∈ [0, 1]} et si l’application qui à" x ∈ S associe df (x) ∈ L(E, F ) est continue sur 1 S, alors on a f (a + u) − f (a) = 0 df (a + tu)(u) dt. 3) En déduire que si f est G-différentiable au voisinage de a ∈ U et si l’application x −→ df (x) est continue dans un voisinage de a, alors f est différentiable en a et Df (a) = df (a). PROBLÈME Dans toute la suite E et F sont des espaces de Banach, U un ouvert de E et f : U −→ R et g : U → F sont des applications. 1) On suppose que f atteint son minimum sur U en a ∈ U et que f est différentiable en a. Montrez que Df (a) = 0. 2) On suppose que f et g sont de classe C 1 sur U . Soit a ∈ U , b ∈ F et M = g−1 (b). On suppose que a ∈ M et que Dg(a) est surjective. On suppose également que N = ker Dg(a) admet un supplémentaire topologique G (i.e. E = N ⊕ G et les projections sur N et G sont continues). a) Montrez que N et G sont des espaces de Banach et que la restriction Dg(a)|G ∈ Isom(G, F ). b) Montrez qu’il existe V (resp. W ) voisinage ouvert de 0 dans N (resp. G) tels que a + V + W ⊂ U . On définit alors une application Φ : V × W −→ F par Φ(v, w) = g(a + v + w) − b. Montrez que Φ(., .) est de classe C 1 et que D2 Φ(v, w) = Dg(a + v + w)|G . 23
Chapitre 1. Énoncés
c) Déduire de b) l’existence d’un voisinage ouvert Ω de 0 dans N et d’une application ϕ : Ω −→ G de classe C 1 telle que l’on ait g(a + v + ϕ(v)) = b pour tout v ∈ Ω. Montrez que Dϕ(0) = 0. d) On pose λ = (Df (a)|G ) ◦ (Dg(a)|G )−1 ∈ L(F, R). Montrez que Df (a) = λ ◦ Dg(a) sur G. 3) On suppose que f atteint un minimum local sur M en a (c’est-à-dire, il existe un voisinage U0 de a dans E tel que f (x) ≥ f (a) pour tout x ∈ M ∩ U0 ). On se propose de montrer que l’on a aussi Df (a) = λ ◦ Dg(a) sur N . a) Soit v ∈ N et t ∈ R. Montrez que a + tv + ϕ(tv) ∈ M pour t assez petit et que, si l’on pose ψ(t) = f (a + tv + ϕ(tv)), on a 0 = ψ (0) = Df (a)v. En déduire que Df (a) = 0 sur N et que Df (a) = λ ◦ Dg(a) sur N . b) En déduire que si f atteint un minimum local sur M = g−1 (b) en un point a ∈ M tel que Dg(a) est surjective, alors il existe λ ∈ L(F, R) tel que Df (a) = λ ◦ Dg(a). Que peut-on dire si f atteint un maximum local sur M en a ? 4) On suppose que E = Rp et F = Rq . On pose g = (g1 , · · · , gq ). Montrez que si f atteint un minimum local sur M = g−1 (b) en a ∈ M et si les vecteurs ∇gi (a), 1 ≤ i ≤ q sont linéairement indépendants, alors il existe λ = (λ1 , · · · , λq ) ∈ Rq tel que q λi Dgi (a). Df (a) = i=1
5) Application : soit A ∈ Mp (R) une matrice symétrique. On identifie de façon classique le vecteur x ∈ Rp avec la forme linéaire x, · où ·, · est le produit scalaire usuel sur Rp . a) On pose f (x) = Ax, x . Montrez que f est différentiable et que pour tout x ∈ Rp on a Df (x) = 2Ax. b) On pose S = {x ∈ Rp : x2 = 1} où x2 = x, x . Montrez que f atteint son minimum sur S. Déduire de 4) qu’il existe λ1 ∈ R et v1 ∈ S tels que Av1 = λ1 v1 . c) On pose Vp−1 = {v1 }⊥ = {x ∈ Rp : v1 , x = 0}. Montrez que Vp−1 est stable par A. En déduire qu’il existe une base de Rp constituée de vecteurs propres de A. 24
1.13. Minimisation d’une fonction convexe sous une contrainte d’inégalité...
1.13. Minimisation d’une fonction convexe sous une contrainte d’inégalité convexe Durée : 3 heures Soit U un ouvert d’un espace de Hilbert X dont le produit scalaire est noté ·, · et la norme · , et soient f , g : U −→ R deux fonctions convexes. On suppose que f est continue et on pose C = {x ∈ U : f (x) ≤ 0} ; on suppose de plus qu’il existe y ∈ U tel que f (y) < 0. 1) Montrez que C est convexe et fermé dans U . Montrez que l’intérieur int C de C est non vide et que {x ∈ U : f (x) < 0} ⊂ int C. 2) Pour x ∈ C, on pose NC (x) = {ξ ∈ X : ξ, z − x ≤ 0 pour tout z ∈ C}. a) Montrez que NC (x) = {0} si f (x) < 0. b) On suppose que f (x) = 0. Soit ξ ∈ NC (x) \ {0}, montrez que ξ, z − x < 0 pour tout z ∈ int S. En déduire que f (z) ≥ f (x) pour tout z ∈ H ∩ U où H = {z ∈ X : ξ, z − x ≥ 0}. c) On suppose désormais que f est différentiable en x. Soit ξ ∈ NC (x) \ {0} et soit u ∈ X tel que ξ, u ≤ 0. Utilisant le fait que x + tu ∈ H ∩ U pour t > 0 assez petit, montrez que ∇f (x), u ≥ 0, et que ∇f (x), u = 0 si ξ, u = 0. En déduire l’existence de λ > 0 tel que ξ = λ∇f (x). d) En déduire que pour tout x ∈ C et pour tout ξ ∈ NC (x), il existe λ ≥ 0 tel que ⎧ ⎪ ⎨ξ = λ∇f (x) ⎪ ⎩
λf (x) = 0.
3) On suppose que g atteint son minimum sur C en un certain x ¯ ∈ C où g est différentiable. Montrez que l’on a −∇g(¯ x), x − x ¯ ≤ 0 pour tout x ∈ C. 25
Chapitre 1. Énoncés
Déduire alors de 2) qu’il existe μ ≤ 0 tel que ⎧ ⎪ x) = μ∇f (¯ x) ⎨∇g(¯ ⎪ ⎩
(1.20) μf (¯ x) = 0.
4) Soit x ¯ ∈ C. On suppose qu’il existe μ ≤ 0 tel que (1.20) soit vérifiée. a) On suppose que μ = 0. Montrez alors que x ¯ réalise le minimum de g sur S. b) On suppose que μ = 0. Montrez alors que 0 ≥ f (x) − f (¯ x) ≥ ∇f (¯ x), x − x ¯ pour tout x ∈ C, et que ∇g(¯ x), x − x ¯ ≥ 0. En déduire alors que x ¯ réalise le minimum de g sur C. 5) On suppose que C est fermé dans X et que τ := inf {z∈U :f (z)≥0} ∇f (z) > 0. a) Soit x ∈ / C. Justifiez l’existence de la projection x ¯ de x sur C. Déduire de 3) l’existence de λ > 0 tel que x − x ¯ = λ∇f (¯ x). Montrez que f (¯ x) = 0. b) Montrez alors que τ d(x, C) ≤ f (x), (on pourra observer que f (x) ≥ f (¯ x) + x − x ¯ ∇f (¯ x), x − x ¯ et que ≥ τ ). En déduire alors que λ τ d(x, C) ≤ f (x)+ pour tout x ∈ U, où f (x)+ = sup(f (x), 0) est la partie positive de f (x). 6) Soit S n (R) l’espace vectoriel des matrices n × n symétriques à coefficients réels muni de sa norme euclidienne usuelle, à savoir celle définie par A, B = Tr (AB), et soit U ⊂ S n (R) l’ouvert des matrices symétriques définies positives. Introduisons f : U −→ R définie par f (X) = log(det(X −1 )) où log désigne le logarithme de base e. a) Montrez que f est de de classe C ∞ , que ∇f (X) = −X −1 pour tout X ∈ U , et que f est convexe. b) On pose C = {X ∈ U : f (X) ≤ 0}. Montrez que C = {X ∈ U, det(X) ≥ 1}, et que min
{X∈U, det(X)≤1}
En déduire que
26
√
X −1 =
√ n.
n d(X, C) ≤ log(det(X −1 ))+ pour tout X ∈ U.
(1.21)
1.14. Minimisation d’une fonction convexe sur un polyèdre convexe de Rn
1.14. Minimisation d’une fonction convexe sur un polyèdre convexe de Rn Durée : 3 heures Étant donnés a1 , · · · , am ∈ Rn , on note co (a1 , · · · , am ) l’enveloppe convexe des points a1 , · · · , am : ⎧ ⎫ m m ⎨ ⎬ tj aj : (t1 , · · · , tm ) ∈ Rm tj = 1 . co (a1 , · · · , am ) = +, ⎩ ⎭ j=1
j=1
On dit qu’une partie non vide C de Rn est un cône si λC ⊂ C pour tout λ > 0. Pour b ∈ Rm , on pose PA,b = {x ∈ Rn : aTj x ≤ bj , pour tout 1 ≤ j ≤ m}, en d’autres PA,b = {x ∈ Rn : Ax ≤ b} où A est la matrice m × n définie ⎞ ⎛ termes aT1 ⎜ ⎟ par A = ⎝ ... ⎠ et u ≤ v avec u, v ∈ Rm signifie uj ≤ vj pour tout 1 ≤ j ≤ m. aTm Il est important de remarquer que, pour tout t ∈ Rm , on a AT t = m j=1 tj aj . On n pourra utiliser, sans le justifier, qu’une fonction continue f : R −→ R telle que limx→+∞ f (x) = +∞ atteint sa borne inférieure sur tout sous-ensemble fermé de Rn . / C. Montrez Question préliminaire. Soit C ⊂ Rn un convexe fermé tel que 0 ∈ n x où qu’il existe y ∈ R \ {0} tel que supz∈C y, z < 0. (Indication : essayer y = −¯ x ¯ est la projection de 0 sur C). En déduire que si C ⊂ Rn est un convexe fermé tel que x ∈ / C, il existe y ∈ Rn \ {0} tel que supy, z < y, x .
(1.22)
z∈C
1) Soit C ⊂ Rn un cône convexe, on pose Montrez que C − C −− = C.
C − = {y ∈ Rn : y, x ≤ 0 pour tout x ∈ C}. − est un cône convexe fermé. On pose C −− := C − , montrez que
2) On pose pos (a1 , · · · , am ) =
m
R+ aj = AT (Rm + ).
j=1
Montrez que pos (a1 , · · · , am ) est un cône convexe. 27
Chapitre 1. Énoncés
3) a) On suppose que 0 ∈ / co (a1 , · · · , am ). Montrez que pos (a1 , · · · , am ) est fermé (on pourra considérer une suite (yk )k∈N ⊂ pos (a1 , · · · , am ) avec yk = AT tk qui converge vers y et montrer par l’absurde que la suite (tk )k∈N ⊂ Rm + est bornée). b) On suppose que 0 ∈ co (a1 , · · · , am ). Montrez que m &
pos (a1 , · · · , am ) =
pos (a[1,m]\{j} ).
j=1
c) Montrez que pos (a1 , · · · , am ) est fermé pour tout a1 , · · · , am ∈ Rn . 4) Montrez que pos (a1 , · · · , am ) ⊂ (PA,0 )− puis que pos (a1 , · · · , am ) = (PA,0 )− . 5) Étant donné x ∈ PA,b , on introduit le cône normal à PA,b en x par : NPA,b (x) = {y ∈ Rn : y, z − x ≤ 0 pour tout z ∈ PA,b }, et on se propose de déterminer NPA,b (x). a) On suppose que aTj x < bj pour tout j ∈ [1, m]. Montrez que NPA,b (x) = {0}. b) On suppose qu’il existe j ∈ [1, m] tel que aTj x = bj , et on pose JA,b (x) = {j ∈ [1, m] : aTj x = bj }. Montrez que
NPA,b (x) = C −
où C = {u ∈ Rn : aTj u ≤ 0 pour tout j ∈ JA,b (x)}. Déduire alors de la question 3) que R+ aj . NPA,b (x) = pos aJA,b (x) := j∈JA,b (x)
6) On considère une fonction convexe différentiable f : Rn −→ R. Montrez que x ¯ ∈ PA,b vérifie f (¯ x) = inf f (x) x∈PA,b
si et seulement si : x), −∇f (¯ x) ∈ NPA,b (¯ 28
1.15. Détermination et nature des points critiques d’une fonction...
ou, de façon équivalente, il existe λ1 , · · · λm ≥ 0 tels que ⎧ x) = m ⎨−∇f (¯ j=1 λj aj , ⎩
(1.23) λj (aj x − bj ) = 0
pour tout j ∈ [1, m].
T
7) a) Donner un exemple de fonction dérivable γ : R −→ R telle que γ (0) = 0, |γ (x)| ≤ 1 pour tout x ∈ R et lim|x|→+∞ γ(x) = +∞. Pour une telle fonction, on pose g(x) = γ(x) pour tout x ∈ Rn . Montrez que g est différentiable sur Rn et que ∇g(x) ≤ 1 pour tout x ∈ Rn . b) Soit u ∈ Rn tel que inf x∈PA,b uT x > −∞. On se propose de montrer que le problème min uT x,
(P)
x∈PA,b
possède alors au moins une solution. Pour tout k ∈ N∗ , on considère le problème g(x) T , min u x + (Pk ) x∈PA,b k où g est définie en a). Montrez que (Pk ) possède au moins une solution. Soit xk ∈ PA,b une telle solution. Déduire de la question 6) et des propriétés de g qu’il 1 existe vk ∈ Rn tel que vk ≤ et k −u + vk ∈ NPA,b (xk ). Montrez qu’il existe une partie J ⊂ [1, m] et un sous-ensemble infini K ⊂ N∗ tels que JA,b (xk ) = J pour tout k ∈ K. Soit k0 ∈ K, montrez que −u+vk ∈ NPA,b (xk0 ) pour tout k ∈ K. En déduire que −u ∈ NPA,b (xk0 ) puis que xk0 est solution de (P).
1.15. Détermination et nature des points critiques d’une fonction. Différentiation de l’application exponentielle Durée : 3 heures EXERCICE 1 Soit H un espace de Hilbert dans lequel ., . désigne le produit scalaire et · la norme associée. Étant donné a = 0 fixé dans H, on considère la fonction f : H −→ R définie par : 2
f (x) = a, x .e−x pour tout x ∈ H. 29
Chapitre 1. Énoncés
1) a) Démontrer que f est différentiable sur H et calculer le gradient ∇f (x) de f en tout x ∈ H. b) Déterminer les points critiques (ou stationnaires) de f , c’est-à-dire les points de H en lesquels le gradient s’annule. 2) a) Démontrer que f est deux fois différentiable en tout x ∈ H et calculer D2 f (x). b) Déterminer la nature des points critiques de f trouvés à la 1re question (maximum local ou minimum local, ou ni l’un ni l’autre). EXERCICE 2 Soit (X, · ) un espace vectoriel normé, soit L(X) l’espace vectoriel des applications linéaires continues de X dans X, normé par u ∈ L(X) −→ u := sup{u(x) : x = 1}. Étant donnés u et v dans L(X), on notera (de manière simplifiée) uv la composée u◦v. Pour n ∈ N∗ , la notation un désigne u◦u◦· · · ◦u (n fois) ; u0 est l’application identité de X. 1) Étant donné u ∈ L(X), soit Lu : L(X) −→ L(X) définie par Lu (h) := uh + hu pour tout h ∈ E. a) Montrer que Lu est linéaire et continue. b) Soit E2 : L(X) −→ L(X) définie par E2 (u) := u2 . Montrer que E2 est différentiable sur L(X) avec DE2 (u) = Lu pour tout u ∈ L(X). 2) Généralisation. Soit n ∈ N∗ et En : L(X) −→ L(X) définie par En (u) := un . a) Montrer que En est différentiable en tout u ∈ L(X) et déterminer DEn (u). b) Établir : [DEn (u)](h) ≤ n u n−1 . h pour tout h ∈ L(X); et ||||DEn (u)|||| ≤ n un−1 (où |||| · |||| désigne ici la norme sur L(L(X), L(X)) déduite de · ). 3) On suppose désormais que X est de Banach. On désigne par exp(u) la somme un . de la série (normalement convergente) de terme général n! 30
1.16. Calcul différentiel d’ordre supérieur. Différentielle d’ordre 2...
DEn (u) converge vers un élément n! G(u) ∈ L(L(X), L(X)), et ce uniformément sur {u : u ≤ M }, (M > 0 quelconque). a) Montrer que la série de terme général
b) Établir que l’application exp : L(X) −→ L(X) est différentiable sur L(X) et calculer D(exp)(u) en tout u ∈ L(X). Déterminer en particulier D(exp)(0) et D(exp)(idX ). 4) Soit u ∈ L(X) et soit Φu : R −→ L(X) définie par Φu (t) := exp(tu). Montrer que Φu est dérivable en tout point t ∈ R, et comparer Φu (t) à Φu (t) ◦ u.
1.16. Calcul différentiel d’ordre supérieur. Différentielle d’ordre 2 d’une application composée Durée : 3 heures EXERCICE 1 Soit E un espace vectoriel normé, H un espace de Hilbert, u une application linéaire continue de E dans H, et a un élément fixé de H. On définit f : E −→ R comme suit : f (x) := u(x) − a2 pour tout x ∈ E, où · désigne la norme associée au produit scalaire ·, · sur H. 1) Donner une raison simple selon laquelle f est deux fois différentiable sur E. Déterminer en tout x ∈ E la différentielle de f en x et la différentielle seconde de f en x. 2) Les différentielles de f d’ordre p ≥ 3 existent-elles ? Que peut-on dire à leur sujet ? EXERCICE 2 1) On se donne E, F , G trois espaces vectoriels normés, O un ouvert de E, une application f : O ⊂ E −→ F , O un ouvert de F contenant f (O), une application g : O ⊂ F −→ G, et on considère l’application g ◦ f . On suppose que f (resp. g) est deux fois différentiable sur O (resp. sur O ). Montrer qu’en tout x ∈ O : D 2 (g ◦ f )(x)(h, k) = D2 g(f (x))(Df (x)h, Df (x)k) + Dg(f (x)(D2 f (x))(h, k)) 31
Chapitre 1. Énoncés
pour tout (h, k) ∈ E × E. [On note Dφ(u) (resp D2 φ(u)) la différentielle (resp. l’application bilinéaire symétrique différentielle seconde) de φ au point u]. 2) (H, ·, · ) désignant un espace de Hilbert, on pose : c : x ∈ H −→ c(x) := x2 (= x, x ); et n : x ∈ H −→ n(x) := x. a) Montrer que c(·) est différentiable sur H et déterminer sa différentielle en x ∈ H (notée Dc(x)). b) En déduire que n(·) est différentiable sur H \ {0} et déterminer Dn(x) en x ∈ H \ {0}. c) Montrer que n(·) est deux fois différentiable sur H \ {0} et, pour tout x ∈ H \ {0} et pour tout (h, k) ∈ H × H, déterminer D2 n(x)(h, k). 3) Soit g :]0, +∞[−→ R une fonction dérivable sur ]0, +∞[ et soit F : H \ {0} −→ R définie par F (x) := g(x). a) Montrer que F est différentiable sur H \ {0} avec, en tout x ∈ H \ {0}, h ∈ H −→ DF (x)h =
g (x) x, h . x
b) On suppose que g est deux fois dérivable sur ]0, +∞[. En déduire que F est deux fois différentiable sur H \{0} et déterminer D 2 F (x) en tout point x ∈ H \{0}. c) Ici, H = Rn muni du produit scalaire canonique x, y := ni=1 xi yi . On suppose comme dans b) que g est deux fois dérivable sur ]0, +∞[. Pour x ∈ Rn \ {0}, déterminer la matrice symétrique ∇2 F (x) telle que D 2 F (x)(h, k) = ∇2 F (x)h, k pour tout (h, k) ∈ Rn × Rn . En déduire ΔF (x) pour tout x ∈ Rn \ {0}. (On rappelle que ΔF (x), dit laplacien n ∂2F de F en x, est par définition 2 (x).) ∂x i i=1 32
1.17. Résolution d’équations par la méthode de Newton I
1.17. Résolution d’équations par la méthode de Newton I Durée : 2-3 heures Soient E et F des espaces de Banach, U un ouvert de E et soit f : U −→ F une application de classe C 1 . On se propose dans ce problème de résoudre l’équation f (x) = 0 par une méthode itérative. Pour tout x ∈ U et z ∈ E tels que x + z ∈ U , on pose R(x, z) = f (x) − f (x + z) + Df (x + z)(z). On suppose qu’il existe M ≥ 0 ¯ρ la boule fermée de centre 0 tel que Df soit M -Lipschitzienne sur U . On note B et de rayon ρ. Soit a ∈ U . On suppose enfin que Df (a) ∈ Isom (E, F ). −1 1) a) On pose g(z) = Df (a + z) . Montrez qu’il existe δ, C > 0 tels que ¯δ . g(z) ∈ Isom (F, E) et g(z) ≤ C pour tout z ∈ B b) Montrez que pour tout Φ1 , Φ2 ∈ Isom (F, E), on a −1 −1 −1 Φ−1 1 − Φ2 = Φ1 ◦ (Φ2 − Φ1 ) ◦ Φ2 .
¯δ . En déduire l’existence de L > 0 telle que g soit L-Lipschitzienne sur B ¯δ , F (z) = g(z)(R(a, z) − b) où b = f (a). 2) On pose pour tout z ∈ B ¯δ on a R(a, z) − R(a, z ) = A + B, où a) Montrez que pour tout z ∈ B 1 Df (a + z + s(z − z)) − Df (a + z) (z − z)ds, A= 0
B = Df (a + z) − Df (a + z ) (z ).
(On pourra considérer ψ(s) = f (a + z + s(z − z)) − sDf (a + z)(z − z).) En déduire que R(a, z) − R(a, z ) ≤ M z − z2 + z − zz . b) En remarquant que F (z ) − F (z) = (g(z ) − g(z))(R(a, z) − b) + g(z )(R(a, z ) − R(a, z)), ¯δ avec déduire des questions précédentes que F est κ-Lipschitzienne sur B κ = L(M δ2 + b) + 3CM δ. c) En déduire que pour b et δ assez petits F est une contraction et que ¯δ . ¯ F (Bδ ) ⊂ B 33
Chapitre 1. Énoncés
¯δ . Montrez que x d) Soit z¯ l’unique point fixe de F sur B ¯ = a + z¯ est l’unique ¯ solution sur a + Bδ de l’équation f (x) = 0. 3) Soit (zn ) la suite définie par zn = F n (0) où F n = F ◦ · · · ◦ F (n fois). Montrez que la suite définie par xn = a + zn vérifie, pour tout n ∈ N, −1 xn+1 = xn − Df (xn ) (f (xn )) et que cette suite converge vers l’unique solution x ¯ de l’équation f (x) = 0 sur ¯δ . C’est la méthode itérative de Newton pour résoudre l’équation f (x) = 0. a+ B ¯δ 4) a) On pose, pour t ∈ [0, 1], x, x ∈ a + B ϕ(t) = f (x + t(x − x)) − tDf (x)(x − x). Montrez que ϕ (t) ≤ M x − x2 . En déduire que f (x ) − f (x) − Df (x)(x − x) ≤ M x − x2 . b) Soit (xn ) la suite définie à la question 3). Montrez que −Df (xn )(xn+1 − xn ) = f (xn ) − f (xn−1 ) − Df (xn−1 )(xn − xn−1 ). En déduire l’existence d’une constante K > 0 telle que, pour tout n ∈ N∗ xn+1 − xn ≤ Kxn − xn−1 2 . c) Montrez que, pour tout n ∈ N∗ , n−1
n
xn+1 − xn ≤ K 1+2+...+2 x1 − x0 2 n (Kx1 − x0 )2 . ≤ K d) Observant que xn − x ¯ ≤
∞
j=0 xn+j+1
− xn+j , montrez que n
¯ ≤ xn − x
34
(Kx1 − x0 )2 . K(1 − Kx1 − x0 )
1.18. Résolution de l’équation f (x) = 0 par la méthode de Newton II...
1.18. Résolution de l’équation f (x) = 0 par la méthode de Newton II. Minimisation d’une fonction convexe par la méthode du gradient Durée : 3 heures EXERCICE 1 Soient E, F des espaces de Banach et soit f : U −→ F une application continue définie sur un ouvert U de E. 1) Soit [a, b] ⊂ U tel que f soit deux fois différentiable en tout x ∈ [a, b]. Montrez que f (b) − f (a) − Df (a)(b − a) ≤ b − a2 sup D2 f (x) . x∈[a,b]
¯ 0 , r), r > 0, est contenue dans U , que f 2) On suppose que la boule fermée B(x ¯ 0 , r), et que Df (x) ∈ Isom (E, F ) pour est deux fois différentiable en tout x ∈ B(x ¯ tout x ∈ B(x0 , r). On suppose aussi qu’il existe c > 0 tel que sup ¯ 0 ,r) x∈B(x
[Df (x)]−1 ≤ c et
sup ¯ 0 ,r) x∈B(x
D2 f (x) ≤ c.
r ) et on suppose que f (x0 ) ≤ η. On pose η = min( 2c13 , 2c
¯ 0 , r). a) On pose x1 = x0 − [Df (x0 )]−1 (f (x0 )). Montrez que x1 ∈ B(x b) On suppose connus x0 , · · · , xn , n ∈ N∗ tels que, pour tout 1 ≤ k ≤ n, xk = xk−1 − [Df (xk−1 )]−1 (f (xk−1 )), et xk − xk−1 ≤ c−2 (c3 η)2
k−1
.
¯ 0 , r). Montrez que f (xn ) ≤ cxn − xn−1 2 (on Montrez que x0 , · · · , xn ∈ B(x pourra observer que f (xn ) = f (xn ) − f (xn−1 ) − Df (xn−1 )(xn − xn−1 )). c) On pose
xn+1 = xn − [Df (xn )]−1 (f (xn )).
Montrez que xn+1 − xn ≤ c−2 (c3 η)2 . En déduire que l’on peut définir une suite ¯ 0 , r) par la formule xn+1 = xn − [Df (xn )]−1 (f (xn )). Montrez que (xn )n∈N ⊂ B(x ¯ 0 , r) tel que f (¯ ¯ ∈ B(x x) = 0. la suite (xn )n∈N ainsi définie converge vers un point x n
EXERCICE 2 Dans la suite ., . désigne le produit scalaire usuel dans Rd et · la norme euclidienne associée. Étant donnée une fonction f : Rd −→ R différentiable, on 35
Chapitre 1. Énoncés
notera Df (x) ∈ L(Rd , R) sa différentielle en x ∈ Rd et ∇f (x) ∈ Rd son gradient en x. On dit qu’une fonction f : U −→ R définie sur une partie convexe U ⊂ Rd est convexe si pour tout x, y ∈ Rd , pour tout t ∈ [0, 1] on a f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y). 1) question préliminaire. Soit f : Rd −→ R une fonction continue telle que lim
x→+∞
f (x) = +∞.
Montrez que f atteint son minimum sur Rd . 2) Soit U ⊂ Rd un ouvert convexe et soit f : U −→ R une fonction de classe C 1 . Montrez que pour tout x, y ∈ U et t ∈ [0, 1] on a 1 f (y) − f (x) = ∇f (x + t(y − x)), y − x dt. (1.24) 0
3) Soit f : Rd −→ R une fonction de classe C 1 telle qu’il existe c > 0 tel que pour tout x, y ∈ Rd , t ∈ [0, 1], c f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y) − t(1 − t)x − y2 . 2
(1.25)
Montrez que f est convexe. Soient x, y ∈ Rd , montrez que c f (y) − f (x) ≥ ∇f (x), y − x + x − y2 . 2
(1.26)
(On pourra faire passer x à gauche dans (1.25) et diviser par t.) En déduire que ∇f (y) − ∇f (x), y − x ≥ cx − y2 pour tout x, y ∈ Rd .
(1.27)
Retrouvez (1.26) à l’aide de (1.27) et (1.24). Montrez que limy→+∞ f (y) = +∞ et que f atteint son minimum en un unique x∗ ∈ Rd . 4) Soit f : Rd −→ R une fonction de classe C 1 vérifiant (1.25) et dont le gradient est L-Lipschitzien pour un L > 0. On choisit α ∈]0, L2c2 [, x0 ∈ Rd et on définit par récurrence la suite xk+1 = xk − α∇f (xk ) pour tout k ∈ N. Soit x∗ l’unique point de minimum de f . Montrez que pour tout k ∈ N on a xk+1 − x∗ 2 = xk − x∗ 2 − 2α∇f (xk ) − ∇f (x∗ ), xk − x∗ +α2 ∇f (xk ) − ∇f (x∗ )2 . 36
1.19. Un théorème de Rolle pour les fonctions à valeurs vectorielles...
En déduire que xk+1 − x∗ 2 ≤ θxk − x∗ 2 pour tout k ∈ N avec θ = (1 − 2cα + L2 α2 ). Montrez que l’on a alors limk→∞ xk − x∗ = 0. Quel est le meilleur choix pour α i.e. celui qui rend θ le plus petit possible ?
1.19. Un théorème de Rolle pour les fonctions à valeurs vectorielles. Un problème de maximisation. Sensibilité des racines simples d’un polynôme Durée : 3 heures EXERCICE 1 L’objet de l’exercice est de montrer une version du Théorème de Rolle pour des fonctions à valeurs vectorielles. 1) Soit f : R2 −→ R2 définiepar (x, y) −→ f (x, y) = x(x2 + y 2 − 1), y(x2 + y 2 − 1) . a) Justifier rapidement la différentiabilité de f sur R2 . b) Quelle est la matrice représentant (dans la base canonique de R2 ) la différentielle Df (x, y) de f en (x, y) ? Vérifier que Df (x, y) n’est nulle en aucun point (x, y) ∈ R2 . c) Soit Ω = B(0, 1) (boule ouverte unité pour la norme euclidienne). Que vaut f (x, y) lorsque (x, y) ∈ Fr Ω (frontière de Ω) ? Conclusion quant à un éventuel théorème de Rolle relatif à f sur Ω ? 2) Soit Ω un ouvert connexe borné de Rn , H un espace de Hilbert (dont le produit scalaire sera noté ., . ) et f : Rn −→ H une application différentiable sur Rn . On suppose qu’il existe d ∈ H tel que (H)
x −→ f (x), d soit constante sur Fr Ω.
On se propose de démontrer qu’il existe c ∈ Ω tel que (C)
Df (c)h, d = 0 pour tout h ∈ Rn .
¯ est de la forme a) Soit g : x ∈ Rn −→ g(x) = f (x), d . Montrer que g(Ω) [m, M ] (intervalle compact de R). 37
Chapitre 1. Énoncés
b) Déduire de ce qui précède l’existence d’un c ∈ Ω tel que (C) ait lieu. c) On revient à l’exemple de la 1re question. Étant donné d = (d1 , d2 ) ∈ R2 , trouver un c ∈ B(0, 1) tel que (C) ait lieu. 3) Applications. a) On considère ici Ω =]a, b[⊂ R, f1 et f2 deux fonctions de R dans R dérivables. En posant f : x ∈ R −→ f (x) = (f1 (x), f2 (x)), et d = (f2 (a) − f2 (b), f1 (b) − f1 (a)), montrer par application du résultat de la question précédente qu’il existe c ∈]a, b[ tel que f1 (c)[f2 (a) − f2 (b)] = f2 (c)[f1 (a) − f1 (b)]. b) Soit Γ : (u, v) ∈ R2 −→ Γ(u, v) = (x(u, v), y(u, v), z(u, v)) une application de classe C 1 sur R2 . On suppose que DΓ(u, v) (différentielle de Γ en (u, v)) est injective pour tout (u, v) ∈ R2 . Comment détermine-t-on le plan (vectoriel) tangent à la surface paramétrée Σ = Im Γ de R3 au point Γ(u0 , v0 ) ? On suppose qu’il existe un plan Π de R3 tel que Γ(u, v) ∈ Π pour tout (u, v) dans le cercle-unité euclidien de R2 . Montrer qu’il existe alors (u0 , v0 ) ∈ B(0, 1) tel que le plan tangent à Σ en Γ(u0 , v0 ) soit parallèle à Π. EXERCICE 2 Dans R3 muni du produit scalaire usuel et de la norme euclidienne usuelle, on considère la surface S d’équation cartésienne x4 y 4 z 4 + 4 + 4 =1 a4 b c où a, b, c sont des réels non nuls fixés, et on cherche les points de S les plus éloignés x, y¯, z¯) de S de l’origine (0, 0, 0) de R3 . Cela revient donc à chercher les points (¯ qui rendent maximale sur S la fonction 1 (x, y, z) −→ f (x, y, z) = (x2 + y 2 + z 2 ) 2 (ce problème est appelé (P) dans la suite). 1) Indiquer rapidement pourquoi (P) a au moins une solution. 38
1.20. Conditions d’optimalité exprimées à l’aide du cône tangent à l’ensemble...
2) Quels sont les points (¯ x, y¯, z¯) de S vérifiant la condition nécessaire d’extrémalité du 1er ordre de Lagrange ? 3) Déduire des calculs précédents les points de S à distance maximale de l’origine. (Indication : il y en a 8 au total) et donner la valeur maximale de cette distance. EXERCICE 3 Soit d ∈ N∗ ; on note E l’espace vectoriel des polynômes à coefficients réels et de degré inférieur ou égal à d. On rappelle que r ∈ R est une racine simple de P ∈ E lorsque P (r) = 0 et P (r) = 0. Considérons l’application F : E × R −→ R définie par : pour tout (P, r) ∈ E × R, F (P, r) = P (r). 1) a) Montrer que les différentielles partielles D1 F (P0 , r0 ) (∈ L(E, R)) et D2 F (P0 , r0 ) (∈ L(R, R)) existent en tout (P0 , r0 ) ∈ E × R et déterminer leurs expressions. b) En déduire que F est de classe C 1 sur E × R. 2) Soit r0 une racine simple de P0 . a) Montrer qu’il existe un voisinage ouvert V de (P0 , r0 ), un voisinage ouvert W de P0 , une fonction ϕ : W −→ R de classe C 1 sur W , tels que : ⎧ ⎧ ⎪ ⎪ ⎨(P, r) ∈ V ⎨P ∈ W si et seulement si et et ⎪ ⎪ ⎩ ⎩ P (r) = 0 r = ϕ(P ). b) Montrer que l’on peut choisir V assez petit pour que P (ϕ(P )) = 0 pour tout P ∈ W , c’est-à-dire pour que r = ϕ(P ) soit une racine simple de P . c) Quelle est la différentielle en P0 de l’application ϕ ?
1.20. Conditions d’optimalité exprimées à l’aide du cône tangent à l’ensemble des contraintes. Applications à un problème variationnel Durée : 4-5 heures Première partie. Soit E un espace vectoriel normé, S une partie de E et a un point de S. On appelle vecteur tangent à S en a un élément d de E tel qu’il 39
Chapitre 1. Énoncés
existe une suite (xn )n∈N d’éléments de S et une suite (tn )n∈N de réels strictement positifs vérifiant : limn→+∞ xn = a, limn→+∞ tn = 0, limn→+∞
xn − a = d. tn
On note T (S, a) l’ensemble des vecteurs tangents à S en a. 1) Montrer que si S est convexe, alors, quels que soient les points x et a de S, d = x − a est un vecteur tangent à S en a. 2) Exemple. Soit E = R2 , D le disque unité fermé et Σ le cercle unité : D = {(x, y) : x2 + y 2 ≤ 1} et Σ = {(x, y) : x2 + y 2 = 1}. Décrire T (D, a) lorsque a est intérieur à D et lorsque a est sur la frontière Σ de D. Comparez dans ce dernier cas T (D, a) et T (Σ, a). 3) Soit f : E −→ R différentiable sur E ; on pose Sr = {x ∈ E : f (x) ≤ r}, où r est un réel fixé. Montrer que si a vérifie f (a) < r on a T (Sr , a) = E, et que si a vérifie f (a) = r on a T (Sr , a) ⊂ {d ∈ E : Df (a)d ≤ 0}. Donner un exemple où l’inclusion ci-dessus est stricte. Deuxième partie. Soit E un espace vectoriel normé, J : E −→ R une application différentiable sur E et S une partie de E. 1) Montrer qu’une condition nécessaire pour que J présente en a un minimum local sur S est (CN)
DJ(a)d ≥ 0 pour tout d ∈ T (S, a)
Cette condition est-elle suffisante ? 2) Montrer que si S est convexe et si J est convexe, la condition (CN) est suffisante pour que J présente en a un minimum global sur S. 40
1.20. Conditions d’optimalité exprimées à l’aide du cône tangent à l’ensemble...
3) Montrer que si de plus J est strictement convexe, a est le seul point où le minimum de J sur S est atteint. J est dite strictement convexe si J est convexe et si de plus, pour tout x, y ∈ E tels que x = y et pour tout λ ∈]0, 1[, J(λx + (1 − λ)y) < λJ(x) + (1 − λ)J(y). Troisième partie. Soit E l’espace vectoriel des applications de classe C 1 de [0, 1] dans R, nulles en 0, normé par : h = max{ max |h(t)|, max |h (t)|}. t∈[0,1]
t∈[0,1]
Pour tout scalaire α on pose
1
Sα = {h ∈ E :
h2 (t) dt ≤ 1, h(1) = α}.
0
Soit enfin J l’application de E dans R définie par J(h) =
1
(h )2 (t) dt.
0
1) Montrer que Sα est convexe et que J est strictement convexe. 2) Montrer que l’application J et l’application f de E dans R définie par
1
f (h) =
h2 (t) dt
0
sont différentiables et déterminer leurs différentielles en tout h ∈ E. 1 3) Soit h un élément de Sα . Si h2 (t) dt < 1 on pose 0
T (Sα , h) = {H ∈ E : H(1) = 0};
1
si
h2 (t) dt = 1 on pose
0
1
T (Sα , h) = {H ∈ E :
h(t)H(t)dt ≤ 0, H(1) = 0}.
0
Montrer dans chacun des deux cas que T (Sα , h) est contenu dans T (Sα , h). 4) On se propose de minimiser J sur Sα . La méthode d’étude pour cela est la suivante : si on trouve h ∈ Sα tel que DJ(h) soit ≥ 0 sur T (Sα , h) alors DJ(h) sera ≥ 0 sur T (Sα , h) et donc J atteindra son minimum au point h (cf. 2e question 41
Chapitre 1. Énoncés
de la 2e partie). Comme de plus J est strictement convexe, ce point sera le seul où le minimum est atteint (cf. 3e question de la 2e partie). Dans la suite, on note E0 le sous-espace vectoriel de E des fonctions nulles en 1. 1 a) Montrer que si h appartient à Sα et vérifie h2 (t) dt < 1, alors : 0
DJ(h)H ≥ 0 pour tout H ∈ T (Sα , h) si et seulement si
1 0
En déduire que si |α|
√ 3, J atteint son minimum sur Sα en h définie par : h(t) =
α × sinh(λα t) pour tout t ∈ [0, 1], sinh λα
où λα est un paramètre strictement positif, dépendant de α, que l’on précisera. 42
1.21. Problème variationnel de minimisation d’une fonctionnelle du Calcul...
1.21. Problème variationnel de minimisation d’une fonctionnelle du Calcul des variations Durée : 3 heures EXERCICE 1 Soit T > 0, N ≥ 1, et X l’espace des fonctions u de classe C 1 de [0, T ] vers RN telles que u(0) = u(T ) = 0. On munit X de la norme uX = sup u(t) + sup u (t) t∈[0,T ]
t∈[0,T ]
(où · est la norme euclidienne usuelle sur RN ). Notons, pour tout u ∈ X et r > 0, ¯X (u, r) la boule fermée de X de centre u et de rayon r. Soit une application B F : RN × RN −→ R de classe C 2 . Le but du problème est la minimisation de la fonction T F (u(t), u (t)) dt. (1.28) J : u ∈ X −→ J(u) = 0
Si x et y sont deux points de RN , on note ∇x F (x, y) (resp. ∇y F (x, y)) le vecteur ∂F ∂F de RN dont les composantes sont les dérivées partielles (x, y) (resp. (x, y)), ∂xi ∂yi 1 ≤ i ≤ N . Enfin on note ·, · le produit scalaire usuel dans Rp . 1) a) Soit (u, v) ∈ X × X. Démontrer l’existence d’une constante M > 0 telle ¯X (0, 1) et pour tout t ∈ [0, T ] on ait : ¯X (0, 1) × B que, pour tout (h, k) ∈ B |ϕ(t)| ≤ M (h(t)2 + k(t)2 ),
(1.29)
où ϕ(t) := F (u(t) + h(t), v(t) + k(t)) − F (u(t), v(t))− ∇x F (u(t), v(t)), h(t) − ∇y F (u(t), v(t)), k(t) . b) Supposons F convexe sur RN × RN . Rappeler pourquoi on a : ϕ(t) ≥ 0
(1.30)
pour tout (u, v, h, k) ∈ X 4 et pour tout t ∈ [0, T ]. 43
Chapitre 1. Énoncés
2) a) Montrer que J est différentiable sur X, avec :
T
DJ(u)(h) =
[∇x F (u(t), u (t)), h(t) + ∇y F (u(t), u (t)), h (t) ] dt.
(1.31)
0
pour tout u, h ∈ X. b) Montrer que J est de classe C 1 sur X. 3) Soit u ∈ X ∩ C 2 ([0, 1], RN ). a) Montrer que l’application G : t ∈ [0, 1] −→ G(t) = ∇y F (u(t), u (t)) est de classe C 1 . On notera
d ∇y F (u(t), u (t)) la dérivée de cette fonction. dt
b) Montrer, au moyen d’une intégration par parties, que :
T
DJ(u)(h) =
[∇x F (u(t), u (t)) −
0
d ∇y F (u(t), u (t)) , h(t) ] dt. dt
(1.32)
c) On suppose que u est un minimiseur local de J sur X. Montrer que, pour tout t ∈ [0, T ] : ∇x F (u(t), u (t)) −
d ∇y F (u(t), u (t)) = 0. dt
(1.33)
d) Montrer que si F est convexe sur RN × RN , alors toute solution u de (1.33) est un minimiseur global de J sur X. 4) Soit T et U deux fonctions de classe C 2 de RN vers R, et soit F : (x, y) ∈ RN × RN −→ F (x, y) = T (y) − U (x). a) Comment s’écrit alors l’équation (1.33) en fonction de T et U ? b) Résoudre l’équation (1.33) dans le cas particulier suivant : T = 1, N = 1, et
1
J(u) = 0
44
π2 2 u (t) − u(t) dt. 4
2
1.22. Calcul différentiel d’ordre 2 sur un espace de matrices...
1.22. Calcul différentiel d’ordre 2 sur un espace de matrices. Surjectivité de la normale unitaire à une hypersurface compacte de Rn . Ensemble des solutions possibles d’une équation différentielle scalaire linéaire d’ordre n Durée : 3 heures EXERCICE 1 Soit E = Mn (R) l’ensemble des matrices carrées de taille n à coefficients réels structuré en espace euclidien grâce au produit scalaire ·, · : (A, B) ∈ E × E −→ A, B := Tr (AT B) ; on désigne par · la norme associée. On considère f : E −→ R définie pour tout A ∈ E par f (A) = AT A − In 2 . 1) Montrer que f est de classe C ∞ sur E et déterminer, pour tout A, H ∈ E Df (A)(H), et D2 f (A)(H, K), (pour A ∈ E, (H, K) ∈ E × E). 2) On suppose A orthogonale. Vérifier que Df (A) = 0, D2 f (A)(H, H) ≥ 0 pour tout H ∈ E. Ce résultat était-il prévisible ? EXERCICE 2 Soit Rn , n ≥ 2, muni du produit scalaire ·, · et de la norme euclidiennne · canoniques. On désigne par S la sphère unité de Rn . On considère h : Rn −→ R de classe C 1 et on pose Σ = {x ∈ Rn : h(x) = 0}. On suppose : Σ = ∅, Σ bornée, ∇h(x) = 0 pour tout x ∈ Σ. Le but de l’exercice est de démontrer que l’application ∇h(x) est surjective de Σ dans S. x −→ ∇h(x) 1) Quelle est la nature de Σ? Donner l’équation de l’hyperplan (vectoriel) tangent à Σ en x ¯ ∈ Σ. 2) Soit B une boule fermée contenant Σ. Indiquer les raisons pour lesquelles h garde un signe constant sur Rn \ B. On supposera dans la suite que h est strictement positive sur Rn \ B. 3) Soit u ∈ S (un vecteur unitaire de Rn donc) ; soit f : Rn −→ R définie par f (x) := u, x . a) Démontrer qu’il existe x ¯ ∈ Σ, λ ∈ R, tels que u = λ∇h(¯ x). (Indication : on pourra par exemple chercher x ¯ extremum de f sur Σ.) 45
Chapitre 1. Énoncés
b) Vérifier que l’on peut choisir x ¯ tel que, de plus, ¯ > 0} E := {x ∈ Rn : u, x − x ne rencontre pas Σ. On prendra un tel x ¯ pour la suite. Montrer alors que h est strictement positive sur E. c) Soit ϕ : t ∈ R → ϕ(t) := h(¯ x + tu). Vérifier que ϕ(t) > 0 pour t > 0 et que ∇h(¯ x) . ϕ (0) ≥ 0. En déduire que u = ∇h(¯ x) EXERCICE 3 Soit I un intervalle ouvert de R, n un entier strictement positif. L’objet de l’exercice est de caractériser les fonctions y : I −→ R qui sont n fois dérivables sur I et qui sont telles qu’il existe des fonctions a1 , a2 , · · · , an continues sur I pour lesquelles (edl)n
y (n) + a1 y (n−1) + · · · + an−1 y + an y = 0.
1) (Question de cours.) On considère (edl)n où les fonctions a1 , a2 , · · · , an supposées continues sont données. Rappeler les résultats concernant l’existence et la structure des solutions de (edl)n , ainsi que les conditions additionnelles assurant l’unicité de la solution. 2) Soit y : I −→ R n fois dérivable sur I, non identiquement nulle sur I, vérifiant (edl)n pour un jeu de données a1 , a2 , · · · , an continues sur I. Montrer que (∗)
[y(t)]2 + [y (t)]2 + · · · + [y (n−1) (t)]2 > 0 pour tout t ∈ I.
3) Soit y : I −→ R n fois dérivable sur I, vérifiant (∗). Pour tout i = 1, · · · , n, on définit y (n−i) (t)y (n) (t) . t ∈ I −→ ai (t) := − [y(t)]2 + [y (t)]2 + · · · + [y (n−1) (t)]2 Vérifier que y est solution de (edl)n correspondant à données a1 , a2 , · · · , an . 4) Résumer en un énoncé clair ce qu’est l’ensemble E des fonctions y ∈ C n (I, R) telles qu’il existe a1 , a2 , · · · , an continues sur I telles que y (n) + a1 y (n−1) + · · · + an−1 y + an y = 0.
46
1.23. Descente continue le long du gradient. Projection sur une surface de R3
1.23. Descente continue le long du gradient. Projection sur une surface de R3 Durée : 3 heures EXERCICE 1 On munit Rp de la norme x = x, x 1/2 où ·, · désigne le produit scalaire usuel. On considère x0 un élément fixé de Rp et la fonction F : Rp −→ R définie par F (x) =
Ax, x − x0 , x , 2
où A ∈ Sp (R) est une matrice symétrique définie positive, i.e. il existe α > 0 tel que Ax, x ≥ αx2 pour tout x ∈ Rp . 1) Montrez que F est différentiable en tout x ∈ Rp et que ∇F (x) = Ax − x0 pour tout x ∈ Rp . 2) On pose f = ∇F : Rp −→ Rp . Soit a ∈ Rp , montrez que le problème de Cauchy, ⎧ ⎪ ⎨x (t) = −f (x(t)) (1.34) ⎪ ⎩ x(0) = a admet une solution unique x définie sur [0, +∞[. On pose h(t) = F (x(t)) ; montrez que, pour tout t ≥ 0, on a h (t) = −x (t)2 . En déduire que F (x(t)) ≤ F (a) pour tout t ≥ 0. 3) Montrez que h (t) = 2Ax (t), x (t) . En déduire que h +2αh ≥ 0 sur [0, +∞[ et que la fonction ψ(t) = h (t)e2αt est croissante sur [0, +∞[. En déduire que x (t) ≤ e−αt f (a) pour tout t ∈ [0, +∞[. Montrez que pour tout 0 ≤ s ≤ t, on a x(t) − x(s) ≤
f (a) −αs (e − e−αt ). α
En déduire que x(t) a une limite quand t tend vers +∞, notée x∞ , et que f (x∞ ) = 0. Que représente x∞ pour la fonction F ? 47
Chapitre 1. Énoncés
4) Application numérique. On pose A =
2 0 0 1
0 et x0 = − . Résoudre le 2
système (1.34) et calculez limt→+∞ x(t). EXERCICE 2 L’espace R3 est muni des coordonnées x, y, z et du produit scalaire usuel qui en fait un espace euclidien. On note B(x, r) la boule euclidienne ouverte de centre x et de rayon r. On considère la fonction de R3 dans R donnée par F (x, y, z) = x2 + y 2 − z, et le sous-ensemble S := F −1 {0} = {(x, y, z) ∈ R3 : x2 + y 2 − z = 0}. Pour tout p ∈ R3 , on pose d(p, S) = inf m∈S p − m. 1) Questions préliminaires. a) Tracer la surface S. b) Soit p ∈ R3 quelconque. Montrer qu’il existe un point m ∈ S tel que p − m = d(p, S),
(1.35)
et que pour tout m vérifiant la condition (1.35), il existe λ ∈ R tel que p − m = λ∇F (m), (on pourra observer que (1.35) équivaut à p − m2 = inf m ∈S p − m 2 ). c) Déterminer l’ensemble de ces points m ∈ S pour p = (0, 0, 1). 2) On considère l’application Φ : R2 × R −→ R3 donnée par Φ((x, y), t) := (x, y, x2 + y 2 ) + t∇F (x, y, x2 + y 2 ). a) Soit (x0 , y0 ) ∈ R2 et p0 = (x0 , y0 , x20 + y02 ). Montrez qu’il existe η > 0 et un voisinage U de p0 tels que Φ soit un difféomorphisme de B((x0 , y0 )), η)×] − η, η[ sur U . b) Soit p ∈ U ∩ B(p0 , η/2) ; montrez que d(p, S) ≤ η/2. Soit m ∈ S tel que d(p, S) = p − m ; montrez que m ∈ B(p0 , η). Soit λ ∈ R tel que p = m + λ∇F (m). Montrez que λ ≤ η ; en déduire que m = m(p) est unique et est donné par m(p) = Φ [Φ−1 (p)]1 , 0 , où, si X est un élément de R2 × R, [X]1 désigne sa première composante, qui est un élément de R2 . 48
1.24. Une surface conique de R3 . Monotonie des solutions d’équations...
1.24. Une surface conique de R3 . Monotonie des solutions d’équations différentielles scalaires autonomes. Une équation différentielle vectorielle linéaire Durée : 3 heures EXERCICE 1 Soit Σ = {(x, y, z) ∈ R3 : f (x, y, z) = 0}, où f (x, y, z) = x3 + y 3 + z 3 − 6xyz. 1) Démontrer que Σ\{(0, 0, 0)} est une sous-variété de classe C 1 de dimension 2 de R3 . 2) Donner une condition suffisante (portant sur (x0 , y0 , z0 )) pour que l’on puisse remplacer, au voisinage de (x0 , y0 , z0 ) ∈ Σ, l’équation f (x, y, z) = 0 de Σ, par une expression de la forme z = ϕ(x, y). 3) Déterminer le plan affine tangent à Σ au point (1, 2, 3). Comment pouvait-on prévoir que ce plan passerait nécessairement par l’origine ? EXERCICE 2 Soit I0 un intervalle ouvert de R et f : I0 −→ R continue. On considère l’équation différentielle scalaire autonome suivante : (ed)
x = f (x).
Soit I un intervalle ouvert contenu dans I0 , x : I −→ R dérivable sur I, tels que x soit solution de (ed), i.e. : pour tout t ∈ I, x(t) ∈ I0 et x (t) = f (x(t)). Montrer que, nécessairement, x est croissante sur I ou décroissante sur I. EXERCICE 3 Soit à résoudre l’équation différentielle ⎧ t 1 ⎪ x+ y x = − ⎪ ⎪ 2 ⎨ 1+t 1 + t2 (ED) ⎪ ⎪ ⎪ ⎩y = 1 x + t y 1 + t2 1 + t2 49
Chapitre 1. Énoncés
et le problème de Cauchy associé ⎧ ⎪ ⎨(ED) (C) ⎪ ⎩ (x(t0 ), y(t0 )) = (x0 , y0 ). où t0 ∈ R et (x0 , y0 ) ∈ R2 . 1) – De quel type est l’équation différentielle (ED) ? – Que peut-on en déduire concernant l’existence, l’unicité et l’intervalle de définition des solutions maximales de (C) ? – Déterminer les solutions t −→ X(t) = (x(t), y(t)) de (ED) qui sont (des fonctions) affines. – Résoudre (C) lorsque t0 = 1 et (x0 , y0 ) = (1, 1). 2) On désigne par Xt0 ,x0 ,y0 la solution du problème de Cauchy (C) et par R la matrice 2 × 2 (canoniquement associée à un endomorphisme de R2 ) telle que x xt0 ,x0 ,y0 (t) = R 0 pour tout t ∈ R. Xt0 ,x0 ,y0 (t) = y0 yt0 ,x0 ,y0 (t) (R est la résolvante de (ED), elle dépend de t et t0 ). Calculer, sans chercher à déterminer Xt0 ,x0 ,y0 ni R, la valeur du déterminant de R. 3) On cherche à déterminer les solutions de (ED) de la forme t −→ X(t) = (u(t), tu(t) + v(t)), où u et v sont des fonctions de la variable réelle t. – Montrer que cela conduit à une équation différentielle en (u, v), notée (ED)1 , que l’on explicitera. – Résoudre (ED)1 et en déduire l’expression générale des solutions de (ED). 4) Déduire de ce qui précède Xt0 ,x0 ,y0 et R. (On donnera les résultats sous la forme la plus simplifiée et lisible possible.) 50
1.25. Un problème aux limites par le Théorème des fonctions implicites...
1.25. Un problème aux limites par le Théorème des fonctions implicites. Équations différentielles linéaires à coefficients périodiques Durée : 3 heures EXERCICE On considère C([0, 1], R) muni de la norme x∞ = supt∈[0,1] |x(t)| et X = C 2 ([0, 1], R) muni de la norme x = x∞ + x ∞ + x ∞ . On pose Z = C([0, 1], R) × R × R, et pour f ∈ C([0, 1], R) fixé, on définit F = X × R −→ Z par F (x, ε) = (x + x2 − εf, x(0), x(1)). Montrez que F est de classe C 1 et que, pour tout x, u ∈ X, ε, η ∈ R, on a DF (x, ε)(u, η) = (u + 2ux − ηf, u(0), u(1)). Montrez que D1 F (0, 0) ∈ Isom(X, Z). En déduire que pour tout ε proche de 0, il existe une solution de ⎧ 2 ⎪ ⎨x (t) + (x(t)) = εf (t) pour tout t ∈ [0, 1] . ⎪ ⎩ x(0) = x(1) = 0. PROBLÈME On considère un ouvert U de Rn et g : R × U −→ Rn une application continue localement Lipschitzienne par rapport à la deuxième variable. On suppose que pour tout x ∈ U , la fonction g(., x) est T -périodique. 1) Soit x : R −→ Rn une solution définie sur tout R de x (t) = g(t, x(t)) telle que x(0) = x(T ). On pose, pour tout t ∈ R, z(t) = x(t+T ). Montrez que z : R −→ Rn est solution de z (t) = g(t, z(t)) ; en déduire que x(·) est T -périodique. 2) Soient A : R −→ Mn (R) et f : R −→ Rn des applications continues et T périodiques. On note R(t, t0 ) la matrice résolvante associée à l’équation x (t) = A(t)x(t) et on pose X(t) = R(t, 0). a) Exprimez la solution du problème de Cauchy ⎧ ⎪ ⎨x (t) = A(t)x(t) + f (t) ⎪ ⎩
x(0) = c ∈ Rn 51
Chapitre 1. Énoncés
en fonction de R(·, ·), X(·), f etc. En déduire que l’équation x (t) = A(t)x(t) + f (t) possède une solution T -périodique si et seulement si l’équation T (X(s))−1 f (s) ds (I − X(T ))c = X(T )
(1.36)
0
possède une solution c ∈ Rn . b) En déduire que les propriétés suivantes sont équivalentes : i) l’équation x (t) = A(t)x(t) + f (t) possède une solution T -périodique unique ; ii) l’équation x (t) = A(t)x(t) n’a pas d’autre solution T -périodique que x(t) ≡ 0 ; iii) la matrice I − X(T ) est inversible. 0 −1 01 c) On considère les matrices A1 (t) = , A2 (t) = , et la fonction 1 0 10 cos(ωt) f (t) = avec ω ∈ R∗ . Quelle est la plus petite période T de f ? Pour sin(ωt) quelles valeurs de ω les équations x (t) = Ai (t)x(t) + f (t), i ∈ {1, 2}, possèdentelles des solutions T -périodiques ? On suppose dans toute la suite du problème que l’équation x (t) = A(t)x(t) n’a pas d’autre solution T -périodique que x(t) ≡ 0. 3) Soit c ∈ Rn défini en (1.36), et soit x(.) l’unique solution T -périodique de x (t) = A(t)x(t)+f (t) telle que x(0) = c. Montrez qu’il existe β > 0 ne dépendant que de X(.) tel que c ≤ βf ∞ , où f ∞ = supt∈[0,T ] f (t). En déduire l’existence de α > 0 ne dépendant que de X(.) tel que x∞ ≤ αf ∞ . ¯ r) ⊂ Rn et on considère g : R × B → Rn 4) Soit r > 0, on pose B = B(0, une application continue telle que, pour tout x ∈ B, g(., x) est T -périodique. On suppose qu’il existe k, M > 0 tels que kα < 1, M α < 1 où α est défini en 3), et que g est k-Lipschitzienne par rapport à x avec g(t, x) ≤ M x sur R × B. a) On note X = CT (R, B) l’ensemble des fonctions y : R → B continues et T périodiques, et on munit X de la norme · ∞ . Pour tout y ∈ X, soit z(.) l’unique solution T -périodique de z (t) = A(t)z(t) + μf (t) + g(t, y(t)) dont l’existence est garantie par 3). Montrez que z∞ ≤ α(|μ|f ∞ + M r). 52
1.26. Du Théorème des fonctions implicites au Théorème de Cauchy-Lipschitz
En déduire que, pour |μ| assez petit, on peut définir une application T : X −→ X par T (y) = z. b) Montrez que T est Lipschitzienne de constante αk ; en déduire l’existence d’une solution T -périodique x(.) de x (t) = A(t)x(t) + μf (t) + g(t, x(t)).
1.26. Du Théorème des fonctions implicites au Théorème de Cauchy-Lipschitz Durée : 2-3 heures On pose I = [−1, 1], et on considère les espaces de Banach Z = C(I, R) muni de la norme z∞ = maxt∈I |z(t)| et Y = {y ∈ C 1 (I, R) : y(0) = 0} muni de la norme y1 = y∞ + y ∞ . 1) Soit g : R −→ R une fonction uniformément continue et soit Ng : Z −→ Z l’application définie par Ng (z) = g ◦ z pour tout z ∈ Z. Montrez que Ng est continue sur Z. 2) Soit f : R −→ R une fonction dérivable sur R avec f uniformément continue ˆf : Y −→ Z définie par N ˆf (y) = f ◦ y, pour sur R. On introduit l’application N tout y ∈ Y . Soit y ∈ Y et Ly : Y −→ Z définie par Ly (h) = Nf (y)h = (f ◦ y)h, c’est-à-dire [Ly (h)](t) = f (y(t))h(t) pour tout t ∈ [−1, 1]. ˆf est différentiable en y et Montrez que Ly est linéaire continue. Montrez que N ˆf (y) = Ly . Montrez que, pour tout y1 , y2 ∈ Y , on a que DN ˆf (y2 )|| ≤ Nf (y1 ) − Nf (y2 )∞ . ˆf (y1 ) − DN ||DN ˆf est de classe C 1 sur Y . En déduire que N 3) On considère F : R × Y −→ Z définie par : pour tout λ ∈ R et y ∈ Y ˆf (y). F (λ, y) = y − λN Montrez que l’on a ˆf (y) pour tout s ∈ R, D1 F (λ, y)(s) = −sN
53
Chapitre 1. Énoncés
et D2 F (λ, y)(h) = h − λNf (y)h pour tout h ∈ Y. En déduire que F est de classe C 1 sur R × Y . Montrez que pour tout z ∈ Z, il existe y ∈ Y unique tel que y = z ; en déduire que D2 F (0, 0) est un isomorphisme de Y dans Z. ¯ > 0 et d’une application ϕ : 4) Déduire de ce qui précède l’existence de λ 1 ¯ λ]. ¯ On ¯ ¯ [−λ, λ] −→ Y de classe C telle que F (λ, ϕ(λ)) = 0 pour tout λ ∈ [−λ, ¯ λ] ¯ −→ R définie par introduit x : [−λ, t ¯ x(t) = ϕ(λ) ¯ . λ Montrez que x est solution de ⎧ ¯ λ] ¯ ⎨ x (t) = f (x(t)) pour tout t ∈ [−λ, ⎩
x(0) = 0,
¯ de telle sorte que x soit l’unique fonction de classe C 1 et que l’on peut choisir λ solution de ce problème.
1.27. Intégrales premières. Utilisation du Théorème des fonctions implicites. Une équation aux dérivées partielles Durée : 3 heures EXERCICE 1 Soit U ⊂ R × Rn un ouvert et soit f : U −→ Rn une application continue localement Lipschitzienne par rapport à la deuxième variable. On dit qu’une fonction H : U −→ R est une intégrale première de l’équation différentielle x (t) = f (t, x(t)) si, pour toute solution (I, x(·)) de cette équation, il existe une constante c ∈ R telle que H(t, x(t)) = c pour tout t ∈ I. a) Montrez que H de classe C 1 est une intégrale première si et seulement si ∂H ∂H (t, x) + fj (t, x) (t, x) = 0 pour tout (t, x) ∈ U. ∂t ∂xj n
j=1
54
1.27. Intégrales premières. Utilisation du Théorème des fonctions implicites...
x b) On suppose que n = 1, U = {(t, x) ∈ R×R∗ : t+x2 = 0} et f (t, x) = t + x2 t pour tout (t, x) ∈ U . Montrez que H(t, x) = − x est une intégrale première. x En déduire l’ensemble des solutions de l’équation différentielle x (t) = f (t, x(t)) et leurs représentations graphiques. EXERCICE 2 Soient L(Rn ) (n ∈ N∗ ) l’ensemble des applications linéaires de Rn dans lui-même, et Ω un ouvert de Rn . Soient f : Ω −→ Rn et g : Ω −→ L(Rn ) deux applications de classe C 1 . On définit une application F : Ω × Ω −→ Rn par F (x, y) = g(x)(f (y)) + f (x). a) Montrer que l’application F est de classe C 1 et déterminer DF , D1 F et D2 F . b) On suppose que 0 ∈ Ω et que f (0) = 0. Donner une condition sur f et g pour qu’il existe des voisinages ouverts U et V de 0 dans Rn et une application ψ : U −→ V de classe C 1 tels que (x, y) ∈ U × V et F (x, y) = 0 ⇐⇒ y = ψ(x). Exprimer Dψ(0). EXERCICE 3 Soit l’équation aux dérivées partielles suivante, d’inconnue f : R∗+ × R −→ R de classe C 1 : ∂f ∂f x (x, y) + y (x, y) = x4 + y 4 . ∂x ∂y a) Montrer que l’application φ définie par φ(x, y) = un C 1 -difféomorphisme de R∗+ × R sur R × R∗+ .
y x
, x2 + y 2 = (u, v) est
b) Pour (u, v) ∈ R × R∗+ , on pose : F (u, v) = f (x, y), de sorte que f = F ◦ φ. Exprimer les dérivées partielles premières de f en fonction de celles de F et de φ. En déduire que l’équation proposée se ramène à l’équation d’inconnue F de classe C 1 sur R × R∗+ : √ 1 + u4 ∂F (u, v) = . (1.37) ∂v 2(1 + u2 ) 55
Chapitre 1. Énoncés
c) Déterminer la solution générale de l’équation (1.37), et en déduire que la solution de l’équation de départ est f (x, y) =
y 1 4 x + y4 + g 2 x
,
où g : R −→ R est une fonction arbitraire de classe C 1 .
1.28. Différentiabilité de la fonction distance à un ensemble. Une équation différentielle scalaire non linéaire du deuxième ordre. Système différentiel linéaire où les valeurs propres de A(t) ne dépendent pas de t Durée : 3 heures EXERCICE 1 Soit (H, ·, · ) un espace de Hilbert réel et · la norme associée au produit scalaire ·, · . Si f : H −→ R est différentiable en a, on note ∇f (a) le gradient de f en a, c’est-à-dire l’élément de H caractérisé par : Df (a)h = ∇f (a), h pour tout h ∈ H. On rappelle que la norme de Df (a) dans H ∗ = L(H, R) est égale à la norme de ∇f (a) (dans H). Soit S une partie fermée non vide de H vérifiant la propriété suivante : (π)
pour tout x ∈ H, il existe x ¯ ∈ S tel que x − x ¯ = dS (x).
Ici, dS désigne la fonction distance à S, c’est-à-dire : dS (x) = inf x − y pour tout x ∈ H. y∈S
1) Montrer que si S est une partie fermée non vide de Rn , alors S vérifie (π). (N.B. : la résolution de cette question n’est pas nécessaire pour la suite de l’exercice.) 2) Montrer : pour tout (x, x ) ∈ H × H, |dS (x) − dS (x )| ≤ x − x . 56
(1.38)
1.28. Différentiabilité de la fonction distance à un ensemble. Une équation...
3) Soit a un point de H en lequel dS est différentiable. a) Vérifier que ∇dS (a) ≤ 1.
(1.39)
b) Établir que si a ∈ S, alors ∇dS (a) = 0. c) On suppose ici que a ∈ S ; on considère alors un point a ¯ ∈ S tel que a − a ¯ = dS (a). – Si t ∈]0, 1], montrer que a ¯ est l’unique point y ∈ S vérifiant a − a)] = [a + t(a − a ¯)] − y. dS [a + t(¯
(1.40)
– En déduire ∇dS (a), a ¯ − a = −a − a ¯ et ∇dS (a) =
a−a ¯ . a − a ¯
(1.41)
¯ = dS (a) ? – Est-il possible qu’il y ait d’autres points a ¯ ∈ S vérifiant a − a 4) Exemple (facultatif). Dans Rn muni de la norme euclidienne usuelle, on pose S = {x ∈ Rn : x = 1}. En quels points a de Rn la fonction dS est-elle différentiable ? EXERCICE 2 On considère le problème de Cauchy scalaire suivant :
(C)
⎧ 3 ⎪ ⎨x = 2x , x(0) = 1, ⎪ ⎩ x (0) = 1.
1) Après avoir justifié son existence et son unicité, montrer que la solution maxi¯4 sur I. male (I, x¯) de (C) vérifie (¯ x )2 = x 2) En déduire (I, x¯). EXERCICE 3 Soit I un intervalle ouvert de R et A : t ∈ I −→ A(t) ∈ Mn (R) une application continue. 57
Chapitre 1. Énoncés
1) On suppose : – pour tout t ∈ I, il existe λ(t) valeur propre dans K (K = R ou C) de A(t) telle qu’un vecteur propre associé v (∈ K n ) ne dépende pas de t. – Il existe μ : I −→ K dérivable tel que μ (t) = λ(t) pour tout t ∈ I. Montrer qu’alors
x : I −→ K n t −→ x(t) = eμ(t) v
est solution de x = A(t)x. 2) On suppose ici : – pour tout t ∈ I, A(t) est diagonalisable (à l’aide de matrices de Mn (K)). – Si λ1 (t), · · · , λn (t) désignent les valeurs propres dans K de A(t), il y a des vecteurs propres v1 , · · · , vn (∈ K n ) associés (vi est associé à λi (t)) ne dépendant pas de t. – Pour tout i = 1, · · · , n, il existe μi : I −→ K dérivable tel que μi (t) = λi (t) pour tout t ∈ I. Montrer qu’alors {xi : t ∈ I −→ xi (t) = eμi (t) vi }i=1,··· ,n constitue un système fondamental de solutions de x = A(t)x. a(t) b(t) 3) Exemple d’application : n = 2 et A(t) = , où a, b : I −→ R sont −b(t) a(t) supposés continues. a) Vérifier qu’on est bien dans les conditions de la 2e question. b) On appelle α (resp. β) une primitive de a (resp. b) sur I. – Déterminer en fonction de α et β un système fondamental de solutions (complexes) de x = A(t)x. – En déduire l’expression R(t, t0 ) de la résolvante en (t, t0 ) ∈ I × I du système et un système fondamental de solutions réelles de x = A(t)x. – En déduire la solution du problème de Cauchy suivant : ⎧ ⎪ ⎨x = A(t)x ⎪ ⎩ où t0 ∈ I, (ξ1 , ξ2 ) ∈ R2 . 58
x(t0 ) = (ξ1 , ξ2 ),
1.29. Équations différentielles scalaires. Équation différentielle...
1.29. Équations différentielles scalaires. Équation différentielle vectorielle linéaire à coefficients périodiques Durée : 3 heures EXERCICE 1 Soit E = C ∞ (R, R), p ∈ E, et : E −→ E défini par : (y) = y + py pour tout y ∈ E. 1) Vérifiez que est linéaire et déterminer ◦ . 2) On cherche à résoudre y + 2 tanh(x)y + y = 0.
(ed)
a) Proposer une solution de (ed). b) Déterminer toutes les solutions de (ed). EXERCICE 2
+∞
Soit θ : [0, +∞[−→ R continue telle que
|θ(t)| dt < +∞. On considère
0
l’équation différentielle linéaire
f + (1 + θ(t))f = 0.
(ed)
Soit f une solution de (ed) (donc définie sur tout l’intervalle [0, +∞[). On pose :
t
g(t) = f (t) +
θ(u)f (u) sin(t − u) du pour tout t ≥ 0.
0
1) Vérifiez que g (t) + g(t) = 0 pour tout t ≥ 0. 2) Montrer qu’il existe un réel A tel que :
t
|f (t)| ≤ A +
|θ(u)|.|f (u)| du pour tout t ≥ 0.
0
3) Montrer que toute solution de (ed) est bornée sur [0, +∞[. 59
Chapitre 1. Énoncés
EXERCICE 3 Soit A : R −→ M2 (C) continue et 2π-périodique. On considère l’équation différentielle linéaire homogène suivante : x = A(t)x.
(EDL)0
Soit x1 , x2 : R −→ C2 deux solutions linéairement indépendantes de (EDL)0 , et M : R −→ M2 (C) la matrice fondamentale associée (i.e., les deux vecteurscolonnes de M (t) sont x1 (t) et x2 (t)). 1) a) Vérifier que t −→ x1 (t + 2π) et t −→ x2 (t + 2π) sont encore solutions de (EDL)0 . b) En déduire qu’il existe P ∈ M2 (C) inversible telle que M (t + 2π) = M (t)P pour tout t ∈ R.
(1.42)
2) Déduire qu’il existe B ∈ M2 (C) telle que P : t −→ P (t) = M (t)etB
(1.43)
soit 2π-périodique.
1.30. Distance de l’origine à une courbe de R3 . Comportement asymptotique des solutions d’une équation différentielle scalaire Durée : 3 heures EXERCICE 1 Soit C = {(x, y, z) ∈ R3 : x2 + 2y 2 − z 2 = 1 et − x + 3z = −1}. 1) Montrer que C est une sous-variété C 1 de R3 et déterminer sa dimension. 2) Soit M = (1, 0, 0) ∈ C. Déterminer un vecteur directeur de la droite tangente à C en M . 3) On considère le problème de la minimisation de u −→ f (u) = u2 sur C ( · désigne ici la norme euclidienne usuelle de R3 ). a) Montrer que f est bornée inférieurement sur C et que la borne inférieure de f sur C est atteinte en un point de C. 60
1.30. Distance de l’origine à une courbe de R3 . Comportement asymptotique...
b) Indiquer pourquoi un point minimisant f sur C vérifie les conditions d’extrémalité de Lagrange. Déterminer les points de C vérifiant les conditions d’extrémalité de Lagrange. Quels sont les points de C minimisant (globalement) f sur C. En déduire la distance de l’origine (0, 0, 0) à C. EXERCICE 2 Soit (t, u) ∈ R2 −→ f (t, u) ∈ R une fonction continue sur R2 . On suppose de plus : (H1 )
f (t, 0) = f (t, 1) = 0 pour tout t ∈ R,
(H2 )
f (t + 1, u) = f (t, u) pour tout (t, u) ∈ R2 ,
(H3 )
f est dérivable par rapport à u et
∂f est continue sur R2 . ∂u
Le but de l’exercice est d’étudier le comportement, quand t −→ +∞, des solutions globales de l’équation différentielle : (ED)
x = f (t, x).
Partie A 1) Soient x1 et x2 deux solutions maximales de (ED), définies sur les intervalles ouverts I1 et I2 respectivement. On suppose I1 ∩I2 = ∅ et on considère t0 ∈ I1 ∩I2 . a) Montrer que, si x1 (t0 ) = x2 (t0 ), alors I1 = I2 et x1 = x2 sur I1 . b) On suppose x1 (t0 ) < x2 (t0 ). On se propose de démontrer : x1 (t) < x2 (t) pour tout ∈ I1 ∩ I2 . Pour cela, on raisonne par l’absurde : on suppose qu’il existe t1 ∈ I1 ∩ I2 tel que x1 (t1 ) ≥ x2 (t1 ). Montrer qu’il existe t¯ ∈ I1 ∩ I2 tel que x1 (t¯) = x2 (t¯) et conclure. 2) Soit x une solution maximale de (ED), définie sur l’intervalle ouvert I. Soit t0 ∈ I et supposons que x(t0 ) ∈ [0, 1]. a) Utilisant l’hypothèse (H1 ) et les résultats de la question 1), montrer : 0 ≤ x(t) ≤ 1 pour tout t ∈ I. b) On se propose de démontrer que I = R. On va en fait montrer que I n’est pas majoré (que I n’est pas minorée se démontre de la même manière). Supposons que la partie de I à droite de t0 est [t0 , tmax [ avec tmax < +∞. 61
Chapitre 1. Énoncés
– Montrer que |x | est bornée sur [t0 , tmax [, puis qu’il existe C > 0 tel que : |x(t) − x(t )| ≤ C|t − t | pour tout t, t ∈ [t0 , tmax [. – En déduire que x(t) admet une limite quand t → tmax par valeurs inférieures. – Montrer qu’on a alors une contradiction et déduire de ce qui précède que tmax = +∞. Partie B Dans toute la suite de l’exercice, on désignera par x une solution de (ED) telle que x(0) ∈]0, 1[. Ainsi, au vu des résultats de la Partie A, x est définie sur tout R. 3) a) Définissons une nouvelle fonction x1 : R −→ R par : x1 (t) = x(t + 1) pour tout t ∈ R. – Montrer que x1 est aussi solution de (ED). – En déduire, en utilisant les résultats de la 1re question, que : – ou bien x1 (t) = x(t) pour tout t ∈ R (cas noté I), – ou bien x1 (t) < x(t) pour tout t ∈ R (cas noté II), – ou bien x1 (t) > x(t) pour tout t ∈ R (cas noté III). b) Pour tout n ∈ N, on définit xn : t ∈ R −→ xn (t) = x(t + n). Montrer que : – dans le cas II, la suite des fonctions (xn )n∈N est décroissante ; – dans le cas III, la suite (xn )n∈N est croissante ; – dans le cas I, la suite (xn )n∈N est stationnaire. Le lecteur-étudiant remarquera que, dans le cas I, la fonction est 1-périodique. Le but de la fin de l’exercice est de montrer que, dans les cas II et III, la solution xn tends vers des solutions 1-périodiques de (ED). On supposera que l’on est dans l’un des cas II ou III. 4) a) Montrer que la suite (xn (0))n est convergente. b) Montrer qu’il existe L > 0 tel que : |xn (t) − xp (t)| ≤ |xn (0) − xp (0)| + 0
62
t
L|xn (s) − xp (s)| ds pour tout t > 0.
1.31. Équation différentielle y = xy 2 . Comportement asymptotique...
En déduire : |xn (t) − xp (t)| ≤ eLt |xn (0) − xp (0)| pour tout t > 0. c) Montrer que la suite de fonctions (xn )n converge uniformément sur tout compact de R+ vers une fonction t −→ x∞ (t), 1-périodique. d) Montrer que x∞ est de classe C 1 et que x∞ est solution de (ED). e) Conclure que limτ −→+∞ |x(τ ) − x∞ (τ )| = 0.
1.31. Équation différentielle y = xy 2. Comportement asymptotique des solutions d’une équation différentielle linéaire vectorielle Durée : 3 heures EXERCICE 1 On considère le problème de Cauchy suivant : ⎧ 2 ⎪ ⎨y = xy , ⎪ ⎩
(1.44) y(x0 ) = y0 ,
où y(·) est une fonction numérique de la variable réelle notée x. 1) Rappeler pourquoi, pour tout (x0 , y0 ) ∈ R2 , il existe une et une seule solution maximale y : I −→ R de l’équation différentielle y = xy 2 vérifiant y(x0 ) = y0 . Le but de l’exercice est de déterminer I et y pour tous les couples (x0 , y0 ) de R2 . 2) a) On suppose y0 = 0. Quelle est alors la solution maximale de (1.44) ? b) On suppose y0 = 0 Montrer que la solution maximale y de (1.44) vérifie y(x) > 0 pour tout x ∈ I ou bien y(x) < 0 pour tout x ∈ I. En déduire que dans ce cas, (1.44) équivaut à : ⎧ y ⎪ ⎪ ⎪ ⎨ y 2 = x, ⎪ ⎪ ⎪ ⎩y(x ) = y . 0 0
(1.44)
63
Chapitre 1. Énoncés
3) On suppose désormais y0 = 0. Résoudre (1.44) en précisant, suivant (x0 , y0 ) : – l’intervalle maximal I sur lequel est définie la solution maximale y de (1.44) ; – l’expression de la solution maximale y de (1.44) . Indication : Il y a six cas de figure différents à considérer. EXERCICE 2 On désigne par E l’espace euclidien Rn muni du produit scalaire canonique x, y =
n
xi yi ;
i=1
on note · la norme euclidienne associée (i.e., celle qui à x associe ( ni=1 x2i )1/2 ). Soit t −→ A(t) une application continue d’un intervalle ouvert "I de R contenant +∞ [a, +∞[ (a ≥ 0) à valeurs dans Mn (R). On fait l’hypothèse que a A(t) dt est " +∞ une intégrale convergente, strictement positive et on pose M = a A(t) dt. On se propose d’étudier le comportement des solutions de x = A(t)x
(ED) quand t tend vers +∞.
1) Soit N : E −→ R définie par N (x) = x. Déterminer l’ouvert D de E sur lequel la fonction N est différentiable et calculer la différentielle de N en tout point x de D. 2) Soit (t0 , x0 ) ∈ I × Rn et le problème de Cauchy : ⎧ ⎪ ⎨x = A(t)x (C) ⎪ ⎩ x(t0 ) = x0 . Que peut-on dire des solutions de (C) ? (On demande des réponses sur l’existence, l’unicité, l’intervalle maximal de définition des solutions.) 3) Soit t ∈ I −→ x(t) une solution de (ED) non identiquement nulle. a) Montrer que x(t) = 0 pour tout t ∈ I. b) Soit u : t ∈ I −→ u(t) = log(x(t)) (log désigne le logarithme népérien). Calculer u (t) et en déduire : e−M x(a) ≤ x(t) ≤ eM x(a) pour tout t ≥ a. 64
1.32. Formule de Thermodynamique sur les dérivées partielles. Équation...
c) Soit a ≤ t0 ≤ t1 . Montrer qu’il existe une constante N > 0, indépendante de t0 et t1 , telle que t1 x(t1 ) − x(t0 ) ≤ N A(t) dt. t0
d) En déduire que x(t) tend vers une limite l ∈ Rn lorsque t −→ +∞. 4) Soit l un élément non nul de E ; on va montrer qu’il existe une et une seule solution de (ED) qui tend vers l quand t → +∞. a) Montrer que s’il existe une telle solution, elle est unique. b) Pour tout λ de l’intervalle [a, +∞[, soit xλ la solution du problème de Cauchy ⎧ ⎪ ⎨x = A(t)x ⎪ ⎩
x(λ) = l. "μ Montrer que xμ (λ) − xλ (λ) ≤ e2M l λ A(s) ds pour a ≤ λ ≤ μ. En déduire qu’il existe K > 0 telle que μ A(s) ds pour tout t ∈ [a, +∞[. xμ (t) − xλ (t) ≤ K λ
c) Montrer que si λ → +∞, xλ converge vers une fonction x∞ qui est solution de (ED), et que limt→+∞ x∞ (t) = l.
1.32. Formule de Thermodynamique sur les dérivées partielles. Équation différentielle x = t sin x. Équation différentielle linéaire à coefficients périodiques Durée : 3 heures EXERCICE 1 Un fluide homogène obéit à une certaine « équation d’état », c’est-à-dire qu’il existe une fonction numérique F définie et de classe C 1 sur un ouvert Ω ⊂ (R+ )3 telle que F (p, v, θ) = 0, où p désigne la pression, v le volume et θ la température du fluide en question. On suppose de plus qu’en un état donné (p0 , v0 , θ0 ), chacune de dérivées partielles ∂1 F (p0 , v0 , θ0 ), ∂2 F (p0 , v0 , θ0 ), ∂3 F (p0 , v0 , θ0 ) est différente de 0. 65
Chapitre 1. Énoncés
1) Montrer qu’il existe une fonction Θ de classe C 1 sur un voisinage de (p0 , v0 ), telle que pour (p, v, θ) dans un voisinage de (p0 , v0 , θ0 ), F (p, v, θ) = 0 si et seulement si θ = Θ(p, v). Démontrer de même l’existence des fonctions qui donnent v = V (p, θ), p = P (v, θ) (toujours sous la condition F (p, v, θ) = 0). 2) On note pour simplifier ∂1 Θ(p, v) =
∂θ ∂θ ∂v , ∂2 Θ(p, v) = , ∂2 V (p, θ) = , etc. ∂p ∂v ∂θ
Démontrer alors la formule chère aux thermodynamiciens et d’aspect a priori choquant : ∂p ∂θ ∂v = −1, ∂θ ∂v ∂p (ainsi que toute relation analogue obtenue par permutation circulaire). EXERCICE 2 On considère l’équation différentielle suivante : (ED)
x (t) − t sin(x(t)) = 0,
ainsi que le problème de Cauchy ci-dessous : ⎧ ⎪ ⎨(ED) (C) ⎪ ⎩ x(t0 ) = x0 où t0 ∈ R et x0 ∈ R. 1) Montrer qu’il existe une et une seule solution maximale x : I −→ R de (C) définie sur un intervalle ouvert I de R contenant t0 . (Note : Il est conseillé d’être précis sur les résultats évoqués et leurs énoncés.) 2) Démontrer que I = R ; on se contentera de démontrer que I n’est pas majoré. (Note : Pour celles et ceux qui voudraient appliquer directement un résultat éventuellement démontré en Cours, il est précisé qu’il est bien demandé une démonstration). 3) a) Montrer que toute solution maximale de (ED) est une fonction paire. b) Montrer que si t −→ x(t) est une solution maximale de (ED), alors t −→ x(t) + 2π est encore une solution maximale de (ED). 66
1.32. Formule de Thermodynamique sur les dérivées partielles. Équation...
c) Montrer que si t −→ x(t) est une solution maximale de (ED), alors t −→ −x(−t) est aussi une solution maximale de (ED). d) Que peut-on déduire de ce qui précède quant aux graphes des solutions maximales de (ED) dans R × R ? 4) Résoudre (C) dans les cas suivants : – x0 = 0, – x0 = π, – t0 = 0 et 0 < x0 < π. EXERCICE 3 Soit A : R −→ Mn (R) une application continue. On suppose que A est de période T > 0 : A(t + T ) = A(t) pour tout t ∈ R. On considère l’équation différentielle linéaire homogène suivante : (ED)
x = A(t)x,
et on note R(·, ·) la résolvante associée. 1) Les solutions de (ED) sont-elles nécessairement périodiques de période T ? 2) Montrer que R(t, t0 ) = R(t + T, t0 + T ) pour tout t0 et t. (On rappelle que t −→ R(t, t0 ) ∈ Mn (R) est la solution de ⎧ ⎪ ⎨U (t) = A(t)U (t) (ED)’ ⎪ ⎩ U (t0 ) = In , et ce, quel que soit t0 .) 3) On pose C(t0 ) = R(t0 + T, t0 ). Montrer que si les solutions de (ED) sont toutes de période T , alors C(t0 ) = In pour tout t0 ∈ R. 4) Vérifier que C(t1 ) = R(t1 , t0 )C(t0 )[R(t1 , t0 )]−1 pour tout t0 , t1 . En déduire que C(t) vaut constamment In dès que C(t0 ) = In pour un certain t0 , et qu’alors les solutions de (ED) sont toutes de période T . 5) Soit x une solution non nulle de (ED). Montrer que les deux propositions suivantes sont equivalentes : (i) x(t + T ) = λx(t) pour tout t ∈ R ; (ii) λ est valeur propre de C(t0 ) et x(t0 ) est un vecteur propre associé. En particulier, pour qu’il existe une solution (non nulle) T -périodique de (ED), il faut et il suffit que λ = 1 soit valeur propre de C(t0 ), pour un t0 arbitraire. 67
Chapitre 1. Énoncés
1.33. Équations différentielles non linéaires. Comportement asymptotique des solutions d’une équation différentielle linéaire sous la condition de Liapounov Durée : 3 heures EXERCICE 1 1) a) On considère le problème de Cauchy scalaire ⎧ ⎪ ⎨α − sin α = 1 ⎪ ⎩ α(0) = 0,
(1.45)
et on considère sa solution maximale α : I −→ R. – Vérifier que α est croissante sur I et qu’il existe t¯ > 0 tel que 1 + sin α(t) > 0 pour tout t ∈ [0, t¯]. En déduire que α(t) ∈ [0,
3π [ pour t ∈ [0, t¯]. 2
α = 1 sur [0, t¯], déterminer 1 + sin α l’expression de α(t) pour tout t ∈ [0, t¯]. Rappel : 1 + sin u = 2 cos2 ( u2 − π2 ).
– En intégrant chaque membre de l’égalité
– Déduire de ce qui précède que I = R et donner l’expression de α(t), t ∈ R. b) Soit le problème de Cauchy ⎧ ⎪ ⎨α − sin α = 1 ⎪ ⎩ α(t0 ) = α0 ,
(1.45)
π 3π où t0 ∈ R et α0 ∈] − , [. Déduire de a) que la solution maximale de (1.45)’ 2 2 est définie sur R et donner son expression. 68
1.33. Équations différentielles non linéaires. Comportement asymptotique...
2) On considère le problème de Cauchy vectoriel (non linéaire) suivant : ⎧ ⎪ x = x2 − y − 1 ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ (1.46) y = x + xy, ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ (x(t0 ), y(t0 )) = (x0 , y0 ), où t0 ∈ R et x20 + y02 = 1. a) Donner précisément les propriétés qui font que (1.46) a une solution maximale unique (I, X), avec X : I −→ R2 , t −→ X(t) = (x(t), y(t)). b) On considère le cas particulier où x0 = 0 et y0 = −1. Montrer que la solution maximale de (1.46) est une fonction constante (sur R) à déterminer. c) On suppose (x0 , y0 ) = (0, −1), on choisit α0 ∈] − π2 , 3π 2 [ tel que cos α0 = x0 et sin α0 = y0 . Soit t −→ α(t) = 2 arctan(t + C) + π2 , où C est choisie de sorte que 2 arctan(t0 + C) +
π = α0 . 2
Montrer que t ∈ I = R −→ X(t) = (x(t) = cos α(t), y(t) = sin α(t)) est la solution de (1.46). EXERCICE 2 On considère l’équation différentielle (ED)0
x = Ax,
où A ∈ Mn (R) vérifie l’hypothèse suivante (dite de Liapounov) : Il existe X symétrique définie positive telle que la matrice (symétrique) AT X+XA soit définie négative. Rappel. Une matrice symétrique M est dite définie positive (resp. définie négative) lorsque M x, x > 0 (resp. < 0) pour tout x ∈ R\{0}, ·, · désignant ici le produit scalaire usuel dans Rn . 1) Indiquer pourquoi on peut choisir ε > 0 tel que AT X + XA + εX soit définie négative. On prend pour la suite un tel ε. 2) Montrer que toute solution x(·) de (ED)0 vérifie : Xx(t), x(t) ≤ Xx(0), x(0) e−εt pour tout t ≥ 0.
(1.47) 69
Chapitre 1. Énoncés
Indication : On pourra considérer la dérivée de t −→ Xx(t), x(t) . 3) En déduire : ' x(t) ≤ x(0)
λmax − εt e 2 pour tout t ≥ 0, λmin
où λmax et λmin désignent, respectivement, la plus grande et la plus petite valeur propre de X.
1.34. Une équation différentielle scalaire autonome. Calcul de la hauteur d’une courbe. Différentiation de la fonction déterminant Durée : 3 heures EXERCICE 1 On désigne par x(·) une fonction numérique de la variable réelle t, et on considère l’équation différentielle suivante : x = f (x)
(ed)
⎧ ⎪ ⎨0 si u ≤ 0, où f : u ∈ R −→ f (u) = u si 0 < u ≤ 1, ⎪ ⎩ 1 si u > 1. 1) Justifier que pour tout (t0 , x0 ) ∈ R × R, il existe une et une seule solution maximale de (ed) dont le graphe passe par (t0 , x0 ). Une telle solution est-elle définie sur tout R ? 2) Pour tout (t0 , x0 ), déterminer la solution maximale de (ed) dont le graphe passe par (t0 , x0 ). (Indication : distinguer les cas x0 ≤ 0, x0 ∈]0, 1[, x0 ≥ 1). EXERCICE 2 Soit S = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1 et (x + 2z)2 + y 2 − z 2 = 0}. On pose zmax = max{z : (x, y, z) ∈ S} et zmin = min{z : (x, y, z) ∈ S}, et on se propose de calculer zmax − zmin (c’est-à-dire la hauteur de S). 1) Indiquer rapidement pourquoi il existe (x∗ , y ∗ , z ∗ ) ∈ S (resp. (x∗ , y∗ , z∗ ) ∈ S) tel que z ∗ = zmax (resp. z∗ = zmin ). 70
1.34. Une équation différentielle scalaire autonome. Calcul de la hauteur...
2) Après avoir justifié le procédé, écrire les conditions de Lagrange vérifiées en (x∗ , y ∗ , z ∗ ) (resp. (x∗ , y∗ , z∗ )). En déduire zmax et zmin . EXERCICE 3 Soit E = Mn (R), det : E −→ R l’application déterminant et Tr : E −→ R l’application trace ; In désigne la matrice identité. On rappelle que l’ensemble GLn (R) des matrices inversibles de E est un ouvert dense de E. 1) a) Donner une raison simple selon laquelle l’application det(·) est différentiable sur E. b) On rappelle que pour toute forme linéaire sur E, il existe Z ∈ E unique tel que : pour tout H ∈ E, (H) = Tr (Z H). ˜ 0 ∈ E tel que : En déduire que pour tout X0 ∈ E, il existe un unique X ˜0 H) + Hε(H), det(X0 + H) = det(X0 ) + Tr (X avec ε(H) −→ 0 quand H −→ 0. 2) a) Justifier, sans longs calculs, que lim t→0 cette limite. En déduire que I˜n = In .
det(In + tH) − 1 existe, puis calculer t
˜ 0 quand X0 est inversible. b) Déterminer X ˜ 0 est la transposée c) Déduire soigneusement de b) que pour tout X0 de E, X de la matrice des cofacteurs de X0 . 3) Soit A : t ∈ R −→ A(t) ∈ E une application continue sur R. On considère X : t ∈ R −→ X(t) ∈ E une application dérivable sur R telle que : ⎧ ⎪ ⎨X (t) = A(t)X(t) pour tout t ∈ R, ⎪ ⎩
X(0) = In ,
et on pose θ(t) = det X(t). a) Montrer que θ est dérivable sur R, de dérivée θ (t) = Tr [A(t)]θ(t). (Indication. On rappelle ceci : pour tout B ∈ E, B(cof B)T = (det B)In , où cof B désigne la matrice des cofacteurs de B). En déduire θ(t). b) Soit le système différentiel linéaire : x (t) = A(t)x(t), t ∈ R. 71
Chapitre 1. Énoncés
Soit R la résolvante de ce sytème. Retrouver, grâce à ce qui a été démontré au 3) a), le résultat suivant du Cours : t Tr [A(u)] du . det R(t, t0 ) = exp t0
1.35. Équations différentielles avec retard Durée : 3 heures Soit p ∈ N∗ et soit f : R × Rp × Rp −→ Rp une application continue. On suppose qu’il existe L ≥ 0 tel que pour tout (t, x1 , y1 ), (t, x2 , y2 ) ∈ R × Rp × Rp on ait f (t, x1 , y1 ) − f (t, x2 , y2 ) ≤ L x1 − x2 + y1 − y2 . Soient des réels T > t0 et τ > 0, soit φ : [t0 − τ, t0 ] −→ Rp une fonction continue. On cherche une fonction x : [t0 − τ, T ] −→ Rp de classe C 1 sur [t0 , T ] telle que ⎧ ⎨ x (t) = f (t, x(t), x(t − τ )) sur [t0 , T ] (1.48) ⎩ x(t) = φ(t) sur [t0 − τ, t0 ]. Première partie 1) Soit E l’ensemble des fonctions continues x : [t0 − τ, T ] −→ Rp telles que x(t) = φ(t) pour tout t ∈ [t0 − τ, t0 ]. On pose pour tout x, z ∈ E d(x, z) = max x(t) − z(t). t∈[t0 ,T ]
Montrez que (E, d) est un espace métrique complet. 2) Pour tout x ∈ E on définit T (x) : [t0 − τ, T ] −→ Rp par ⎧ φ(t) si t ∈ [t0 − τ, t0 ] ⎪ ⎪ ⎨ t T (x) (t) = ⎪ ⎪ f (s, x(s), x(s − τ )) ds si t ∈ [t0 , T ]. ⎩ φ(t0 ) + t0
Montrez que T (x) ∈ E et que x : [t0 − τ, T ] −→ Rp est solution de (1.48) si et seulement si x ∈ E et T (x) = x. 3) Montrez que pour tout q ∈ N∗ , pour tout z1 , z2 ∈ E et pour tout t ∈ [t0 − τ, T ], on a (2L(t − t0 ))q d(z1 , z2 ), T q (z1 ))(t) − (T q (z2 ))(t) ≤ q! où T q = T ◦· · · ◦T (q termes). En déduire que (1.48) possède une solution unique. 72
1.35. Équations différentielles avec retard
Deuxième partie
τ
τ . On pose t−m = t0 − mh pour h T − t0 , et on définit 0 ≤ m ≤ n1 et tm = t0 + mh pour 0 ≤ m ≤ M avec M = h le schéma numérique suivant ⎧ si 0 ≤ m ≤ n1 ⎨ x−m = φ(t−m ) (1.49) ⎩ xm+1 = xm + hf (tm , xm , xm−n1 ) si 0 ≤ m ≤ M − 1. Soit h > 0 et n1 =
h
la partie entière de
4) Montrez que limh→0 Ch = 0, où x(tm+1 ) − x(tm ) − hf (tm , x(tm ), x(tm−n1 )). Ch = 0≤m≤M −1
5) On considère le schéma perturbé ⎧ ⎨ y−m = φ(t0 − mh) ⎩
si 0 ≤ m ≤ n1 (1.50)
ym+1 = ym + hf (tm , ym , ym−n1 ) + ζm si 0 ≤ m ≤ M − 1,
où ζm ∈ Rp . On admet l’existence, démontrée dans les questions suivantes, d’une τ et L telle que pour tout h > 0 et constante C ne dépendant que de T − t0 , pour tout m ∈ [0, M − 1], xm − ym ≤ C m−1 j=0 ζj . Montrez que l’on a alors limh→0 sup0≤m≤M x(tm ) − xm = 0 . 6) On définit αm , −n1 ≤ m ≤ M , par ⎧ ⎨ αm = 0 ⎩
pour − n1 ≤ m ≤ 0 (1.51)
αm+1 = (1 + hL)αm + hLαm−n1 + ζm pour 0 ≤ m ≤ M − 1.
Montrez que xm − ym ≤ αm pour tout −n1 ≤ m ≤ M . 7) On suppose que Le−τ L > 1 et on définit βm par αm = (1 + hL)m βm . a) Former la relation de récurrence vérifiée par (βm ). b) Montrez que pour tout h > 0 assez petit, il existe Kh > 0 tel que ehKh = 1 + a(h)hKh e−n1 hKh où a(h) = L(1 + hL)−n1 −1 et qu’il existe c > 0 telle que Kh ≤ c pour tout h > 0 assez petit. 73
Chapitre 1. Énoncés
c) On pose βm = γm emhKh et γˆm = sup−n1 ≤k≤m γk . Montrez que m−1 (ˆ γm )−n1 ≤m≤M est croissante et que γm ≤ j=0 ξj . En déduire alors l’existence d’une constante C ne dépendant que de T − t0 , τ et L telle que pour tout h > 0 assez petit et pour tout m ∈ [0, M − 1] xm − ym ≤ C
m−1
ζj .
j=0
1.36. Méthodes d’approximation de solutions d’équations différentielles Durée : 3 heures EXERCICE Appliquer la méthode de Runge-Kutta d’ordre 4 sur l’intervalle [a, a + h] avec N = 1 au problème ⎧ ⎪ ⎨x (t) = f (t) ⎪ ⎩
x(a) = 0
où f : [a, b] −→ Rk est une fonction continue. En déduire une valeur approchée " a+h de l’intégrale a f (s) ds. Quel est l’ordre de l’erreur ? PROBLÈME On se propose d’étudier une méthode numérique (méthode de Nyström) de résolution d’une équation différentielle du second ordre de la forme y (t) = f (y(t)) où y(t) ∈ Rk et f : Rk −→ Rk est une application de classe C 3 . On considère une solution y : [a, T ] −→ Rk telle que (y(a), y (a)) = (ya , ya ) donné dans Rk × Rk . Pour tout N ∈ N∗ , on introduit une subdivision a = t0 < · · · < tN = T . 1) On définit F : Rk × Rk −→ Rk × Rk par F (y, z) = (z, f (y)). Montrez que F est de classe C 3 et que le problème proposé est équivalent à ⎧ ⎪ ⎨Y (t) = F (Y (t)) ⎪ ⎩ où Y (t) = (y(t), y (t)). 74
Y (a) = (ya , ya )
1.36. Méthodes d’approximation de solutions d’équations différentielles
2) On définit Yn = (yn , yn ) par ⎧ ⎪ ⎨Y0 = (ya , ya ) ⎪ ⎩ Yn+1 = Yn + hn Φ(Yn , hn ) pour n ∈ [0, N − 1], où hn = tn+1 − tn et Φ = (Φ1 , Φ2 ) est définie de la manière suivante. Pour Y = (y, z) on pose ⎧ ⎪ l1 (Y, h) = f (y), ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ l1 ⎪ ⎪ ⎪ l2 (Y, h) = f (y + hα1 z + α2 h2 ), ⎪ ⎪ 2 ⎨ ⎪ (γ1 l1 + γ2 l2 ) ⎪ ⎪ ⎪ , Φ1 (Y, h) = z + h ⎪ ⎪ 2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩Φ2 (Y, h) = (δ1 l1 + δ2 l2 ) 2 où α1 , α2 , γ1 , γ2 , δ1 , δ2 sont des réels à déterminer. a) Montrez que Φ(Y, 0) = F (Y ) si et seulement si δ1 + δ2 = 2. Que peut-on alors en déduire pour la méthode ? b) Soit y(t) une solution de y (t) = f (y(t)). Montrez que l’on a l2 (Y, h) = f (y) + hα1 Df (y)(y ) h2 + (α2 Df (y)(f (y)) + α21 D2 f (y)(y , y )) + O(h3 ), 2 où l’on écrit y, y pour y(t), y (t). c) En déduire un développement suivant les puissances de h à l’ordre 4 de y + hΦ1 (Y, h), y + hΦ2 (Y, h), y(t + h) et y (t + h). 75
Chapitre 1. Énoncés
3) En déduire que Y (t + h) − Y (t) − hΦ(Y (t), h) = O(h4 ) si les relations suivantes sont vérifiées : ⎧ ⎪ δ2 α2 = 2/3, ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ δ2 α21 = 2/3, ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨δ1 + δ2 = 2, ⎪ ⎪ ⎪ δ2 α1 = 1, ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪γ2 α1 = 1/3, ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ γ1 + γ2 = 1. 4) En déduire que la méthode donnée par ⎧ l = f (yn ), ⎪ ⎪ ⎪1 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ l2 = f yn + ⎪ ⎪ ⎨
2hn yn 3
+
2h2n f (yn ) , 9
(l1 + l2 ) ⎪ ⎪ ⎪ , yn+1 = yn + hn yn + h2n ⎪ ⎪ 4 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ (l1 + 3l2 ) ⎩y n+1 = yn + hn 4 est d’ordre local 4 et d’ordre global 3. 5) On considère le problème ⎧ ⎪ ⎨y (t) = y(t) ⎪ ⎩ (y(0), y (0)) = (1, 1). Déterminez avec la méthode précédente une approximation de y(h) et y (h).
76
2 SOLUTIONS
2.1. Calcul différentiel sur des espaces de matrices. Transformation de Legendre-Fenchel EXERCICE 1 1) fA est linéaire (car Tr(·) est linéaire), donc linéaire continue (puisque l’espace de départ E est de dimension finie). Donc fA est différentiable sur E et DfA (X) = fA pour tout X ∈ E ; DfA (X) : H ∈ E −→ Tr (AT H) = A, H . Ainsi, par définition même de ∇fA (X) : ∇fA (X) = A, pour tout X ∈ E. 2) U est un ouvert de E (êtes-vous d’accord ?) ; gA apparaît comme la composée gA = f2 ◦ f1 avec f1 : U −→ E définie par f1 (X) = X −1 et f2 : E −→ R linéaire continue définie par f2 (Y ) := Tr (Y A). L’application f2 est donc différentiable en tout Y ∈ E avec Df2 (Y ) : K ∈ E −→ Tr (KA). De plus f1 est différentiable en tout X ∈ U avec : Df1 (X) : H ∈ E −→ −X −1 HX −1 . Par suite, gA = f2 ◦ f1 est différentiable en tout X ∈ U avec : D(f2 ◦ f1 )(X) : H ∈ E −→ [Df2 (f1 (X))](Df1 (X)H).
Chapitre 2. Solutions
Il s’ensuit, pour tout X ∈ U et pour tout H ∈ E : DgA (X) = Tr (−X −1 HX −1 A) = −Tr (X −1 AX −1 H) (êtes-vous d’accord ?), donc ∇gA (X) = −(X −1 AX −1 )T . 3) ha peut être vue comme (par exemple) f3 ◦ f1 , où f3 : Y ∈ E −→ f3 (Y ) = Y a, a . f3 est linéaire continue, donc Df3 (Y ) = f3 pour tout Y ∈ E. En conséquence, ha est différentiable en tout X ∈ U avec, pour tout H ∈ E : Dha (X)H = −X −1 HX −1 a, a = −aT (X −1 HX −1 )a = −Tr (X −1 aaT X −1 H) (pourquoi ?) d’où :
∇ha (X) = −(X −1 aaT X −1 )T .
Remarque. La 3e question peut être aussi considérée comme un cas particulier de la 2e car X −1 a, a = Tr ((X −1 a)T a) = Tr (aT X −1 a) = Tr (X −1 aaT ), soit encore Tr (X −1 A) avec A := aaT . Les propriétés de la trace d’une matrice (telles que M x, x = Tr (M xxT ), Tr (M N ) = Tr (N M ), Tr (M T ) = Tr (M ), etc.) sont très utiles dans le calcul différentiel relatif aux fonctions définies sur un ouvert de Mn (R). EXERCICE 2 Soit θ : R −→ R+ définie comme suit : ( 1 2 (r − 1) θ(r) := 2 0
si r ≥ 1, si r < 1.
(2.1)
Par définition, f : y ∈ H −→ f (y) = θ(y) ; cette « symétrie sphérique » fait que les propriétés de f sont essentiellement celles de la fonction (de la variable réelle) θ qui est continue sur R, dérivable sauf en -1 et +1, avec : ( r si |r| > 1, θ (r) = (2.2) 0 si |r| < 1. 78
2.1. Calcul différentiel sur des espaces de matrices. Transformation...
1) a) Considérons la différence f (a + h) − f (a) avec h := ta, (t ∈ R). On a : ⎧ ⎪ 0 si −1 < t < 0, ⎪ ⎨ f (a + ta) = ⎪ ⎪ ⎩ 1 [(1 + t2 ) − 1] si t > 0. 2 Par suite : lim t↓0
f (a + ta) − f (a) f (a + ta) − f (a) = 1, et lim = 0. t↑0 t t
La fonction f ne saurait donc être différentiable en a. b) La fonction f étant identiquement nulle sur l’ouvert {y : y < 1} y est donc différentiable et sa différentielle est nulle sur cet ouvert. Sur l’ouvert {y : y > 1} on a f = θ ◦ ., composée de deux fonctions différentiables, avec : y θ (r) = r si |r| > 1 et D · (y) : h −→ , h y (car la norme considérée est la norme hilbertienne et y = 0). Par conséquent, si y > 1, Df (y) : h ∈ H −→ y, h . 2) a)
⎧ ⎪ ⎨x, y θx (y) =
⎪ ⎩
si y ≤ 1,
x, y − 12 (y2 − 1) si y ≥ 1.
Grâce à l’inégalité de Cauchy-Schwarz, x, y ≤ xy, de sorte que θx (y) ≤ x si y ≤ 1,
(2.3)
1 1 (2.4) θx (y) ≤ − y2 + xy + si y ≥ 1. 2 2 La fonction quadratique r −→ − 12 r 2 + xr + 12 est majorée sur R (êtes-vous d’accord ?). Donc θx est majorée sur R ; il est de ce fait licite de parler de sup {x, y − f (y)} := g(x),
y∈H
puisque g(x) ≥ θx (0) = 0, g est bien à valeurs dans R+ . Quant à g(0), on a : g(0) = sup {−f (y)} = inf {f (y)} = 0. y∈H
y∈H
Il s’agit à présent de déterminer g(x) pour x = 0. 79
Chapitre 2. Solutions
– Première observation (fondamentale) : θx est une fonction concave sur H (car f est convexe sur H) ; donc si on trouve des points y ∈ H en lesquels θx est différentiable et Dθx (y) = 0, on est assuré que y réalise le supremum de θx sur H. – Deuxième observation : θx est différentiable sur H \ S, avec ⎧ ⎪ si y < 1, ⎨x, h Dθx (y) : h ∈ H −→ Dθx (y)h = ⎪ ⎩ x − y, h si y > 1.
(2.5)
Donc, le supremum de θx sur H, s’il est atteint, l’est en un point de S (point de non-différentiabilité de θx ) ou bien en un point de H \ S en lequel Dθx s’annule. Cela explique la « découpe » des deux sous-questions qui suivent. b) sup{x, y − f (y)} = sup{x, y }, y∈S
(2.6)
y∈S
puisque f (y) = 0 pour tout y ∈ S. L’inégalité (de Cauchy-Schwarz) x, y ≤ xy devient une égalité lorsque x et y sont colinéaires ; autrement dit le supremum x de x, y lorsque y parcourt S est atteint pour y = x . Il s’ensuit que le supremum dans (2.6) vaut x. c) Supposons x > 1. Alors Dθx (y) = 0 si y = x (cf. (2.5)). Et 1 θx (x) = (x2 + 1) ≥ x puisque x > 1. 2 Par conséquent, θx (x) = sup θx (y) = sup θx (y) (êtes-vous d’accord ?). y∈H\S
y∈H
D’où, lorsque x > 1, g(x) = 12 (x2 + 1). d) On suppose 0 < x < 1. On part toujours de l’observation (déjà utilisée) (2.7) sup θx (y) = max{sup θx (y), sup θx (y)}. y∈H
y∈S
y∈H\S
Dans le cas présent, Dθx ne s’annule pas sur H \ S. Par suite, le supremum de θx sur H, si atteint, l’est en un point de S. Ainsi : sup θx (y) = sup θx (y) = x
y∈H
80
y∈S
2.1. Calcul différentiel sur des espaces de matrices. Transformation...
(le dernier supremum étant atteint en y =
x x ).
D’où :
g(x) = x si x ≤ 1. Observation : g : x ∈ H −→ g(x) = θ ∗ (x), dans lequel ⎧ ⎪ s ⎪ ⎨
∗
θ (s) =
si |s| ≤ 1,
⎪ ⎪ ⎩ 1 (s2 + 1) si |s| ≥ 1. 2
(2.1)∗
3) θ ∗ ci-dessus est dérivable sur R \ {0} (en effet, le « raccordement » se fait bien en s = 1 pour la dérivabilité en ce point) :
∗
(θ ) (s) =
⎧ ⎪ ⎨s ⎪ ⎩
si s > 1,
0 si 0 < s ≤ 1.
Il en résulte que g est différentiable (C 1 même) en tout x ∈ H \ {0}, avec, pour tout h ∈ H : ⎧ ⎪ ⎪x, h si x > 1, ⎪ ⎨ Dg(x)h = ⎪ x, h ⎪ ⎪ si 0 < x < 1. ⎩ x g n’est pas deux fois différentiable en a ∈ S. Pourquoi ? – Une raison « intuitive » : θ ∗ n’est pas dérivable en s = 1. – Une démonstration : [Dg((1 + t)a)h − Dg(a)h] −→ 0 quand t ↓ 0, t tandis que [Dg((1 + t)a)h − Dg(a)h] −→ a, h quand t ↑ 0. t Notons néanmoins que g est deux fois différentiable sur H \ ({0} ∪ S). 81
Chapitre 2. Solutions
2.2. Caractérisation d’un opérateur gradient (lemme de Poincaré) 1) Supposons que f = DF soit un opérateur gradient. Introduisons la fonction h(t) = F (x(t)) pour tout t ∈ [a, b]. Cette fonction h est de classe C 1 par morceaux, et h (t) = DF (x(t))(x (t)) = f (x(t)), x (t) . On a donc b b h (s) ds = f (x(t)), x (t) dt, F (x(b)) − F (x(a)) = h(b) − h(a) = a
a
ce qui montre bien ii). 2) Définissons z1 (s) = sy + (1 − s)x pour tout s ∈ [0, 1] et ⎧ ⎪ ⎨(1 − s)x pour s ∈ [0, 1], z2 (s) = ⎪ ⎩ (s − 1)y pour s ∈ [1, 2]. On a z1 (0) = z2 (0) = x et z1 (1) = z2 (2) = y. D’après ii), on a 1 2 f (z1 (t)), z1 (t) dt = f (z2 (t)), z2 (t) dt, 0
soit 1
0
f (sy + (1 − s)x), y − x ds = −
0
1
2
f ((1 − s)x), x +
0
f ((s − 1)y), y
1
ce qui donne iii) par les changements de variables τ = 1 − s et θ = s − 1. 3) a) On a
1
F (x + τ h) − F (x) =
f (s(x + τ h)), x + τ h ds −
0
1
f (sx), x ds.
0
Utilisant iii) avec y = x + th, il vient 1 1 f (s(x+τ h)+(1−s)x), τ h ds = τ f (x+sτ h), h ds. F (x+τ h)−F (x) = 0
0
"1
(x) = 0 f (x + sτ h), h ds. Comme f est continue en x, On a donc F (x+τ h)−F τ pour tout ε > 0, il existe un η > 0 tel que f (x + sτ h) − f (x) ≤ ε pour tout τ ∈ [−η, η] et pour tout s ∈ [0, 1]. On a donc 1 1 f (x + sτ h), h ds = f (x), h ds = f (x), h , lim τ →0 0
82
0
2.2. Caractérisation d’un opérateur gradient (lemme de Poincaré)
d’où lim
τ →0
F (x + τ h) − F (x) = f (x), h . τ
b) Remarquons que g est bien définie sur [0, 1] car x+th = x+t(x+h−x) ∈ U de par la convexité de U . On a alors F (x + th + τ h) − F (x + th) g(t + τ ) − g(t) = , τ t ce qui, appliquant 3) a) avec x remplacé par x + th montre que lim
τ →0
g(t + τ ) − g(t) = f (x + th), h . τ
Il en résulte que g est dérivable sur [0, 1] et que g (t) = f (x + th), h ; de plus g est bien continue comme composée d’applications continues. On a alors 1 1 F (x + h) − F (x) = g(1) − g(0) = g (s) ds = f (x + sh), h ds, 0
donc
0
1
F (x + h) − F (x) − f (x), h =
f (x + sh) − f (x), h ds.
0
Utilisant la continuité de f en x, pour tout ε > 0, il existe un η > 0 tel que f (x + sh) − f (x) ≤ ε pour tout s ∈ [0, 1] et pour tout h tel que h ≤ η. On a donc pour h ≤ η, 1 f (x + sh) − f (x)h ds ≤ εh. |F (x + h) − F (x) − f (x), h | ≤ 0
Il en résulte bien que F est différentiable sur U avec DF = f , donc F ∈ C 1 (U, R). Remarquons alors que, pour tout x ∈ U et u, v ∈ E, on a Df (x)(u), v = D(DF )(x)(u), v = D2 F (x)(u, v). On en déduit par le Théorème de Schwarz que Df (x)(u), v = Df (x)(v), u , donc Df (x) est symétrique. 4) On a F (x + h) − F (x) =
1
0
donc
1
F (x + h) − F (x) = 0
1
f (tx + th), x + h dt −
f (tx), x dt,
(2.8)
0
f (tx + th), h dt +
1
f (tx + th) − f (tx), x dt.
0
83
Chapitre 2. Solutions
Introduisons alors, pour t ∈ [0, 1] fixé, la fonction ϕ : [0, 1] −→ R définie par ϕ(s) = f (tx + sh), x pour tout s ∈ [0, 1]. Il est clair que ϕ est de classe C 1 et que ϕ (s) = Df (tx + sh)(h), x = Df (tx + sh)(x), h du fait de la symétrie de Df . On a alors 1 1 f (tx + th) − f (tx), x dt = (ϕ(t) − ϕ(0)) ds 0 0 1 t ϕ (s) ds dt = 0 0 1 t Df (tx + sh)(h), x ds dt = 0 0 1 t Df (tx + sh)(x), h ds dt. = 0
0
On peut intervertir l’ordre des intégrations dans l’intégrale "1 "t 0 0 Df (tx+sh)(x), h ds dt car la fonction (t, s) −→ Df (tx+sh)(x), h ds est continue donc intégrable sur {(t, s) : t ∈ [0, 1], 0 ≤ s ≤ t}. On obtient alors 1 t 1 1 Df (tx + sh)(x), h ds dt = Df (tx + sh)(x), h ds ds 0 0 0 s 1 1 ψ (t) dt dt, = 0
s
avec ψ : [0, 1] −→ R définie par ψ(t) = f (tx + sh), h pour tout t ∈ [0, 1]. Il en résulte que 1 1 f (tx + th) − f (tx), x dt = (ψ(1) − ψ(s)) ds 0 0 1 f (x + sh) − f (sx + sh), h ds. = 0
"1 c) Remplaçant 0 f (tx + th) − f (tx), x dt par la valeur trouvée dans la question précédente et reportant dans (2.8), il vient F (x + h) − F (x) = 0
1
1
f (sx + sh), h ds +
f (x + sh) − f (sx + sh), h ds
0
"1 d’où F (x + h) − F (x) = 0 f (x + sh), h ds, puis (comme dans 3) b)) que F est de classe C 1 sur U avec DF = f . 84
2.3. Convexité et différentiabilité
5) D’après ce qui précède, une condition nécessaire et suffisante pour que f soit un opérateur gradient est que Df soit symétrique. Ceci équivaut à : pour tout x ∈ U , Df (x)(ei ), ej = Df (x)(ej ), ei pour tout i, j ∈ [1, n] où ∂fj (x), e1 , · · · , en désigne la base canonique de Rn . Comme Df (x)(ei ), ej = ∂xi cette condition équivaut à rot f = 0.
2.3. Convexité et différentiabilité 1) question préliminaire. Soit a ∈ R tel que inf x∈Rd f (x) < a et r > 0 tel que f (x) ≥ a pour tout x ≥ r. On a alors inf x>r f (x) ≥ a > inf x∈Rd f (x), d’où inf x∈Rd f (x) = inf x≤r f (x). Comme {x ∈ Rd : u ≤ r} est compact et f continue, il existe bien x ¯ ∈ {x ∈ Rd : x ≤ r} tel que f (¯ x) = inf f (x) = inf f (x). x≤r
x∈Rd
2) a) Pour tout t ∈]0, 1], et pour tout x, y ∈ U , on a f (x + t(y − x)) ≤ tf (y) + (1 − t)f (x), d’où
t−1 (f (x + t(y − x)) − f (x)) ≤ f (y) − f (x).
Faisant tendre t vers 0, on obtient bien ∇f (x), y − x ≤ f (y) − f (x). b) Soient x, y ∈ U et t ∈ [0, 1]. Posant xt = tx + (1 − t)y, on a f (x) ≥ f (xt ) + ∇f (xt ), x − xt = f (xt ) + (1 − t)∇f (xt ), x − y , d’où f (y) ≥ f (xt ) + ∇f (xt ), y − xt = f (xt ) + t∇f (xt ), y − x . Multipliant par t et (1 − t) et additionnant, il vient tf (x) + (1 − t)f (y) ≥ f (xt )) + t(1 − t)∇f (xt ), x − y + y − x , ce qui montre que f est convexe. 3) a) On a f (y) − f (x) ≥ ∇f (x), y − x et f (x) − f (y) ≥ ∇f (y), x − y , ce qui, par addition, donne 0 ≥ ∇f (y) − ∇f (x), x − y , d’où ∇f (y) − ∇f (x), y − x ≥ 0. 85
Chapitre 2. Solutions
b) Introduisons ϕ : [0, 1] −→ R par ϕ(t) = f (x + t(y − x)). La fonction ϕ est de classe C 1 et ϕ (t) = ∇f (x), y − x . On a alors 1 ϕ(1) − ϕ(0) = ϕ (s) ds, 0
d’où
f (y) − f (x) =
1
∇f (x + t(y − x)), y − x dt.
0
Si f vérifie (1.2), on a, pour tout t ∈ [0, 1] ∇f (x + t(y − x)) − ∇f (x), t(y − x) ≥ 0, ce qui implique ∇f (x + t(y − x)), y − x) ≥ ∇f (x), y − x) , d’où
1
f (y) − f (x) ≥
∇f (x), y − x dt = ∇f (x), y − x ,
0
ce qui implique que f est convexe d’après 2) b). On peut aussi introduire β : [0, 1] −→ R définie par β(t) = f (x + t(y − x)) − t∇f (x), y − x . On a β (t) = ∇f (x + t(y − x)) − ∇f (x), y − x ≥ 0, d’où β(1) ≥ β(0) soit f (y) − ∇f (x), y − x ≥ f (x). Remarquons que cette démonstration marche si on suppose seulement f différentiable sur U . 4) a) Soit η > 0 tel que x + tw ∈ U pour tout t ∈ [−η, η]. On peut donc définir ψ : [−η, η] −→ R par ψ(t) = ∇f (x + tw), w . Pour tout −η ≤ s < t ≤ η, on a d’après 3) a) ∇f (x + tw) − ∇f (x + sw), (t − s)w) ≥ 0, donc ψ(s) ≤ ψ(t). La fonction ψ étant croissante, on obtient 0 ≤ ψ (0) = D2 f (x)(w, w). b) En utilisant la formule de Taylor avec reste sous forme d’intégrale, on a, pour tout x, y ∈ Rd , 1 (1 − t)D2 f (x + t(y − x))(y − x, y − x) dt. f (y) = f (x) + ∇f (x), y − x + 0
86
2.3. Convexité et différentiabilité
Comme
"1 0
(1 − t)D2 f (x + t(y − x))(y − x, y − x) dt ≥ 0, on obtient f (y) ≥ f (x) + ∇f (x), y − x ,
donc f est convexe d’après 2) b). On peut aussi introduire γ : [0, 1] −→ R définie par γ(t) = ∇f (x + t(y − x)), y − x , qui est dérivable avec γ (t) = D2 f (x + t(y − x))(y − x, y − x) ≥ 0. Il en résulte que γ(1) ≥ γ(0), d’où ∇f (y) − ∇f (x), y − x ≥ 0, donc f est convexe d’après 3) b). On remarque que cette démonstration marche si on suppose seulement f deux fois différentiable sur U . Enfin on a, pour le cas de l’exemple, ∂f ∂f (x, y) = log(x) − log(x + y) et (x, y) = log(y) − log(x + y), ∂x ∂y d’où la matrice Hessienne ∇2 f (x, y) est donnée par ) * y 1 − x+y x+y . ∇2 f (x, y) = x 1 − x+y x+y On a donc, pour tout u, v ∈ Rd , ∇2 f (x, y)(u, v), (u, v) = u2 + v 2 ≥ 0, ce qui montre que f est convexe sur R∗+ × R∗+ . 5) On a c c − tx + (1 − t)y2 = − (t2 x2 + 2t(1 − t)x, y + (1 − t)2 y2 ), 2 2 donc c c c c − tx + (1 − t)y2 − t(1 − t)x − y2 = −t x2 − (1 − t) y2 , 2 2 2 2 d’où c c c f (tx + (1 − t)y) − tx + (1 − t)y2 ≤ t(f (x) − x2 ) + (1 − t)(f (y) − y2 ), 2 2 2 ce qui montre que f − 2c · 2 est convexe. Posons g = f − 2c · 2 . On a alors ∇g(x) = ∇f (x) − cx. D’après 3) a), on a ∇f (x) − cx − (∇f (y) − cy), y − x ≥ 0, 87
Chapitre 2. Solutions
d’où ∇f (y) − ∇f (x), y − x ≥ cy − x2 . D’après 2) a), on a c c ∇f (w) − cx, y − x ≤ f (y) − y2 − (f (x) − y2 ), 2 2 d’où
c f (y) − f (x) ≥ ∇f (x), y − x + y − x2 . 2
On a c c f (y) − f (x) ≥ −∇f (x)y − x + y − x2 ≥ y − x(−∇f (x) + y − x) 2 2 et limy→∞ y − x = +∞, limy→∞ (−∇f (x) + 2c y − x) = +∞, donc limy→∞ f (y) = +∞, ce qui montre bien que la fonction continue f atteint son minimum sur Rd d’après la question préliminaire. Si f atteint son minimum en x ¯ ∈ U et y¯ ∈ U avec x ¯ = y¯, on a pour t ∈]0, 1[, c x − y¯2 f (t¯ x + (1 − t)¯ y ) ≤ tf (¯ x) + (1 − t)f (¯ y) − t(1 − t)¯ 2 c x − y¯2 , ≤ inf f − t(1 − t)¯ 2 x∈Rd ce qui conduit à la contradiction f (t¯ x + (1 − t)¯ y ) < inf x∈Rd f (x).
2.4. Un théorème de Rolle approché. Différentiation d’applications radiales. Un système différentiel linéaire EXERCICE 1 1) Soit f : Rn −→ R définie par f (x) = a, x , où a ∈ Rn est de norme ε égale à . On a bien |f (x)| ≤ ε dès que x = r (cela résulte de l’inégalité de r ε ¯ ∈ Rn . Cauchy-Schwarz), tandis que ∇f (¯ x) = a = en tout x r ¯ r) ; donc g est bornée inférieurement 2) a) g est continue sur le compact B(0, ¯ sur B(0, r) et sa borne inférieure est atteinte. b) On a
f (0) μ = min g(x) ≤ g(0) = − ¯ ε x∈B(0,r) 88
2
≤ 0.
(2.9)
2.4. Un théorème de Rolle approché. Différentiation d’applications radiales...
c) La norme · considérée étant celle associée à un produit scalaire, la fonction ·2 est différentiable (et même C ∞ ) sur Rn . Il s’ensuit que la fonction g est différentiable sur B(0, r) avec : f (x) x (2.10) ∇g(x) = 2 2 − 2 ∇f (x) pour tout x ∈ B(0, r). r ε 3) a) D’après (2.9), on a g(0) = f (0) = 0 et, de par la définition de g et μ, on x |f (x)| ¯ r). ≤ pour tout x ∈ B(0, a ε r f (td) b) Sachant que ∇f (0), d = lim et que td = td pour tout + t t−→0 t > 0, l’inégalité obtenue au-dessus conduit à d ∇f (0), d ≤ pour tout d ∈ Rn . ε r À présent, puisque ∇f (0) = maxd=1 ∇f (0), d , on arrive immédiatement ε au fait que ∇f (0) ≤ . r f (x) 2 4) Comme g(x) = 1 − ≥ 0 pour tout x vérifiant x = r, la fonction g ε est minimisée en un (ou des) point(s) x ¯ ∈ B(0, r) ; ainsi g(¯ x) = μ et ∇g(¯ x) = 0. Il s’ensuit avec l’expression (2.10) de ∇g(¯ x) : f (¯ x) x ¯ − 2 ∇f (¯ x) = 0. r2 ε
(2.11)
Par suite x f (¯ x) 2 , 1 1+ [f (¯ x)]2 ¯ 2 2 μ + ≤ 2 2 [f (¯ ∇f (¯ x ) = = x)]2 . ε4 r2 r2 ε r ε Comme f (¯ x) = 0 (sinon on aurait x ¯ = 0 et donc μ = 0, ce qui a été exclu dans ε2 cette question), il vient finalement ∇f (¯ x)2 ≤ 2 , soit r ε ∇f (¯ x) ≤ . r EXERCICE 2 1) On a ϕ(x) = Φ(α(x), x) où Φ : R × E −→ E est définie par Φ(s, x) = sx. L’application Φ est bilinéaire, continue (êtes-vous d’accord ?), elle est donc différentiable ainsi que ϕ = Φ ◦ (α, idR ). On a alors, pour tout u ∈ E, Dϕ(x)(u) = DΦ(α(x), x)(Dα(x)(u), u) = Φ(α(x), u) + Φ(Dα(x)(u), x), On a donc Dϕ(x)(u) = α(x)u + Dα(x)(u)x. 89
Chapitre 2. Solutions
2) a) On peut appliquer le résultat de la question précédente avec α(x) =
1 x2 .
Dans ce cas, on a α = ρ ◦ ψ avec ψ(x) = x2 et ρ(t) = 1t , d’où, pour tout x ∈ U et u ∈ E, Dα(x)(u) = Dρ(ψ(x))(Dψ(x)(u)) = − ce qui montre que ∇α(x) = −
2x, u 1 2x, u = − , 4 x x4
2x . On a donc, pour tout x ∈ U et u ∈ E x4
Df (x)(u) =
2x, u u − x. 2 x x4
x z b) Montrons que f est injective. Soit donc x, z ∈ U tels que x 2 = z2 . 2 tz z On a alors x = tz avec t = x , d’où t2 x 2 = x2 , ce qui implique t = 1 et z x = z. Montrons à présent que f est surjective. Pour y ∈ U , on cherche x ∈ U ty x tel que x 2 = y. On doit donc avoir x = ty avec t > 0, d’où t2 y2 = y, ce y 1 qui donne t = y 2 . On vérifie alors immédiatement que x = y2 est tel que f (x) = y. On a donc montré que f est bijective et que f −1 = f . Comme f est de classe C ∞ (comme quotient de deux fonctions de classe C ∞ ) on en déduit que f est un C ∞ difféomorphisme de U sur U . Remarquant que f ◦ f = idU , on a Df (f (x)) ◦ Df (x) = idE . Comme on sait que Df (x) est bijective, cela implique [Df (x)]−1 = Df (f (x)). Cela donne
[Df (x)]−1 : E −→ E h −→ −2x, h x + x2 h. On peut aussi, tout simplement, résoudre Df (x)k = h (de manière à avoir k = [Df (x)]−1 (h)). Partons donc de −2
k x, k x + = h. 4 x x2
En faisant le produit scalaire avec x, il vient −2 d’où
x, k x, k + = x, h , x2 x2
x, k x, h k =h+2 x=h−2 , 2 4 x x x2
ce qui conduit à k = x2 h − 2x, h x. 90
2.4. Un théorème de Rolle approché. Différentiation d’applications radiales...
Remarque. Dans le plan affine euclidien identifié à un espace vectoriel par le choix d’une origine O, f représente la transformation géométrique appelée « inversion de pôle O et de puissance 1 » ; elle est définie comme suit : M = f (M ), avec O, M et M alignés et OM .OM = 1. EXERCICE 3 x(t) x (t) = A(t) est une équation différentielle (vectorielle) li(EDL)0 y(t) y (t) néaire homogène avec 2/t −1/t2 t ∈]0, +∞[−→ A(t) := continue. 2 0 1) a) Il est aisé de vérifier que t −→ (EDL)0 . De plus
1/2 t
t et t − → 2 sont solutions de t
det M (t) = 0 pour tout t ∈]0, +∞[
(ou, ce qui est équivalent dans un tel contexte, pour un certain t ∈]0, +∞[). Il en résulte que M (t) est bien une matrice fondamentale de (EDL)0 . b) La résolvante R(·, ·) de (EDL)0 est alors donnée par R(t, t0 ) = M (t)[M (t0 )]−1 (par exemple), d’où :
⎛
−1 + 2 tt0
1 t0
R(t, t0 ) = ⎝ 2 −2t + 2 tt0
−
2 tt0 −
t t20 t2 t20
⎞ ⎠.
2) On utilise la méthode de variation de la constante : la solution du problème de Cauchy proposé est t x(t) 0 u t ∈]0, +∞[−→ = R(t, 1) + R(t, u) 2 du, y(t) 0 u 1 ce qui conduit à ) t ∈]0, +∞[−→
* x(t)
) =
y(t)
t(t − 1) t2 (t − 1)
* .
91
Chapitre 2. Solutions
2.5. Différentielle d’une fonctionnelle intégrale. Calcul différentiel sur des fonctions à valeurs matricielles EXERCICE 1 1) Pour n ∈ N∗ considérons fn : t −→ fn (t) = tn . Évidemment fn ∈ E, et un calcul facile conduit à : 1 fn p = 1 et fn ∞ = 1. (np + 1) p Pour +∞ > p > q ≥ 1, 1
(nq + 1) q fn p = 1 = fn q (np + 1) p On remarque que
fn p fn q
nq + 1 np + 1
1
p
1
(np + 1) q
− p1
.
−→ +∞ quand n −→ +∞ ; donc · p et · q ne f
p −→ +∞ quand n −→ +∞ : sauraient être équivalentes. De même, fnn∞ .p et .∞ ne sont pas équivalentes non plus. Notons toutefois l’inégalité · p ≤ · ∞ .
2) Lg est linéaire, c’est clair. Maintenant 1 1 1 p |f (t)||g(t)| dt ≤ |f (t)|p dt . |Lg (f )| ≤ 0
0
1
|g(t)|q dt
1 q
,
0
où q désigne l’exposant conjugué de p : 1p + 1q = 1 (c’est l’inégalité de Hölder). Dans le cas limite où p = 1, on prend q = +∞. De l’inégalité |Lg (f )| ≤ f p .gq pour tout f ∈ E, il vient que Lg (qui est linéaire) est continue et Lg = sup f =0
|Lg (f )| ≤ gq . f p
On se propose de montrer qu’en fait Lg = gq pour tout +∞ > p ≥ 1. Pour cela nous serons amenés à distinguer deux cas : celui où p > 1 et celui où p = 1. – Cas où p > 1 (d’où q > 1). On définit ⎧ q−1 ⎪ ⎨|g(t)| f : t ∈ [0, 1] −→ f (t) = ⎪ ⎩ −|g(t)|q−1 92
si g(t) ≥ 0, si g(t) ≤ 0.
2.5. Différentielle d’une fonctionnelle intégrale. Calcul différentiel...
Alors, f ∈ E (pourquoi ? ) et 1 Lg (f ) = |g(t)|q−1 |g(t)| dt = 0
1
|g(t)|q dt
0
(ça a été fait pour !). Que vaut alors f p ? On a : 1 1 1 1 p(q−1) p |g(t)| dt = |g(t)|q dt p f p = 0
0
car p(q − 1) = q. Il s’ensuit : Lg (f ) = f p
1
|g(t)|q dt
1− 1
= gq .
p
0
Par conséquent, Lg = gq . – Cas où p = 1 (d’où q = +∞). Soit t0 ∈ [0, 1] tel que g(t0 ) = max |g(t)|. t∈[0,1]
En écartant le cas trivial où g ≡ 0 et quitte à changer g en −g, on peut supposer g(t0 ) > 0. Soit ε ∈]0, g(t0 )[. En raison de la continuité de g en t0 , il existe η > 0 tel que |g(t) − g(t0 )| ≤ ε pour tout t ∈ [0, 1] tel que |t − t0 | ≤ η. Considérons f ∈ E qui soit strictement positive sur {t ∈ [0, 1] : |t − t0 | ≤ η} et nulle ailleurs. Alors : 1 f (t)g(t) dt =
t0 +η t0 −η
0
f (t)g(t) dt ≥
≥ [g(t0 ) − ε]
t0 +η t0 −η
t0 +η
t0 −η
f (t)[g(t0 ) − ε] dt
f (t) dt = [g(t0 ) − ε]f 1 .
Ainsi, Lg (f ) ≥ g(t0 ) − ε = g∞ − ε. f 1 Ceci étant vrai pour ε −→ 0, on en déduit Lg = g∞ . Lg ≥
3) a) Soit f0 ∈ Ω. L’image K0 = f0 ([0, 1]) est un intervalle compact contenu dans J. Considérons donc ε > 0 tel que K0 + B(0, ε) ⊂ J. Si f ∈ E est telle que f − f0 ∞ < ε, il est clair que f (x) ∈ J pour tout x ∈ [0, 1] (êtes-vous d’accord ?). D’où {f ∈ E : f − f0 ∞ < ε} ⊂ Ω. Ω est bien un ouvert de (E, .∞ ). 93
Chapitre 2. Solutions
b) Soit f ∈ Ω et h ∈ E. On a : 1 . ϕ[f (t) + h(t)] − ϕ[f (t)] dt. θ(f + h) − θ(f ) = 0
Or, il existe ξt ∈]0, 1[ tel que ϕ[f (t) + h(t)] − ϕ[f (t)] = ϕ [f (t) + ξt h(t)]h(t) (êtes-vous d’accord ?). Donc, de l’expression 1 ϕ [f (t) + ξt h(t)].h(t) dt θ(f + h) − θ(f ) =
0 1
=
ϕ [f (t)].h(t) dt + . . . ,
0
il semble découler que ˆ f : E −→ R (Lϕ ◦f =)L " ˆ f (h) = 1 ϕ [f (t)].h(t) dt h −→ L 0 ˆ f est linéaire (c’est clair) et, est notre candidat à être Dθ(f ). Tout d’abord, L selon une technique de majoration déjà vue (cf. 2)), 1 1 ˆ |ϕ [f (t)]|.|h(t)|dt ≤ h∞ ϕ [f (t)] dt, |Lf (h)| ≤ 0
0
≤ M1 h∞ ; ˆ f soit une ˆ f est bien continue sur (E, .∞ ). C’est bien parti pour que L donc L différentielle, mais il reste à démontrer l’essentiel, à savoir ˆ f (h)|/h∞ −→ 0 quand h∞ −→ 0. |θ(f + h) − θ(f ) − L On a :
1
ˆ f (h) = θ(f + h) − θ(f ) − L
. h(t) ϕ [f (t) + ξt h(t)] − ϕ [f (t)] dt,
0
d’où ˆ f (h)| ≤ h∞ · |θ(f + h) − θ(f ) − L
1
|ϕ [f (t) + ξt h(t)] − ϕ [f (t)]| dt.
0
La fonction ϕ , continue sur J, est uniformément continue sur tout compact contenu dans J. C’est la propriété que nous utilisons pour « contrôler » l’expression ϕ [f (t) + ξt h(t)] − ϕ [f (t)]. 94
2.5. Différentielle d’une fonctionnelle intégrale. Calcul différentiel...
f (fixée) est continue sur [0, 1], h ∈ E sera prise de norme .∞ « petite », ξt ∈ [0, 1]. Ainsi, pour tout ε > 0, on peut trouver η > 0 assez petit de sorte que (h∞ ≤ η) implique |ϕ [f (t) + ξt h(t)] − ϕ [f (t)]| ≤ ε pour tout t ∈ [0, 1], d’où ˆ f (h)| ≤ ε.h∞ . |θ(f + h) − θ(f ) − L C’est bien ce qu’on voulait démontrer. c) Puisque J = R, Ω = E ici. Changer de norme sur E change la donne du problème de différentiation de θ puisque · 2 et · ∞ ne sont pas équiˆ f que précédemment pourrait être candidat à valentes. Voyons si le même L être la différentielle de θ en f . Pour cela, vérifions (à nouveau car cela a déjà ˆ f (qui est toujours linéaire) est continue sur été fait à la 2e question) que L (E, .2 ). On a, pour tout h ∈ E,
1
ˆ f (h)| ≤ |L 0
|h(t)|.|ϕ [f (t)]| dt ≤ h2 .
.2 ϕ [f (t)] dt
1-
1/2 ,
0
≤ h2 .M2 ; ˆ f est encore continue si on munit E de la norme .2 . donc L ˆ f (h), dont on rappelle l’expression Examinons à présent θ(f + h) − θ(f ) − L trouvée : 1 . ˆ f (h) = θ(f + h) − θ(f ) − L h(t) ϕ [f (t) + ξt h(t)] − ϕ [f (t)] dt. 0
À présent, il existe ζt ∈]0, 1[ tel que ϕ [f (t) + ξt h(t)] − ϕ [f (t)] = ξt h(t)ϕ [f (t) + ζt ξt h(t)] (êtes-vous d’accord ?). Par suite
1
ˆ f (h)| ≤ |θ(f + h) − θ(f ) − L
|h(t)ξt h(t)ϕ [f (t) + ζt ξt h(t)]| dt
0 1
≤
[h(t)]2 K dt, où K = sup |ϕ (u)|
0
u∈R
≤ Kh22 . 95
Chapitre 2. Solutions
En conclusion ˆ f (h)| |θ(f + h) − θ(f ) − L −→ 0 quand h2 −→ 0, h2 ˆf . et θ est différentiable en f avec Dθ(f ) = L EXERCICE 2 1) On a :
A(t) = S(t)A(0)S −1 (t) pour tout t ∈ R.
(1.7)
a) Pour tout t ∈ R, A(t) et A(0) sont semblables et ont donc les mêmes valeurs propres ; les valeurs propres de A(t) sont celles de A(0) et ne dépendent donc pas de t. b) De la dérivabilité de S sur R il vient celle de S −1 : R −→ Ω t −→ S −1 (t) et celle de
A : R −→ Ω t −→ A(t) = S(t)A(0)S −1 (t),
avec (S −1 ) (t) = −S −1 (t)S (t)S −1 (t), A (t) = S (t)A(0)S −1 (t) + S(t)A(0)(S −1 ) (t) pour tout t ∈ R. Par suite A (t) = S (t)A(0)S −1 (t) − S(t)A(0)S −1 (t)S (t)S −1 (t), = S (t)[S(t)]−1 A(t) − A(t)S (t)S −1 (t). En définissant B : R −→ E comme étant B(t) = −S (t)[S(t)]−1 pour tout t ∈ R, on a bien une application continue B (S est continue car S est de classe C 1 ) vérifiant la relation souhaitée : A (t) = A(t)B(t) − B(t)A(t) pour tout t ∈ R.
(2.12)
2) a) Si λ1 , · · · , λn sont les valeurs propres de C, celle de C k sont λk1 , · · · , λkn . On peut voir ceci de la manière suivante. C est triangularisable : il existe une matrice inversible P telle que P −1 CP soit une matrice triangulaire supérieure T = [tij ], avec tii = λi pour tout i = 1, . . . , n. Comme P −1 C k P = T k pour 96
2.5. Différentielle d’une fonctionnelle intégrale. Calcul différentiel...
tout k (on le vérifie facilement) et que T k est une matrice triangulaire supérieure avec λk1 , · · · , λkn sur la diagonale, on a bien que λk1 , · · · , λkn sont les valeurs propres de C k . Par conséquent : Tr (C k ) =
n
λki pour tout k ∈ N∗ .
(2.13)
i=1
Les fonctions symétriques élémentaires des racines λi du polynôme caractéristique de C ∈ E sont les quantités σk définies par σk = λi1 λi2 . . . λik i1 0 donné, on associe ∂v δ > 0 tel que : 1 1 ∂g ∂g 1 1 (v, s2 )1 ≤ ε . (s ∈ [a, b], |v1 − v2 | ≤ δ) =⇒ 1 (v, s1 ) − ∂v ∂v Ainsi, si h∞ ≤ δ, |ϑ(s)h(s)| ≤ |h(s)| ≤ δ pour tout s ∈ [a, b), de sorte que 1 1 1 ∂g 1 ∂g 1 |α(s)| ≤ |h(s)| 1 (s, x0 (s) + ϑ(s)h(s)) − (s, x0 (s))11 ≤ |h(s)|ε. ∂v ∂v Or
[F (x0 + h) − F (x0 )](t) − [Lx0 (h)](t) =
b
N (t, s)α(s) ds a
précisément. Ceci étant, pour h∞ ≤ δ et pour tout t ∈ [a, b] : 1 1 1 1 1[F (x0 + h) − F (x0 ) − Lx0 (h)](t)1 ≤ max |N (t, s)|ε(b − a)h∞ . s,t∈[a,b]
On a en fait démontré que F (x0 + h) − F (x0 ) − Lx0 (h)∞ −→ 0 quand h∞ −→ 0. h∞ En définitive : F est différentiable en x0 et Df (x0 ) = Lx0 .
2.7. Différentiabilité (et caractère C 1 ) via les différentielles partielles. Calcul différentiel (basique, Théorème des accroissements finis) EXERCICE 1 L’ensemble E0 × R muni de la norme (f, x) = f 0 + |x| (par exemple) est un espace vectoriel normé. Mais Φ n’est pas linéaire sur E0 × R. 99
Chapitre 2. Solutions
1) Soit (f0 , x0 ) ∈ E0 × R. On a : Φ(f, x) − Φ(f0 , x0 ) = f (x) − f (x0 ) = f (x) − f0 (x) + f0 (x) − f0 (x0 ). f est continue en x0 : ε > 0 étant donné, il existe η tel que |f0 (x) − f0 (x0 )| < ε pour tout |x − x0 | < η. Par ailleurs, |f (x) − f0 (x)| ≤ f − f0 0 . Soit α = min(ε, η). Si (f − f0 , x − x0 )E0 ×R < α, on a : f − f0 0 < α ≤ ε, |x − x0 | < η, d’où |f0 (x) − f0 (x0 )| < ε, et Φ(f, x) − Φ(f0 , x0 ) < 2ε. On a ainsi démontré que Φ est continue en (f0 , x0 ). 2) On considère ici la restriction de Φ à E1 × R. a) À x fixé considérons Φx : f ∈ E1 −→ Φx (f ) = f (x) (c’est la 1re application partielle). Cette fois, Φx est linéaire et |Φx (f )| ≤ f 0 ≤ f 1 pour tout f ∈ E1 ; par conséquent Φx est continue. Il s’ensuit que Φx (∈ L(E1 , R)) est différentiable sur E avec D1 Φ(f, x) = DΦx (f ) = Φx pour tout f ∈ E1 . À f fixé. Considérons Φf : x ∈ R −→ Φf (x) = f (x) (c’est la 2e application partielle). On constate que Φf n’est autre que f ; donc Φf est différentiable et D2 Φ(f, x) = DΦf (x) : R −→ R y −→ yf (x). En résumé : D1 Φ(f, x) ∈ L(E1 , R) est définie par D1 Φ(f, x) : g ∈ E1 −→ g(x); et D2 Φ(f, x) ∈ L(R, R) est définie par D2 Φ(f, x) : y ∈ R −→ yf (x). Ainsi, la différentielle de Φ en (f, x), si elle existe, ne pourra être que E1 × R −→ R (g, y) −→ D1 Φ(f0 , x0 )g + D2 Φ(f0 , x0 )y, c’est-à-dire g(x0 ) + yf (x0 ). 100
2.7. Différentiabilité (et caractère C 1 ) via les différentielles partielles...
b) Montrons que D1 Φ et D2 Φ sont continues sur E1 × R. Attention ici de bien repérer les espaces dans lesquels on travaille ! Comme D1 Φ(f, x) − D1 Φ(f0 , x0 ) = Φx − Φx0 , on a Φx − Φx0 ( norme dans L(E1 , R)) est
|g(x) − g(x0 )| . g1 g∈E1 ,g=0 sup
D’après le Théorème des accroissements finis (pour les fonctions dérivables de R −→ R) : |g(x) − g(x0 )| ≤ |x − x0 |.g 0 ≤ |x − x0 |.g1 pour tout g ∈ E1 . D’où :
Φx − Φx0 ≤ |x − x0 | ≤ (f − f0 , x − x0 )E1 ×R .
L’application D1 Φ est 1-Lipschitzienne sur E1 × R, a fortiori continue sur E1 × R. On a D2 Φ(f, x) − D2 Φ(f0 , x0 ) : R −→ R y −→ y f (x) − f (x0 ) . Par suite, D2 Φ(f, x)−D2 Φ(f0 , x0 ) = |f (x)−f0 (x0 )| (êtes-vous d’accord ?). Quand (f, x) − (f0 , x0 )E1 ×R −→ 0, (f , x) − (f0 , x0 )E0 ×R −→ 0 nécessairement (êtes-vous d’accord ?), d’où f (x) − f0 (x0 ) = Φ(f , x) − Φ(f0 , x0 ) tend aussi vers 0 (cf. résultat de la première question). En résumé : D1 Φ et D2 Φ existent et sont continues sur E1 ×R. Conclusion : Φ est de classe C 1 sur E1 × R. c) Comme cela a déjà été dit, DΦ(f0 , x0 ) est nécessairement (g, y) ∈ E1 × R −→ DΦ(f0 , x0 ) (g, y) = g(x0 ) + yf0 (x0 ). Remarque. On pouvait aussi déterminer directement la différentielle de Φ en (f0 , x0 ). Pour tout (g, y) ∈ E1 × R, Φ(f0 + g, x0 + y) = (f0 + g)(x0 + y) = f0 (x0 ) + Φ(f0 ,x0 )
g(x ) + yf (x ) 0 0 0
forme linéaire continue de (g,y)
+ yg (x0 ) + yε(y); o((g,y)E1 ×R )
mais la démarche proposée dans l’exercice était autre. 101
Chapitre 2. Solutions
EXERCICE 2 1) a) On a : f (x) − f (y) = x − y + g(x) − g(y), d’où f (x − f (y) ≥ x − y − g(x) − g(y). Comme g est différentiable sur H et que Dg(u) ≤ k pour tout u ∈ H, on a l’inégalité g(x) − g(y) ≤ kx − y (c’est une simple application du théorème des accroissements finis). Par suite f (x) − f (y) ≥ (1 − k)x − y = k x − y, où k = 1 − k > 0. Première conséquence :
f (x) = f (y) ⇒ k x − y = 0 , i.e. x = y.
L’application f est bien injective. Deuxième conséquence : fixons un y ∈ H, par exemple y = 0 ; on a f (x) ≥ f (x) − f (0) − f (0) ≥ k x − f (0); ainsi f (x) −→ +∞ quand x −→ +∞. b) L’application f , somme de deux applications différentiables, est différentiable, avec : Df (x) = idH + Dg(x) pour tout x ∈ H. Il s’ensuit : 1 1 Df (x)h, h = h2 + Dg(x)h, h ≥ h2 − 1Dg(x)h, h 1. De par l’inégalité de Cauchy-Schwarz, 1 1 1Dg(x)h, h 1 ≤ Dg(x)h.h ≤ Dg(x) .h2 ≤ kh2 . D’où, en définitive : Df (x)h, h ≥ k .h2 . 102
2.7. Différentiabilité (et caractère C 1 ) via les différentielles partielles...
2) Écrivons u comme la composée de deux applications différentiables. L’application ϕ1 : H −→ H x −→ ϕ1 (x) = f (x) − y est différentiable et Dϕ1 (x) : h −→ Dϕ1 (x)h = Df (x)h. L’application ϕ2 : H −→ R z −→ ϕ2 (z) = z2 est différentiable (résultat classique sur le carré d’une norme hilbertienne) et Dϕ2 (z) : h −→ Dϕ2 (z)h = 2z, h . En conséquence, ϕ2 ◦ ϕ1 = u est différentiable sur H avec + , Dϕ1 (x)h Du(x) : h −→ Du(x)h = Dϕ2 ϕ1 (x) = 2f (x) − y, Df (x)h . Remarque. Si on sait ce qu’est l’adjointe A∗ de A ∈ L(H, H), le résultat précédent induit que ∗ Du(x) : h ∈ H −→ 2 Df (x) (f (x) − y), h , ∗ et donc ∇u(x) = 2 Df (x) (f (x) − y). 3) a) Si on avait à minimiser u sur un compact de H, la question serait réglée. Mais on a à minimiser sur H tout entier ; le manque de compacité de H est compensé par la propriété (dite de coercivité) : u(x) −→ +∞ quand x −→ +∞. Inutile donc de chercher à minimiser « au-delà d’un certain borné ». Par exemple, il existe R tel que x > R ⇒ u(x) > u(0) (êtes-vous d’accord ?). ¯ R). Comme B(0, ¯ R) Par suite, minimiser u sur H revient à minimiser u sur B(0, est un compact (car H est de dimension finie !) et que u est continue, il existe ¯ R) tel que x0 ∈ B(0, u(x0 ) =
inf
¯ x∈B(0,R)
u(x) = inf u(x). x∈H
b) La fonction différentiable u est minimisée sur H en x0 ; donc Du(x0 ) = 0 nécessairement, soit ici : Df (x0 )h, f (x0 ) − y = 0 pour tout h ∈ H. 103
Chapitre 2. Solutions
Choisissons un h particulier, h = f (x0 ) − y par exemple. Il s’ensuit 0 = Df (x0 )(f (x0 ) − y), f (x0 ) − y ≥ k f (x0 ) − y2 , d’où f (x0 ) − y = 0. c) On a démontré que pour tout y ∈ H il existe x0 ∈ H tel que f (x0 ) = y. L’application f , dont on savait déjà qu’elle était injective, est donc surjective. En résumé : f est une bijection de H sur H.
2.8. Dérivée de t −→ exp((1 − t)A) exp(tB). Formules de Taylor sur la fonction déterminant. Conditions d’extrémalité du deuxième ordre sur un espace de Hilbert EXERCICE 1 1) a) L’application s −→ esA est dérivable sur R, de dérivée AesA en s ∈ R. Il s’ensuit que θ est dérivable sur R, avec en t ∈ R : θ (t) = −Ae(1−t)A etB + e(1−t)A BetB . Comme A et e(1−t)A commutent (êtes-vous d’accord ?), on a θ (t) = e(1−t)A (B − A)etB pour tout t ∈ R. b) Il vient de l’expression au-dessus de θ que θ est continûment dérivable sur R. Par suite 1 θ (t) dt, θ(1) − θ(0) = 0
ce qui induit (1.11). 2) · étant une norme sur Mn (R), il existe α > 0 tel que U V ≤ αU V pour tout U , V dans Mn (R) (êtes-vous d’accord ?). Par ailleurs, l’application (s, U ) ∈ R × Mn (R) −→ esU ∈ Mn (R) est continue (êtes-vous d’accord ?) ; il existe donc β > 0 tel que esU ≤ β pour tout s ∈ [0, 1] et U ∈ B. 104
2.8. Dérivée de t −→ exp((1 − t)A) exp(tB). Formules de Taylor sur la fonction...
En conséquence, il vient de (1.11) : 1 B A e(1−t)A (B − A)etB dt e − e ≤ 0 1 ≤ α2 β 2 B − A dt = α2 β 2 B − A. 0
Remarque et prolongement 1. Si A et B commutent, (1.11) prend une forme simplifiée : 1 A B A (A − B)et(B−A) dt. e −e =e 0
2. Les résultats de l’exercice conduisent facilement au résultat de dérivabilité suivant : σ : R −→ Mn (R) t −→ σ(t) = eA+tH est dérivable en 0 avec
1
σ (0) =
e(1−t)A HetA dt.
0
EXERCICE 2 1) a) La fonction f est de classe C ∞ sur E ; elle est aussi multilinéaire (continue) sur E ≡ Rn × · · · × Rn ). Donc Dn+1 f ≡ 0. n fois
Toutes les formules de Taylor sont utilisables ici, par exemple celle de Taylor-Mc Laurin ou celle avec expression du reste sous forme d’intégrale. Comme D n+1 f ≡ 0, seule la « partie régulière à l’ordre n » du développement va subsister : n 1 k D f (M )(N, · · · , N ). f (M + N ) = f (M ) + k!
(2.15)
k=1
b) Partant de (2.15) avec M = A et N = tB, t ∈ R, et sachant que D k f (A) est multilinéaire, on a f (A + tB) = f (A) +
n tk k=1
k!
Dk f (A)(B, · · · , B).
(2.16)
105
Chapitre 2. Solutions
D’autre part, partant de (2.15) avec M = tB et N = A, et sachant que D k f (B) est homogène de degré n − k, on a f (tB + A) = f (tB) +
n tn−l l=1
donc f (A + tB) = tn f (B) +
n−1 k=0
l!
Dl f (B)(A, · · · , A),
tk Dn−k f (B)(A, · · · , A). (n − k)!
La fonction polynôme exprimée ci-dessus est égale à celle exprimée en (2.16), les coefficients correspondant aux monômes de même degré sont égaux : 1 1 k D f (A)(B, · · · , B) = Dn−k f (B)(A, · · · , A) k! (n − k)! pour k ∈ {1, · · · , n − 1}, (2.17) 1 n D f (A)(B, · · · , B) = f (B), n! 1 n D f (B)(A, · · · , A). f (A) = n!
(2.18)
Il vient alors de (2.18) | det A| = |f (A)| ≤ d’où limA→0
1 Dn f (B) ·An , n!
det A = 0. An−1
2) a) n = 2. En faisant k = 1 dans (2.17), on obtient Df (A)(B) = Df (B)(A), d’où (1.16) par le fait que Df (X)(H) = cof X, H . Sachant que f (A) = det A, Df (A)(B) = cof A, B , et 1 2 D f (A)(B, B) = f (B) = det B, 2 il vient de (2.15) la formule élégante que voici det(A + B) = det A + cof A, B + det B = det B + cof B, A + det A. b) n = 3. En faisant k = 1 puis k = 2 dans (2.17) on obtient 1 2 D f (B)(A, A) = Df (A)(B) = cof A, B , 2 1 cof B, A = Df (B)(A) = D2 f (A)(B, B). 2 106
2.8. Dérivée de t −→ exp((1 − t)A) exp(tB). Formules de Taylor sur la fonction...
1 Comme D3 f (A)(B, B, B) = f (B) = det B, il vient de (2.15) la formule tout 3! aussi élégante : det(A + B) = det A + cof A, B + A, cof B + det B. c) Cas où n = 2. Il nous faut donner Df et D2 f , puisque Dk f ≡ 0 pour tout k ≥ 3. On sait que Df (A) : H −→ Df (A)(H) = cof A, H . Quant à D2 f (A), elle a déjà été déterminée sur la « diagonale » de E × E ; c’est-à-dire que l’on connait D2 f (A)(U, U ), U ∈ E (cf. (2.18)) : D2 f (A)(U, U ) = 2 det U. Il ne reste plus qu’à évaluer D2 f (A)(H, K) via une formule de « polarisation » relative aux formes bilinéaires symétriques ; cela consuit à D2 f (A)(H, K) = cof A, H =
1 [det(H + K) − det(H − K)] 2
= det(H + K) − det H − det K. Cas où n = 3. Il s’agit d’exprimer Df , D2 f et D3 f , puisque Dk f ≡ 0 pour tout k ≥ 4. On a toujours Df (A) : H −→ Df (A)(H) = cof A, H . Pour ce qui est de D2 f (A), il a été vu à la question précédente : D2 f (A)(B, B) = 2cof B, A . Par conséquent, à nouveau par « polarisation », D2 f (A)(H, K) =
1 cof (H + K) − cof (H − K), A 2
= cof (H + K) − cof (H) − cof (K), A . Enfin, concernant la forme trilinéaire symétrique D3 f (A), on a déjà d’après (2.18) : D 3 f (A)(B, B, B) = 6f (B) = 6 det B. 107
Chapitre 2. Solutions
Toujours par « polarisation » (de forme trilinéaires symétriques cette fois), on obtient que D 3 f (A)(H, K, L) est égal à 1 {det(H + K + L) − det(H + K − L) + det(H − K − L) − det(H − K + L)}. 4 EXERCICE 3 1) Étant donné x = (xn )n≥1 ∈ E, notons x2 (resp. x3 la suite de terme général 2 (x2n )n≥1 ) (resp. (x3n )n≥1 )). Pour tout n ≥ 1, on a xnn ≤ x2n donc la série de terme 2 2 général xnn converge car on a ∞ n=1 xn < +∞. De plus, la suite (xn )n≥1 étant bornée (elle tend vers 0), il existe une constante c ≥ 0 telle que supn≥1 |xn | ≤ c. Comme |x3n | ≤ cx2n , on obtient que la série de terme général x3n converge, ce qui donne bien un sens à f (x) pour tout x ∈ E. 2) a) Notant w = ( n1 )n≥1 , on a w ∈ E et f (x) = x2 , w − x . Posant a(x) = (x2 , w − x) = (a1 (x), a2 (x)), on a f = b ◦ a où b : E × E −→ R est définie par b(x, y) = x, y . Comme b est bilinéaire continue, elle est C ∞ . Il suffit alors de montrer que a est C ∞ et f le sera aussi. Cela revient à vérifier que a1 et a2 sont C ∞ . Pour a2 cela découle du fait que a2 est affine continue. Pour a1 , on observe que a1 = ψ ◦ avec (x) = (x, x), donc linéaire et continue et ψ(x, y) = (xn yn )n≥1 de sorte que ψ est bilinéaire. Comme, de plus, on a ψ(x, y)2 =
∞
x2n yn2 ≤ x2 y2 ,
n=1
ce qui montre que ψ est continue donc C ∞ car elle est bilinéaire. On a alors bien démontré que f est C ∞ . b) Pour tout x, h ∈ E, on a alors Df (x)(h) = Db(a1 (x), a2 (x))(Da1 (x)(h), Da2 (x)(h)) = b(a1 (x), Da2 (x)(h)) + b(Da1 (x)(h), a2 (x)) = 2xw − 3x2 , h . On note que le vecteur gradient ∇f (x) est ici 2xw − 3x2 . En particulier ∇f (0) = 0 d’où Df (0) = 0. 3) a) Comme on sait que f est deux fois différentiable, le moyen le plus simple pour calculer D 2 f (x)(h, k) est d’écrire D 2 f (x)(h, k) = Du(x)(k) où 108
2.8. Dérivée de t −→ exp((1 − t)A) exp(tB). Formules de Taylor sur la fonction...
u(x) = Df (x)(h). On obtient alors D2 f (x) : (h, k) ∈ E × E −→ D2 f (x)(h, k) = 2w − 3x, hk c’est-à-dire 2
D f (x)(h, k) = 2
∞ 1 n=1
n
− 3xn hn kn .
En particulier, pour x = 0 et h = k = d ∈ E, D2 f (0)(d, d) = 2
∞ d2
n
n=1
n
.
Ainsi, D 2 f (0)(d, d) > 0 pour tout d ∈ E \ {0}. b) Soit ε > 0 et x = (xn )n≥1 ∈ E définie comme suit ( ε si n = n0 xn = 2 0 si n = n0 , où n0 ∈ N est choisi strictement supérieur à 2ε . Alors ¯ ε) ; – x = |xn0 | = 2ε , de sorte que x ∈ B(0, – f (x) =
ε2 1 4 n0
−
ε 2
< 0 = f (0).
¯ ε) tel que f (xε ) < f (0) : f ne Donc, pour tout ε > 0, il existe xε ∈ B(0, présente pas de minimum local en 0. Pourtant les conditions nécessaires de minimalité locale de f en 0, à savoir : Df (0) = 0 et D 2 f (0)(d, d) ≥ 0 pour tout d ∈ E, sont satisfaites, et même plus : Df (0) = 0 et D2 f (0)(d, d) > 0 pour tout d ∈ E \ {0}.
(2.19)
Mais, contrairement à ce qui se passe quand E est de dimension finie, la condition (2.19) n’est pas suffisante pour assurer que f présente un minimum local en 0. Seule la condition renforcée Df (0) = 0 et, pour un certain α > 0, D2 f (0)(d, d) ≥ αd2 pour tout d ∈ E assurerait que f présente en 0 un minimum local. 109
Chapitre 2. Solutions
2.9. Conditions nécessaires d’optimalité du premier ordre en l’absence de différentiabilité Première partie 1) La fonction f : R −→ R définie par f (x) = sup(x, −x) = |x| s’écrit comme un max de deux fonctions différentiables sur R et n’est pas différentiable en 0. 2) a) Soient i ∈ I(x∗ ), d ∈ Rn , t > 0, on a f (x∗ + td) ≥ fi (x∗ + td) ≥ fi (x∗ ) + t∇fi (x∗ ), d + tεi (d, t) ≥ f (x∗ ) + t∇fi (x∗ ), d + tε(d, t). Passant à la borne supérieure sur i ∈ I(x∗ ), il vient f (x∗ + td) ≥ f (x∗ ) + t max ∇fi (x∗ ), d + tε(d, t). i∈I(x∗ )
b) Pour tout i ∈ [1, m] \ I(x∗ ), on a fi (x∗ ) < f (x∗ ). Par continuité des fonctions fi , i = 1, · · · , m, il existe un voisinage V de x∗ tel que fi (x) < f (x) pour tout x ∈ V et pour tout i ∈ [1, m] \ I(x∗ ). On a donc bien I(x) ⊂ I(x∗ ) pour tout x ∈ V . c) Soit t > 0 assez petit pour que x∗ + td ∈ V ; on a alors f (x∗ + td) = fit (x∗ + td) = fit (x∗ ) + t∇fit (x∗ ), d + tεit (d, t). Comme it ∈ I(x∗ + td) ⊂ I(x∗ ), on a fit (x∗ ) = f (x∗ ), donc f (x∗ + td) = f (x∗ ) + t∇fit (x∗ ), d + tεit (d, t)
≤ f (x∗ ) + t max ∇fi (x∗ ), d + E(d, t). i∈I(x∗ )
d) On a alors, divisant par t > 0, ε(d, t) ≤ t−1 (f (x∗ + td) − f (x∗ )) − max ∇fi (x∗ ), d ≤ E(d, t) i∈I(x∗ )
pour t > 0 assez petit, d’où |t−1 (f (x∗ + td) − f (x∗ )) − max ∇fi (x∗ ), d | ≤ max(|ε(d, t)|, |E(d, t)|). i∈I(x∗ )
Comme limt↓0 t−1 max(|ε(d, t)|, |E(d, t)|) = 0, on obtient bien que lim t−1 (f (x∗ + td) − f (x∗ )) = max ∇fi (x∗ ), d . t↓0
110
i∈I(x∗ )
2.9. Conditions nécessaires d’optimalité du premier ordre en l’absence...
Par ailleurs, f atteint un minimum local en x∗ , donc t−1 (f (x∗ +td)−f (x∗ )) ≥ 0 pout tout t > 0 assez petit. Faisant tendre t vers 0, on obtient lim t−1 (f (x∗ + td) − f (x∗ )) ≥ 0, t↓0
donc
max ∇fi (x∗ ), d ≥ 0.
i∈I(x∗ )
3) Pour tout x ∈ Rn , on a ϕ(x) + εx ≥ infn ϕ + εx, x∈R
ce qui montre que limx→∞ (ϕ(x) + εx) = +∞, ce qui implique que la fonction ϕ(·) + ε · atteint son minimum sur Rn . On a alors ϕ(xε ) − ϕ(x) ≤ ε(x − xε ) ≤ εx − xε , d’où ϕ(xε + td) − ϕ(xε ) ≥ −tεd, ce qui implique ∇ϕ(xε ), d = lim t−1 (ϕ(xε + td) − ϕ(xε )) ≥ −εd. t↓0
Changeant d en −d, on obtient −∇ϕ(xε ), d = lim t−1 (ϕ(xε + td) − ϕ(xε )) ≥ −εd, t↓0
d’où |∇ϕ(xε ), d | ≤ εd pour tout d ∈ Rn , ce qui montre que ∇ϕ(xε ) ≤ ε. 4) a) On sait que maxi∈I(x∗ ) ∇fi (x∗ ), d ≥ 0, il existe donc j ∈ I(x∗ ) tel que ∇fj (x∗ ), d ≥ 0, d’où exp ∇fj (x∗ ), d ≥ 1, ce qui implique bien ϕ(d) := exp ∇fi (x∗ ), d ≥ 0. i∈I(x∗ )
b) Posant ε = k1 , on déduit de 3) l’existence de dk ∈ Rn tel que ∇ϕ(dk ) ≤
1 . k
Par ailleurs, on a ∇ϕ(dk ) = i∈I(x∗ ) exp ∇fi (x∗ ), dk ∇fi (x∗ ), d’où le résul ∗ ¯= tat demandé. Posant alors λ j∈I(x∗ ) exp ∇fj (x ), dk ≥ 1, on obtient 1 ¯ −1 1 ¯ −1 ≤ . exp ∇fi (x∗ ), dk ∇fi (x∗ ) ≤ λ λ k k ∗ i∈I(x )
111
Chapitre 2. Solutions
On a donc bien
1 ∗ (2.20) λ ∇f (x ) ≤ , i i,k k ∗ i∈I(x ) −1 ¯ exp ∇fi (x∗ ), dk tels que λi,k ≥ 0 et avec λi,k = λ i∈I(x∗ ) λi,k = 1. c) Comme λi,k ≥ 0 et i∈I(x∗ ) λi,k = 1, on a λi,k ∈ [0, 1] pour tout i ∈ I(x∗ ) et pour tout k ∈ N∗ . Il existe alors une sous-suite encore notée (λi,k )k∈N∗ et limk→∞ λi,k = λi pour tout i ∈ I(x∗ ). des réels (λi )i∈I(x∗ ) ⊂ [0, 1] tels que Comme i∈I(x∗ ) λi,k = 1, on a aussi i∈I(x à la limite sur ∗ ) λi = 1. Passant ∗ k → ∞ dans (2.20), on obtient bien que i∈I(x∗ ) λi ∇fi (x ) = 0. 5) a) On a max{g1 (x∗ ), · · · , gk (x∗ )} ≤ 0 et f0 (x∗ ) − f0 (x∗ ) = 0, donc f (x∗ ) = 0. Par ailleurs, si x ∈ V ∩ S, alors max{g1 (x), · · · , gk (x)} ≤ 0, et f0 (x) − f0 (x∗ ) ≥ 0, donc f (x) ≥ 0, et si x ∈ V ∩ (Rn \ S), alors max{g1 (x), · · · , gk (x)} > 0 et donc f (x) > 0. On a donc bien f (x) ≥ f (x∗ ) = 0 pour tout x ∈ V . On a alors i ∈ I(x∗ ) si et seulement si gi (x∗ ) = 0, ce qui est équivalent à i = 0 ou i ∈ Iac (x∗ ), d’où I(x∗ ) = {0} ∪ Iac (x∗ ). Il existe donc d’après 4) des réels λ0 , (λi )i∈Iac (x∗ ) non tous nuls tels que λi ∇gi (x∗ ) = 0. λ0 ∇f0 (x∗ ) + i∈Iac (x∗ )
· · · , ∇gk (x∗ ) soient linéairement indépendants. Supposons alors que ∇g1 (x∗ ), Si on avait λ0 = 0, on aurait i∈Iac (x∗ ) λi ∇gi (x∗ ) = 0, ce qui est impossible. b) Si Iac (x∗ ) = ∅, alors max{g1 (x∗ ), · · · , gk (x∗ )} < 0. Il existe donc un voisinage W de x∗ tel que max{g1 (x), · · · , gk (x)} < 0 pour tout x ∈ W . Il en résulte que x∗ est un minimum local de f sur Rn , auquel cas on a ∇f0 (x∗ ) = 0.
2.10. Méthode de descente le long du gradient 1) Définissons ϕ : [0, 1] −→ X par ϕ(t) = f (x0 + t(x − x0 )) pour tout t ∈ [0, 1]. La fonction ϕ est de classe C 1 comme composée de telles applications, et ϕ (t) = ∇f (x0 + t(x − x0 ), x − x0 par application de la règle de différentiation d’une composée. On a alors, notant que f (x) − f (x0 ) = ϕ(1) − ϕ(0), 1 1 ϕ (t) dt = ∇f (x0 + t(x − x0 )), x − x0 dt, f (x) − f (x0 ) = 0
112
0
2.10. Méthode de descente le long du gradient
ce qui montre bien que 1 ∇f (x0 + t(x − x0 )) − ∇f (x0 ), x − x0 dt+ f (x) − f (x0 ) = 0
∇f (x0 ), x − x0 .
2) Appliquant la question 1) avec x0 et x remplacés respectivement par xn+1 et xn , il vient 1 ∇f (xn + t(xn+1 − xn )) − ∇f (xn ), xn+1 − xn dt+ f (xn+1 ) − f (xn ) = 0
∇f (xn ), xn+1 − xn .
On a alors |∇f (xn + t(xn+1 − xn )) − ∇f (xn ), xn+1 − xn | ≤ ktxn+1 − xn 2 donc 1
kxn+1 − xn )2 2 2 k ≤ n ∇f (xn )2 , 2
∇f (xn + t(xn+1 − xn )) − ∇f (xn ), xn+1 − xn dt ≤
0
et ∇f (xn ), xn+1 − xn = −n ∇f (xn )2 . Il en résulte que f (xn+1 ) − f (xn ) ≤ −n ∇f (xn )2 (1 − car 1 −
kn 2
kn ∇f (xn )2 ) ≤ −n , 2 2
≥ 12 .
3) Comme f (xn+1 ) − f (xn ) = (f (xn+1 ) − mf ) − (f (xn ) − mf ), on obtient (f (xn+1 ) − mf ) − (f (xn ) − mf ) ≤ −n
∇f (xn )2 . 2
On sait que −∇f (xn )2 ≤ −(f (xn ) − mf ), d’où (f (xn+1 ) − mf ) − (f (xn ) − mf ) ≤ −
n (f (xn ) − mf ), 2 113
Chapitre 2. Solutions
ce qui montre bien que n ¯ (f (xn ) − mf ) ≤ 1 − (f (xn ) − mf ) f (xn+1 ) − mf ≤ 1 − 2 2 si 0 < ¯ ≤ n ≤ k1 . Par récurrence, il vient alors f (xn ) − mf ≤ q n (f (x0 ) − mf ). Comme q ∈ [0, 1[, on a limn→∞ q n = 0, donc limn→∞ (f (xn ) − mf ) = 0. 4) On a xn+1 − xn 2 = 2n ∇f (xn )2 , et, d’après 2),
∇f (xn )2 ≤ f (xn ) − f (xn+1 ). 2 On a donc, utilisant le fait que f (xn+1 ) ≥ mf , n
xn+1 − xn 2 ≤ 2n (f (xn ) − f (xn+1 )) ≤ 2n (f (xn ) − mf ) ≤ On a donc bien
2(f (x0 ) − mf ) n q . k
n
xn+1 − xn ≤ cq 2 , ! +∞ √ n n 2(f (x0 )−mf ) 2 . Comme +∞ avec c = n=0 q = n=0 q < +∞, on obtient que k +∞
xn+1 − xn < +∞,
n=0
¯ ∈ X (êtes-vous d’accord ?). donc la suite (xn )n∈N converge vers un élément x Comme limn→∞ f (xn ) = mf , on a bien f (¯ x) = mf car f est continue. 5) On a xn+1 − x0 ≤
n k=0
xk+1 − xk ≤ c
n √
q k ≤ c(1 −
√
k=0
on en déduit, faisant tendre n vers +∞, que √ ¯ x − x0 ≤ c(1 − q)−1 . Comme x ¯ ∈ argmin f , on a x − x0 2 ≤ c2 (1 − d2 (x0 , argmin f ) ≤ ¯ 114
√
q)−2 ,
q)−1 ,
2.10. Méthode de descente le long du gradient
d’où d2 (x0 , argmin f ) ≤ δ(f (x0 ) − mf ), avec δ =
2√ . k(1− q)2
Comme x0 est arbitraire, on obtient
d2 (x, argmin f ) ≤ δ(f (x) − mf ) pour tout x ∈ X. 6) Il est clair que f atteint son minimum sur Rn en x0 , d’où ∇f (x0 ) = 0. On a alors, par la formule de Taylor-Young à l’ordre 2, D2 f (x0 )(u, u) + t2 (t), 2 avec limt→0 (t) = 0. Divisant par t2 et faisant tendre t vers 0, il vient bien D 2 f (x0 )(u, u) ≥ 2u2 . t2 u2 ≤ f (x0 + tu) − f (x0 ) = t2
Soit alors u ∈ Rn tel que D(Df )(x0 )(u) = 0. On a donc 2u2 ≤ D2 f (x0 )(u, u) = (D(Df )(x0 )(u))(u) = 0, d’où u = 0. Il en résulte que D(Df )(x0 ) est injective. Comme dim Rn = dim L(Rn , R), on obtient donc que D(Df )(x0 ) ∈ Isom (Rn , L(Rn , R)). D’après le Théorème d’inversion locale, il existe donc des voisinages U de x0 et V de Df (x0 ) = 0 et une constante κ ≥ 0 tels que Df soit un difféomorphisme de U dans V et tel que Df −1 soit κ-lipschitzien sur V . Pour tout x, y ∈ U on a alors x − y = Df −1 (Df (x)) − Df −1 (Df (y)) ≤ κDf (x) − Df (y). Pour y = x0 , on obtient bien que x − x0 ≤ κDf (x) = κ∇f (x) pour tout x ∈ U. On a alors, pour tout x ∈ U , f (x) − mf = f (x) − f (x0 ) 1 = ∇f (x0 + t(x − x0 )), t(x − x0 ) dt 0 1 ∇f (x0 + t(x − x0 )) − ∇f (x0 ), t(x − x0 ) dt. = 0
Comme f est C 2 , son gradient est lipschitzien sur les bornés. Supposant U borné et ∇f l-lipschitzien sur U , il vient alors f (x) − mf ≤ lx − x0 2 ≤ lκ2 ∇f (x)2 pour tout x ∈ U. 115
Chapitre 2. Solutions
2.11. Conditions nécessaires d’optimalité en présence de contraintes d’inégalité 1) a) Soit u ∈ TC (a) et soit x : I −→ C dérivable en 0 telle que x(0) = a, x(I) ⊂ C et x (0) = u. On a donc g(x(t)) = 0 pour tout t ∈ I, donc Dg(a)(u) = Dg(x(0))(x (0)) = 0. On a donc bien TC (a) ⊂ ker Dg(a). b) Soit v ∈ ker Dg(a). On remarque que F est de classe C 1 comme composée de g qui est de classe C 1 et de l’application affine continue (t, w) −→ (t, w) = a + tv + Dg(a)∗ (w). On a alors, pour tout s ∈ R et z ∈ Rq , DF (t, w)(s, z) = Dg(a + tw + Dg(a)∗ (w))(sv + Dg(a)∗ (z)), donc
D2 F (0, 0)(z) = DF (0, 0)(0, z) = (Dg(a) ◦ Dg(a)∗ )(z).
On a bien D2 F (0, 0) = Dg(a) ◦ Dg(a)∗ qui est bijective. En effet, posant A = Dg(a) et considérant w ∈ ker (A ◦ A∗ ), on a 0 = AA∗ (w), w = A∗ (w)2 d’où w = 0 car A surjective implique A∗ injective. Remarquons aussi que F (0, 0) = g(a) = 0. D’après le Théorème des fonctions implicites, il existe alors un intervalle ouvert I 0 et w : I −→ Rq telle que w(0) = a et F (t, w(t)) = 0 pour tout t ∈ I, soit g(a + tv + Dg(a)∗ (w(t))) = 0 pour tout t ∈ I. On a alors F (t, w(t)) = 0 pour tout t ∈ I, donc 0 = DF (0, 0)(1, w (0)) = Dg(a)(v + Dg(a)∗ (w (0))). Comme Dg(a)(v) = 0, il en résulte que (Dg(a) ◦ Dg(a)∗ )(w (0)) = 0, donc w (0) = 0. Posant x(t) = a + tv + Dg(a)∗ (w(t)), on a donc x(I) ⊂ C et x(0) = a, d’où x (0) ∈ TC (a). On a alors x (0) = v + Dg(a)∗ (w (0)) = v, d’où v ∈ TC (a). On a donc bien TC (a) = ker Dg(a). 2) D’après 1), on sait que ker Dg(a) = TC (a). Soit alors v ∈ ker Dg(a) = TC (a) et soit x : I −→ C avec I 0 intervalle ouvert tel que x(0) = a et v = x (0). On a donc f (x(t)) ≥ f (x(0)) pour t assez petit, donc Df (a)(v) = (f ◦ x) (0) = 0. On a donc ∇f (a), v = 0 pour tout v ∈ TC (a) = ker Dg(a), donc ∇f (a) ∈ (ker Dg(a))⊥ = Im Dg(a)∗ . 116
2.11. Conditions nécessaires d’optimalité en présence de contraintes...
Il existe alors bien λ ∈ Rq tel que ∇f (a) = Dg(a)∗ (−λ) = 0, d’où ∇f (a) + Dg(a)∗ (λ) = 0. De plus λ est unique car Dg(a)∗ est injective puisque Dg(a) est surjective. Notons que l’on a alors, pour tout u ∈ Rp , ∇f (a), u = Df (a)(u) = −Dg(a)∗ (λ), u = q q λi ∇gi (a), u = − λi ∇gi (a), u . −λ, Dg(a)u = − i=1
d’où ∇f (a) +
q
i=1 λi ∇gi (a)
i=1
= 0.
3) Tous les points de C vérifient x ≥ 1 et la fonction x2 +(x−1)3 est croissante sur [1, +∞[, son minimum est donc atteint pour x = 1 ; le point a = (1, 0) réalise bien le minimum de f sur C. On a ∇f (a) = (2, 0), ∇g(a) = (0, 0). Il n’existe donc aucun λ ∈ R tel que ∇f (a) + λ∇g(a) = 0. On remarque que Dg(a) n’est pas surjective car Dg(a) = 0.
y (x − 1)3 + y 2 = 0
0
x
a
(C)
Figure 2.1. Tracé de la courbe C.
117
Chapitre 2. Solutions
4) a) On a gq∗ +1 (a), · · · , gq (a)) < 0. En raison de la continuité des fonctions gi , i = 1, · · · , q, il existe un voisinage U ⊂ Rp de a tel que gq∗ +1 (x), · · · , gq (x)) < 0 pour tout x ∈ U . Soit V ⊂ Rp un voisinage de a tel que f (x) ≥ f (a) pour tout x ∈ V ∩ C. Pour tout x ∈ U ∩ V ∩ Cac on a donc x ∈ U ∩ V ∩ C, d’où f (x) ≥ f (a), ce qui montre bien que f admet un minimum local sur Cac en a. b) Comme Dgac (a) est surjective et comme f atteint un minimum local sur Cac en a, il existe alors λ∗ ∈ Rq∗ tel que ∇f (a) + Dgac (a)∗ (λ∗ ) = 0. 5) a) Soit μ ∈
Rq ∗
tel que
q∗
j=1 μj dj
= 0. On a donc Dgac
(a)∗
q∗
j=1 μj ej
= 0.
on sait alors que L’application Dgac (a) ∈ L(Rp , Rq∗ ) étant surjective, q∗ ∗ q p ∗ Dgac (a) ∈ L(R , R ) est injective. On a donc j=1 μj ej = 0, d’où μ = 0. On observe alors que Vect (d2 , · · · , dq∗ )⊥ n’est pas contenu dans Vect d⊥ 1 car sinon on aurait Vect d1 ⊂ Vect (d2 , · · · , dq∗ ), ce qui est impossible. Il existe donc v ∈ Rp tel que d1 , v = 0 et v ∈ Vect (d2 , · · · , dq∗ )⊥ . Quitte à changer v en −v, on a d1 , v < 0 et v ∈ Vect (d2 , · · · , dq∗ )⊥ . On a alors ∇f (a), v = −
q∗
λ∗i di , v = −λ∗1 d1 , v < 0.
i=1
b) Définissons gˆ : Rp −→ Rq∗ −1 par gˆ(x) = (g2 (x), · · · , gq∗ (x)). Alors Dˆ g(a) est surjective et Dˆ g(a)(v) = 0. Posant Cˆ = gˆ−1 (0) et utilisant 2), il existe un intervalle ouvert I 0 et x : I −→ Cˆ tel que x(0) = a et x (0) = v. On peut supposer que (gq∗ +1 (x(t)), · · · , gq (x(t))) < 0 pour tout t ∈ I. On a alors x(t) = a + tv + o(t) et g1 (x(t)) = tDg1 (a)(v) + o(t) = td1 , v + o(t), donc g1 (x(t)) < 0 pour t > 0 assez petit, d’où x(t) ∈ C. Pour t > 0 assez petit, on a donc f (x(t)) ≥ f (x(0)) d’où (f ◦ x)d (0) ≥ 0, ce qui est contradictoire car (f ◦ x)d (0) = ∇f (a), v < 0. c) On a ∇f (a), v = −λ∗1 ∇g1 (a), v = λ∗1 d1 2 < 0, et g1 (a + tv) = g1 (a) + t∇g1 (a), v + o(t) < 0 pour t > 0 petit. On a donc a+tv ∈ Cac pour t > 0 petit, d’où f (a+tv) ≥ f (a) pour t > 0 petit, ce qui conduit à la contradiction ∇f (a), v ≥ 0. 118
2.12. Différentielle de Gâteaux. Multiplicateurs de Lagrange
d) Si Jac = 0, alors gi (a) < 0 pour tout i ∈ [1, q]. Il en résulte que a est intérieur à C, donc a est un minimum local de f , d’où ∇f (a) = 0. On a démontré le résultat suivant. Soit g = (g1 , · · · , gq ) : Rp −→ Rq une application de classe C 1 , et soit C = {x ∈ Rp : g1 (x) ≤ 0, · · · , gq (x) ≤ 0}. Soit f : Rp −→ R une fonction différentiable qui admet un minimum local sur C en un point a ∈ C. On pose Jac = {i ∈ [1, q] : gi (a) = 0}. On suppose que les vecteurs (∇gi (a))i∈Jac sont linéairement indépendants. Alors il existe (λ1 , · · · , λq ) ∈ Rq+ unique tel que ⎧ q ⎪ ⎨∇f (a) + i=1 λi ∇gi (a) = 0 ⎪ ⎩
λi gi (a) = 0 pour tout i ∈ [1, q].
2.12. Différentielle de Gâteaux. Multiplicateurs de Lagrange EXERCICE 1) Supposons f différentiable en a. On a : f (a + tu) = f (a) + Df (a)(tu) + o(tu) = f (a) + tDf (a)(u) + o(t), d’où t−1 (f (a + tu) − f (a)) = Df (a)(u) + t−1 o(t), et lim t−1 (f (a + tu) − f (a)) = Df (a)(u),
t→0
ce qui montre bien que f est G-différentiable en a avec df (a) = Df (a). 2) Définissons ϕ : [0, 1] −→ F par ϕ(t) = f (a + tu) pour tout t ∈ [0, 1]. On a alors, pour t ∈]0, 1[ fixé s−1 (ϕ(t + s) − ϕ(t)) = s−1 (f (a + ts + su) − f (a + tu)) = s−1 (f (b + su) − f (b)), avec b = a + su. On en déduit que lims→0 s−1 (ϕ(t + s) − ϕ(t)) = Df (a + tu)(u) donc ϕ est dérivable en t et ϕ (t) = df (a + tu)(u). De même ϕd (0) = df (a)(u) et ϕg (1) = df (a + u)(u). On remarque alors que ϕ = e ◦ df ◦ avec e : L(E, F ) −→ F 119
Chapitre 2. Solutions
définie par e(Φ) = Φ(u) et : [0, 1] −→ S définie par (t) = a + tu." On obtient 1 donc que ϕ est continue sur [0, 1], ce qui implique ϕ(1) − ϕ(0) = 0 ϕ(s) ds, à savoir 1
f (a + u) − f (a) =
df (a + tu)(u) dt. 0
3) Supposons que f est G-différentiable sur la boule ouverte B(a, r). Alors, pour tout u ∈ B(0, r) et pour tout t ∈ [0, 1], on a a + tu ∈ "B(a, r). On en dé1 duit, d’après la question précédente, que f (a + u) − f (a) = 0 df (a + tu)(u) dt. On a donc 1 f (a + u) − f (a) − df (a)(u) = (df (a + tu) − df (a))(u) dt, 0
d’où
1
f (a + u) − f (a) − df (a)(u) ≤
(df (a + tu) − df (a))(u) dt
0 1
≤
df (a + tu) − df (a) u dt.
0
Soit alors ε > 0 et η > 0 tel que df (a + v) − df (a) ≤ ε pour tout v ≤ η. On a alors, pour tout u ∈ B(0, η), f (a + u) − f (a) − df (a)(u) ≤ εu. Il en résulte bien que f est différentiable en a et que Df (a) = df (a). PROBLÈME 1) C’est un résultat bien connu du Cours. 2) a) Il suffit de montrer que N et G sont fermés. C’est le cas pour N car Dg(a) est continue, pour G qui est le noyau d’une application linéaire continue, à savoir la projection sur N parallèlement à G. Posons Ψ = Dg(a)|G et considérons u ∈ ker Ψ. On a donc u ∈ N ∩ G donc u = 0. Par ailleurs, pour tout v ∈ F , il existe w ∈ E tel que Dg(a)(w) = v. Écrivant w = u + u ˆ avec u ∈ N et u ˆ ∈ G, on a Ψ(u) = Dg(a)(u) = Dg(a)(w) = v, donc Ψ est aussi bijective. On sait alors, d’après un théorème de Banach, que toute application linéaire bijective entre espaces de Banach est un isomorphisme, d’où Dg(a)|G ∈ Isom(G, F ). b) Soit r > 0 tel que B(a, 2r) ⊂ U . Posant V = N ∩ B(0, r) et W = G ∩ B(0, r), on a bien a + V + W ⊂ U . On a alors Φ = g ◦ avec (v + w) = a + v + w. L’application est affine continue donc de classe C 1 , c’est 120
2.12. Différentielle de Gâteaux. Multiplicateurs de Lagrange
donc aussi le cas pour Φ comme composée de deux applications de classe C 1 . On a D(v, w)(ˆ v , w) ˆ = vˆ + w, ˆ d’où DΦ(v, w)(ˆ v , w) ˆ = Dg(a + v + w)(ˆ v + w). ˆ On a alors, pour tout w ˆ ∈ G, ˆ = DΦ(v, w)(0, w) ˆ = Dg(a + v + w)(w), ˆ D2 Φ(v, w)(w) ce qui montre bien que D2 Φ(v, w) = Dg(a + v + w)|G . c) On a D2 Φ(0, 0) ∈ Isom(G, F ) et Φ(0, 0) = 0. D’après le Théorème des fonctions implicites, il existe donc un voisinage ouvert Ω de 0 dans N et une application ϕ : Ω −→ G de classe C 1 telle que l’on ait Φ(v, ϕ(v)) = 0 pour tout v ∈ Ω, soit g(a + v + ϕ(v)) = b sur Ω. On a Φ(v, ϕ(v)) = 0 sur Ω, donc D1 Φ(v, ϕ(v)) + (D2 Φ(v, ϕ(v)) ◦ Dϕ(v) = 0. Pour v = 0, on obtient donc v ) + D2 Φ(0, 0)(Dϕ(0)(ˆ v ) = 0 pour tout vˆ ∈ N , soit D1 Φ(0, 0)(ˆ Dg(a)(ˆ v ) + Dg(a)(Dϕ(0)(ˆ v )) = 0, d’où Dg(a)|G ◦ Dϕ(0) = 0, ce qui implique bien que Dϕ(0) = 0 car Dg(a)|G est bijective. d) Par définition de λ, on a Df (a)|G = λ ◦ Df (a)|G , ce qui montre bien que que Df (a) = λ ◦ Dg(a) sur G. 3) a) Pour t assez petit, on a tv ∈ Ω, d’où Φ(tv, ϕ(tv)) = 0 soit g(a + tv + ϕ(tv)) = b, donc a + tv + ϕ(tv) ∈ M . Pour t assez petit, on a aussi a + tv + ϕ(tv) ∈ U0 . Posant ψ(t) = f (a + tv + ϕ(tv)), on a donc ψ(t) ≥ ψ(0) pour tout t voisin de 0, d’où ψ (0) = 0. Or on a ψ (0) = Df (a)(v + Dϕ(0)(v)) = Df (a)(v). Il en résulte que Df (a)(v) = (λ ◦ Dg(a))(v) = 0 pour tout v ∈ N . b) Comme E = N ⊕ G, on a donc bien Df (a) = λ ◦ Dg(a) sur E. Si f atteint un maximum local sur M en a, alors −f atteint un minimum local sur M en a, il existe donc aussi λ ∈ L(F, R) tel que Df (a) = λ ◦ Dg(a). 4) On a Dg(a) = (Dg1 (a), · · · , Dgq (a)). Notant Jg (a) la matrice Jacobienne de g en a, on a donc ⎛ ⎞ [∇g1 (a)]T ⎜ ⎟ .. Jg (a) = ⎝ ⎠ ∈ Mq,p (R), . T [∇gq (a)] 121
Chapitre 2. Solutions
donc, pour tout λ ∈ Rq , Dg(a)T (λ) = Jg (a)T λ =
q
λi ∇gi (a).
i=1
Comme les vecteurs ∇g1 (a), · · · , ∇gq (a) sont linéairement indépendants, l’application Dg(a)T est injective donc Dg(a) est surjective. On peut donc appliquer 3) b) : il existe λ ∈ L(Rq , R) ≡ Rq tel que Df (a) = λ ◦ Dg(a), soit, pour tout u ∈ Rp , ∇f (a), u = Df (a)(u) = λ, Dg(a)(u) = Dg(a)T (λ), u , d’où le résultat car Dg(a)T (λ) = qi=1 λi ∇gi (a). 5) a) Exercice classique et facile. b) S est compact (fermé et borné dans Rp ) et f est continue, ce qui montre bien que f atteint son minimum sur S. Soit v1 ∈ S réalisant le minimum de f sur S. D’après 4) il existe λ1 ∈ R tel que Df (v1 ) = λ1 Dg(v1 ) soit Av1 = λ1 v1 . c) Pour tout u ∈ Vp−1 = {v1 }⊥ , on a Au, v1 = u, Av1 = u, λv1 = 0, ce qui montre bien que Vp−1 est stable par A. Il existe donc v2 ∈ S ∩ Vp−1 et λ2 ∈ R tel que Av2 = λ2 v2 . Par récurrence, on construit ainsi des vecteurs propres v1 , · · · , vq orthogonaux deux à deux qui forment donc une base de Rp .
2.13. Minimisation d’une fonction convexe sous une contrainte d’inégalité convexe 1) Soient x, y ∈ C et t ∈ [0, 1] ; on a f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y) ≤ 0, donc tx + (1 − t)y ∈ C et C est convexe, C est fermé dans U car f est continue sur U (attention, C n’est pas nécessairement fermé dans X). De plus si f (x) < 0, il existe, du fait de la continuité de f , une boule B(x, r) telle que f (z) < 0 pour tout z ∈ B(x, r) d’où B(x, r) ⊂ C, donc x ∈ int C. 2) a) Soit x ∈ C tel que f (x) < 0, soit ξ ∈ NC (x), et soit u ∈ X. Comme x ∈ int C, il existe t > 0 tel que x + tu ∈ C d’où ξ, tu ≤ 0, ce qui montre que ξ, u ≤ 0. Changeant u en −u, il vient ξ, u = 0 pour tout u ∈ X, donc ξ = 0. b) Soit x ∈ C tel que f (x) = 0 et soit ξ ∈ NC (x) \ {0}. On a alors ξ, z − x < 0 122
2.13. Minimisation d’une fonction convexe sous une contrainte d’inégalité...
pour tout z ∈ int C. Sinon, il existerait x0 ∈ int X tel que ξ, x0 −x ≥ 0, ce qui impliquerait ξ, x0 − x = 0 car on a déjà ξ, x0 − x ≤ 0 (puisque ξ ∈ NC (x)). On a donc ξ, x0 = ξ, x ≥ ξ, z pour tout z ∈ int C. La fonction convexe −ξ, · aurait alors un minimum local, donc global en x, ce qui impliquerait la contradiction ξ = 0. On en déduit que ξ, z − x ≥ 0 implique z ∈ / int C, donc f (z) ≥ 0 = f (x). On obtient alors f (z) ≥ f (x) pour tout z ∈ H ∩ U. c) Soit ξ ∈ NC (x) \ {0} et soit u ∈ X tel que ξ, u ≥ 0. Observant que f (x + tu) − f (x) x + tu ∈ H ∩ U pour t > 0 assez petit, il vient ≥ 0, donc t faisant tendre t vers 0, on a ∇f (x), u ≥ 0. Il en résulte que ∇f (x), u = 0 si ξ, u = 0, ce qui implique l’existence de λ ∈ R∗ tel que ξ = λ∇f (x). On remarque enfin que λ > 0 car ∇f (x), u ≥ 0 si ξ, u ≥ 0. d) Soit x ∈ C et ξ ∈ NC (x). Si f (x) < 0, alors, d’après a), on a ξ = 0 = λ∇f (x) avec λ = 0 et λf (x) = 0. Si f (x) = 0 et ξ = 0, on déduit de c) l’existence de λ > 0 tel que ξ = λ∇f (x) ; on a bien alors λf (x) = 0. Enfin ξ = 0 s’écrit ξ = 0∇f (x) et 0f (x) = 0. 3) Pour tout x ∈ C et pour tout t ∈]0, 1], on a x ¯ + t(x − x ¯) ∈ C, d’où g(¯ x + t(x − x ¯)) − g(¯ x) ≥ 0. t Faisant tendre t vers 0, il vient ∇g(¯ x), x − x ¯ ≥ 0, d’où −∇g(¯ x), x − x ¯ ≤ 0 x). Il existe alors d’après 2) un pour tout x ∈ C. On a donc −∇g(¯ x) ∈ NC (¯ réel λ ≥ 0 tel que ∇g(¯ x) = λ∇f (¯ x) et λf (¯ x) = 0. Posant μ = −λ, on a bien μ ≤ 0 et ⎧ ⎪ x) = μ∇f (¯ x) ⎨∇g(¯ ⎪ ⎩
μf (¯ x) = 0.
4) Supposons que (1.20) soit vérifiée. a) Si μ = 0, alors ∇g(¯ x) = 0, donc x ¯ réalise le minimum de g sur U , par suite sur C. b) Supposons μ < 0 de telle sorte que f (¯ x) = 0. On a alors, pour tout x ∈ C, 0 ≥ f (x) − f (¯ x) ≥ ∇f (¯ x), x − x ¯ , 123
Chapitre 2. Solutions
donc ∇g(¯ x), x − x ¯ ≥ 0 car ∇g(¯ x) = μ∇f (¯ x) avec μ < 0. On a alors, pour tout x ∈ C, g(x) − g(¯ x) ≥ ∇g(¯ x), x − x ¯ ≥ 0, d’où le résultat. 5) a) La projection existe et est unique car C est un convexe fermé dans ¯ miniun espace de Hilbert. Posant g(z) = z − x2 , on obtient que x x) = μ∇f (¯ x), mise g sur C. D’après 3), il existe donc μ < 0 tel que ∇g(¯ soit 2(¯ x − x) = μ∇f (¯ x), donc x − x ¯ = λ∇f (¯ x) avec λ = −μ/2 > 0. On a f (¯ x) = 0, sinon on aurait f (¯ x) < 0. Introduisant ϕ : [0, 1] −→ R par ϕ(t) = f (x + t(¯ x − x)), on aurait ϕ(0) > 0 car x ∈ / C et ϕ(1) < 0. Il existerait donc, par le Théorème des valeurs intermédiaires, un t ∈]0, 1[ tel que ϕ(t) = 0. Posant z = x + t(¯ x − x), on aurait alors z − x = tx − x ¯ < x − x ¯, ce qui contredit le fait que x ¯ est la projection de x sur C. b) On a alors f (x) ≥ f (¯ x) + ∇f (¯ x), x − x ¯ ≥ ∇f (¯ x), x − x ¯ =
x − x ¯2 . λ
x − x ¯ Observant que ∇f (¯ x) = et que f (x)+ = f (x) car f (x) > 0, on a λ donc ¯∇f (¯ x) ≥ τ x − x ¯ = τ d(x, C). f (x)+ ≥ x − x Si x ∈ C, on a f (x) ≤ 0 d’où f (x)+ = 0 = d(x, C), donc l’inégalité précédente est encore vérifiée. 6) a) L’application f est de classe C ∞ de classe C ∞ . Soit g(X) = det(X −1 ) H ∈ S n (R), DI(X)H = −X −1 HX −1 a D(det)(Y )H = det(Y )Y −1 , H où des matrices. On a alors
comme composée de trois applications = det(I(X)). On sait que, pour tout et que si Y ∈ S n (R) est inversible, on ·, · désigne le produit scalaire usuel
Df (X)H = D(log(g(X)))Dg(X)H =
Dg(X)H , det(X −1 )
et Dg(X)H = D(det(X −1 ))(−HX −1 H) = − det(X −1 )X, X −1 HX −1 = − det(X −1 )Tr (XX −1 HX −1 ) = − det(X −1 )X −1 , H 124
2.13. Minimisation d’une fonction convexe sous une contrainte d’inégalité...
d’où Df (X)H = −X −1 , H , ce qui montre bien que ∇f (X) = −X −1 . Posant alors h(X) = Df (X)H, on sait que Dh(X)H = D 2 f (X)(H, H). On a donc, pour tout H ∈ S n (R), D 2 f (X)(H, H) = X −1 HX −1 , H = Tr (X −1 HX −1 H) = X −1 H2 ≥ 0, donc f est bien convexe. b) Pour X ∈ U , on a log(det(X −1 ) ≤ 0 si et seulement si det(X −1 ) ≤ 1 ; comme det(X) > 0 pour tout X ∈ U , cela équivaut à det(X) ≥ 1. On a alors notant, λ1 , · · · λn les valeurs propres de X, inf
{X∈U, det(X)≤1}
X
−1
=⎧
n 1 , λ2 j=1 j
inf
⎪ ⎨ λ∈(R∗ )n 2 ⎪ ⎩ n
+
j=1
λj ≤1
donc, posant xi = log(λj ),
inf
{X∈U, det(X)≤1}
X
−1
=⎧
inf
⎪ ⎨ x∈Rn ⎪ ⎩ n
j=1
n
exp(−2xj ).
j=1 xj ≤0
Posons alors U = X = Rn , f (x) = nj=1 xj et g(x) = nj=1 exp(−2xj ). On ⎛ ⎞ ⎛ ⎞ 1 2 ⎜ .. ⎟ ⎜ .. ⎟ a ∇f (0) = ⎝ . ⎠ et ∇g(0) = − ⎝ . ⎠ d’où ∇g(0) = λ∇f (0) avec λ = −2 1 2 et λf (0) = 0. On peut alors appliquer la question 4), ce qui montre que le minimum est atteint en x = 0 et vaut donc f (0) = n. Il en résulte que inf
{X∈U :f (X)>0}
∇f (X) ≥
inf
{X∈U, det(X)≤1}
X −1 = n,
donc (1.21) se déduit de la question 5). 125
Chapitre 2. Solutions
2.14. Minimisation d’une fonction convexe sur un polyèdre convexe de Rn Question préliminaire.
C
y
0 hyperplan y, x = y2
Figure 2.2. Interprétation géométrique : C ⊂ {x ∈ Rn : y, x ≥ y2 }.
Soit y = −¯ x où x ¯ est la projection de 0 sur C (n’oublions pas que C est convexe et fermé). Comme 0 ∈ / C, on a y = 0, de plus y, z + y ≤ 0 pour tout z ∈ C, d’où y, z ≤ −y2 pour tout z ∈ C, donc supz∈C y, z ≤ −y2 < 0. Maintenant, si x ∈ / C, alors 0 ∈ / C − x. Comme C − x est convexe fermé et ne contient pas 0, il existe, d’après ce qui précède, y ∈ Rn \{0} tel que supz∈C y, z−x < 0, soit supy, z < y, x . z∈C
1) Le fait que C − soit un cône se vérifie immédiatement ; pour la convexité, si y1 y2 ∈ C − et si t ∈ [0, 1], il vient, pour tout x ∈ C, ty1 + (1 − t)y2 , x = ty1 , x + (1 − t)y2 , x ≤ 0 car y1 , x ≤ 0 et y2 , x 3≤ 0. On a donc montré que ty1 + (1 − t)y2 ∈ C − . Enfin C − est fermé car C − = x∈C Fx avec Fx = {y ∈ Rn : y, x ≤ 0} fermé. 126
2.14. Minimisation d’une fonction convexe sur un polyèdre convexe de Rn
Pour tout x ∈ C et pour tout y ∈ C − , on a y, x ≤ 0, ce qui montre que − C ⊂ C − = C −− − et donc que C ⊂ C −− car on vient de voir que C − est fermé. Réciproque/ C, il existe d’après la ment, montrons que Rn \ C ⊂ Rn \ C −− . En effet, si x ∈ question préliminaire un vecteur y ∈ Rn \ {0} tel que supy, z = supy, z < y, x . z∈C
z∈C
Soit t > 0 ; pour tout z ∈ C, on a tz ∈ C donc ty, z ≤ y, x d’où y, x y, z ≤ . Faisant tendre t vers +∞, il vient supz∈C y, z ≤ 0. Par ailleurs t supy, ζ ≥ ty, z , ζ∈C
d’où faisant tendre t vers 0, on obtient supz∈C y, z ≥ 0. On a donc y, x > supy, z = 0. z∈C
− / C − = C −− . Il en résulte que y ∈ C − et y, x > 0, ce qui montre que x ∈ 2) Il est clair que pos (a1 , · · · , am ) est un cône qui contient a1 , · · · , am . Soient alors x, y ∈ pos (a1 , · · · , am ) et t ∈ [0, 1]. Il existe λ, μ ∈ Rm + tels que x=
m j=1
m
λj aj et y =
m
μj aj .
j=1
On a donc tx + (1 − t)y = j=1 (tλj + (1 − t)μj )aj et tλj + (1 − t)μj ) ≥ 0 pour tout j ∈ [1, m], donc tx + (1 − t)y ∈ pos (a1 , · · · , am ) qui est alors convexe. m 3) a) Soit (yk )k∈N ⊂ pos (a1 , · · · , am ) avec yk = AT tk , (tk )k∈N m⊂ R+ , une m suite qui converge vers y. Munissons R de la norme y = j=1 |yj |. Supposons que la suite (tk )k∈N ⊂ Rm + ne soit pas bornée. On peut supposer, quite à considérer une sous-suite, que limk→∞ tk = +∞. Posant sk = ttkk , il existe alors une sous-suite, encore notée (sk )k∈N , qui converge vers un m T T avec s ∈ Rm + j=1 sj = 1. On a alors A (s) = limk→∞ A (sk ) = 0 car AT (sk ) = yk −1 AT (tk ). On aboutit alors à 0 ∈ co (a1 , · · · , am ), ce qui est contradictoire. m m b) Soit t ∈ Rm + tel que 0 = j=1 tj = 1 et soit m j=1 tj aj avec x ∈ pos (a1 , · · · , am ) s’écrivant x = j=1 yj aj avec y ∈ Rm + . Posant
J = {j ∈ [1, m] : tj > 0} = ∅ 127
Chapitre 2. Solutions
et λ = minj∈J t−1 j yj , on a yj −λtj ≥ 0 pour tout j ∈ [1, m], et il existe i ∈ [1, m] tel que yi − λti = 0. On a alors x=
m (yj − λtj )aj ∈ pos (a[1,m]\{i} ). j=1
On a donc bien le résultat escompté. c) Pour m = 1, il est clair que R+ a1 est fermé. Supposons que pour un m ∈ N∗ et pour tout a1 , · · · , am ∈ Rn l’ensemble pos (a1 , · · · , am ) soit fermé / co (a1 , · · · , am+1 ), on sait d’après a) et considérons a1 , · · · , am+1 ∈ Rn . Si 0 ∈ que pos (a1 , · · · , am+1 ) est fermé. Si 0 ∈ co (a1 , · · · , am+1 ), alors, d’après b), pos (a1 , · · · , am+1 ) =
m+1 &
pos (a[1,m+1]\{j} )
j=1
qui est une réunion finie d’ensembles qui sont fermés par hypothèse de récurrence, d’où pos (a1 , · · · , am+1 ) est fermé. m 4) Pour tout z = m j=1 λj aj ∈ pos (a1 , · · · , am ) avec λ ∈ R+ , et pour tout x ∈ PA,0 , on a m T λj aTj x ≤ 0, z x= j=1
car aj x ≤ 0 et λj ≥ 0 pour tout j ∈ [1, m]. Il en résulte que T
pos (a1 , · · · , am ) ⊂ (PA,0 )− . Réciproquement, soit x ∈ / pos (a1 , · · · , am ). Comme pos (a1 , · · · , am ) est convexe et fermé (question 3) c), il existe d’après la question préliminaire, un vecteur y ∈ Rn \ {0} tel que sup
y, z < y, x .
z∈pos (a1 ,··· ,am )
Comme pos (a1 , · · · , am ) est un cône, on obtient, comme dans la question 1) que y, z = 0. sup z∈pos (a1 ,··· ,am )
/ (PA,0 )− et Il en résulte que y ∈ PA,0 et y, x > 0, d’où x ∈ (PA,0 )− ⊂ pos (a1 , · · · , am ). 128
2.14. Minimisation d’une fonction convexe sur un polyèdre convexe de Rn
5) a) Il est clair que 0 ∈ NPA,b (x). Supposons que aTj x < bj pour tout j ∈ [1, m]. Alors, pour tout u ∈ NPA,b (x), il existe t > 0 petit tel que aTj (x + tu) < bj , d’où x + tu ∈ PA,b , et tu, x + tu − x ≤ 0, ce qui conduit à tu2 ≤ 0, donc u = 0.
z PA,b
x x + NPA,b (x) y
Figure 2.3. Cône normal.
b) Soit y ∈ C − et soit z ∈ PA,b . Pour tout j ∈ JA,b (x), on a aTj x = bj donc aTj (z − x) ≤ bj − bj = 0, d’où z −x ∈ C et y T (z −x) ≤ 0, ce qui implique y ∈ NPA,b (x) et C − ⊂ NPA,b (x). Réciproquement, soient y ∈ NPA,b (x) et u ∈ C. Pour tout j ∈ [1, m] \ JA,b (x), on a aTj x < bj donc, par continuité, pour t > 0 assez petit on a aTj (x + tu) < bj pour tout j ∈ [1, m] \ JA,b (x). Par ailleurs, si j ∈ JA,b (x), on a aTj (x + tu) ≤ bj + taTj u ≤ bj car aTj u ≤ 0. On obtient donc que x + tu ∈ PA,b pour t > 0 assez petit, d’où ty T u ≤ 0 impliquant y T u ≤ 0, d’où NPA,b (x) ⊂ C − . On sait, d’après la question 3) que C − = pos aJA,b (x) , d’où
NPA,b (x) = pos aJA,b (x) . 129
Chapitre 2. Solutions
6) Soit x ¯ ∈ PA,b tel que f (¯ x) = inf x∈PA,b f (x) et x)}. u ∈ C := {v ∈ Rn : aTj v ≤ 0 pour tout j ∈ JA,b (¯ ¯ + tu ∈ PA,b pour tout t > 0 assez petit, On a vu dans la question 5) que x induisant f (¯ x + tu) ≥ f (¯ x) et f (¯ x + tu) − f (¯ x) ≥ 0, t et, faisant tendre t vers 0 −∇f (¯ x), u ≤ 0 pour tout u ∈ PA,0 . x). RéciproIl en résulte que −∇f (¯ x) ∈ C − , d’où le résultat car C − = NPA,b (¯ x). Soit x ∈ PA,b , on a quement, considérons x ¯ ∈ C tel que −∇f (¯ x) ∈ NPA,b (¯ vu dans la question 5) que x)}. x−x ¯ ∈ C := {x ∈ Rn : aTj x ≤ 0 pour tout j ∈ JA,b (¯ Comme f est convexe, on sait que f (x) ≥ f (¯ x) + ∇f (¯ x), x − x ¯ . x) = C − , donc ∇f (¯ x), x − x ¯ ≥ 0, induisant Or −∇f (¯ x) ∈ NPA,b (¯ f (x) ≥ f (¯ x) pour tout x ∈ PA,b . J
(¯ x)
D’après la question 5), il existe donc λ ∈ R+A,b tel que λj aj . −∇f (¯ x) = j∈JA,b (¯ x)
Posant λj = 0 pour j ∈ [1, m] \ JA,b (¯ x), on a λj (aTj x − bj ) = 0. De plus, x), on a λj (aTj x − bj ) = λj 0 = 0, d’où (1.23). Réciproquesi j ∈ JA,b (¯ x) donc ment, si (1.23) est vérifié, alors λj = 0 pour j ∈ [1, m] \ JA,b (¯ x), d’où le résultat. −∇f (¯ x) ∈ pos aJA,b (¯x) = NPA,b (¯ 7) a) Une vérification immédiate montre que γ(s) = log(1 + s2 ) vérifie les propriétes requises. On peut aussi choisir ⎧ 2 ⎪ si |s| ≤ 12 ⎨s . γ(s) = ⎪ ⎩ 1 1 s − 4 si |s| > 2 130
2.14. Minimisation d’une fonction convexe sur un polyèdre convexe de Rn
On sait que la fonction · (norme euclidienne) est différentiable sur Rn \ {0} x et que ∇( · )(x) = pour tout x ∈ Rn \ {0}. Comme γ est différentiable x sur R (elle est en effet dérivable sur R), il en résulte que g = γ ◦ · est différentiable sur Rn \ {0} et, pour tout x = 0 et u ∈ Rn , on a 5 5 4 x 4 x , u = γ (x) ,u , Dg(x)(u) = Dγ(x) x x d’où
∇g(x) = γ (x)
x , x
ce qui montre que ∇g(x) = |γ (x)| ≤ 1. Enfin, pour x = 0, on a γ(x) = γ (0) = 0, x→0 x lim
d’où g est différentiable en 0 avec Dg(0) = 0. On a donc bien ∇g(x) ≤ 1 pour tout x ∈ Rn . b) Pour tout x ∈ PA,b , on a uT x +
g(x) γ(x) ≥μ+ , k k
γ(x) = +∞, on obtient k que (Pk ) possède au moins une solution. Soit xk ∈ PA,b une telle solution, on a donc d’après la question 6) où μ = inf x∈PA,b uT x > −∞. Comme limx→+∞
−∇f (xk ) ∈ NPA,b (xk ), où f (x) = uT x +
g(x) . On a donc k −u −
Posant vk =
∇g(xk ) ∈ NPA,b (xk ). k
∇g(xk ) 1 , on a bien vk ≤ et k k −u + vk ∈ NPA,b (xk ).
Pour tout J ⊂ [1, m], introduisons l’ensemble (éventuellement vide) : KJ = {k ∈ N∗ : JA,b (xk ) = J}. 131
Chapitre 2. Solutions
6 On a N∗ = J∈2[1,m] KJ . Comme 2[1,m] est fini, il existe J ∈ 2[1,m] tel que K := KJ est infini. Soit alors k0 ∈ K, comme NPA,b (xk ) = pos aJA,b (xk ) = pos aJ pour tout k ∈ K, on obtient −u + vk ∈ NPA,b (xk0 ), soit −u + vk , x − xk0 ≤ 0 pour tout x ∈ PA,b . Faisant tendre k ∈ K vers +∞ dans l’inégalité ci-dessus (on le peut car K est infini), il vient −u, x − xk0 ≤ 0, d’où −u ∈ NPA,b (xk0 ), ce qui montre que (P) admet xk0 pour solution, d’après la question 6) appliquée à la fonction f (x) = uT x.
2.15. Détermination et nature des points critiques d’une fonction. Différentiation de l’application exponentielle EXERCICE 1 1) a) f est le produit de deux fonctions φ et ψ de H dans R : φ : x −→ a, x 2 linéaire et continue, et ψ : x −→ ψ(x) := e−x , composée de fonctions différentiables. La fonction f est donc différentiable sur H. De plus, pour tout x∈H : Dφ(x) : h −→ a, h , et
2
Dψ(x) : h −→ −2x, h e−x (êtes-vous d’accord ?), d’où 2
2
2
Df (x) : h −→ a, h e−x − 2a, x x, h e−x = a − 2a, x x, h e−x . En conséquence, pour tout x ∈ H, 2
∇f (x) = (a − 2a, x x)e−x .
132
2.15. Détermination et nature des points critiques d’une fonction... 2
b) Puisque e−x = 0 pour tout x ∈ H, ∇f (x) = 0 équivaut à a − 2a, x x = 0. Il s’ensuit qu’un point critique de f doit être colinéaire à a : x = αa, α ∈ R. Alors a − 2a, x x = a − 2αa, αa a = a(1 − 2α2 a2 ) = 0. √
2 . Les seuls Puisque a = 0, cela équivaut à 1 − 2α2 a2 = 0, soit α = ± 2a points critiques possibles de f sont donc :
√ √ 2 a 2 a et x ¯2 = − . x ¯1 = 2 a 2 a ¯2 sont points critiques de f . On vérifie bien que x ¯1 et x 2) a) f est le produit de deux fonctions φ et ψ qui sont deux fois différentiables (C ∞ même) sur H ; f est donc deux fois différentiable (C ∞ même) sur H. Sachant cela, une manière de déterminer D 2 f (x0 )(h, k) est de procéder comme suit : D 2 f (x0 )(h, k) est égal à la différentielle en x0 de x −→ Df (x)k, appliquée au vecteur h. Cela conduit après quelques calculs à : D2 f (x0 )(h, k) = [−2a, k x0 , h − 2a, h x0 , k − 2a, x0 h, k 2
+4x0 , k a, x0 x0 , h ]e−x0 . En particulier, 2
D 2 f (x0 )(h, h) = 2[−2a, h x0 , h − a, x0 h2 + 2(x0 , h )2 a, x0 ]e−x0 . √ 2 a . On obtient, après quelques calculs, b) Considérons x ¯1 = 2 a √ D f (¯ x1 )(h, h) = − 2
2e−1/2 [(a, h )2 + a2 h2 ], a
de sorte que x1 )(h, h) ≤ −αh2 , D 2 f (¯ où α :=
√ √2 a. e
Par conséquent, x ¯1 est un maximum local strict de f .
Comme f (−x) = −f (x) pour tout x ∈ H, il est inutile de refaire les calx1 ) est un minimum local strict de f . On peut culs pour constater que x ¯2 (= −¯ vérifier que x ¯1 est en fait un maximum global de f sur H. 133
Chapitre 2. Solutions
EXERCICE 2 1) a) Il est clair que Lu est linéaire. Pour assurer la continuité de Lu , notons que Lu (h) ≤ uh + hu ≤ 2 u . h pour tout h ∈ L(X) (car uv ≤ u . v pour tout u et v dans L(X)). Donc Lu est continue (Lu ∈ L(L(X), L(X))), avec Lu ≤ 2 u .
(2.21)
b) On a : E2 (u + h) = (u + h)2 = u2 + uh + hu + h2 = E2 (u) + Lu (h) + h2 . On a déjà vu que Lu ∈ L(L(X), L(X)). De plus, de l’inégalité h2 ≤ h2 il vient que h2 = o(h). Par conséquent, E2 est bien différentiable en u avec DE2 (u) = Lu . 2) a) Exprimons En comme la composée de deux applications différentiables. Soient Δn : L(X) −→ (L(X))n définie par Δn (u) := (u, · · · , u) pour tout u ∈ L(X), et Bn : (L(X))n −→ L(X) définie par Bn (u1 , · · · , un ) := u1 · · · un pour tout (u1 · · · , un ) ∈ (L(X))n , de sorte que En = Bn ◦ Δn . L’application Δn est linéaire continue, donc différentiable sur L(X) avec DΔn (u) = Δn pour tout u ∈ L(X). Bn est multilinéaire (c’est clair) et continue car Bn (u1 , · · · , un ) ≤ u1 · · · un pour tout (u1 , · · · , un ) ∈ (L(X))n . Il s’ensuit que Bn est différentiable sur (L(X))n avec, en tout (u1 , · · · , un ) ∈ (L(X))n : [DBn (u1 , · · · , un )](h1 , · · · , hn ) =
n
u1 · · · ui−1 hi ui+1 · · · un
i=1
(résultat de différentiation d’une application multilinéaire continue qu’il faut connaître et savoir utiliser). Par conséquent, En = Bn ◦ Δn est différentiable en tout u ∈ L(X), avec, pour tout h ∈ L(X), [DEn (u)](h) = {DBn (u, · · · , u)}[Δn (h)] = [DBn (u, · · · , u)](h, · · · , h), ce qui donne [DEn (u)](h) =
n i=1
134
ui−1 hun−i .
(2.22)
2.15. Détermination et nature des points critiques d’une fonction...
b) Il résulte de (2.22) : [DEn (u)](h) ≤
n
u i−1 h . un−i = n u n−1 h
i=1
pour tout h ∈ L(X), d’où DEn (u) ≤ n u n−1 .
(2.23)
un un un ≤ pour tout u ∈ L(X) et que est le terme n! n! n! un général d’une série numérique convergente, la série de terme général est n! convergente dans l’espace de Banach L(X) (êtes-vous d’accord ?). On pose 3) Comme
exp(u) :=
+∞ n u n=0
n!
∈ L(X).
a) Soit M > 0. Il vient de (2.23) : DE (u) n M n−1 n ≤ M n−1 = . u ≤ M ) =⇒ n! n! (n − 1)! Mp est le terme général d’une série numérique convergente ; par consép! DEn (u) est normalement convergente, donc quent, la série de terme général n! uniformément convergente sur {u : u ≤ M }.
Or
b) On déduit du théorème de différentiabilité de limites de suites de fonctions différentiables (ou sommes de séries de fonctions différentiables) appliqué sur l’ouvert convexe borné {u : u < M } que u −→ exp(u) est différentiable sur {u : u < M } avec D(exp)(u) =
+∞ DEn (u) n=0
n!
=
+∞ DEn (u) n=1
n!
car DE0 = 0 (êtes-vous d’accord ?). Le résultat établi étant acquis pour tout M > 0, l’application exp est différentiable en tout u ∈ L(X) avec : +∞ n 1 i−1 n−i u hu pour tout h ∈ L(X). [D(exp)(u)](h) = n! n=1
(2.24)
i=1
En particulier : D(exp)(0) : h −→ h,
soit D(exp)(0) = idL(X) , 135
Chapitre 2. Solutions
et
7 +∞ 8 +∞ 1 1 nh = h = eh, D(exp)(idX ) : h −→ n! (n − 1)! n=1
n=1
d’où D(exp)(idX ) = e · idL(X) . 4) Voyons Φu comme la composée des deux applications différentiables suivantes : l : t ∈ R −→ l(t) := tu ∈ L(X), et exp : v ∈ L(X) −→ exp(v) ∈ L(X). Il s’ensuit que Φu = exp ◦ l est dérivable en tout t ∈ R avec : Φu (t)r = DΦu (t)(r) = {D(exp)(tu)}[ru] pour tout r ∈ R. En particulier, en faisant r = 1, Φu (t) = {D(exp)(tu)}[u] +∞ n 1 ( (tu)i−1 u(tu)n−i ) = n! =
n=1 +∞
i=1
tn−1 un (n − 1)!
n=1 +∞
=(
m=0
(tu)m )◦u m!
= exp(tu) ◦ u. En définitive,
Φu (t) = Φu (t) ◦ u ∈ L(X).
2.16. Calcul différentiel d’ordre supérieur. Différentielle d’ordre 2 d’une application composée EXERCICE 1 Soient
ϕ1 : E −→ H x −→ ϕ1 (x) := u(x) − a ; ϕ2 : H −→ R v −→ ϕ2 (v) := v2 (= v, v ),
de telle sorte que f = ϕ2 ◦ ϕ1 . 136
2.16. Calcul différentiel d’ordre supérieur. Différentielle d’ordre 2...
1) L’application ϕ1 est affine continue (de partie linéaire u) ; elle est donc de classe C ∞ sur E et Dϕ1 (x) = u en tout x ∈ E. Par ailleurs ϕ2 étant le carré de la norme hilbertienne ., est C ∞ sur H et, pour tout v ∈ H, Dϕ2 (v) : H −→ R k −→ Dϕ2 (v)k = 2v, k . Donc f = ϕ2 ◦ ϕ1 est de classe C ∞ sur E. Calculons Df (x). D’après la règle de différentiation d’applications composées, Df (x)h = {Dϕ2 (ϕ1 (x))}[Dϕ1 (x)h] = 2u(x) − a, u(h) pour tout h ∈ E. Calculons alors D2 f (x)(h1 , h2 ) (sachant que cette différentielle d’ordre deux existe). Par exemple : D 2 f (x)(h1 , h2 ) est la différentielle de x −→ Df (x)h1 prise en h2 . Cela donne rapidement : D 2 f (x)(h1 , h2 ) = 2u(h1 ), u(h2 ) pour tout (h1 , h2 ) ∈ E × E.
(2.25)
On peut aussi invoquer le développement u(x + h) − a2 = u(x) − a2 + 2u(x) − a, u(h) + u(h)2
(2.26)
pour déduire Df (x)h, puis pour affirmer que D 2 f (x)(h, h) = 2u(h)2 nécessairement et donc (2.25) par polarisation. 2) Évidemment les différentielles de f d’ordre p ≥ 3 (existent et) sont toutes nulles. EXERCICE 2 1) g ◦ f est deux fois différentiable sur O car composée d’applications deux fois différentiables. On sait qu’en tout x ∈ O : D(g ◦ f )(x) = Dg(f (x)) ◦ Df (x). Soit v : x −→ v(x) := {Dg(f (x))}[Df (x)h] ; la différentielle de v en x appliquée à k nous donnera D2 (g ◦ f )(x)(h, k). Posons, pour tout x ∈ O et pour tout (l, y) ∈ L(F, G) × F : α(x) = (Dg(f (x)), Df (x)h) ∈ L(F, G) × F et β(l, y) = l(y) ∈ G. L’applicatiion β est bilinéaire continue, donc : Dβ(l, y) : (s, z) → Dβ(l, y)(s, z) = β(l, z) + β(s, y) = l(z) + s(y).
(2.27)
L’application α dont les deux applications-composantes sont différentiables est différentiable avec : k → Dα(x)k = {D(Dg)(f (x))}[Df (x)k], D2 f (x)(h, k) . 137
Chapitre 2. Solutions
Par suite : Dv(x)k = {Dβ(α(x))}[Dα(x)k] = Dβ Dg(f (x)), Df (x)h {D(Dg)(f (x)}[Df (x)k], D2 f (x)(h, k) l
y
s
z
d’où Dv(x)k =
+ , Dg(f (x))(D 2 f (x)(h, k)) + {D(Dg)(f (x))}[Df (x)k] (Df (x)h) (=D 2 g(f (x))(Df (x)k,Df (x)h)
(d’après (2.27)), d’où le résultat annoncé. 2) a) La différentiabilité (et même le caractère C ∞ ) de la fonction carré de la norme hilbertienne est un résultat du Cours. Néanmoins démontrons rapidement sa différentiabilité en x ∈ H, comme cela est demandé. On a : c(x + h) = c(x) + 2x, h + h2 ; or h −→ x, h est linéaire continue et h2 = o(h), par conséquent c est différentiable en x et Dc(x) : H −→ R h −→ Dc(x)h = 2x, h . On peut aussi faire apparaître c comme composée de deux applications (dont il est facile de vérifier qu’elles sont) différentiables : x ∈ H −→ l(x) := (x, x) ∈ H × H; (u, v) ∈ H × H −→ b(u, v) := u, v ∈ R. l est linéaire continue, b est bilinéaire continue, et c = b ◦ l. b) Soit r :]0, +∞[ −→ R √ t −→ r(t) := t, de sorte que n = r ◦ c. Pour x ∈ H \ {0}, c(x) est dans ]0, +∞[, et comme r est dérivable sur ]0, +∞[, on en déduit que n est différentiable en x avec . Dn(x) : h ∈ H −→ Dn(x)h = Dr(c(x)) [Dc(x)h] = r (c(x))(2x, h ) = Donc, en x = 0, Dn(x) : h ∈ H −→ Dn(x)h = 138
x,h x .
x,h x .
2.16. Calcul différentiel d’ordre supérieur. Différentielle d’ordre 2...
c) La fonction c est deux fois différentiable sur H, avec D 2 c(x) = 2c pour tout x ∈ H (êtes-vous d’accord ?). Sachant que r est deux fois dérivable sur 1 pour tout t ∈]0, +∞[, on obtient grâce à la formule ]0, +∞[ avec r (t) = − 4t3/2 établie à la question 1) : 1 x2 h, k − x, h x, k D2 n(x) : (h, k) −→ D2 n(x)(h, k) = 3 x pour tout x = 0 et pour tout (h, k) ∈ H × H. 3) a) Pour x = 0, n(x) est dans ]0, +∞[, zone sur laquelle g a été supposée dérivable. Par conséquent, F = g ◦ n est différentiable en x = 0 avec DF (x) : h −→ DF (x)h = g (x)
x, h . x
b) F = g ◦ n, composée de n deux fois différentiable sur H \ {0} avec g supposée deux fois derivable sur ]0, +∞[, est deux fois différentiable sur H \{0} avec D2 F (x)(h, k) = D2 ((g ◦ n)(x)) (h, k) = D2 g(n(x)) Dn(x)h, Dn(x)k + Dg(n(x)) D2 n(x)(h, k) , pour tout (h, k) ∈ H × H. En tenant compte des calculs déjà faits : D2 F (x)(h, k) =
g (x) g (x) x, h x, k + h, k x2 − x, h x, k . 2 3 x x
c) On demande de trouver la matrice symétrique ∇2 F (x) telle que D 2 F (x)(h, k) = ∇2 F (x)h, k pour tout (h, k) ∈ Rn × Rn . Observons la chose suivante : xxT est une matrice symétrique (semidéfinie positive, de rang 1 si x = 0) telle que (xxT )h, k = x, h .x, k (êtes-vous d’accord ?) . D’où 2
D F (x)(h, k) =
9 g (x)
et donc ∇2 F (x) =
: g (x||)x − g (x) T In + xx h, k , x|| x3
g (x) g (x||)x − g (x) T In + xx . x|| x3
ΔF (x) est par définition la trace de ∇2 F (x). Observant que Tr (xxT ) = x2 , on obtient 1 g (x)x + (n − 1)g (x) . ΔF (x) = x 139
Chapitre 2. Solutions
L’équation « ΔF (x) = 0 pour tout x ∈ Rn \ {0} » équivaut à : g (t)t + (n − 1)g (t) = 0 pour tout t > 0, soit encore
tn−2 [g (t) + (n − 1)g (t)] = 0 pout tout t > 0, θ (t)
où θ : t > 0 −→ θ(t) := tn−1 g (t). Deux cas sont à distinguer : n = 2 et n = 2. Si n = 2, on trouve g : t > 0 −→ g(t) = α log t + β, (α, β réels). Si n = 1 ou si n > 2, on trouve g : t > 0 −→ g(t) = λt2−n + μ (λ, μ réels).
2.17. Résolution d’équations par la méthode de Newton I 1) a) On sait que Isom (E, F ) est ouvert dans L(E, F ) et que l’application z → h(z) = Df (a + z) est continue. On en déduit que h−1 (Isom (F, E)) ¯ ˆ ⊂ U et qui contient 0 est un ouvert. Il existe donc δˆ > 0 tel que a + B δ ¯ g(z) ∈ Isom (F, E) pour tout z ∈ Bδˆ. On sait que l’application Φ → Φ−1 est continue de Isom (E, F ) dans Isom (F, E), donc g est continue. Il existe alors ¯δ , g(z) − g(0) ≤ 1 d’où g(z) ≤ C 0 < δ < δˆ tel que l’on ait pour tout z ∈ B ¯ ˆ n’est pas compacte dans E.) avec C = 1 + g(0). (Attention, la boule B δ −1 b) On a (Φ2 − Φ1 ) ◦ Φ−1 2 = IF − Φ1 ◦ Φ2 , d’où −1 −1 −1 Φ−1 1 ◦ (Φ2 − Φ1 ) ◦ Φ2 = Φ1 − Φ2 .
¯ ˆ, On a alors, pour tout z1 , z2 ∈ B δ Df (a + z1 )−1 − Df (a + z2 )−1 ≤
Df (a + z1 )−1 Df (a + z1 ) − Df (a + z2 )Df (a + z1 )−1 ,
¯ ˆ, ce qui montre d’où g(z1 ) − g(z2 ) ≤ C 2 M z1 − z2 pour tout z1 , z2 ∈ B δ 2 ¯δ avec L = C M . bien que g est L-Lipschitzienne sur B 2) a) Remarquons que R(a, z) − R(a, z ) = f (a + z) − f (a + z ) − Df (a + z)(z) + Df (a + z )(z ), ce que l’on peut écrire R(a, z) − R(a, z ) = f (a + z) − f (a + z ) − Df (a + z)(z − z ) +(Df (a + z ) − Df (a + z))(z ). 140
2.17. Résolution d’équations par la méthode de Newton I
On a donc R(a, z) − R(a, z ) = ψ(1) − ψ(0) + (Df (a + z ) − Df (a + z))(z ) avec ψ : [0, 1] −→ F définie par ψ(s) = f (a + z + s(z − z)) − sDf (a + z)(z − z) ¯ δ))). (on remarque que a + z + s(z − z) = a + s(a + z − (a + z)) ∈ B(a, L’application ψ étant continuement dérivable avec ψ (s) = Df (a + z + s(z − z)) − Df (a + z) (z − z), "1 on obtient ψ(1) − ψ(0) = 0 ψ (s) ds. Il vient alors 1 M sz − z2 ds ≤ M z − z2 , ψ(1) − ψ(0) ≤ 0
et on obtient bien R(a, z)−R(a, z ) ≤ M z −z2 +M z −zz = M (z −z2 +z −zz ). b) On a F (z ) − F (z) = (g(z ) − g(z))(R(a, z) − b) + g(z )(R(a, z ) − R(a, z)), donc F (z ) − F (z) ≤ g(z ) − g(z)R(a, z) − b + g(z )R(a, z ) − R(a, z). On obtient alors g(z )R(a, z ) − R(a, z) ≤ CM (z − z2 + z − zz ) ≤ CM (z − z + z )z − z ≤ 3CM δz − z, et, notant que 0 = R(a, 0), R(a, z) − b ≤ R(a, z) − R(a, 0) + b ≤ R(a, z) − R(a, 0) + b ≤ M z2 + b ≤ M δ2 + b, ce qui implique g(z ) − g(z)R(a, z) − b ≤ L(M δ2 + b)z − z. On a donc bien F (z ) − F (z) ≤ κz − z avec κ = L(M δ2 + b) + 3CM δ. 141
Chapitre 2. Solutions
c) Si b et δ sont assez petits, on a κ < 1. De plus F (z) − F (0) ≤ κz, d’où F (z) = F (0) + κz ≤ g(0)b + κδ ; ¯δ pourvu que g(0)b ≤ (1 − κ)δ, ce qui sera vérifié on aura donc F (z) ∈ B si b est assez petit en observant que l’on peut garder la même constante κ ¯δ en diminuant b. Il en résulte que F est une contraction sur B d) Comme F (¯ z ) = z¯, on a Df (a + z¯)−1 (R(a, z¯) − b) = z¯ donc R(a, z¯) − b = Df (a + z¯)(¯ z ), soit b − f (a + z¯) + Df (a + z¯)(z) − b = Df (a + z¯)(¯ z ), d’où f (¯ x) = f (a + z¯) = 0 avec x ¯ = a + z¯. Par ailleurs si f (a + z) = 0 avec ¯δ , on a alors z∈B b − f (a + z) + Df (a + z)(z) − b = Df (a + z)(z), d’où R(a, z) − b = Df (a + z)(z) et F (z) = z, ce qui montre bien que z = z¯. 3) On a zn+1 = F (zn ) = Df (a + zn )−1 (R(a, zn ) − b) = Df (a + zn )−1 (b − f (a + zn ) − Df (a + zn )(zn ) − b), d’où zn+1 = −Df (xn )−1 (f (xn )) + zn , ce qui montre bien que xn+1 = −1 xn − Df (xn ) (f (xn )). On sait que la suite (zn ) converge vers l’unique point ¯δ , donc (xn ) converge vers a + z¯ = x ¯, unique solution x ¯ de fixe z¯ de F sur B ¯δ . l’équation f (x) = 0 sur a + B 4) a) On a ϕ (t) = (Df (x + t(x − x)) − Df (x))(x − x), d’où en utilisant le ¯δ , fait que Df est M -Lipschitzienne sur a + B ϕ (t) ≤ M tx − xx − x ≤ M x − x2 . On a alors, d’après le Théorème des accroissements finis, ϕ(1) − ϕ(0) ≤ M x − x2 , soit
142
f (x ) − f (x) − Df (x)(x − x) ≤ M x − x2 .
2.17. Résolution d’équations par la méthode de Newton I
b) On a −Df (xn )(xn+1 − xn ) = f (xn ) et −Df (xn−1 )(xn − xn−1 ) = f (xn−1 ), d’où −Df (xn )(xn+1 −xn ) = f (xn )−0 = f (xn )−(f (xn−1 )+Df (xn−1 )(xn −xn−1 )), d’où −Df (xn )(xn+1 − xn ) = f (xn ) − f (xn−1 ) − Df (xn−1 )(xn − xn−1 ). On a donc f (xn ) = −Df (xn )(xn+1 − xn ) = f (xn ) − f (xn−1 ) − Df (xn−1 )(xn − xn−1 ), ce qui implique, d’après 4) a) f (xn ) ≤ M xn − xn−1 2 , et donc xn+1 − xn ) ≤ Df (xn )−1 f (xn ) ≤ CM xn − xn−1 2 . c) On a x2 − x1 ≤ Kx1 − x0 , donc la propriété est vraie pour n = 1. n−1 n Supposons que xn+1 − xn ≤ K 1+2+...+2 x1 − x0 2 . On en déduit n
n+1
xn+2 − xn+1 ≤ Kxn+1 − xn 2 ≤ K 1+2+...+2 x1 − x0 2
,
d’où la propriété pour n + 1. Enfin, on a 1 + 2 + ... + 2n−1 = 2n − 1 donc 2n n−1 K 1+2+...+2 = KK , d’où n
xn+1 − xn ≤
(Kx1 − x0 )2 . K
d) On a xn+i − xn ≤
i−1
xn+j+1 − xn+j ,
j=0
d’où, faisant tendre i vers l’infini ¯ ≤ xn − x
∞
xn+j+1 − xn+j .
j=0
On a xn+j+1 − xn+j ≤ ∞
xn+j+1 − xn+j ≤
j=0
On a donc bien
n+j
(Kx1 −x0 )2 K
, donc
n ∞ (Kx1 − x0 )2 (Kx1 − x0 )j = . K K(1 − Kx1 − x0 ) n
j=2
n
(Kx1 − x0 )2 . ¯ ≤ xn − x K(1 − Kx1 − x0 ) 143
Chapitre 2. Solutions
2.18. Résolution de l’équation f (x) = 0 par la méthode de Newton II. Minimisation d’une fonction convexe par la méthode du gradient EXERCICE 1 1) Remarquons que f est différentiable sur un voisinage de [a, b] car D 2 f existe pour tout x ∈ [a, b]. On a d’après l’inégalité des accroissements finis appliquée à l’application g(x) = f (x) − Df (a)(x), g(b)−g(a) = f (b)−f (a)−Df (a)(b−a) ≤ b−a sup Df (x)−Df (a). x∈[a,b]
Appliquant de nouveau l’inégalité des accroissements finis à l’application Df , on obtient, pour tout x ∈ [a, b], Df (x) − Df (a) ≤ x − a sup D(Df )(z) . z∈[a,x]
Comme x − a ≤ b − a et supz∈[a,x] D(Df )(z) = supz∈[a,x] D2 f (z), on a bien f (b) − f (a) − Df (a)(b − a) ≤ b − a2 sup D2 f (x) . x∈[a,b]
2) a) On a x1 − x0 = [Df (x0 )]−1 (f (x0 )) ≤ [Df (x0 )]−1 .f (x0 ) ≤ cη ≤
r , 2
¯ 0 , r). donc x1 ∈ B(x b) Pour 1 ≤ k ≤ n, on a xk − x0 ≤
k−1
xj+1 − xj ≤
j=0
k−1
−2
c
3
2j
(c η)
j=0
Remarquant alors que 1 − c3 η ≥
1 2
−2
≤c
+∞
(c3 η)m =
m=1
cη . 1 − c3 η
et que cη ≤ 2r , on obtient bien que
xk − x0 ≤ r. ¯ 0 , r), c) On a alors, utilisant la question 1), et le fait que [xn−1 , xn ] ⊂ B(x f (xn ) = f (xn ) − f (xn−1 ) − Df (xn−1 )(xn − xn−1 ) ≤ cxn − xn−1 2 . On en déduit que xn+1 − xn = [Df (xn )]−1 (f (xn )) ≤ cf (xn ) ≤ c2 xn − xn−1 2 ≤ c2 c−4 [(c3 η)2
n−1
144
]2 ,
2.18. Résolution de l’équation f (x) = 0 par la méthode de Newton II...
ce qui montre bien que xn+1 − xn ≤ c−2 (c3 η)2 . On a alors, pour tout m ∈ N et p ∈ N∗ , n
xm+p − xm ≤
p
−2
xm+j − xm+j−1 ≤ c
j=1
+∞
3
2m+j−1
(c η)
xm+p − xm ≤ c−2
≤c
+∞
(c3 η)j .
j=2m
j=1
On a donc
−2
m
(c3 η)2 . 1 − c3 η m
Comme c3 η < 1, il en résulte que limm→∞ (c3 η)2 = 0, ce qui implique que la suite (xn )n∈N est de Cauchy dans E, donc convergente vers un élément x ¯ ∈ B(x0 , r). On a f (xn ) = −Df (xn−1 )(xn+1 − xn ), ce qui implique, en prenant la limite pour n → ∞, que f (¯ x) = −Df (¯ x)(0) = 0. EXERCICE 2 1) question préliminaire. Soit A > 0 tel que f (x) > f (0) pour tout x ∈ Rd tel que x > A. Comme inf x∈Rd f (x) = min(inf x>A f (x), inf x≤A f (x)) et que inf x>A f (x) ≥ f (0) ≥ inf x≤A f (x), il en résulte que inf x∈Rd f (x) = inf x≤A f (x). Remarquant que l’ensemble {x ∈ Rd : x ≤ A} est compact et que f est continue, on a inf x∈Rd f (x) = inf x≤A f (x) = minx≤A f (x). Autre démonstration. Posons μ = inf x∈Rd f (x) ∈ [−∞, +∞[ et considérons une suite (xn )n∈N ⊂ Rd telle que limn→∞ f (xn ) = μ. Étant donné un réel c > μ, il existe A > 0 tel que f (x) ≥ c pour tout x ∈ Rd tel que x > A. Comme f (xn ) < c pour tout n assez grand, on en déduit que xn ≤ A pour tout n assez grand. La suite (xn )n∈N étant donc bornée, elle possède ¯ ∈ Rd . On a alors une sous-suite (xσ(n) )n∈N qui converge vers un certain x f (¯ x) = limn→∞ f (xσ(n) ) = μ, d’où le résultat. 2) C’est la formule de Taylor avec reste sous forme d’intégrale du Cours à l’ordre 0. Démonstration directe : la fonction ϕ : R −→ Rd définie par ϕ(t) = f (x + t(y − x)) est de classe C 1 et ϕ (t) = Df (x + t(y − x))(y − x) = ∇f (x + t(y − x)), y − x . On a alors
f (y) − f (x) = ϕ(1) − ϕ(0) =
1
ϕ (t) dt = 0
1
∇f (x) + t(y − x), y − x dt.
0
145
Chapitre 2. Solutions
3) On a pour tout x, y ∈ Rd , t ∈ [0, 1], c f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y) − t(1 − t)x − y2 ≤ (1 − t)f (x) + tf (y), 2 donc f est convexe. On a alors, divisant par t > 0, c t−1 (f (x + t(y − x)) − f (x)) ≤ f (y) − f (x) − (1 − t)x − y2 . 2 Comme limt↓0 t−1 (f (x + t(y − x)) − f (x)) = ∇f (x), y − x , il vient c ∇f (x), y − x ≤ f (y) − f (x) − x − y2 , 2 d’où c f (y) ≥ f (x) + ∇f (x), y − x + x − y2 . 2 Échangeant x et y, on obtient c f (x) ≥ f (y) + ∇f (y), x − y + x − y2 . 2 Ajoutant les deux inégalités précédentes, on obtient bien ∇f (y) − ∇f (x), y − x ≥ cx − y2 . On a
f (y) = f (x) +
1
∇f (x + t(y − x)), x − y dt,
0
donc
f (y) = f (x) +
1
t−1 ∇f (x + t(y − x)) − ∇f (x), t(x − y)
0
+∇f (x), x − y ) dt. Par suite
1
f (y) ≥ f (x) +
tcx − y2 dt + ∇f (x), x − y
0
c ≥ f (x) + ∇f (x), y − x + x − y2 . 2 On a alors, utilisant l’inégalité de Cauchy-Schwarz, c f (y) ≥ f (x) − ∇f (x)x − y + x − y2 2 et c lim {f (x) − ∇f (x)x − y + x − y2 } = +∞, 2 y→+∞ 146
2.19. Un théorème de Rolle pour les fonctions à valeurs vectorielles...
d’où limy→+∞ f (y) = +∞, ce qui montre que f atteint son minimum d’après la question 1). Ce minimum est unique car la fonction convexe f vérifie f ((1 − t)x + ty) < (1 − t)f (x) + tf (y) pour tout x = y et t ∈]0, 1[. 4) Remarquons que xk+1 = xk − α(∇f (xk ) − ∇f (x∗ )), car ∇f (x∗ ) = 0. On a alors xk+1 − x∗ 2 = xk+1 − xk + xk − x∗ 2 = xk − x∗ − α(∇f (xk ) − ∇f (x∗ ))2 , ce qui donne bien xk+1 − x∗ 2 = xk − x∗ 2 − 2α∇f (xk ) − ∇f (x∗ ), xk − x∗ +α2 ∇f (xk ) − ∇f (x∗ )2 . On a alors ∇f (xk ) − ∇f (x∗ )2 ≤ L2 xk − x∗ 2 et ∇f (xk ) − ∇f (x∗ ), xk − x∗ ≥ cxk − x∗ 2 , ce qui montre bien que xk+1 − x∗ 2 ≤ θxk − x∗ 2 pour tout k ∈ N avec θ = (1 − 2cα + L2 α2 ). √ Remarquons que θ ∈]0, 1[ et que xk+1 − x∗ ≤ ( θ)k x1 − x0 , ce qui induit que limk→∞ xk − x∗ = 0. Le meilleur choix pour α est celui pour lequel θ est le plus petit possible, ce qui est obtenu pour α = Lc2 .
2.19. Un théorème de Rolle pour les fonctions à valeurs vectorielles. Un problème de maximisation. Sensibilité des racines simples d’un polynôme EXERCICE 1 1) a) f1 : (x, y) −→ f1 (x, y) = x(x2 + y 2 − 1) et f2 : (x, y) −→ f2 (x, y) = y(x2 + y 2 − 1) sont les deux fonctions-composantes de f . Chacune de ces fonctions est polynomiale (en (x, y)), donc différentiable (et même de classe C ∞ ) sur R2 ; f est donc différentiable (et même de classe C ∞ ) sur R2 . 147
Chapitre 2. Solutions
b) Df (x, y) est représenté dans la base canonique de R2 par la matrice 2 2xy 3x + y 2 − 1 . Jf (x, y) = 2xy 3y 2 + x2 − 1 On ne peut avoir tous les termes de Jf (x, y) nuls en même temps (Jf (x, y) = 0 impliquerait, entre autres, xy = 0, et si x = 0 ou y = 0, on ne peut pas avoir 3x2 + y 2 − 1 = 0 et 3y 2 + x2 − 1 = 0 simultanément). Donc Df (x, y) n’est nulle en aucun point (x, y) de R2 . c) On a f (x, y) = 0 (0 de R2 ) pour tout (x, y) ∈ Fr Ω mais Jf (x, y) n’est jamais nulle. Ainsi, bien que f s’annule sur Fr Ω, il n’existe aucun point de Ω en lequel la différentielle de f s’annule. ¯ est une partie connexe compacte de Rn , g : Rn −→ R est évidem2) a) Ω ¯ est une partie connexe compacte de R (êtes-vous ment continue. Donc g(Ω) d’accord ?), de la forme [m, M ] par conséquent. b) Puisque g(x) = c (constante) pour tout x ∈ Fr Ω, il y a trois possibilités : – g est constante sur Ω (= c) ; – il existe x ˜ ∈ Ω tel que g(˜ x) > c ; – il existe x ˜ ∈ Ω tel que g(˜ x) < c. Dans tous les cas, il existe c ∈ Ω en lequel g(c) = max g(x) ou bien g(c) = min g(x). ¯ x∈Ω
¯ x∈Ω
Ainsi Dg(c) = 0 nécessairement. Mais Dg(c) : h ∈ Rn −→ Dg(c)h = Df (c)h, d (par une application simple de la règle de différentiation des fonctions composées). On a bien démontré l’existence d’un c ∈ Ω tel que (C) ait lieu. c) Choisissons d = (d1 , d2 ) unitaire, ce qui ne constitue pas une perte de généralité (êtes-vous d’accord ?). La relation (C), écrite en c = (x, y), se traduit par ⎧ 2 2 ⎪ ⎨(3x + y − 1)d1 + (2xy)d2 = 0, ⎪ ⎩
(2xy)d1 + (3y 2 + x2 − 1)d2 = 0. d d 1 2 fait l’affaire. Mais on ne peut trouver On constate que c = √ , √ 3 3 c ∈ B(0, 1) qui fasse l’affaire pour tout d unitaire. 148
2.19. Un théorème de Rolle pour les fonctions à valeurs vectorielles...
3) a) Ici, Fr Ω = {a, b}. Avec les f et d proposés, on a f (x), d = f1 (x)[f2 (a) − f2 (b)] + f2 (x)[f1 (b) − f1 (a)], f (a), d = −f1 (a)f2 (b) + f2 (a)f1 (b), et f (b), d = f1 (b)f2 (a) − f2 (b)f1 (a). Par application du résultat de la question précédente, il existe c ∈]a, b[ tel que *< ;) * ) f2 (a) − f2 (b) hf1 (c) , = 0 pour tout h ∈ R, hf2 (c) f1 (b) − f1 (a) soit encore
f1 (c)[f2 (a) − f2 (b)] + f2 (c)[f1 (b) − f1 (a)] = 0, f1 (c)[f2 (a) − f2 (b)] = f2 (c)[f1 (a) − f1 (b)].
On reconnait là le théorème dit des accroissements finis généralisé de Cauchy, que le lecteur-étudiant a pu voir en exercice en 1er cycle. b) Σ = Im Γ est une surface (ou nappe) paramétrée de R3 . En le point M0 = Γ(u0 , v0 ) de Σ, le plan tangent (vectoriel) à Σ est le plan DΓ(u0 , v0 )R2 , c’est-à-dire le plan engendré par les deux vecteurs (linéairement indépendants) ⎞ ⎞ ⎛ ∂x ⎛ ∂x (u0 , v0 ) (u0 , v0 ) ⎟ ⎟ ⎜ ∂u ⎜ ∂v ⎟ ⎟ ⎜ ⎜ ⎟ ⎟ ⎜ ⎜ −−→ −−→ ∂y ∂y ⎟ ⎜ ⎜ ∂u Γ(u0 , v0 ) = ⎜ (u0 , v0 )⎟ et ∂v Γ(u0 , v0 ) = ⎜ (u0 , v0 )⎟ ⎟. ⎟ ⎟ ⎜ ∂u ⎜ ∂v ⎠ ⎠ ⎝ ⎝ ∂z ∂z (u0 , v0 ) (u0 , v0 ) ∂u ∂v Soit d un vecteur orthogonal à Π. L’hypothèse faite indique : Γ(u, v), d = 0 pour tout (u, v) ∈ Fr (B(0, 1)). Nous sommes dans les conditions d’application du résultat de la 2e question. D’après (C), il existe c0 = (u0 , v0 ) ∈ B(0, 1) tel que DΓ(u0 , v0 )(h1 , h2 ), d = 0 pour tout (h1 , h2 ) ∈ R2 , c’est-à-dire d est orthogonal à DΓ(u0 , v0 )R2 . Ainsi le plan tangent à Σ en Γ(u0 , v0 ) est parallèle à Π. 149
Chapitre 2. Solutions
EXERCICE 2 1) On maximise une fonction continue sur un compact : (P) a donc au moins une solution. De plus, en raison de la structure particulière du problème, si on a trouvé une solution (¯ x, y¯, z¯) avec x ¯, y¯, z¯ différents, il y a au moins six solutions (faire des permutations circulaires sur les coordonnées). 2) Soit x4 y 4 z 4 + 4 + 4 − 1, a4 b c 3 de sorte que S = {(x, y, z) ∈ R : h(x, y, z) = 0}. La fonction h, polynomiale, est de classe C ∞ sur R3 . De plus, h : (x, y, z) ∈ R3 −→ h(x, y, z) =
x3 y 3 z 3 , , ) a4 b4 c4 d’où ∇h(x, y, z) = 0 pour tout (x, y, z) ∈ S. Les conditions sont donc toutes remplies pour écrire la condition nécessaire d’extrémalité du 1er ordre de Lagrange : il existe λ ∈ R tel que ∇f (¯ x, y¯, z¯) + λ∇h(¯ x, y¯, z¯) = 0 (autrement dit ∇f (¯ x, y¯, z¯) et ∇h(¯ x, y¯, z¯) sont colinéaires). Il nous faut donc exploiter : ⎧ 4 y¯4 z¯4 x ¯ ⎪ ⎪ + + 4 −1=0 ; ⎪ ⎪ a4 b4 c ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎛ 3⎞ x ¯ ⎛ ⎞ ⎛ ⎞ a4 0 x ¯ ⎪ ⎜ 3⎟ ⎪ ⎪ ⎜ ⎟ ⎜ y¯ ⎟ ⎜ ⎟ ⎪ ⎪⎝y¯⎠ + 4λ ⎜ b4 ⎟ = ⎝0⎠ pour un certain λ ∈ R. ⎪ ⎪ ⎝ ⎠ ⎪ ⎪ ⎩ z¯ 0 z¯3 ∇h(x, y, z) = 4(
c4
1er
cas. Aucun des (¯ x, y¯, z¯) n’est nul. Après quelques manipulations algébriques (simples) on trouve les 8 points 1 (¯ x, y¯, z¯) = 4 (±a2 , ±b2 , ±c2 ). (a + b4 + c4 )1/4
¯ = 0, y¯ = 0. On trouve les points 2e cas. Par exemple, z¯ = 0, x 1 (±a2 , ±b2 , 0). (¯ x, y¯, z¯) = 4 (a + b4 )1/4 Ensuite (¯ x, y¯, z¯) =
(a4
1 (±a2 , 0, ±c2 ) + c4 )1/4
(b4
1 (0, ±b2 , ±c2 ). 4 1/4 +c )
et (¯ x, y¯, z¯) = (Au total 3 × 4 = 12 points). 150
2.19. Un théorème de Rolle pour les fonctions à valeurs vectorielles...
3e cas. Par exemple, x ¯ = 0, y¯ = 0 (et donc z¯ = 0). On trouve les points (¯ x, y¯, z¯) = (0, 0, ±c). Puis : (¯ x, y¯, z¯) = (0, ±b, 0), (¯ x, y¯, z¯) = (±a, 0, 0). (Au total 3 × 2 = 6 points). Il y a donc au total 26 points de S vérifiant la condition nécessaire d’extrémalité de Lagrange. 3) Une simple vérification montre que le maximum de f sur S est atteint pour les points mis en évidence dans le 1er cas. De fait max f (x, y, z) = (x,y,z)∈S
1 a4 + b4 + c4 1 = (a4 + b4 + c4 )1/2 . 1/2 4 4 4 2 (a + b + c ) 2
Donc les points de S les plus éloignés de l’origine sont à la distance dmax = (a4 + b4 + c4 )1/4 . EXERCICE 3 E est un espace vectoriel de dimension finie (de dimension d + 1 exactement), que l’on peut normer par exemple par P =
d
ak X k ∈ E −→ P ∞ = max |ak |.
k=0
k=0,...,d
1) a) L’application partielle F (., r0 ) : E −→ R P −→ F (P, r0 ) = P (r0 ) est linéaire, donc linéaire continue puisque E est de dimension finie. Par suite, F (·, r0 ) est différentiable sur E et sa différentielle en P0 est elle-même : D1 F (P0 , r0 ) : H ∈ E −→ H(r0 ). La deuxième application partielle F (P0 , .) : R −→ R r −→ F (P, r0 ) = P0 (r) est dérivable sur R et sa dérivée en r est P0 (r). Donc : D2 F (P0 , r0 ) : t ∈ R −→ P0 (r0 )t. 151
Chapitre 2. Solutions
b) Montrons que D1 F et D2 F sont continues sur E × R. – Continuité de D1 F . On a : D F (P, r) − D1 F (p0 , r0 ) : H = 1 ∈L(E,R)
d
ak X k ∈ E −→ H(r) − H(r0 ),
k=0
de sorte que |[D1 F (P, r) − D1 F (p0 , r0 )].H| ≤ H∞
d
|r k − r0k |
k=1
et D1 F (P, r) − D1 F (p0 , r0 ) ≤ ( norme dans L(E,R))
d
|r k − r0k |.
k=1
Quand (P, r) −→ (P0 , r0 ) (dans E × R), on a bien D1 F (P, r) −→ D1 F (p0 , r0 ) (dans L(E, R)). – Continuité de D2 F . Il suffit pour cela d’observer que E × R −→ R (identifié à L(R, R)) (P, r) −→ P (r) est continue (êtes-vous d’accord ?). D1 F et D2 F étant continues sur E × R, F est de classe C 1 sur E × R. 2) a) P0 (r0 ) = 0 et P0 (r0 ) = 0 par hypothèse, d’où : F (P0 , r0 ) = 0 et D2 F (P0 , r0 ) ∈ Isom (R, R). E est un espace de Banach, R aussi. On est donc dans les conditions d’application du théorème des fonctions implicites. Ses conclusions conduisent exactement à ce qui est demandé. b) L’application P −→ P (ϕ(P )) étant continue et sachant que P0 (ϕ(P0 )) = 0, =r0
on peut choisir V assez petit pour qu’on ait ϕ (P ) = 0 pour tout P ∈ W . 152
2.20. Conditions d’optimalité exprimées à l’aide du cône tangent à l’ensemble...
c) On a : . Dϕ(P0 ) : H ∈ E −→ −[D2 F (P0 , r0 )]−1 ◦ D1 F (P0 , r0 ) (H), d’où Dϕ(P0 )(H) = −
H(r0 ) . P0 (r0 )
2.20. Conditions d’optimalité exprimées à l’aide du cône tangent à l’ensemble des contraintes. Applications à un problème variationnel Première partie. Bien que non demandé, on peut montrer que T (S, a) est un cône fermé de sommet l’origine. De plus, si a ∈ S1 ∩ S2 , T (S1 ∩ S2 , a) ⊂ T (S1 , a) ∩ T (S2 , a). 1) Pour n ∈ N∗ , 1 xn = a + (xn − a) = n
1 1− n
a+
1 x; n
ce point appartient au segment joignant a à x, donc appartient à S ; de plus xn − a = x − a, n→+∞ 1/n lim
donc d = x − a est un vecteur tangent à S en a. 2) Si a est intérieur à D, il existe une boule de centre a contenue dans D et donc pour tout d ∈ R2 , il existe un entier n0 tel que xn = a + Ainsi, d = limn→+∞
1 d ∈ D pour tout n ≥ n0 . n
xn − a est vecteur tangent à D en a. On a donc 1/n T (D, a) = R2 .
Si a est sur la frontière Σ de D, soit H = {d : a, d ≤ 0}. Nous allons montrer que T (D, a) = H. Bien que ces détails ne soient pas tout à fait nécessaires, distinguons trois volets : (i) Si a, d < 0. La fonction ϕ(λ) = a + λd2 est ≤ 1 pour λ assez petit ; d’où xn = a + n1 d ∈ D pour n assez grand, et d est vecteur tangent à D en a. 153
Chapitre 2. Solutions
(ii) Si a, d = 0, la géométrie élémentaire nous apprend que d est tangent à Σ en a, donc a fortiori à D en a. (iii) T (D, a) ⊂ H et T (Σ, a) ⊂ {d : a, d = 0}. Montrons simplement la xn − a , xn = a + tn dn ∈ D et dn −→ d ; ainsi première inclusion. Si dn = tn a + tn dn 2 = a2 + 2tn a, dn + t2n dn 2 ≤ 1, d’où 2a, d + tn dn 2 ≤ 0 ; un passage à la limite sur n donne a, d ≤ 0. En résumé T (D, a) = {d : a, d ≤ 0} et T (Σ, a) = {d : a, d = 0} ; T (Σ, a) est la frontière de T (D, a). 3) L’application f étant continue, si f (a) < r, a est intérieur à Sr ; donc en suivant un raisonnement similaire à celui exposé au-dessus pour D, on montre aisément que T (Sr , a) = E. On suppose maintenant que f (a) = r. xn − a avec xn ∈ Sr et tn > 0. Posons Si d ∈ T (Sr , a), on a d = limn→+∞ tn xn − a , de sorte que dn −→ d et a + tn dn = xn ∈ Sr . Il vient alors dn = tn f (xn ) = f (a + tn dn ) = f (a) + tn Df (a)dn + tn dn εn , avec limn→+∞ εn = 0. Sachant que f (xn ) ≤ f (a) = r et en divisant par tn > 0 on arrive à Df (a)dn + dn εn ≤ 0. On fait tendre n −→ +∞ et on obtient Df (a)d ≤ 0. Soit f : x ∈ R −→ f (x) = x3 , a = 0 et r = 0. Alors T (Sr , a) = R− tandis que {d : Df (a)d ≤ 0} = R. Deuxième partie. 1) En reprenant les mêmes notations que dans la question précédente, J(xn ) = J(a) + tn DJ(a)dn + tn dn εn , avec limn→+∞ εn = 0. Si J présente en a un minimum local sur S, sachant que xn ∈ S, il vient que J(xn ) ≥ J(a) pour n assez grand. D’où, après division par tn > 0, DJ(a)dn + dn εn ≥ 0. On fait tendre n −→ +∞ et on obtient DJ(a)d ≥ 0. Dans le cas où a est intérieur à S, la condition (CN) devient DJ(a) = 0, et on sait que ceci est loin d’assurer que f présente en a un minimum local. 154
2.20. Conditions d’optimalité exprimées à l’aide du cône tangent à l’ensemble...
2) Si S est convexe, d = x − a est tangent à S en a (cf. 1) de la 1re partie). La condition (CN) entraîne donc que DJ(a)(x − a) ≥ 0 pour tout x ∈ S. Or J étant convexe, J(x) ≥ J(a) + DJ(a)(x − a) ; d’où J(x) ≥ J(a). Donc J présente en a un minimum global sur S. 3) Si J atteint son minimum global m en deux points a et b distincts, alors 1 1 a+b < J(a) + J(b) = m, m≤J 2 2 2 d’où contradiction. Troisième partie.
"1 "1 1) Si h et k ∈ Sα , on a : 0 h2 (t) dt ≤ 1, h(1) = α, 0 k2 (t) dt ≤ 1, et k(1) ≤ α. Alors, pour tout λ ∈ [0, 1], on aura : 1 1 1 2 2 h (t) dt + (1 − λ) k2 (t) dt λh(t) + (1 − λ)k(t) dt ≤ λ 0
0
0
≤ + (1 − d’où (en raison de l’inégalité [λu + (1 1 2 λh(t) + (1 − λ)k(t) dt ≤ λ + (1 − λ) = 1, − λ)v]2
λu2
λ)v 2 ),
0
et [λh + (1 − λ)k](1) = λα + (1 − λ)α = α, donc λh + (1 − λ)k ∈ Sα : Sα est bien convexe. Si h et k sont deux éléments de E, pour tout λ ∈ [0, 1] on a 1 J(λh + (1 − λ)k) = [λh (t) + (1 − λ)k (t)]2 dt 0 1 1 (h )2 (t) dt + (1 − λ) (k )2 (t) dt ≤λ 0
= λJ(h) + (1 − λ)J(k).
0
J est donc convexe. Si h = k, alors h = k : en effet, si h = k , comme h(0) = k(0) = 0, on aurait h = k. Il existe alors un intervalle [a, b] ⊂ [0, 1] tel que h (t) = k (t) pour tout t ∈ [a, b]. Pour λ ∈]0, 1[ on a donc, pour tout t ∈ [a, b] : 2 λh (t) + (1 − λ)k (t) < λ(h )2 (t) + (1 − λ)(k )2 (t), 155
Chapitre 2. Solutions
d’où
b
2 λh (t) + (1 − λ)k (t) dt < λ
a
b
2
b
(h ) (t) dt + (1 − λ)
a
(k )2 (t) dt ;
a
ce qui conduit à J(λh + (1 − λ)k) < λJ(h) + (1 − λ)J(k). On a bien démontré que J est strictement convexe. 2) Les applications : B0 : E × E −→ R 1 h(t)k(t) dt, (h, k) −→ 0
B1 : E × E −→ R 1 h (t)k (t) dt (h, k) −→ 0
sont bilinéaires (c’est clair) et continues puisque |B0 (h, k)| ≤ h · k et |B1 (h, k)| ≤ h · k. Ces applications sont de classe C ∞ et les applications f et J, définies par f (h) = B0 (h, h) et J(h) = B1 (h, h), sont également de classe C ∞ avec : 1 h(t)H(t) dt, H ∈ E −→ Df (h)H = 2B0 (h, H) = 2 H ∈ E −→ DJ(h)H = 2B1 (h, H) = 2
0
1
h (t)H (t) dt.
0
3) On peut considérer Sα comme l’intersection de S = {h ∈ E : f (h) ≤ 1} et de l’hyperplan Hα = {h ∈ E : h(1) = α}. On a alors : T (Sα , h) ⊂ T (S, h) ∩ T (Hα , h). La partie S est du type étudié à la 3e question de la première partie. On a donc 1 h2 (t) dt < 1, T (Sα , h) = E si f (h) = 0
et
1
T (Sα , h) ⊂ {H : Df (h)H = 2 0
h(t)H(t) dt ≤ 0} si f (h) =
1
h2 (t) dt = 1.
0
La partie Hα étant un hyperplan affine, T (Hα , h) est l’hyperplan vectoriel qui dirige Hα , à savoir : T (Hα , h) = {H : H(1) = 0}. 156
2.20. Conditions d’optimalité exprimées à l’aide du cône tangent à l’ensemble...
La partie T (Sα , h) de l’énoncé n’est autre que T (S, h) ∩ T (Hα , h), d’où les inclusions annoncées. 4) a) On a T (Sα , h) = E0 . Pour qu’une forme linéaire DJ(h) soit ≥ 0 sur un sous-espace vectoriel il faut et il suffit qu’elle soit nulle sur ce sous-espace, donc 1
DJ(h)H = 0
h (t)H (t) dt = 0 pour tout H ∈ E0 .
Le lemme fondamental du Calcul des variations (de Du Bois-Reymond) endu 1er degré. traîne que h doit être une constante, donc que h est un " 1polynôme Ce sera la solution cherchée si h(0) = 0, h(1) = α et 0 h2 (t) dt < 1. Les deux premières conditions donnent h(t) = αt, et la troisième 1 α2 0, il existe η > 0 tel que kX < η implique
sup |(DJ(u + k) − DJ(u))(h)| < ε.
hX ≤1
Posons R = 1 + uX . Alors ∇x F et ∇y F sont uniformément continues sur ¯ R) × B(0, ¯ R) ⊂ RN × RN . Donc, il existe η ∈]0, 1[ tel que si le compact B(0, (x1 , y1 ) − (x2 , y2 ) < 2η, alors ε ε ∇x F (x1 , y1 ) − ∇x F (x2 , y2 ) < et ∇y F (x1 , y1 ) − ∇y F (x2 , y2 ) < . 2T 2T Si on suppose kX < η, alors (x1 , y1 ) = (u(t), u (t)) et (x2 , y2 ) = (u(t) + h(t), u (t) + h (t)) répondent aux conditions ci-dessus, et les majorations trouvées, jointes à l’inégalité de Cauchy-Schwarz et à la majoration habituelle de l’intégrale comme dans la partie a), donnent le résultat. 3) a) Les applications qui à t associent u(t) et u (t) sont de classe C 1 , ainsi que celle qui à (x, y) ∈ RN × RN associe ∇x F (x, y). Donc, par composition, G est de classe C 1 . b) Notons d’abord que si f et g sont des fonctions à valeurs dans RN , défid nies sur un intervalle de R, alors f (t), g(t) = f (t), g(t) + f (t), g (t) , à dt cause de la bilinéarité du produit scalaire. Ceci permet d’étendre à des produits scalaires la formule bien connue d’intégration par parties : T T ∇y F (u(t), u (t)), h (t) dt = ∇y F (u(t), u (t)), h(t) 0 0 T d − ∇y F (u(t), u (t)), h(t) dt. dt 0 161
Chapitre 2. Solutions
Le terme « tout intégré » de cette expression se réduit à 0, car comme h ∈ X, on a h(0) = h(T ) = 0. En reportant la nouvelle expression de l’intégrale dans la formule pour DJ(u)(h) trouvée à la question 2) a), on obtient la formule (1.32). d c) Posons U (t) = ∇x F (u(t), u (t)) − ∇y F (u(t), u (t)). C’est une foncdt tion C 1 . Choisissons hn ∈ X tels que ⎧ si n1 ≤ t ≤ T − n1 ⎪ ⎨hn (t) = U (t) ⎪ ⎩
hn (0) = hn (T ) = 0
et hn ∞ ≤ 2U ∞ . (Il est possible de construire de telles fonctions comme des polynômes de degré trois par morceaux, par exemple). Alors il est facile de voir que T T− 1 n 4 0= U (t), hn (t) dt ≥ U (t)2 dt − U ∞ , 1 n 0 n "T 2 d’où 0 U (t) dt = 0, ce qui implique (par continuité et positivité de l’intégrande) U (t)2 = 0 pour tout t ∈ [0, T ], et donc U est identiquement nulle. d) Soit w = u + h une autre fonction de X. En appliquant la formule (1.30) pour v = u , k = h , et en intégrant de 0 à T , on obtient J(u + h) − J(u) ≥ DJ(u)(h) = 0, donc u minimise bien la fonctionnelle J. 4) a) Ici ∇x F (x, y) = −∇U (x), ∇y F (x, y) = ∇T (y), donc (1.33) devient 0 = −∇U (u(t)) −
d ∇T (u (t)), dt
ou de façon équivalente 0 = ∇U (u(t)) + ∇2 T (u (t))u (t), où ∇2 T (u (t)) s’interprète comme une application linéaire de RN dans luimême. π2 2 x , T (y) = y 2 , on obtient b) Dans le cas donné par l’exemple, U (x) = 4 donc l’équation différentielle suivante : π2 u(t) + 2u (t) = 0, 2 dont les solutions sont combinaisons linéaires de cos π2 t et sin π2 t. Les conditions aux bords u(0) = u(1) = 0 imposent comme unique solution u = 0. 162
2.22. Calcul différentiel d’ordre 2 sur un espace de matrices...
2.22. Calcul différentiel d’ordre 2 sur un espace de matrices. Surjectivité de la normale unitaire à une hypersurface compacte de Rn . Ensemble des solutions possibles d’une équation différentielle scalaire linéaire d’ordre n EXERCICE 1 1) On a f = g ◦ A avec g : Mn (R) −→ R définie par g(M ) = M 2 et A : Mn (R) −→ Mn (R) définie par A(A) = AT A − In . On sait que g est de classe C ∞ avec ∇g(M ) = 2M . On a alors A(A) = B(A, A) − In avec B = Mn (R) × Mn (R) −→ Mn (R) définie par B(A, B) = AT B. L’application B est bilinéaire, elle est continue car Mn (R) est de dimension finie. On sait alors que B est de classe C ∞ . L’application A −→ (A, A) est linéaire continue de Mn (R) dans Mn (R) × Mn (R) elle est donc de classe C ∞ . Il en résulte donc que f est de classe C ∞ sur Mn (R). On sait alors, que pour tout A, H ∈ Mn (R), on a DA(A)(H) = B(A, H) + B(H, A) = AT H + H T A et Df (A)(H) = Dg(A(A))(DA(A)(H)) = 2AT A − In , AT H + H T A . On sait aussi que D 2 f (A)(H, K) = ϕ (0) avec ϕ(t) = Df (A + tH)(K). On obtient alors, les termes contenant t2 entrant dans le terme o(t), ϕ(t) = ϕ(0) + 2tAT A − In , H T K + K T H +2tAT H + H T A, AT K + K T A + o(t). Ce qui montre que D 2 f (A)(H, K) = 2AT A−In , H T K +K T H +2AT H +H T A, AT K +K T A . 2) Supposant A orthogonale, on a AT A − In = 0 donc Df (A)(H) = 0. Par ailleurs on obtient D2 f (A)(H, H) = 2AH + AT H, AH + AT H = 2AH + AT H2 ≥ 0. Ce résultat était prévisible car lorsque A est orthogonale, la fonction f atteint son minimum sur E en A. 163
Chapitre 2. Solutions
EXERCICE 2 1) Sous les hypothèses faites Σ est une sous-variété de Rn de classe C 1 et de dimension n − 1 (une hypersurface). On sait alors que l’hyperplan (vectoriel) tangent à Σ en x ¯ ∈ Σ est égal à Ker Dh(¯ x), il a donc pour équation ∇h(¯ x), v = 0. 2) Comme n ≥ 2, on sait que Rn \ B est connexe par arcs. S’il existait x1 , x2 ∈ Rn \ B tels que h(x1 ) > 0 et h(x2 ) < 0 et si γ : [0, 1] −→ Rn \ B continue vérifie γ(0) = x1 et γ(1) = x2 , alors la fonction continue h ◦ γ prendrait au moins une fois la valeur 0, ce qui est impossible. Il en résulte que h garde un signe constant sur Rn \ B. Changeant éventuellement h en −h, on peut supposer que h > 0 sur Rn \ B. 3) a) Comme Σ est compact (fermé borné de Rn ) et f continue, il existe x ¯∈Σ réalisant le minimum ou le maximum de f sur Σ. On peut appliquer le Théorème des multiplicateurs de Lagrange car ∇h = 0 sur Σ. Il existe donc λ ∈ R tel que ∇f (¯ x) = λ∇h(¯ x). Comme ∇f (¯ x) = u, on a bien u = λ∇h(¯ x). b) Si x ¯ réalise le maximum de f sur Σ, alors u, x− x ¯ ≤ 0 pour tout x ∈ Σ, ¯ > 0} ne rencontre pas Σ. ce qui montre bien que E := {x ∈ Rn : u, x − x Comme E est aussi connexe par arcs (il est même convexe) et ne rencontre pas Σ, on en déduit que h garde un signe constant sur Σ. Comme E ∩ (Rn \ B) = ∅ (prendre t > 0 assez grand pour que x ¯ + tu ∈ / B), on obtient que h > 0 sur E. c) On a x ¯ + tu ∈ E pour tout t > 0 car u, x¯ + tu − x ¯ = tu2 > 0, d’où h(¯ x + tu) > 0 car h > 0 sur E. Comme ϕ(0) = h(¯ x) = 0, on en déduit que x), u . 0 ≤ ϕd (0) = ∇h(¯ x), u et ∇h(¯ x), u ≥ 0, Comme u = λ∇h(¯ x), on a donc u2 = λ∇h(¯ 1 et d’où λ > 0, ce qui implique 1 = u = λ∇h(¯ x), donc λ = ∇h(¯ x) ∇h(¯ x) u= . ∇h(¯ x) Commentaires. Le résultat démontré dans cet exercice est clair du point de vue géométrique : le vecteur unitaire normal à Σ en x ¯ ∈ Σ « fait tout le tour du x), quadrant » quand x ¯ ∈ Σ décrit Σ ; ou bien les demi-droites normales R+ ∇h(¯ n x ¯ ∈ Σ, « remplissent » tout R . L’exemple n = 1, h(x) = x montre que le résultat ne subsiste pas sans l’hypothèse n ≥ 2. Le lecteur-étudiant cherchera avec profit l’endroit où on a eu besoin de savoir que n ≥ 2. Un résultat plus faible, x), x ¯ ∈ Σ, « remplissent » valable pour tout n ∈ N∗ , eût été : les droites R∇h(¯ tout Rn . 164
2.22. Calcul différentiel d’ordre 2 sur un espace de matrices...
∇h(¯ x) Σ
x¯ u
Figure 2.4. Interprétation géométrique.
EXERCICE 3 1) On sait que l’ensemble des solutions de (edl)n est un espace vectoriel de dimension n de C n (I, R) et que pour tout t0 ∈ I et pour tout (y0 , · · · , yn−1 ) ∈ Rn , il existe une solution unique (qui est dans C n (I, Rn )) du problème de Cauchy ⎧ ⎪ y (n) + a1 y (n−1) + · · · + an−1 y + an y = 0 ⎪ ⎪ ⎪ ⎨y(t0 ) = y0 .. ⎪ ⎪ . ⎪ ⎪ ⎩ (n−1) y (t0 ) = yn−1 . 2) On a toujours [y(t)]2 + [y (t)]2 + · · · + [y (n−1) (t)]2 ≥ 0 pour tout t ∈ I. Supposons qu’il existe t0 ∈ I tel que [y(t0 )]2 + [y (t0 )]2 + · · · + [y (n−1) (t0 )]2 = 0, alors y ≡ 0 d’après l’unicité de la solution du problème de Cauchy. 3) Pour tout i ∈ [1, n − 1], on a ai (t)y (n−i) (t) = −y (n) (t) d’où
n−1
[y (n−i) (t)]2 , [y(t)]2 + [y (t)]2 + · · · + [y (n−1) (t)]2
ai (t)y (n−i) (t) =
i=1
−y (n) (t)
n−1 i=1
[y (n−i) (t)]2 = −y (n) (t), [y(t)]2 + [y (t)]2 + · · · + [y (n−1) (t)]2
donc y(·) est solution de (edl)n correspondant au jeu de données a1 , a2 , · · · , an . 165
Chapitre 2. Solutions
4) On a donc démontré que E \ {0} est l’ensemble des fonctions y ∈ C n (I, R) telles que [y(t)]2 + [y (t)]2 + · · · + [y (n−1) (t)]2 > 0 pour tout t ∈ I.
2.23. Descente continue le long du gradient. Projection sur une surface de R3 EXERCICE 1 1) La fonction F est différentiable d’après les règles usuelles de calcul, et, d’après un calcul facile : ∇F (x) = Ax − x0 pour tout x ∈ Rp . 2) On a une équation de la forme x (t) = Bx(t) + b(t) avec B = −A et b(t) ≡ x0 . Il y a donc, d’après le Cours, une solution unique au problème de Cauchy définie sur tout [0, +∞[. La fonction h est dérivable comme composée de l’application différentiable F avec la fonction dérivable x, et h (t) = Df (x(t))(x (t)) = ∇F (x(t)), x (t) = f (x(t)), −f (x(t)) = −x (t)2 . La fonction h est donc décroissante sur [0, +∞[, on a donc h(t) ≤ h(0) pour tout t ≥ 0, d’où F (x(t)) ≤ F (a) pour tout t ∈ [0, +∞[. 3) On remarque que x = −f ◦ x et que −f (z) = −Az + x0 est différentiable comme application affine, et x (t) = −Ax (t). La fonction x étant donc dérivable, on obtient, d’après la règle de dérivation d’une composée de fonctions, que h est dérivable sur [0, +∞[, et h (t) = −2x (t), x (t) = 2x (t), Ax (t) = 2Ax (t), x (t) . On a donc
h (t) ≥ 2αx (t)2 = −2αh (t) pour tout t ≥ 0.
On a alors ψ (t) = (h (t) + 2αh (t))e2αt ≥ 0 pour tout t ∈ [0, +∞[. La fonction ψ est donc croissante sur [0, +∞[, d’où, pour tout t ≥ 0, h (t)e2αt ≥ h (0), soit −x (t)2 e2αt ≥ −f (a)2 , 166
2.23. Descente continue le long du gradient. Projection sur une surface de R3
d’où x (t) ≤ e−αt f (a).
(2.28)
Pour 0 ≤ s ≤ t, on a t t t x (τ ) dτ ≤ e−ατ f (a) dτ, x(t) − x(s) = x (τ ) dτ ≤ s
s
donc x(t) − x(s) ≤
s
f (a) −αs (e − e−αt ). α
La fonction x(·) à valeurs dans Rp , vérifie donc le critère de Cauchy (sur les fonctions) pour t tendant vers +∞, ce qui montre l’existence de x∞ = lim x(t). t→+∞
On a x (t) = −f (x(t)) pour tout t ≥ 0,
(2.29)
et, d’après (2.28), limt→+∞ x (t) = 0. Faisant t −→ +∞ dans (2.29), il vient bien 0 = f (x∞ ). On a alors ∇F (x∞ ) = 0 et D2 F (x∞ ) est définie positive, ce qui montre que x∞ est un minimum local de F . Comme F est strictement convexe, x∞ est en fait l’unique minimum global de F sur Rp . 4) On doit résoudre
⎧ ⎪ ⎨x (t) = −2x(t) ⎪ ⎩ y (t) = −y(t) − 2
avec x(0) = a1 et y(0) = a2 . On trouve alors ⎧ −2t ⎪ ⎨x(t) = a1 e ⎪ ⎩
y(t) = (a2 + 2)e−t − 2,
et lim (x(t), y(t)) = (0, −2).
t→+∞
167
Chapitre 2. Solutions
EXERCICE 2 1) a) Le tracé de S s’obtient en faisant tourner la parabole z = r 2 autour de l’axe des z :
30
25
20
15
10
5
0 –4 –2
4
0 x
2 2 4
–2
0 y
Figure 2.5. Tracé de S.
b) Soit p0 ∈ S et δ > p − p0 . On a d(p, S) ≤ p − p0 < δ, donc inf
{m∈S, p−m>δ}
p − m ≥ δ > d(p, S),
¯ δ) désigne la boule fermée de p − m, où B(p, d’où d(p, S) = inf m∈S∩B(p,δ) ¯ ¯ δ) est compact (fermé et borné dans centre p et de rayon δ. Comme S ∩ B(p, 3 R ), la fonction continue p − · y atteint bien son minimum. Soit alors m ∈ S tel que d(p, S) = p − m. Si p ∈ S alors m = p vérifie p − m = 0∇F (m). Si p ∈ / S, on a p − m ≤ p − m pour tout m ∈ S, 2 donc p − m ≤ p − m 2 pour tout m ∈ S. La fonction f de classe C 1 −1 définie par f = · −p2 atteint ⎛ ⎞son minimum sur S = F {0}, avec F de 2x classe C 1 , et ∇F (x, y, z) = ⎝2y ⎠ = 0 pour tout (x, y, z) ∈ S. On peut alors 1 appliquer le Théorème des multiplicateurs de Lagrange : il existe μ ∈ R tel que ∇f (m) = μ∇F (m) soit p − m = λ∇F (m) avec λ = −μ/2. c) On doit minimiser x2 + y 2 + (z − 1)2 sous la contrainte z = x2 + y 2 . Cela revient à minimiser Φ(x, y) = x2 + y 2 + (x2 + y 2 − 1)2 sur R2 . On a * ) 2x(1 + 2(x2 + y 2 − 1)) . ∇Φ(x, y) = 2y(1 + 2(x2 + y 2 − 1)) 168
2.23. Descente continue le long du gradient. Projection sur une surface de R3
Les seules solutions possibles de ∇Φ(x, y) = 0 sont : (x, y) = (0, 0) qui donne Φ(0, 0) = 1, et x2 + y 2 = 12 pour lequel Φ(x, y) = 34 . L’ensemble des solutions est donc le cercle {(x, y, 12 ) : x2 + y 2 = 12 }. Il va sans dire qu’un petit dessin aide grandement à répondre à cette question. 2) a) On a Φ((x, y), t) = (x, y, x2 + y 2 ) + t(2x, 2y, −1) d’où Φ = (Φ1 , Φ2 , Φ3 ) avec Φ1 , Φ2 , Φ3 de classe C 1 . La matrice Jacobienne de Φ s’écrit alors ∂Φ1 ∂Φ1 ⎞ ∂x ∂y ∂t ⎜ ∂Φ ∂Φ ∂Φ ⎟ 2 2⎟ ⎜ 2 ⎝ ∂x ∂y ∂t ⎠ ∂Φ3 ∂Φ3 ∂Φ3 ∂x ∂y ∂t
⎛ ∂Φ1 JΦ (x, y, t) =
⎛
⎞ 1 + 2t 0 2x ⎜ ⎟ = ⎝ 0 1 + 2t 2y ⎠ . 2x 2y −1
En particulier ⎞ 1 0 2x0 det(JΦ (x0 , y0 , 0)) = det ⎝ 0 1 2y0 ⎠ = −1 − 4(x20 + y02 ) = 0. 2x0 2y0 −1 ⎛
D’après le Théorème d’inversion locale, il existe donc un voisinage ouvert W de (x0 , y0 , 0) et un voisinage ouvert V de Φ(x0 , y0 , 0) = p0 tel que Φ soit un difféomorphisme de W sur V . Soit alors η > 0 tel que B((x0 , y0 ), η)×] − η, η[⊂ W, on obtient que Φ est un difféomorphisme de B((x0 , y0 )), η)×] − η, η[ sur U = Φ(B((x0 , y0 )), η)×] − η, η[). b) Comme p0 ∈ S, on a d(p, S) ≤ p − p0 ≤ η/2. Soit alors m ∈ S tel que d(p, S) = p − m. On a m − p0 ≤ m − p + p − p0 < η/2 + η/2 = η. Soit alors λ ∈ R tel que p = m + λ∇F (m). On a η > p − m = λ∇F (m) ≥ λ car ∇F (m) ≥ 1. Posant m = (x, y, x2 + y 2 ), on remarque que (x, y) − (x0 , y0 ) ≤ p − p0 < η, 169
Chapitre 2. Solutions
donc (x, y, λ) ∈ B((x0 , y0 ), η)×] − η, η[ avec p = Φ(x, y, λ). Comme p ∈ U , il existe un (x, y, λ) ∈ B((x0 , y0 ), η)×] − η, η[ unique ayant cette propriété. On a alors (x,y, λ) = Φ−1 (p), ce qui montre bien l’unicité de m = m(p) = Φ [Φ−1 (p)]1 , 0 .
2.24. Une surface conique de R3 . Monotonie des solutions d’équations différentielles scalaires autonomes. Une équation différentielle vectorielle linéaire EXERCICE 1 1) f est de classe C ∞ sur R3 (c’est une fonction polynomiale) ; ⎛ ⎞ ⎛ 2 ⎞ ∂1 f (x, y, z) 3x − 6yz ⎜ ⎟ ⎜ ⎟ ∇f (x, y, z) = ⎝∂2 f (x, y, z)⎠ = ⎝3y 2 − 6xz ⎠ . ∂3 f (x, y, z)
3z 2 − 6xy
On a ∇f (x, y, z) = 0 dès que (x, y, z) = (0, 0, 0). En effet, ∇f (x, y, z) = 0 si et seulement si x3 = y 3 = z 3 = 2xyz, i.e. x = y = z = 0 (êtes-vous d’accord ?). Σ\(0, 0, 0) est donc une sous-variété de classe C ∞ de R3 , de dimension d = 3 − 1 = 2 ; c’est une surface de R3 . 2) Le Théorème des fonctions implicites permet d’exprimer localement z en fonction de (x, y) (on peut remplacer l’équation implicite f (x, y, z) = 0 de Σ par une forme explicite z = f (x, y), dans un voisinage de (x0 , y0 , z0 ) ∈ Σ) lorsque ∂3 f (x0 , y0 , z0 ) = 3z03 − 6x0 y0 = 0. 3) Il y a plusieurs façons de répondre à la question. Par exemple, en écrivant que l’équation du plan affine tangent à Σ en (x0 , y0 , z0 ) s’écrit ⎞ ⎛ ; u − x0 < ∇f (x0 , y0 , z0 ), ⎝ v − y0 ⎠ = 0. w − z0 Cela donne (3x20 − 6y0 z0 )u + (3y02 − 6x0 z0 )v + (3z02 − 6x0 y0 )w = 0, soit (x20 − 2y0 z0 )u + (y02 − 2x0 z0 )v + (z02 − 2x0 y0 )w = 0. En particulier, si x0 = 1, y0 = 2, z0 = 3, on obtient : 11u + 2v − 5w = 0. 170
2.24. Une surface conique de R3 . Monotonie des solutions d’équations...
Remarquons que si (x, y, z) ∈ Σ, il en est de même de (αx, αy, αz) lorsque α ∈ R. Posant ϕ(t) = (x, y, z) + t(x, y, z), on en déduit que (x, y, z) ∈ T(x,y,z) (S), d’où −(x, y, z) ∈ T(x,y,z) (S). Il n’est donc pas étonnant que le plan affine tangent à Σ en (x, y, z) qui est égal à (x, y, z) + T(x,y,z) (S) passe par l’origine. EXERCICE 2 La fonction x considérée est nécessairement de classe C 1 sur I. Supposons que x n’est ni croissante sur I ni décroissante sur I. Il existe alors a, b ∈ I tels que x (a) > 0 et x (b) < 0. On peut sans perte de généralité supposer a < b (sinon on remplace x par y = −x qui est solution de l’équation y (t) = g(y(t)) avec g(y) = −f (−y)). Il existe alors τ ∈]a, b[ tel que x(τ ) = max{x(t) : t ∈ [a, b]}, car si le maximum était atteint en a (resp. b), on aurait x (a) ≤ 0 (resp. x (b) ≥ 0). Si x(b) > x(a) posons σ = max{t ∈ [a, τ ] : x(t) ≤ x(b)}, et si x(a) > x(b), posons θ = min{t ∈ [τ, b] : x(t) ≤ x(a)}. (remarquons que x(a) = x(b) car x (a) = x (b)). Dans le cas x(b) > x(a), nous avons : σ < τ, x(σ) = x(b) et x(t) > x(σ) pour tout t ∈]σ, τ ]. En effet, comme x(b) < x(τ ) on a bien σ < τ . De plus, par continuité de x, on obtient x(σ) ≤ x(b) ; on a aussi x(s) > x(b) pour tout s ∈]σ, τ [ impliquant par continuité x(σ) = lims↓σ x(s) ≥ x(b). Enfin, pour tout t ∈]σ, τ ], on a bien x(t) > x(σ) par définition de σ. Par conséquent, x (σ) ≥ 0.
x
t a
σ
τ
b 171
Chapitre 2. Solutions
Par ailleurs :
x (b) = f (x(b)) et x (σ) = f (x(σ)).
Comme x(b) = x(σ), nous déduisons de ce qui précède : 0 > x (b) = f (x(b)) = f (x(σ)) = x (σ) ≥ 0, ce qui est absurde. La cas x(b) < x(a) se traite de façon analogue. Remarques. – Le résultat (qualitatif) démontré dans cet exercice permet, à défaut de valider des solutions, d’écarter des solutions erronées. – Le lecteur-étudiant s’est convaincu ou se convaincra à l’aide d’exemples que ce résultat de monotonie de solutions ne saurait être vrai dans le cas d’équations différentielles scalaires non-autonomes. EXERCICE 3
1) Posons X(t) =
x(t) . L’équation différentielle (ED) s’écrit y(t) X (t) = A(t)X(t),
où
1 ⎞ t ⎜ 1 + t2 1 + t2 ⎟ . A(t) = ⎝ 1 t ⎠ 1 + t2 1 + t2 ⎛
−
– Il s’agit donc d’une équation différentielle (vectorielle) linéaire (à coefficients non constants). – t −→ A(t) est continue sur R, donc (résultat du Cours), le problème de Cauchy (C) a une et une seule solution définie sur R tout entier. – On demande de déterminer les solutions de (ED) qui sont de la forme αt + β t −→ , γt + δ où α, β, γ, δ sont des réels. Cela conduit à ⎧ 2 ⎪ ⎨2αt + (β − γ)t + α − δ = 0 ⎪ ⎩ 172
(α + δ)t + β − γ = 0
pour tout t ∈ R,
2.24. Une surface conique de R3 . Monotonie des solutions d’équations...
d’où α = δ = 0 et β = γ. Les solutions affines de (ED) sont donc les fonctions β 1 t ∈ R −→ =β où β ∈ R. βt t – La solution de (C) correspondant à t0 = 1 et (x0 , y0 ) = (1, 1) est 1 t −→ . t 2) On sait (résultat du Cours) que
det R = exp
t
Tr A(u) du . t0
Ici, Tr A(u) = 0, d’où det R = 1 (et ce, quels que soient t et t0 ). 3) On cherche à déterminer les solutions de (ED) de la forme 1 0 u(t) t −→ X(t) = u(t) + v(t) = . t 1 tu(t) + v(t) En reportant dans (ED) on est conduit à : ⎧ 2 ⎪ ⎨(1 + t )u = −tu + tu + v ⎪ ⎩ (1 + t2 )(tu + u + v ) = u + t2 u + tv, soit encore
⎧ 2 ⎪ ⎨(1 + t )u = v ⎪ ⎩
t(1 + t2 )u + (1 + t2 )v = tv,
ce qui, comme t(1 + t2 )u = tv, équivaut à : ⎧ v ⎪ ⎪ ⎨u = 1 + t2 (ED)1 ⎪ ⎪ ⎩v = 0. La résolution de (ED)1 est immédiate : v = α, puis u(t) = α arctan t + β, où α, β ∈ R. On arrive en définitive à : α arctan t + β arctan t 1 (∗) t ∈ R −→ =α +β , α(1 + t arctan t) + βt 1 + t arctan t t (α, β) ∈ R2 . 173
Chapitre 2. Solutions
Les deux solutions suivantes de (ED) t −→ X (t) = 1
arctan t 1 + t arctan t
1 et t −→ X (t) = t 2
0 et X 2 (0) = sont linéairement indépendantes, car (voir le Cours) X 1 (0) = 1 1 sont linéairement indépendants. Donc (∗) est la solution générale de (ED). 0 4) On « ajuste » les constantes α et β de manière initiale de que la condition xt0 ,x0 ,y0 (t) défini, pour tout (C) soit satisfaite ; cela conduit à Xt0 ,x0 ,y0 = xt0 ,x0 ,y0 (t) t ∈ R, par
x0 + (y0 − t0 x0 )(arctan t − arctan t0 ) xt0 ,x0 ,y0 (t) = . yt0 ,x0 ,y0 (t) (t − t0 )x0 + y0 + (y0 − t0 x0 )t(arctan t − arctan t0 )
Il s’ensuit : R=
arctan t − arctan t0 1 − t0 (arctan t − arctan t0 ) . t − t0 − t0 t(arctan t − arctan t0 ) t(arctan t − arctan t0 ) + 1
Le lecteur-étudiant pourra vérifer que det R = 1, que R−1 est bien obtenu en échangeant le rôle de t et t0 dans R, et autres propriétés de la résolvante R.
2.25. Un problème aux limites par le Théorème des fonctions implicites. Équations différentielles linéaires à coefficients périodiques EXERCICE Munissons Z de la norme (x, a, b) = x∞ + |a| + |b| et X × R de la norme (x, ε) = max(x∞ , |ε|). On a F (x + u, + η) = (x + u + (x + u)2 − (ε + η)f, x(0) + u(0), x(1) + u(1)) = F (x, ) + (u + 2ux − ηf, u(0), u(1)) + (u2 , 0, 0),
174
2.25. Un problème aux limites par le Théorème des fonctions implicites...
et (u2 , 0, 0) ≤ u2∞ . Posant L(u, η) = (u +2ux−ηf, u(0), u(1)), on observe que L est linéaire et que L(u, η) ≤ u ∞ + 2u∞ x∞ + |η|f ∞ + |u(0)| + |u(1)| ≤ (3 + 2x∞ )u + |η|f ∞ . On a donc L(u, η) ≤ (3 + 2x∞ + f ∞ )(u, η), ce qui montre que l’application linéaire L est continue. On a alors F (x + u, ε + η) − F (x, ε) − L(u, η) ≤ u2∞ ≤ (u, η)2 , donc F est différentiable en (x, ε) et DF (x, ε) = L. Pour tout (x1 , ε1 ), (x2 , ε2 ), (u, η) ∈ X × R, on a (DF (x1 , ε1 ) − DF (x2 , ε2 ))(u, η) = (2u(x1 − x2 ), 0, 0), d’où (DF (x1 , ε1 )−DF (x2 , ε2 ))(u, η) ≤ 2u∞ x1 −x2 ∞ ≤ 2x1 −x2 ∞ (u, η). On a donc DF (x1 , ε1 ) − DF (x2 , ε2 ≤ 2x1 − x2 ∞ , ce qui montre la continuité de DF . Autre méthode : on a F = (F1 , F2 , F3 ) avec F2 et F3 linéaires continues donc C 1 . Par ailleurs, F1 est somme de l’application ϕ : X × R −→ C([0, 1], R) définie par x −→ x2 et de deux applications linéaires continues. On remarque que ϕ = B ◦ où B : C([0, 1], R) × C([0, 1], R) −→ C([0, 1], R) définie par B(x, y) = xy est bilinéaire continue, et : X × R −→ X × X définie par (x, ε) = (x, x) est linéaire continue ; donc F1 est de classe C 1 ainsi que F . Remarquant que Dϕ(x, )(u, η) = DB(x, x)((u, η)) = xu + ux = 2ux, on obtient donc bien DF (x, ε)(u, η) = (DF1 (x, ε)(u, η), DF2 (x, ε)(u, η), DF3 (x, ε)(u, η)) = (u + 2xu − ηf, u(0), u(1)). Pour tout u ∈ X × R, on a alors D1 F (0, 0)(u) = DF (0, 0)(u, 0), donc D1 F (0, 0)(u) = (u , u(0), u(1)). Si D1 F (0, 0)(u) = (0, 0, 0), on a u =" 0 et u(0) = u(1) "= 0, d’où u = 0. t t Soit alors (v, a, b) ∈ Z. Posant V (t) = 0 v(s) ds et u(t) = 0 V (s) ds + ct + d " 1 où c, d ∈ R, on a u = v, u(0) = d et u(1) = 0 V (s) ds + c + d. Posant 175
Chapitre 2. Solutions
"1 d = a et c = b − a − 0 V (s) ds, on a D1 F (0, 0)(u) = (v, a, b). On a donc bien montré que D1 F (0, 0) ∈ Isom(X, Z). D’après le Théorème des fonctions implicites, il existe un intervalle ouvert I 0 et une fonction ϕ : I −→ X tels que F (ϕ(ε), ε) = 0 pour tout ε ∈ I. Posant x = ϕ(ε), on a bien ⎧ 2 ⎪ ⎨x (t) + (x(t)) = εf (t) pour tout t ∈ [0, 1] ⎪ ⎩
x(0) = x(1) = 0.
PROBLÈME 1) On a z (t) = x (t + T ) = g(t + T, x(t + T )) = g(t, x(t + T )) = g(t, z(t)), ce qui montre que z : R −→ Rn est solution de z (t) = g(t, z(t)). Comme z(0) = x(T ) = x(0), on a z ≡ x (unicité de la solution maximale). Il en résulte que x(t) = x(t + T ) pour tout t ∈ R ; x(·) est bien T -périodique. 2) a) On sait que
t
t
R(t, s)f (s) ds = X(t)c +
x(t) = X(t)c + 0
X(t)(X(s))−1 f (s) ds.
0
On a alors x(0) = x(T ) si et seulement si il existe c ∈ Rn tel que T (X(s))−1 f (s) ds, (I − X(T ))c = X(T ) 0
ce qui démontre bien 2) a) grâce à 1). b) D’après 2) a) on a i) si seulement si il existe c ∈ Rn unique tel que T (X(s))−1 f (s) ds, (I − X(T ))c = X(T ) 0
ce qui équivaut à Ker (I − X(T )) = {0}, donc équivaut à iii). Par ailleurs, remplaçant f par 0, ii) est équivalent à l’existence d’un unique c ∈ Rn tel que (I − X(T ))(c) = 0 donc à iii). 2π x . Notant Z = une solution de Z (t) = Ai (t)Z(t), c) On a T = y ω i ∈ {1, 2}, on observe que x(·) est solution de x + x = 0, donc x(t) = a cos(t) + b sin(t) dans le cas i = 1, qui est 2π-périodique, et x − x = 0 donc x(t) = aet + be−t dans le cas i = 2, qui n’est jamais périodique quand (a, b) = (0, 0) car 176
2.25. Un problème aux limites par le Théorème des fonctions implicites...
non bornée. Il en résulte que si ω = 1 l’équation x (t) = A1 (t)x(t) + f (t) a une unique solution T -périodique et que pour tout ω ∈ R∗ l’équation x (t) = A2 (t)x(t) + f (t) a une unique solution T -périodique. 3) Munissons Mn (R) d’une norme · telle que AX ≤ AX pour tout "T n −1 X(T ) 0 (X(s))−1 f (s) ds A ∈ Mn (R) et X ∈ R . On a c = (I − X(T )) donc T (X(s))−1 f (s) ds c ≤ (I − X(T ))−1 X(T ) 0
−1 ≤ (I − X(T )) X(T )
0
T
(X(s))−1 ds f ∞ ,
"T donc c ≤ βf ∞ avec β = (I − X(T ))−1 X(T ) 0 (X(s))−1 ds . "t Comme x(t) = X(t)c + 0 X(t)(X(s))−1 f (s) ds, on obtient, pour tout t ∈ [0, T ], T (X(s))−1 ds f ∞ , x(t) ≤ X∞ c + X∞ 0
d’où
avec α = X∞ β +
"T 0
x∞ ≤ αf ∞ . (X(s))−1 ds .
4) a) D’après la question précédente, on a z∞ ≤ αf˜∞ , avec f˜(t) = μf (t) + g(t, y(t)). On a alors f˜∞ ≤ μf ∞ + M r donc z∞ ≤ α(|μ|f ∞ + M r). Observant que r(1 − αM ) > 0 et choisissant |μ| assez petit pour que α|μ|f ∞ ≤ r(1− αM ), il vient z∞ ≤ r donc z ∈ X, ce qui permet bien de définir une application T : X −→ X par T (y) = z. b) Soient y1 , y2 ∈ X et soient z1 = T (x1 ) et z2 = T (x2 ). On a (z1 − z2 ) (t) = A(t)(z1 − z2 )(t) + g(t, y1 (t)) − g(t, y2 (t)), d’où z1 − z2 ∞ ≤ α sup g(t, y1 (t)) − g(t, y2 (t)) ≤ αky1 − y2 ∞ , t∈[0,T ]
177
Chapitre 2. Solutions
donc T est une contraction car αk < 1 par hypothèse. Comme X est complet, il existe alors, d’après le théorème de contraction de Banach, un x ∈ X unique tel que T (x) = x, soit x (t) = A(t)x(t) + μf (t) + g(t, x(t)) pour tout t ∈ Rn .
2.26. Du Théorème des fonctions implicites au Théorème de Cauchy-Lipschitz 1) Soit z, h ∈ Z et soit ε > 0. Comme g est uniformément continue, il existe η > 0 tel que |g(x1 ) − g(x2 )| ≤ ε pour tout x1 , x2 ∈ R tels que |x1 − x2 | ≤ η. Si h∞ ≤ η, on a alors |g(z(t) + h(t)) − g(z(t))| ≤ ε pour tout t ∈ [−1, 1], donc Ng (z + h) − Ng (z)∞ ≤ ε, ce qui montre la continuité de Ng en z ∈ Z. 2) Il est clair que Ly est linéaire. De plus, pour tout h ∈ Y et pour tout t ∈ R, on a |[Ly (h)](t)| = |f (y(t))h(t)| ≤ ch∞ avec c = f ◦ y∞ fini car f ◦ y est continue sur le compact [−1, 1]. Il en résulte la continuité de l’application linéaire Ly . Soient alors y, h ∈ Y . Pour tout t ∈ [−1, 1], il existe, d’après le Théorème des accroissements finis, un θ(t) ∈]0, 1[ tel que f (y(t) + h(t)) = f (y(t)) + f (y(t) + θ(t)h(t))h(t), donc f (y(t) + h(t)) − f (y(t)) − [Ly (h)](t) = f (y(t) + θ(t)h(t)) − f (y(t)) h(t). Soit ε > 0. Comme f est uniformément continue, il existe η > 0 tel que |f (x1 ) − f (x2 )| ≤ ε, et ce pour tout x1 , x2 ∈ R tels que |x1 − x2 | ≤ η. Si h∞ ≤ η, on a |f (y(t) + h(t)) − f (y(t)) − [Ly (h)](t)| ≤ ε|h(t)| ≤ εh∞ pour tout t ∈ [−1, 1], d’où ˆf (y) − Ly (h)∞ ≤ εh∞ ˆf (y + h) − N N 178
2.26. Du Théorème des fonctions implicites au Théorème de Cauchy-Lipschitz
ˆf est différentiable en pour tout h ∈ Y tel que h∞ ≤ η, ce qui montre que N ˆ y et que DNf (y) = Ly . Soient y1 , y2 ∈ Y et h ∈ Y . Pour tout t ∈ [−1, 1], on a ˆf (y2 ) (h)](t)| = |(f (y1 (t)) − f (y2 (t)))h(t)| ˆf (y1 ) − DN |[ D N ≤ Nf (y1 ) − Nf (y2 )∞ h∞ , ce qui montre bien que ˆf (y2 ) ≤ ||Nf (y1 ) − Nf (y2 )∞ . ˆf (y1 ) − DN DN Comme Nf est continue d’après la question 1), on en déduit bien que Nf est de classe C 1 sur Y . 3) Soient λ ∈ R et y ∈ Y . L’application F (·, y) est somme d’une application ˆf (y), il en résulte bien que constante et de l’application linéaire λ −→ −λN ˆf (y) pour tout s ∈ R. D1 F (λ, y)(s) = −sN On a aussi ˆf (·) F (λ, ·) = Θ − λN avec Θ(y) = y . L’application Θ est linéaire. Elle est aussi continue car Θ(y)∞ = y ∞ ≤ y pour tout y ∈ Y . Il en résulte que D2 F (λ, y) existe et que ˆf (y), D2 F (λ, y) = Θ − λN d’où
D2 F (λ, y)(h) = h − λNf (y)h pour tout h ∈ Y,
ce qui montre aussi la continuité de D2 F sur R × Y . On a alors, pour tout λ, μ ∈ R et pour tout y1 , y2 ∈ Y , ˆf (y1 ) − N ˆf (y2 )∞ , D1 F (λ, y1 ) − D1 F (λ, y2 ) = N donc D1 F est continue sur R × Y d’après la question 1). On a D2 F (0, 0) = Θ. Soit alors z ∈ Z, il existe alors une seule primitive de z qui prend la valeur 0 en 0, donc D2 F (0, 0) = Θ est bijective, d’où D2 F (0, 0) ∈ Isom (Y, Z). 4) Comme F (0, 0) = 0 et D2 F (0, 0) ∈ Isom (Y, Z), le Théorème des fonctions implicites montre qu’il existe des voisinages ouverts U de 0 dans R, V de 0 dans Y , et une application ϕ : U −→ Y de classe C 1 tels que F (λ, ϕ(λ)) = 0 pour tout (λ, y) ∈ U × V , et F (λ, y) = 0 avec (λ, y) ∈ U × V , impliquent ¯ > 0 tel que [−λ, ¯ λ] ¯ ⊂ U et soit x : [−λ, ¯ λ] ¯ −→ R définie y = ϕ(λ). Soit alors λ par t ¯ x(t) = ϕ(λ) ¯ . λ 179
Chapitre 2. Solutions
¯ ( ¯t ). Comme (ϕ(λ)) ¯ − λ(f ◦ ϕ(λ)) ¯ = 0, on On a x(0) = 0 et x (t) = λ−1 (ϕ(λ)) λ t ¯ en déduit que x (t) = f (ϕ(λ)( λ¯ )) = f (x(t)). Donc x est solution de ⎧ ¯ λ] ¯ ⎨ x (t) = f (x(t)) pour tout t ∈ [−λ, (C) ⎩ x(0) = 0. ¯ soit assez petit. Démontrons alors l’unicité de la solution de (C) pourvu que λ ¯ ; Soit x(·) une solution de (C), et soit yλ¯ : [−1, 1] −→ R définie par yλ¯ (t) = x(λt) ¯ assez petit pour que y ¯ ∈ V , car y ¯ tend on a yλ¯ ∈ Y . On peut supposer λ λ λ ¯ vers 0 dans Y quand λ tend vers 0. En effet ¯ ¯ ∞ ≤ x∞ + λx ¯ ∞ , yλ¯ Y = yλ¯ ∞ + λy λ ¯ assez petit pour que et x(0) = 0 ; donc ε > 0 étant donné, on peut choisir λ ¯ ∞ ≤ ε (car x ∞ reste borné quand λ ¯ tend vers x∞ ≤ ε et pour que λx 0). Il vient ¯ (λt) ¯ = λf ¯ (x(λt)) ¯ = λf ¯ (y ¯ (t)), yλ¯ (t) = λx λ ¯ y ¯ ) ∈ U × V , donc ¯ pour tout t ∈ [−1, 1]. On a alors F (λ, yλ¯ ) = 0 et (λ, λ t ¯ ¯ y ¯ = ϕ(λ), d’où x(t) = ϕ(λ)( ¯ ). λ
λ
2.27. Intégrales premières. Utilisation du Théorème des fonctions implicites. Une équation aux dérivées partielles EXERCICE 1 a) Étant donnée une solution (I, x(·)) de l’équation ∂H d (H(t, x(t))) = (t, x(t)) + différentielle x (t) = f (t, x(t)), on a dt ∂t n ∂H xj (t) (t, x(t)), donc ∂xj j=1
d ∂H ∂H (H(t, x(t))) = (t, x(t)) + fj (t, x(t)) (t, x(t)). dt ∂t ∂xj n
(2.30)
j=1
Si H est une intégrale première, et si (t, x) ∈ U , il existe un intervalle ouvert I t et une solution x : I −→ Rn de ⎧ ⎪ ⎨x (s) = f (s, x(s)) pour tout s ∈ I ⎪ ⎩
180
x(t) = x,
2.27. Intégrales premières. Utilisation du Théorème des fonctions implicites...
(car on est dans les conditions du Théorème d’existence et d’unicité de Cauchy-Lipschitz). On a alors d ∂H ∂H 0 = (H(t, x(t))) = (t, x) + fj (t, x) (t, x) pour tout (t, x) ∈ U. dt ∂t ∂xj n
j=1
(2.31) Réciproquement, si (2.31) est vérifiée, et si (I, x(·)) est solution de l’équation d différentielle x (t) = f (t, x(t)), on déduit de (2.30) que (H(t, x(t))) = 0 pour dt tout t ∈ I, donc, I étant un intervalle, il existe c ∈ R tel que H(t, x(t)) = c pour tout t ∈ I. b) On a
t x t d −x + −x =0 x t + x2 dx x t pour tout (t, x) ∈ U , donc H(t, x) = − x est bien une intégrale première. Les x t − x(t) = c soit t = x(t)2 + cx(t). Les trajectoires solutions vérifient donc x(t) c2 c sont des arcs de parabole dont les sommets sont − , − , ces sommets 4 2 sont situés sur la parabole t + x2 = 0. Les trajectoires s’arrêtent donc quand elles coupent cette parabole. d dt
x t = x2 + cx
−c
t = −x2
0
t
2 − c4
Figure 2.6. Courbes représentatives des solutions.
181
Chapitre 2. Solutions
EXERCICE 2 a) Soit e : L(Rn ) × Rn −→ Rn définie par e(A, x) = A(x) pour tout (A, x) ∈ L(Rn ) × Rn ; cette application est bilinéaire continue donc de classe C 1 , et on a F (x, y) = e(g(x), f (y)) + f (x), d’où F = e ◦ (g, f ) + H, avec H(x, y) = f (x). On a D1 H(x, y) = Df (x) et D2 H(x, y) = 0, d’où D1 H et D2 H sont continues sur Ω, donc H est de classe C 1 sur Ω. De plus e ◦ (g, f ) est de classe C 1 sur Ω comme composée d’applications de classe C 1 sur Ω. Il en résulte que F est de classe C 1 sur Ω. On a alors DF (x, y)(u, v) = De(g(x), f (y))(Dg(x)u, Df (y)v) + Df (x)u = e(g(x), Df (y)v) + e(Dg(x)u, f (y)) + Df (x)u = g(x)(Df (y)v) + (Dg(x)u)(f (y)) + Df (x)u, et
⎧ ⎪ ⎨D1 F (x, y)u = DF (x, y)(u, 0) = (Dg(x)u)(f (y)) + Df (x)u, ⎪ ⎩ D2 F (x, y)v = DF (x, y)(0, v) = g(x)(Df (y)v).
b) On a : F (0, 0) = g(0)f (0) + f (0) = 0 et D2 F (0, 0) = g(0) ◦ Df (0). Il suffit alors que g(0) ◦ Df (0) ∈ Isom (Rn ) pour que le Théorème des fonctions implicites nous assure l’existence de voisinages ouverts U et V de 0 dans Rn et d’une application ψ : U −→ V de classe C 1 tels que (x, y) ∈ U × V et F (x, y) = 0 ⇐⇒ y = ψ(x). On sait que Dψ(0) = −D2 F (0, 0)−1 ◦ D1 F (0, 0), donc, pour tout u ∈ Rn , on a Dψ(0) = −(g(0) ◦ Df (0))−1 ◦ Df (0). EXERCICE 3 a) Pour tout (x, y) ∈ R∗+ × R, on a y 1 − x2 x , JΦ (x, y) = 2x 2y y2 + 1) = 0. Par ailleurs, si (x, y), (ˆ x, yˆ) ∈ R∗+ × R x2 sont tels que Φ(x, y) = Φ(ˆ x, yˆ), alors il existe un réel λ tel que x ˆ = λx, yˆ = λy et λ2 (x2 + y 2 ) = x2 + y 2 donc λ = ±1. Comme x ˆ > 0 et x > 0, on a λ = 1 soit donc det(JΦ (x, y)) = −2(
182
2.27. Intégrales premières. Utilisation du Théorème des fonctions implicites...
(ˆ x, yˆ) = (x, y), donc Φ est injective. Les hypothèses du Théorème du difféomorphisme global étant satisfaites, on obtient que Φ est un C 1 difféomorphisme de R∗+ × R dans Φ(R∗+ × R). Montrons alors que Φ(R∗+ × R) = R × R∗+ . En effet, si (u, v) ∈ R × R∗+ , posons ' ' v v et y = u ; x= 2 1+u 1 + u2 on a (x, y) ∈ R∗+ × R et Φ(x, y) = (u, v). b) On a ∂f (x, y) = Df (x, y)(1, 0) = DF (Φ(x, y))DΦ(x, y)(1, 0) ∂x = DF (u, v)(− =−
y , 2x) x2
y ∂F ∂F (u, v) + 2x (u, v), 2 x ∂u ∂v
et ∂f (x, y) = Df (x, y)(0, 1) = DF (Φ(x, y))DΦ(x, y)(0, 1) ∂x 1 = DF (u, v)( , 2y) x =
∂F 1 ∂F (u, v) + 2y (u, v). x ∂u ∂v
En conséquence x
∂f ∂f ∂F ∂F (x, y) + y (x, y) = 2(x2 + y 2 ) (u, v) = 2v (u, v). ∂x ∂y ∂v ∂v
c) Remarquant que x4 + y 4 = x2 1 + u4 =
v 1 + u4 , 1 + u2 l’équation aux dérivées partielles proposée devient √ 1 + u4 ∂F (u, v) = , ∂v 2(1 + u2 ) dont la solution générale est F (u, v) = v
√
1 + u4 + g(u), 2(1 + u2 ) 183
Chapitre 2. Solutions
avec g une fonction arbitraire de classe C 1 . Revenant aux variables x et y, on a finalement ' y4 1+ 4 x + g y = 1 x4 + y 4 + g y . f (x, y) = (x2 + y 2 ) x 2 x y2 2 1+ 2 x
2.28. Différentiabilité de la fonction distance à un ensemble. Une équation différentielle scalaire non linéaire du deuxième ordre. Système différentiel linéaire où les valeurs propres de A(t) ne dépendent pas de t EXERCICE 1 ¯ y0 − x) ∩ S. Il est clair que K est fermé et 1) Soit y0 ∈ S et K = B(x, borné, donc compact (H = Rn est de dimension finie ici). Si y ∈ S \ K, on a y − x > y0 − x ; pour minimiser y −→ y − x sur S, il est donc inutile d’aller considérer les points y de S \K. L’application y −→ y −x est continue sur le compact K, elle y est donc bornée inférieurement et atteint sa borne inférieure : il existe x ¯ ∈ K tel que ¯ x − x = inf{y − x : y ∈ K} = inf{y − x : y ∈ S}. 2) Soit (x, x ) ∈ H × H. On a : x − y ≤ x − y + x − x pour tout y ∈ S, x − y ≤ x − y + x − x pour tout y ∈ S. On en déduit facilement en prenant les bornes inférieures sur y ∈ S : dS (x ) ≤ dS (x) + x − x , dS (x) ≤ dS (x ) + x − x , d’où :
|dS (x) − dS (x )| ≤ x − x .
3) a) On a pour tout h ∈ H dS (a + th) − dS (a) , t−→0 t
DdS (a)h = ∇dS (a), h = lim ce qui avec (2.32) conduit à :
|∇dS (a), h | ≤ h pour tout h ∈ H. 184
(2.32)
2.28. Différentiabilité de la fonction distance à un ensemble. Une équation...
Par voie de conséquence ∇dS (a) = sup |∇dS (a), h | ≤ 1. h≤1
(2.33)
b) On a dS (x) ≥ 0 pour tout x ∈ H, et dS (a) = 0. Par conséquent, a est un minimiseur de dS sur H et comme il a été supposé que dS est différentiable en a, on a nécessairement ∇dS (a) = 0. c) Un petit dessin facilite grandement le raisonnement ici.
B
a A at a ¯ S
Soit B = {u ∈ H : u − a < a − a ¯}, a − a) et at = a + t(¯ ¯}. A = {u ∈ H, u = a ¯, u − at ≤ at − a Des calculs aisés sur les distances conduisent à A ⊂ B ⊂ H \ S, d’où : at − a ¯ = dS (at ), et a}. at − y > dS (at ) dès que y ∈ S \ {¯ 185
Chapitre 2. Solutions
Ainsi, a ¯ est le seul point y de S tel que dS (at ) = at − y. Par suite : dS [a + t(¯ a − a)] − dS (a) = −a − a ¯ ; t−→0 t a − a ≤ a − a ¯. |∇dS (a), a¯ − a | ≤ ∇dS (a) · ¯
∇dS (a), a ¯ − a = lim
Nous sommes donc dans le cas d’égalité de l’inégalité de Cauchy-Schwarz : ∇dS (a) est nécessairement le vecteur unitaire dirigé par a − a ¯. ¯ = dS (a) ; en effet Il ne peut y avoir un autre point a ¯ ∈ S tel que a − a on aurait dans ce cas / vecteur unitaire dirigé par a − a ¯, ∇dS (a) = vecteur unitaire dirigé par a − a ¯ . 4) dS n’est pas différentiable en 0 (centre de S) ni sur S. Prolongement. Dans le cas où H est de dimension finie on montre que dS est différentiable en a ∈ / S si, et seulement si, il n’y a qu’un seul point de S à distance minimale de a. De fait, dS ne se trouve être différentiable sur Rn \ S que lorsque S est convexe. EXERCICE 2 1) Il s’agit d’un problème de Cauchy scalaire non-linéaire, autonome, du 2e ordre, avec (t, u) ∈ R × R −→ f (t, u) = 2u3 de classe C ∞ . Les conditions du théorème (d’existence et d’unicité) de Cauchy-Lipschitz sont donc réunies : il existe une et une seule solution maximale (I, x¯) au problème (C) posé. x3 par 2¯ x , on obtient En multipliant l’égalité x ¯ = 2¯ ¯ = 4¯ x3 x ¯ , 2¯ x x d’où (¯ x )2 = x ¯4 +c, où c est une constante que l’on détermine par les conditions x )2 = x ¯4 . initiales x ¯(0) = 1 et x ¯ (0) = 1. Par conséquent, (¯ 2) Montrons que x ¯ ne s’annule jamais sur I. En effet, s’il existait t0 ∈ I tel ¯ et x ¯ ci-dessus impliquerait x ¯ (t0 ) = 0 et le que x ¯(t0 ) = 0, la relation entre x théorème (d’existence et d’unicité) de Cauchy-Lipschitz appliqué à : ⎧ 3 ⎪ ⎨x = 2x , x(t0 ) = 0, ⎪ ⎩ x (t0 ) = 0 conduirait à x ¯ ≡ 0. Ceci est en contradiction avec le fait que x ¯(0) = 1. 186
2.28. Différentiabilité de la fonction distance à un ensemble. Une équation...
Ainsi x ¯, et par suite x ¯ , gardent des signes constants sur I. En fait : x ¯(t) > 0 et x ¯ (t) > 0 pour tout t ∈ I. ¯4 vient donc x ¯ = x ¯2 ; il reste à résoudre De la relation (¯ x )2 = x ⎧ ¯2 , ⎪ ¯ = x ⎨x x ¯(0) = 1, ⎪ ⎩ x ¯ (0) = 1, ce qui aboutit facilement à I =] − ∞, 1[ et t ∈ I −→ x ¯(t) =
1 . 1−t
EXERCICE 3 1) Considérons t −→ x(t) = eμ(t) v. Puisque μ est dérivable, il en est de même de x et x (t) = μ (t)eμ(t) v = λ(t)eμ(t) v. Par ailleurs, A(t)x(t) = eμ(t) A(t)v = eμ(t) λ(t)v. Donc : x (t) = A(t)x(t), pour tout t ∈ I. 2) Comme précédemment, xi (t) = A(t)xi (t) pour tout t ∈ I. Les fonctions xi , i = 1, . . . , n, sont des solutions de x = A(t)x. Pour que les solutions xi soient linéairement indépendantes, il faut et il suffit que les xi (t0 ) soient linéairement indépendants pour un certain t0 ∈ I. Les vi sont linéairement indépendants (car on sait que {v1 , · · · , vn } constitue une base de vecteurs propres), il en est de même des eμ(t0 ) vi = xi (t0 ). ¯ = a(t) − ib(t). 3) a) Les valeurs propres de A(t) sont λ(t) = a(t) + ib(t) et λ(t) On a −ib(t) b(t) −i 1 A(t) − λ(t)I2 = = b(t) , −b(t) −ib(t) −1 −i 1 ∈ C2 est un vecteur propre associé à λ(t), et ce quel que soit t ∈ I. et v1 = i i 1 ¯ De même, comme les coefficients de A(t) sont réels, A(t)−λ(t)I2 = b(t) −1 i 1 ¯ ∈ C2 est un vecteur propre associé à λ(t), quel que soit t ∈ I. et v2 = −i {v1 , v2 } constitue une base de C2 . 187
Chapitre 2. Solutions
1 1 α(t)−iβ(t) b) t −→ x1 (t) = et t −→ x2 (t) = e forment i −i un système fondamental de solutions (complexes) de x = A(t)x. (Évidemment x2 (t) = x¯1 (t) ici.) Il y a ensuite plusieurs manières de procéder. Par exemple : eα(t)+iβ(t)
– déterminer un système fondamental de solutions réelles de x = A(t)x en prenant Re(x1 ) et Im(x1 ) (à valeurs dans R2 ) ; en déduire R(t, t0 ) ; – déterminer R(t, t0 ) qui n’est autre que M (t)[M (t0 )]−1 , où M (t) = (x1 (t), x2 (t)) ∈ M2 (C); en déduire un système fondamental de solutions réelles. Suivons cette dernière voie. Ici
M (t) = eα(t) de sorte que −1
[M (t0 )]
e−α(t0 ) = −2i
eiβ(t) e−iβ(t) , ieiβ(t) −ie−iβ(t)
−ie−iβ(t0 ) −e−iβ(t0 ) −ieiβ(t0 ) eiβ(t0 )
et R(t, t0 ) = M (t)[M (t0 )]−1 α(t)−α(t0 )
=e
cos(β(t) − β(t0 )) sin(β(t) − β(t0 )) − sin(β(t) − β(t0 )) cos(β(t) − β(t0 ))
(ce qui représente une similitude de R2 ). Un exemple de système fondamental de solutions réelles de x = A(t)x est : cos β(t) α(t) , t −→ y1 (t) = e − sin β(t) α(t) sin β(t) . t −→ y2 (t) = e cos β(t) La solution du problème de Cauchy ( x = A(t)x x(t0 ) = (ξ1 , ξ2 ) 188
2.29. Équations différentielles scalaires. Équation différentielle...
ξ est alors x(t) = R(t, t0 ) 1 soit ξ2 * ) cos(β(t) − β(t )) + ξ sin(β(t) − β(t )) ξ 1 0 2 0 . x(t) = eα(t)−α(t0 ) −ξ1 sin(β(t) − β(t0 )) + ξ2 cos(β(t) − β(t0 ))
2.29. Équations différentielles scalaires. Équation différentielle vectorielle linéaire à coefficients périodiques EXERCICE 1 1) est linéaire (c’est immédiat) et ◦ : y ∈ E −→ ( ◦ )(y) = y + 2py + (p + p2 )y. 2) a) Sachant que Ker ⊂ Ker ( ◦ ), on trouve une solution de (ed) en résolvant y + py = 0. Or, ici, (ed) correspond à ( ◦ )(y) = 0 avec construite à partir de p : x −→ p(x) = tanh(x) (êtes-vous d’accord ?). Un élément y de Ker – c’est-à-dire une solution y de y + tanh(x)y = 0 – que les règles de 1 . trigonométrie hyperbolique suggèrent, est y : x −→ y(x) = cosh(x) b) Déterminons les autres solutions de (ed) via un changement de fonction z(x) inconnue : x −→ y(x) = . Cela conduit (après calculs) à z = 0. Donc cosh(x) l’ensemble des solutions de (ed) est le plan vectoriel de E dirigé par les deux x 1 et x −→ . fonctions (linéairement indépendantes) x −→ cosh(x) cosh(x) EXERCICE 2 1) Après quelques calculs : t t g (t) = f (t) + cos t (cos u)θ(u)f (u) du + sin t (sin u)θ(u)f (u) du, 0
0
et g (t) = f (t) + f (t)θ(t) +
t
θ(u) sin(u − t) du.
0
D’où
g (t) + g(t) = f (t) + (1 + θ(t))f (t) = 0.
2) Il vient de ce qui précède : g(t) = λ cos t + μ sin t 189
Chapitre 2. Solutions
avec λ = g(0)(= f (0)) et μ = g (0)(= f (0)). En conséquence : |g(t)| ≤ |λ| + |μ| = |f (0)| + |g (0)| pour tout t ≥ 0. t sin(t − u)θ(u)f (u) du, Puis, étant donné que f (t) = g(t) − 0
t
|f (t)| ≤ |g(t)| +
|θ(u)|.|f (u)| du
0
et donc
|f (t)| ≤ |f (0)| + |f (0)| +
(I)
A
t
|θ(u)|.|f (u)| du.
0
3) Posons :
t
F (t) = A +
t |θ(u)||f (u)| du · exp − |θ(u)| du .
0
0
F est dérivable sur [0, +∞[ avec, pour tout t ≥ 0, t t |θ(u)||f (u)| du | · θ(t)| · exp − |θ(u)| du . F (t) = |f (t)| − A − 0
F (t)
D’après l’inégalité (I), [0, +∞[, ce qui implique
0
≤ 0 pour tout t ≥ 0. Donc F est décroissante sur
F (t) ≤ F (0) = A pour tout t ≥ 0. Cette inégalité se traduit par : t t |θ(u)||f (u)| du ≤ A exp |θ(u)| du pour tout t ≥ 0. A+ 0
0
Grâce à l’inégalité (I), on obtient ainsi : +∞ |θ(u)| du pour tout t ≥ 0. |f (t)| ≤ A exp 0
EXERCICE 3 x)i : t −→ x ˜i (t) = xi (t + 2π), i = 1, 2. La 2π-périodicité de A fait 1) a) Soit (˜ 1 2 ˜ sont encore solutions de (EDL)0 . En effet, pout tout t ∈ R, que x ˜ et x xi (t). (˜ xi ) (t) = (xi ) (t + 2π) = A(t + 2π)xi (t + 2π) = A(t)˜ 190
2.30. Distance de l’origine à une courbe de R3 . Comportement asymptotique...
b) x1 et x2 constituent une base de l’ensemble des solutions de (EDL)0 ; ˜2 sont combinaisons linéaires de x1 et x2 : il existe λ1 , par conséquent x ˜1 et x λ2 , μ1 , μ2 ∈ C tels que ˜2 = μ1 x1 + μ2 x2 . x ˜1 = λ1 x1 + λ2 x2 et x λ1 μ 1 Cela se traduit matriciellement par une matrice P := telle que λ2 μ2 M (t + 2π) = M (t)P. ˜2 sont aussi linéairement indépendantes (êtesComme les deux solutions x ˜1 et x vous d’accord ?), la matrice P est inversible. 2) Or toute matrice complexe inversible est l’exponentielle d’une matrice. Il suffit donc d’exprimer P sous la forme P = e−2πB pour avoir une matrice B vérifiant, pour tout t ∈ R : P (t + 2π) = M (t + 2π)e(t+2π)B = M (t)e−2πB e(t+2π)B = M (t)etB = P (t).
2.30. Distance de l’origine à une courbe de R3 . Comportement asymptotique des solutions d’une équation différentielle scalaire EXERCICE 1 ( h1 (x, y, z) = x2 + 2y 2 − z 2 − 1 h1 avec 1) Soit h = h2 h2 (x, y, z) = −x + 3z + 1
; h est C ∞ et
C = {(x, y, z) : h(x, y, z) = 0}. De plus,
Jh(x, y, z) =
[∇h1 (x, y, z)]T [∇h2 (x, y, z)]T
=
2x 4y −2z ; −1 0 3
de sorte que⎛ Jh(x,⎞ y, z) ⎛ = 0 et ⎞ que Jh(x, y, z) est de rang 1 si et seulement si 2x −1 les vecteurs ⎝ 4y ⎠ et ⎝ 0 ⎠ sont colinéaires, ce qui a lieu si et seulement si −2z 3 (
y=0 . Comme aucun point de la forme (x, 0, 3x) ne se trouve sur C, 3x − z = 0 C est donc une sous-variété C 1 de R3 de dimension d = 3 − 2 = 1. 191
Chapitre 2. Solutions
2) La direction d = (d1 , d2 , d3 ) est tangente à C en M = (1, 0, 0) si, et seulement si, d ∈ Ker Jh(1, 0, 0). Cela s’exprime par : ( 2d1 = 0 −d1 + 3d3 = 0. Donc, tout vecteur de la forme (0, δ, 0), avec δ = 0, dirige la droite tangente à C en M . ¯ r) = ∅. Alors 3) a) Soit r assez grand pour que C ∩ B(0, inf f (u) = C
inf
¯ C∩B(0,r)
f (u).
¯ r) est compact : f est donc bornée inférieurement sur f est continue, C ∩ B(0, C et il existe u ¯ ∈ C tel que f (¯ u) = inf u∈C f (u). b) f est différentiable, h est C 1 , Jh(x, y, z) est de rang 2 en tout point (x, y, z) de C. Tout point u ¯ minimisant f sur C vérifie donc les conditions d’extrémalité de Lagrange : il existe (λ1 , λ2 ) ∈ R2 tel que u) + λ2 ∇h2 (¯ u) = 0. ∇f (¯ u) + λ1 ∇h1 (¯ En détaillant : u ¯ = (x, y, z) vérifie (
x2 + 2y 2 − z 2 = 1 −x + 3z = −1
⎧ ⎪ ⎨2(1 + λ1 )x − λ2 = 0 et (1 + 2λ1 )y = 0 ⎪ ⎩ 2(1 − λ1 )z + 3λ2 = 0.
– Pour y = 0, il vient (3z + 1)2 − z 2 = 1, i.e. 8z 2 + 6z = 0 donnant lieu aux deux solutions admissibles u ¯1 = (1, 0, 0) avec (λ1 , λ2 ) = (−1, 0) et 5 3 u ¯2 = (− 4 , 0, − 4 ) avec (λ1 , λ2 ) = (− 32 , 54 ). – Pour λ1 = − 12 , il vient x − λ2 = 0 et z + λ2 = 0, donnant lieu à deux autres solutions admissibles u ¯3 = ( 14 , √12 , − 14 ) avec (λ1 , λ2 ) = (− 12 , 14 ) et u ¯4 = ( 14 , − √12 , − 14 ) avec (λ1 , λ2 ) = (− 12 , 14 ).
Remarquant que u4 2 = ¯ u3 2 = ¯
5 < ¯ u1 2 < ¯ u2 2 , 8
¯4 minimisent f sur C et que d((0, 0, 0), C) = on obtient que u ¯3 et u 192
'
5 . 8
2.30. Distance de l’origine à une courbe de R3 . Comportement asymptotique...
EXERCICE 2 Partie A 1) a) Les hypothèses du Théorème de Cauchy-Lipschitz sont vérifiées : f est continue et, grâce à (H3 ), localement lipschitzienne en la deuxième variable (notée u). D’où existence et unicité d’une solution maximale du problème de Cauchy ⎧ ⎪ ⎨x = f (t, x) ⎪ ⎩ x(t0 ) = x0 . b) Puisque x1 − x2 est continue, s’il existe t1 tel que (x1 − x2 )(t1 ) ≥ 0, on aura un t¯ ∈ I1 ∩ I2 tel que x1 (t¯) = x2 (t¯)(= v) (théorème des valeurs intermédiares). Mais alors le problème de Cauchy ⎧ ⎨x = f (t, x) ⎩x(t ) = v 0 aurait deux solutions distinctes x1 et x1 (car x1 (t0 ) < x2 (t0 )), ce qui est impossible. Conclusion : pour tout t ∈ I1 ∩ I2 , on a x1 (t) < x2 (t) si x1 (t0 ) < x2 (t0 ). 2) a) En raison de (H1 ), les fonctions constantes 0 et 1 sont solutions de (ED). Les résultats de la 1re question induisent alors que : 0 ≤ x(t) ≤ 1 pour tout t ∈ I. b) Idée intuitive : la fonction f est définie et continue sur R2 ; x(t) ne peut « traverser » les droites x = 0 et x = 1 ; il faut bien que x « vive » sur tout R. – Puisque f est continue sur R2 , elle est bornée sur [t0 , tmax ] × [0, 1] ; donc t ∈ [t0 , tmax [−→ x (t) = f (t, x(t)) est bornée. Par suite, par application du théorème des accroissements finis, il existe c > 0 tel que : |x(t) − x(t )| ≤ c|t − t | pour tout t, t ∈ [t0 , tmax [. – Le critère de Cauchy (pour les fonctions) assure que t −→ x(t) a une limite finie quand t ↑ tmax , notée l. – Le problème de Cauchy
⎧ ⎨x = f (t, x) ⎩x(t
max )
=l
admettant une solution sur un voisinage de tmax , prolongeant nécessairement x, ceci contredit le caractère maximal de x. 193
Chapitre 2. Solutions
Partie B 3) a) Pour tout t ∈ R, x1 (t) = x (t + 1) = f (t + 1, x(t + 1)) = f (t, x(t)) (grâce à l’hypothèse (H2 )). Donc x1 est solution de (ED). D’après les résultats de la 1re question : – si x1 (0) = x(0), alors x = x1 sur R (cas I) ; – si x1 (0) < x(0), alors x1 < x (cas II) ; – si x1 (0) > x(0), alors x1 > x (cas III). b) xn est encore solution de (ED). Dans le cas II, x1 (t + n) < x(t + n) pour tout t ∈ R et n ∈ N, soit xn+1 < xn sur R pour tout n ∈ N. Raisonnement similaire mutatis mutandis dans le cas III. Dans le cas I, x(t + n) = x(t) pour tout t ∈ R et n ∈ N, soit xn+1 = xn sur R pour tout n ∈ N. 4) a) La suite (xn (0))n est décroissante et minorée par 0 (cas II) ou bien croissante et majorée par 1 (cas III) : dans les deux cas elle est convergente. b) Grâce à l’hypothèse (H3 ) et au Théorème des accroissements finis, il existe L > 0 tel que |f (t, u) − f (t, v)| ≤ L|u − v| pour tout (t, u), (t, v) ∈ [0, 1] × [0, 1]. La périodicité de f en la variable t (hypothèse (H2 )) fait que ceci demeure vrai sur R × [0, 1]. Alors, de t [xn (s) − xp (s)] ds xn (t) − xp (t) = xn (0) − xp (0) + 0 t = xn (0) − xp (0) + [f (s, xn (s)) − f (s, xp (s))] ds 0
on déduit :
t
|xn (t) − xp (t)| ≤ |xn (0) − xp (0)| +
L|xn (s) − xp (s)| ds pour tout t ≥ 0.
0
Le lemme de Gronwall permet alors de conclure à : |xn (t) − xp (t)| ≤ |xn (0) − xp (0)|eLt pour tout t ≥ 0. c) Si t est dans un compact K de R+ , sachant que la suite (xn (0)) est convergente (cf. a)), l’inégalité ci-dessus montre que la suite (xn )n est uniformément de Cauchy sur K. Par conséquent, la suite (xn )n converge vers une fonction x∞ , et ce uniformément sur tout compact de R+ . 194
2.31. Équation différentielle y = xy 2 . Comportement asymptotique...
On fait un travail analogue sur R− . La suite (xn )n converge uniformément sur tout compact de R vers une fonction x∞ . Par ailleurs, pour tout t ∈ R : x∞ (t + 1) =
lim
n−→+∞
xn (t + 1) =
lim
n−→+∞
xn+1 (t) = x∞ (t).
La fonction-limite x∞ est 1-périodique. d) Puisque xn = f (t, xn ) et que f est continue, la suite (xn ) converge uniformément sur tout compact de R. Le caractère C 1 de x∞ s’ensuit ainsi que x∞ = limn−→+∞ xn . A la limite, x∞ = f (t, x∞ ) : x∞ est solution de (ED). e) Nous savons que : lim x(t + n) = x∞ (t) pour tout t ∈ R ;
n→∞
x∞ (t + n) = x∞ (t) pour tout t ∈ R et pour tout n ∈ N. Par conséquent : lim
n−→+∞
x(t + n) − x∞ (t + n) = 0 pour tout t ∈ R.
Cette convergence en « sauts de puce » est insuffisante, il faut s’assurer de la convergence tout court. Écrivons τ ∈ R sous la forme suivante : τ = [τ ] + τ0 , où [τ ] ∈ N évidemment et τ0 ∈ [0, 1[. On a : x(τ ) − x∞ (τ ) = x([τ ] + τ0 ) − x∞ ([τ ] + τ0 ) = x[τ ] (τ0 ) − x∞ (τ0 ). Il ne reste plus qu’à utiliser la convergence uniforme sur [0, 1] de (xn )n vers x∞ .
2.31. Équation différentielle y = xy 2 . Comportement asymptotique des solutions d’une équation différentielle linéaire vectorielle EXERCICE 1 1) L’application f : R × R −→ R (x, y) −→ xy 2 est continue, localement lipschitzienne en y. Alors pour tout (x0 , y0 ) ∈ R2 , il existe une et une seule solution maximale y : I −→ Rn de l’équation différentielle y = xy 2 , définie sur un intervalle ouvert « maximal », telle que 195
Chapitre 2. Solutions
y(x0 ) = y0 (d’après le Théorème d’existence et d’unicité de solution maximale de Cauchy-Lipschitz). 2) a) y ≡ 0 sur I = R est la solution maximale de (1.44) correspondant à y0 = 0. b) S’il existait x1 ∈ I tel que y(x1 ) = 0, il n’y aurait pas unicité pour le problème de Cauchy relatif au point M (x1 , 0) : par ce point passerait en effet deux solutions (y et la solution nulle). On a donc : y(x) = 0 pour tout x ∈ I. Comme y est continue, il y a ainsi deux possibilités : y(x) > 0 pour tout x ∈ I, ou bien y(x) < 0 pour tout x ∈ I. y = x, y(x0 ) = y0 . y2 x2 y 1 = + c, soit 3) L’équation 2 = x s’intègre facilement : − y y(x) 2 1 y(x) = − 2 x /2 + c Donc, pour y0 = 0, (1.44) équivaut à
sur l’intervalle de définition de y. Forme des intervalles : I =√R si c > 0 ; √ I = R+ ou I = R− si √ maximaux I √ c = 0 ; I =] − ∞, − −c[ ou I =] − −c, −c[ ou I =] −c, +∞[ si c < 0. Détermination de c : grâce à la condition initiale y(x0 ) = y0 , i.e. −
x2 1 = 0 + c, y0 2
donc y(x) =
2 y0
1 . + x20 − x2
Discussion suivant (x0 , y0 ) : x2 1 + 0 < 0, on a c > 0 d’où I = R. y0 2 1 x2 – Si + 0 > 0, on a c < 0 d’où y0 2 √ I =] − ∞, − −c[ si x0 < 0 et y0 < 0
– Si
√ I =] −c, +∞[ si x0 > 0 et y0 < 0 I =] − 196
√
√ −c, −c[ si y0 > 0.
(α)
(β) (γ) (δ)
2.31. Équation différentielle y = xy 2 . Comportement asymptotique...
On a épuisé tous les cas puisque x0 = 0 et y0 < 0 est impossible ici. – Si
x2 1 + 0 = 0 (donc x0 = 0), on a c = 0 et y0 2 I =] − ∞, 0[ si x0 < 0
(ε)
I =]0, +∞[ si x0 > 0.
(ζ)
y
(δ)
x 0
(ε)
(α)
(ζ) (γ)
(β)
Figure 2.7. Tracé des solutions.
EXERCICE 2 1) N est la norme euclidienne ici (déduite du produit scalaire ·, · ). La différentiabilité de N 2 : Rn −→ R est un résultat classique : pour tout x ∈ Rn , D(N 2 )(x) : h ∈ Rn −→ 2x, h , 197
Chapitre 2. Solutions
(i.e. ∇(N 2 )(x) = 2x). Par suite, par √ application du théorème de composition de fonctions différentiables, N = N 2 est différentiable en tout x = 0 avec D(N )(x) : h ∈ Rn −→ (i.e. ∇(N )(x) = tive,
x, h x
x ). Une norme n’est jamais différentiable en 0. En définix
D = Rn \ 0, et pour tout x ∈ D, DN (x) : h ∈ Rn −→
x, h . x
(2.34)
2) (ED) est une équation différentielle linéaire. L’application A étant continue sur I, les résultats du Cours sur les équations différentielles linéaires affirment que le problème de Cauchy (C) admet une et une seule solution définie sur tout l’intervalle I (pas question de solutions maximales ici). 3) a) S’il existait un point t¯ en lequel x s’annule, le théorème d’existence et d’unicité vu précédemment ferait que x est identiquement nulle, ce qui est contraire à l’hypothèse faite sur x. On est donc assuré que x(t) > 0 pour tout t ∈ I. b) On a posé u(t) = log(x(t)) pour tout t ∈ I. u est une fonction de la variable réelle t. La règle de différentiation de fonctions composées conduit à la dérivabilité de u sur I avec : x (t), x(t) pour tout t ∈ I. u (t) = x(t)2 Comme x (t) = A(t)x(t), on a aussi : u (t) =
A(t)x(t), x(t) pour tout t ∈ I. x(t)2
(2.35)
En conséquence : |u (t)| ≤ A(t) (êtes-vous d’accord ?). On a u ∈ C 1 (I, Rn ) comme composée de fonctions C 1 , donc t u (s) ds pour tout t ∈ I. u(t) − u(a) = a
Si t est choisi ≥ a,
|u(t) − u(a)| ≤ a
t
A(s) ds ≤
+∞
A(s) ds = M.
a
De l’inégalité −M ≤ u(t) − u(a) ≤ M il vient e−M x(a) ≤ x(t) ≤ eM x(a). Cette inégalité est (aussi) trivialement vérifiée par la solution nulle. 198
(2.36)
2.31. Équation différentielle y = xy 2 . Comportement asymptotique...
c) Si a ≤ t0 ≤ t1 ,
t1 t1 x(t1 ) − x(t0 ) = x (t) dt = A(t)x(t) dt ≤ t0 t0 t1 t1 A(t) ·x(t) dt ≤ A(t) dt · eM x(a) t0
t0
(de par (2.36)). Ainsi : x(t1 ) − x(t0 ) ≤ N
t1
A(t) dt, avec N = eM x(a).
(2.37)
t0
d) On déduit de ce qui précède : pour tout ε > 0, il existe T > 0 tel que x(t1 ) − x(t0 ) ≤ ε pour tout t0 , t1 ≥ T. " +∞ (En effet, puisque a A(t) dt converge, il suffit de prendre T assez grand " +∞ assurant que T A(t) dt ≤ Nε .) Donc, d’après le critère de Cauchy pour les fonctions, x(t) admet une limite l ∈ Rn quand t −→ +∞. 4) a) Si x1 et x2 sont deux solutions de (ED) telles que lim x1 (t) =
t−→+∞
lim x2 (t) = l,
t−→+∞
la fonction y = x1 −x2 est solution de (ED) et vérifie limt→+∞ y(t) = 0. Comme e−M y(a) ≤ y(t) (cf. (2.36)), on a y(a) = 0 nécessairement et donc y ≡ 0. b) On a xμ (λ) − xλ (λ) = xμ (λ) − l = xμ (λ) − xμ (μ). En suivant le même cheminement qu’en 3) c), on aboutit à : μ A(s) ds, xμ (μ) − xμ (λ) ≤ eM xμ (λ).
(2.38)
(2.37)
λ −M
e
xμ (λ) ≤ xμ (μ) ≤ e xμ (λ). M
(2.36)
Comme xμ (μ) = l, il vient de la 1re inégalité de (2.36)’ : xμ (λ) ≤ eM l. Par suite, dans (2.37)’ : μ 2M A(s) ds. xμ (μ) − xμ (λ) ≤ e l. λ
L’observation (2.38) induit enfin : xμ (λ) − xλ (λ) ≤ e2M l.
μ
A(s) ds.
(2.39)
λ
199
Chapitre 2. Solutions
Sur [λ, +∞[ on a donc xμ (t) − xλ (t) ≤ xμ (λ) − xλ (λ)eM μ 3M ≤ e l. A(s) ds λ
d’après (2.39). Comme, de plus, e−M xμ (a) − xλ (a) ≤ xμ (t) − xλ (t), on en déduit μ 4M A(s) ds. xμ (a) − xλ (a) ≤ e l. λ
Donc :
xμ (t) − xλ (t) ≤ e
5M
l.
μ
A(s) ds pour tout t ∈ [a, +∞[.
(2.40)
λ
c) D’après (2.40) la suite (xλ (·))λ est uniformément de Cauchy sur [a, +∞[. Par conséquent, la suite (xλ )λ converge (quand λ −→ +∞) vers une fonction x∞ , et ce uniformément sur [a, +∞[. Puisque xλ = A(t)xλ et que xλ −→ x∞ uniformément, la suite (xλ )λ converge uniformément (vers t −→ A(t)x∞ ), uniformément sur tout compact au moins. Le caractère C 1 de x∞ s’ensuit ainsi que la propriété x∞ = A(t)x∞ . Conséquence de (2.40) : x∞ (t) − xλ (t) ≤ K
∞
A(s) ds pour tout t ≥ a.
λ
En particulier, pour t = λ x∞ (λ) − xλ (λ) ≤ K
∞
A(s) ds.
λ
Comme xλ (λ) = l, il en résulte : x∞ (λ) −→ l quand λ −→ +∞.
2.32. Formule de Thermodynamique sur les dérivées partielles. Équation différentielle x = t sin x. Équation différentielle linéaire à coefficients périodiques EXERCICE 1 1) On est dans les conditions d’application du Théorème des fonctions implicites. Par exemple, puisque ∂3 F (p0 , v0 , θ0 ) = 0, on peut rendre « explicite » 200
2.32. Formule de Thermodynamique sur les dérivées partielles. Équation...
en la 3e variable θ l’équation « implicite » F (p, v, θ) = 0, du moins dans un voisinage de (p0 , v0 , θ0 ) : il existe un voisinage W de (p0 , v0 , θ0 ), un voisinage V de (p0 , v0 ), une fonction continûment différentiable Θ : V −→ R, tels que : F (p, v, θ) = 0 et (p, v, θ) ∈ W ⇐⇒ θ = Θ(p, v) et (p, v) ∈ V. Le raisonnement est le même pour rendre « explicite » la variable v (resp. p) comme fonction de (p, θ) (resp. (v, θ)). 2) La formule annoncée est a priori choquante puisqu’une simplification irréfléchie des dérivées partielles conduit à 1 = −1 . . . Mais, comme disent les thermodynamiciens, « les ∂f ne se manipulent pas comme les df ». De la relation F (p, v, Θ(p, v)) = 0, valable dans un voisinage de (p0 , v0 ), on tire par dérivation par rapport à p puis à v : ∂Θ (p, v) = 0, ∂p ∂Θ (p, v) = 0. ∂2 F (p, v, Θ(p, v)) + ∂3 F (p, v, Θ(p, v)) ∂v ∂θ ∂2 F Ainsi, =− (en notations abrégées). D’une manière similaire, à partir ∂v ∂3 F de F (p, V (p, θ), θ) = 0 et F (P (v, θ), v, θ) = 0 on tire par dérivations partielles : ∂1 F (p, v, Θ(p, v)) + ∂3 F (p, v, Θ(p, v))
∂1 F (p, V (p, θ), θ) + ∂2 F (p, V (p, θ), θ)
∂V (p, θ) = 0, ∂p
∂P (v, θ) + ∂3 F (P (v, θ), v, θ) = 0, ∂θ ∂v ∂1 F ∂p ∂3 F soit =− et =− . D’où la relation annoncée. ∂p ∂2 F ∂θ ∂1 F ∂1 F (P (v, θ), v, θ)
EXERCICE 2 On a (ED)
x = f (t, x), avec (t, u) ∈ R × R −→ f (t, u) = t sin(u).
1) f est C 1 sur R × R ; donc le théorème de Cauchy-Lipschitz s’applique : il existe une et une seule solution maximale x : I −→ R de (C) définie sur un intervalle ouvert I contenant t0 . 2) Montrons que I n’est pas majoré (que I n’est pas minoré se démontrerait de la même manière). Supposons que la partie de I à droite de t0 soit [t0 , tmax [ avec tmax < +∞. On a alors : 201
Chapitre 2. Solutions
– f est bornée sur [t0 , tmax [, donc t −→ x (t) = f (t, x(t)) est bornée sur [t0 , tmax [. – Par application du théorème des accroissements finis, x est Lipschitzienne sur [t0 , tmax [. – Le critère de Cauchy (pour les fonctions) assure que x admet une limite finie quand t ↑ tmax , notée l. De plus x admet aussi une limite v(= f (l, x(l))) quand t ↑ tmax . ( x = f (t, x) admettant une solution au voi– Le problème de Cauchy x(tmax ) = l sinage de tmax , prolongeant nécessairement x, ceci contredit le caractère maximal (supposé) de x. 3) a) Si t −→ x(t) est solution de (ED), alors x = : t −→ x =(t) = x(−t) est = (t) = t sin(= x(t)) ; de plus x et solution : x = (t) = −x (−t) = t sin(x(−t)), d’où x x = prennent la même valeur en t = 0 ; donc x =(t) = x(t) pour tout t ∈ R. b) Clair. c) Si t −→ x(t) est une solution maximale de (ED), alors t −→ x ˜(t) = −x(−t) ˜(t). est aussi solution : x ˜ (t) = x (−t) = t sin x d) Représentons les graphes des solutions dans le plan repéré par − → − → (O; i , j ). – L’ensemble des graphes des solutions maximales de (ED) est invariant → − par translation de vecteur 2π j . – Pour dessiner les solutions maximales il suffit d’étudier les solutions sur [0, +∞[. En bref : pour dessiner les solutions maximales, il suffit d’étudier les solutions de (C) sur [0, +∞[ avec t0 = 0, 0 ≤ x0 ≤ π, de faire une symétrie par rapport à → − l’axe Oy, puis par rapport à O, et des translations verticales de vecteur 2π j . 4) Examinons les différents cas suggérés : – x0 = 0 ; alors t ∈ R −→ x(t) = 0 est la solution de (C) ; – x0 = π ; alors t ∈ R −→ x(t) = π est la solution de (C) ; – 0 < x0 < π ; on est assuré que la solution x : t ∈ R −→ R de (C) vérifie : 0 < x(t) < π pour tout t ∈ R. Déterminons-là. 202
2.32. Formule de Thermodynamique sur les dérivées partielles. Équation...
On a :
x (t) = t, d’où par primitivation de chaque membre sin(x(t)) 1 1 1 tan x(t) 1 t2 1 2 1 , log 1 x0 1 = 1 tan 2 1 2
ce qui conduit finalement à t −→ x(t) = 2 arctan
tan
t2 x0 .e 2 . 2
EXERCICE 3 1) Non, il n’y a aucune raison. Déjà lorsque A ne dépend pas de t (A matrice constante), les solutions de (ED) ne sont pas nécessairement périodiques. 2) On sait que t −→ R(t, t0 ) est la solution de ⎧ ⎪ ⎨U (t) = A(t)U (t) (ED)’ ⎪ ⎩ U (t0 ) = In . Par conséquent, d R(t + T, t0 + T ) = A(t + T )R(t + T, t0 + T ) dt = A(t)R(t + T, t0 + T ), car A(t + T ) = A(t). Comme R(t0 + T, t0 + T ) = In , l’application t −→ R(t + T, t0 + T ) est aussi solution de (ED)’. L’unicité de la solution de (ED)’ fait donc que R(t + T, t0 + T ) = R(t, t0 ). 3) On a posé C(t0 ) = R(t0 + T, t0 ). La solution de (ED) vérifiant x(t0 ) = x0 est t −→ x(t) = R(t, t0 )x0 . Si toutes les solutions de (ED) sont de période T , c’est que x(t0 + T ) = R(t0 + T, t0 )x0 = x(t0 ) = x0 pour tout t0 ∈ R et x0 ∈ Rn . Donc, C(t0 ) = In nécessairement. 203
Chapitre 2. Solutions
4) On a : C(t1 ) = R(t1 + T, t1 ) [par définition] = R(t1 + T, t0 + T )R(t0 + T, t0 )R(t0 , t1 ) [par règle de composition sur les résolvantes] = R(t1 , t0 )C(t0 )[R(t1 , t0 )]−1 car R(t1 + T, t0 + T ) = R(t1 , t0 ) et R(t0 , t1 ) = [R(t1 , t0 )]−1 . C(t1 ) et C(t0 ) sont ainsi des matrices semblables et, par conséquent, ont les mêmes valeurs propres. Si C(t0 ) = In pour un certain t0 , il est clair d’après l’expression ci-dessus que C(t) = In pour tout t. Dans ce cas, sachant que x(t + T ) = C(t)x(t) pour une solution x de (ED), on a bien x(t + T ) = x(t) pour tout t. 5) Montrons que (i) =⇒ (ii). La fonction x étant une solution non nulle de (ED), x(t) = 0 pour tout t ∈ R (êtes-vous d’accord ?). On suppose x(t + T ) = λx(t) pour tout t. On pose x0 = x(t0 ). Comme x(t + T ) = R(t + T, t0 )x0 et λx(t) = λR(t, t0 )x0 , on déduit R(t + T, t0 )x0 = λR(t, t0 )x0 pour tout t ∈ R. En faisant t = t0 , il vient en particulier : R(t0 + T, t0 )x0 = λx0 avec x0 = 0. Réciproquement, supposons R(t0 + T, t0 )x(t0 ) = λx(t0 ). On a : x(t + T ) = R(t + T, t0 )x(t0 ) = R(t + T, t0 + T )R(t0 + T, t0 )x(t0 ) = R(t, t0 ) R(t0 + T, t0 )x(t0 ) = R(t, t0 )[λx0 ] = λR(t, t0 )x0 = λx(t). Commentaires – Illustrer les résultats (sous forme affirmative ou négative) avec A(t) = A matrice constante ; alors C(t0 ) = exp(T A) ne dépend pas de t0 . – Le résultat final de l’exercice est dû à Floquet (Gaston de son prénom), il y a plus d’un siècle (1883). 204
2.33. Équations différentielles non linéaires. Comportement asymptotique...
2.33. Équations différentielles non linéaires. Comportement asymptotique des solutions d’une équation différentielle linéaire sous la condition de Liapounov EXERCICE 1 1) a) Soit f : (t, α) −→ f (t, α) = 1+sin α. Comme f est C 1 sur R2 , le problème de Cauchy ⎧ ⎪ ⎨α (t) = f (t, α(t)) ⎪ ⎩ α(0) = 0 admet une solution maximale (I, α), où I est un intervalle ouvert contenant 0. Comme α (t) = 1 + sin α(t) ≥ 0 pour tout t ∈ I : α est croissante ; 1 + sin α(0) = 1 > 0, α est continue : il existe t¯ > 0 tel que 1 + sin α(t) > 0 pour tout t ∈ [0, t¯]. Comme α est croissante et que sin α(t) > −1 sur [0, t¯], il ¯ est sûr que α(t) ∈ [0, 3π 2 [ sur [0, t]. De
α(t)
t 0
α (t) dt = t 1 + sin α(t)
α(t)
du du α(t) π = − ) = t − 1. u π = t ; d’où tan( 2 1 + sin u 2 cos ( 2 − 4 ) 2 4 0 0 π π α(t) π − ∈] − , [, il s’ensuit Comme 2 4 4 2 π α(t) = 2 arctan(t − 1) + , t ∈ [0, t¯]. 2 π La fonction α ¯ : t ∈ R −→ α ¯ (t) = 2 arctan(t − 1) + vérifie α ¯ (t) = 1 + sin α(t) ¯ 2 pour tout t ∈ R, de plus α ¯ (0) = 0. Ainsi, (R, α ¯ ) est solution du même problème de Cauchy que (I, α) ; on a donc (I, α) = (R, α ¯ ). π a les mêmes b) La fonction α : t ∈ R −→ α(t) = 2 arctan(t + C) + 2 π 3π propriétés que α ¯ : elle est strictement croissante de R dans ] − , [, elle 2 2 vérifie α = 1 + sin α. Il suffit d’ajuster la constante réelle C de sorte que on tire
2 arctan(t0 + C) +
π = α0 . 2 205
Chapitre 2. Solutions
En résumé : π – On choisit C comme étant l’unique réel vérifiant 2 arctan(t0 + C) + = 2 α0 ; – La fonction t −→ 2 arctan(t + C) +
π est la solution de (1.45)’. 2
2) a) Le théorème de Cauchy-Lipschitz s’applique encore puisque l’application (t, x, y) ∈ R3 −→ (x2 − y − 1, x + xy) est C 1 . Pour tout (t0 , (x0 , y0 )) ∈ R × R2 , il existe une unique solution maximale (I, X), avec X(t) = (x(t), y(t)), au problème de Cauchy (1.46). On va déterminer explicitement (I, X) dans le cas où x20 + y02 = 1. b) La fonction constante candidate est évidemment X(t) ≡ (0, −1). D’où : t ∈ R −→ X(t) = (0, −1) est la solution de (1.46) avec x0 = 0 et y0 = −1. c) Soit (x0 , y0 ) = (0, −1) ; on choisit α0 ∈] − π2 , 3π 2 [ tel que cos α0 = x0 et sin α0 = y0 . La fonction α proposée est la solution du problème de Cauchy (1.45)’ : α(t) = α0 ,
α (t) = 1 + sin α(t) pour tout t ∈ R.
Par suite x (t) = α (t)(− sin α(t)) = (1 + sin α(t))(− sin α(t)) = − sin α(t) − sin2 α(t) = x2 (t) − y(t) − 1 ; y (t) = α (t) cos α(t) = (1 + sin α(t)) cos α(t) = x(t) + x(t)y(t). On a bien t ∈ I = R −→ X(t) = (x(t) = cos α(t), y(t) = sin α(t)) solution explicite du problème de Cauchy (1.46). EXERCICE 2 1) Si S ∈ Mn (R) est symétrique, on a λmin (S)x2 ≤ Sx, x ≤ λmax (S)x2 pour tout x ∈ Rn ,
(2.41)
et le fait que S soit définie positive (resp. définie négative) est caractérisé par l’inégalité λmin (S) > 0 (resp. λmax (S) < 0). Si la matrice symétrique S = AT X + XA est définie négative alors, pour tout x ∈ Rn , on a (S + εX)x, x ≤ (λmax (S) + εX)x2 < 0 pourvu que εX < −λmax (S), donc pour tout ε > 0 assez petit. 206
2.34. Une équation différentielle scalaire autonome. Calcul de la hauteur...
2) Pour toute solution x(·) de (ED)0 on a : (AT X + XA)x(t), x(t) + εXx(t), x(t) ≤ 0 pour tout t ∈ R.
(2.42)
La fonction t −→ u(t) := Xx(t), x(t) est clairement dérivable sur R avec, pour tout t ∈ R, u (t) = Xx (t), x(t) + Xx(t), x (t) = XAx(t), x(t) + Xx(t), Ax(t) = (AT X + XA)x(t), x(t) . Ce que dit (2.42) n’est autre que u (t) + εu(t) ≤ 0 pour tout t ∈ R, soit encore
eεt u (t) + εeεt u(t) ≤ 0 pour tout t ∈ R.
(2.43)
On reconnaît dans le membre de gauche de (2.43) la dérivée de t −→ v(t) := eεt u(t). Il en découle v(t) ≤ v(0) pour tout t ≥ 0, ce qui est la relation demandée. 3) Grâce aux inégalités du type de celle de (2.41), il vient de la question précédente : λmin (X)x(t)2 ≤ λmax (X)x(0)2 e−εt pour tout t ≥ 0, d’où l’inégalité annoncée.
2.34. Une équation différentielle scalaire autonome. Calcul de la hauteur d’une courbe. Différentiation de la fonction déterminant EXERCICE 1 x = f (x) est une équation différentielle autonome (f ne dépend pas de t, de x seulement). f étant positive sur R, on en déduit – sans calculs – que x (solution) sera une fonction croissante sur son intervalle de définition. 207
Chapitre 2. Solutions
1) (t, u) −→ fˆ(t, u) = f (u) est clairement continue sur R × R. Pour t quelconque, (2.44) |fˆ(t, x1 ) − fˆ(t, x2 )| ≤ |x1 − x2 | pour tout x1 , x2 ∈ R. f n’est pas C 1 sur R : elle n’est pas dérivable en x = 0 ou x = 1 ; toutefois elle est C 1 par morceaux. On peut démontrer (2.44) de plusieurs manières différentes : – En majorant |f (x1 ) − f (x2 )| dans tous les cas de figure possibles concernant x1 et x2 : x1 et x2 ≤ 0, x1 et x2 ≥ 1, x1 ≤ 0 et x2 ∈ [0, 1], etc. "x – En observant que f (x1 ) − f (x2 ) = x21 f (u) du (vrai ici même si f n’existe pas aux points 0 et 1) et notant que 0 ≤ f (u) ≤ 1 pour tout u ∈ R \ {0, 1}. – En utilisant un théorème de valeurs moyenne pour les fonction dérivables à droite : f est dérivable à droite sur tout R et 0 ≤ fd (u) ≤ 1 pour tout u ∈ R. fˆ est donc Lipschitz en la variable u (sur tout R), uniformément en la variable t (puisqu’elle n’en dépend pas). C’est plus qu’il n’en faut pour appliquer le théorème de Cauchy-Lipschitz local du Cours : pour tout (t0 , x0 ) ∈ R2 il existe une et une seule solution maximale x : I −→ R, avec t0 intérieur à I, de (ed) dont le graphe passe par (t0 , x0 ) : ⎧ ⎪ ⎨x (t) = f [x(t)] pour tout t ∈ I, (2.45) ⎪ ⎩ x(t0 ) = x0 . En fait, le caractère globalement lipschitzien de f sur R (propriété (2.44)) permet de faire appel au théorème de Cauchy-Lipschitz global qui nous assure que I = R dans (2.45). 2) (t0 , x0 ) étant donnés, reste à faire l’essentiel : déterminer la forme explicite de la solution du problème de Cauchy ( ed, x(t0 ) = x0 . N’oublions pas ce que l’on veut : ⎧ ⎪ si x(t) ≤ 0, ⎨x (t) = 0 x (t) = x(t) si x(t) ∈ [0, 1], ⎪ ⎩ si x(t) > 1. x (t) = 1 Examinons les différents cas. 208
(2.46)
2.34. Une équation différentielle scalaire autonome. Calcul de la hauteur...
x0 ≤ 0. Soit x : t ∈ R −→ x(t) ≡ x0 (fonction constante sur R). Elle vérifie – évidemment – (2.46) : c’est donc la solution cherchée. 0 < x0 < 1. La solution x : R −→ R cherchée est > 0 (pourquoi ?) et vérifie x (t) = x(t) dans un voisinage de t0 : elle est donc de la forme t −→ Cet (soit en fait x0 et−t0 ) tant que x(t) ≤ 1 : x(t) = x0 et−t0 si t ≤ t0 − ln x0 . x0 ≥ 1. La solution x : R −→ R cherchée vérifie x (t) = 1 dans un voisinage de t0 : elle est donc de la forme t −→ t + C (soit en fait t − t0 + x0 ) tant que x(t) ≥ 1 : x(t) = t − t0 + x0 si t ≥ t0 + 1 − x0 . On raccorde les solutions des deux derniers cas de manière à avoir une solution définie sur tout R (une solution x est toujours dérivable sur R).
x
(t0 , x0 ) 1 (t0 , x0 ) t (t0 , x0 )
Figure 2.8. Courbes représentatives des solutions.
En somme : Si 0 < x0 < 1 : ⎧ t−t0 ⎪ si t ≤ t0 − ln x0 , ⎨x0 e x(t) = ⎪ ⎩ t − t0 + ln x0 + 1 si t ≥ t0 − ln x0 . 209
Chapitre 2. Solutions
Si 1 ≤ x0 :
⎧ ⎪ ⎨t − t0 + x0 x(t) =
⎪ ⎩
ex0 −1 et−t0
si t ≥ t0 + 1 − x0 , si t ≤ t0 + 1 − x0 .
EXERCICE 2 1) La fonction (x, y, z) −→ f (x, y, z) = z est continue. L’ensemble S est, d’une manière claire, compact. Il existe donc un point (x∗ , y ∗ , z ∗ ) ∈ S (au moins) en lequel z ∗ = zmax . Idem pour zmin . 2) Introduisant h1 : (x, y, z) −→ h1 (x, y, z) = x2 + y 2 + z 2 − 1, et h2 : (x, y, z) −→ h2 (x, y, z) = (x + 2z)2 + y 2 − z 2 , on a :
S = (h1 )−1 (0) ∩ (h2 )−1 (0) ; ⎛ ⎞ ⎛ ⎞ 2x 2(x + 2z) ⎠. ∇h1 (x, y, z) = ⎝2y ⎠ et ∇h2 (x, y, z) = ⎝ 2y 2z −2z + 4(x + 2z)
Il n’y a donc pas de point de la forme (x, y, 0) sur S. Par suite, ∇h1 (x, y, z)T est de rang maximal (= 2) pour tout (x, y, z) ∈ S. ∇h2 (x, y, z)T Il existe nécessairement des réels μ1 et μ2 tels que ∇f (x∗ , y ∗ , z ∗ ) + μ1 ∇h1 (x∗ , y ∗ , z ∗ ) + μ2 ∇h2 (x∗ , y ∗ , z ∗ ) = 0 (c’est le Théorème de Lagrange). On réécrit ce qui est dessus en disant : ⎛ ⎞ 0 2x∗ 2(x∗ + 2z ∗ ) ⎠ = 0. 2y ∗ det ⎝0 2y ∗ ∗ ∗ ∗ ∗ 1 2z −2z + 4(x + 2z ) Il s’ensuit y ∗ z ∗ = 0, et donc y ∗ = 0 (d’après ce qui a été dit plus haut : pas de point de la forme (x, y, 0) dans S). Il reste comme possibilités : ⎧ ∗ ∗ ∗ ∗ ∗ ∗ ⎪ ⎨x + 2z = z ou x + 2z = −z , ⎪ ⎩ 210
(x∗ )2 + (z ∗ )2 = 1,
2.34. Une équation différentielle scalaire autonome. Calcul de la hauteur...
d’où x∗ = −z ∗ ou x∗ = −3z ∗ . On arrive ainsi à 1 1 1 1 3 1 3 1 √ , 0, − √ , − √ , 0, √ , √ , 0, − √ , − √ , 0, √ . 2 2 2 2 10 10 10 10 1 1 En définitive, zmax = √ . Les mêmes calculs conduisent à : zmin = − √ . 2 2 EXERCICE 3 Pour Z ∈ E, on pose ϕZ : H −→ Tr (ZH) forme linéaire sur E (élément de E ∗ donc) ; on a rappelé que ϕZ ∈ E ∗ et que l’application ϕ de E dans E ∗ qui à Z associe ϕZ est un isomorphisme vectoriel (cf. b)). 1) a) det : X = [xij ] ∈ E −→ det X est une fonction polynomiale des coefficients xij de X ∈ E : elle est donc C ∞ . Ou encore, écrivant X ∈ E sous la forme X = (x1 , · · · , xn ) où x1 , · · · , xn ∈ Rn sont les vecteurs colonnes de la matrice X, l’application det : E ≡ Rn × Rn . . . × Rn −→ R est multilinéaire, continue car E est de dimension finie, donc de classe C ∞ . b) La différentielle de det en X0 est donc une forme linéaire sur E : il existe >0 ∈ E tel que un et un seul X >0 H) pour tout H ∈ E D(det)(X0 )H = Tr (X
(2.47)
2) a) On sait que pour tout λ ∈ R : PH (λ) = det(H −λIn ) = (−λ)n +(−λ)n−1 Tr H +. . .+(−λ)cn−1 +det H (2.48) (c’est l’expression du polynôme caractéristique PH de H). Il vient de (2.48) : 1 1 n n . det(In + tH) = t det(H + In ) = t PH − tn t Par suite, det(In + tH) = 1 + t · Tr H + . . . + tn−1 cn−1 + tn det H, de sorte que
det(In + tH) − 1 = Tr H. (2.49) t−→0 t Sachant que det est différentiable en X0 = In , ce qui est au-dessus est exactement D(det)(In )H. Il vient donc de (2.47) : Tr (I?n H) = Tr H pour tout H, d’où I?n = In (pourquoi ?). lim
211
Chapitre 2. Solutions
b) Avec X0 ∈ GLn (R) partons du développement suivant : >0 H) + Hε(H) pour tout H ∈ E. det(X0 + H) = det(X0 ) + Tr (X En remplaçant H par X0 H on a : >0 X0 H) + X0 Hε(X0 H), det X0 · det(In + H) = det X0 + Tr (X d’où encore : >0 X0 X 1 H) + X0 Hε(X0 H), det X0 det X0 = 1 + Tr (H) + o(H).
det(In + H) = 1 + Tr (
L’unicité de la différentielle fait donc que Tr ( d’où
>0 X0 X H) = Tr (H) pour tout H ∈ E, det X0
>0 X0 X >0 = (det X0 )X −1 . Rappelant que = In (pourquoi ?), soit enfin X 0 det X0 T 1 X0−1 = cof (X0 ) det X0
où cof (X0 ) désigne la matrice des cofacteurs de X0 , on a bien : >0 = cof (X0 ) T . X La matrice des cofacteurs de X0 est aussi appelée comatrice de X0 . c) L’application différentielle D(det) : E −→ E ∗ est continue, car det est de classe C 1 . Donc l’application ϕ−1 ◦ D(det) : E −→ E >0 X0 −→ X est continue par composition (ϕ−1 : E ∗ −→ E est continue car linéaire sur un espace de dimension finie). Par ailleurs, l’application c : E −→ E qui à X0 associe la transposée de la comatrice de X0 est continue, car polynomiale. Les deux applications ci-dessus (c et ϕ−1 ◦D(det)) sont continues sur E, coïncident sur GLn (R) (c’est le résultat de b)), et GLn (R) est dense dans E. Elles sont donc égales. Résultat final : en tout X0 ∈ E, >0 H), D(det)(X0 ) : H ∈ E −→ Tr (X >0 désigne la transposée de la comatrice de X0 . où X 212
2.34. Une équation différentielle scalaire autonome. Calcul de la hauteur...
3) a) Par composition, θ est dérivable et, pour tout t ∈ R, θ (t) = D(det)(X(t)) · X (t), différentielle de det en X(t) appliquée à l’élément X (t) de E. Or ? (t)), D(det)(X(t)) · X (t) = Tr (X(t)X
d’après le résultat de la 2e question, d’où ? D(det)(X(t)) · X (t) = Tr (X(t)A(t)X(t)) ? = Tr (A(t)X(t)X(t)) = Tr (A(t) det X(t)In ), (utilisant l’hypothèse sur X (t), le fait que Tr (AB) = Tr (BA) ; attention à ? = XX ? = (det X)In ). Il reste l’ordre ! et le fait que XX θ (t) = Tr [A(t)] · θ(t). Comme X(0) = In , θ(0) = 1, d’où avec ce qui précède : t Tr [A(u)] du . θ(t) = exp 0
b) Considérons le problème de Cauchy linéaire tion X de
(2.50)
⎧ ⎪ ⎨x = A(t)x ⎪ ⎩ x(0) = x0
; la solu-
⎧ ⎪ ⎨X (t) = A(t)X(t) ⎪ ⎩
X(0) = In
n’est autre que la résolvante de x = A(t)x : X(t) = R(t, 0). Pour un t0 quelconque : R(t, t0 ) = R(t, 0) ◦ R(0, t0 )
= R(t, 0) ◦ [R(t0 , 0)]−1 ,
de sorte que (cf. (2.50)), t θ(t) det(R(t, 0)) = = exp Tr [A(u)] . det(R(t, t0 )) = det(R(t0 , 0)) θ(t0 ) t0 213
Chapitre 2. Solutions
On retrouve ainsi un résultat du Cours : t det(R(t, t0 )) = exp Tr [A(u)] du . t0
2.35. Équations différentielles avec retard Première partie 1) On a d(x, z) ≥ 0, d(x, x) = 0, et si d(x, z) = 0 alors x(t) = z(t) sur [t0 , T ] donc x(t) = z(t) sur [t0 − τ, T ] (car on a déjà x(t) = z(t) = φ(t) sur [t0 − τ, t0 ]). On a clairement d(x, z) = d(z, x) ainsi que l’inégalité triangulaire. Enfin si (xn )n∈N ⊂ E est une suite de Cauchy dans E, alors (xn )n∈N est une suite de Cauchy dans C([t0 , T ], Rp ) muni de la distance de la convergence uniforme. On sait donc que la suite (xn )n∈N converge uniformément sur [t0 , T ] que (xn )n∈N converge dans vers une fonction x ¯ ∈ C([t0 , T ], Rp ), ce qui implique ( φ(t) sur [t0 − τ, t0 ] E vers la fonction x ∈ E définie par x(t) = x ¯(t) sur [t0 , T ]. 2) Si x ∈ E vérifie T (x) = x, on a x(t) = (T (x))(t) = φ(t) sur [t0 − τ, t0 ] et x (t) = f (t, x(t), x(t − τ )) sur [t0 , T ]. Réciproquement, si x ∈ E est solution de (1.48), on a (T (x))(t) = x(t) = φ(t) sur [t0 − τ, t0 ] et, utilisant le fait que s → f (s, x(s), x(s − τ )) est continue, t t x (s) ds = φ(t0 ) + f (s, x(s), x(s − τ )) ds, x(t) = x(t0 ) + t0
t0
sur [t0 , T ], d’où x ∈ E et T (x) = x. 3) Soient z1 , z2 ∈ E. Pour t ∈ [t0 − τ, t0 ], on a (T q (z1 ))(t) − (T q (z2 ))(t) = 0 ≤
(2L(t − t0 ))q d(z1 , z2 ). q!
Si t ∈ [t0 , T ] on a (T (z1 ))(t) − (T (z2 ))(t) = t (f (s, z1 (s), z1 (s − τ )) − f (s, z2 (s), z2 (s − τ ))) ds, t0
donc (T (z1 ))(t) − (T (z2 ))(t) ≤ t (f (s, z1 (s), z1 (s − τ )) − f (s, z2 (s), z2 (s − τ ))) ds t0
214
2.35. Équations différentielles avec retard
et (T (z1 ))(t) − (T (z2 ))(t) ≤ t L(z1 (s) − z2 (s) + z1 (s − τ ) − z2 (s − τ )) ds, t0
d’où (T (z1 ))(t) − (T (z2 ))(t) ≤ 2L(t − t0 )d(z1 , z2 ). Supposons alors que (T q (z1 ))(t) − (T q (z2 ))(t) ≤
(2L(t − t0 ))q d(z1 , z2 ). q!
On a alors (T q+1 (z1 ))(t) − (T q+1 (z2 ))(t) ≤ A + B avec t L(T q (z1 ))(s) − (T q (z2 ))(s) ds A= t0
et
t
B= t0
"t
L(T q (z1 ))(s − τ ) − (T q (z2 ))(s − τ ) ds.
(2L(s−t0 ))q d(z1 , z2 ) ds t0 q!
q+1
0) = L(2L)q (t−t On a A ≤ L (q+1)! d(z1 , z2 ). Si t ≤ t0 + τ , alors s − τ ∈ [t0 − τ, t0 ] pour tout t0 ≤ s ≤ t donc B = 0. Si t0 + τ ≤ t ≤ T on a, utilisant le fait que (T q (z1 ))(s − τ ) − (T q (z2 ))(s − τ ) = 0 sur [t0 , t0 + τ ], t L(T q (z1 ))(s − τ ) − (T q (z2 ))(s − τ ) ds B=
≤
t0 +τ t t0
L(T q (z1 ))(s) − (T q (z2 ))(s) ds
≤ L(2L)q
(t − t0 )q+1 d(z1 , z2 ). (q + 1)!
On a donc bien montré que (T q+1 (z1 ))(t) − (T q+1 (z2 ))(t) ≤
(2L(t − t0 ))q+1 d(z1 , z2 ). (q + 1)!
Il en résulte que d(T q (z1 )), T q (z1 )) ≤
(2L(T − t0 ))q d(z1 , z2 ). q!
Comme limq→∞ (2L(Tq!−t0 )) = 0, il existe q tel que (2L(Tq!−t0 )) < 1, auquel cas T q admet un point fixe unique x ∈ E par le Théorème de contraction de Banach. On a alors T q (T (x)) = T (T q (x)) = T (x) donc T (x) = x donc x est q
q
215
Chapitre 2. Solutions
solution de (1.48). Par ailleurs, si z est solution de (1.48), on a T (z) = z donc T q (z) = z, d’où z = x, le problème (1.48) possède donc une solution unique. Deuxième partie 4) La fonction t −→ x (t) = f (t, x(t), x(t − τ )) est de classe C 1 . Il existe donc C ≥ 0 tel que x (t) ≤ C pour tout t ∈ [t0 − τ, T ]. On a alors, par une des formules de Taylor, notant que tm+1 − tm = h, x(tm+1 ) − x(tm ) − hf (tm , x(tm ), x(tm − τ )) ≤ Ch2 . Par ailleurs, on a f (tm , x(tm ), x(tm − τ )) − f (tm , x(tm ), x(tm−n1 ) ≤ Lx(tm − τ ) − x(tm−n1 et x(tm − τ ) − x(tm−n1 ) ≤ c|tm − τ − (tm − n1 h)| ≤ ch, où c ≥ 0 est une constante telle que supt∈[t0 −τ,T ] x (t) ≤ c. On a donc x(tm+1 ) − x(tm ) − hf (tm , x(tm ), x(tm−n1 ) ≤ (C + Lc)h2 , d’où Ch =
x(tm+1 ) − x(tm ) − hf (tm , x(tm ), x(tm−n1 )) ≤
0≤m≤M −1
M (C + cL)h2 ≤ (T − t0 )(C + cL)h, utilisant le fait que M h ≤ T − t0 . On a donc bien limh→0 Ch = 0. 5) Posons ζm = x(tm+1 ) − x(tm ) − hf (tm , x(tm ), x(tm−n1 ) pour tout 0 ≤ m ≤ M − 1. On a ⎧ si 0 ≤ m ≤ n1 ⎨ x(t−m ) = φ(t0 − mh) ⎩
x(tm+1 ) = x(tm ) + hf (tm , x(tm ), x(tm−n1 ) + ζm si 0 ≤ m ≤ M − 1.
Posant ym = x(tm ), −n1 ≤ m ≤ M , on obtient donc l’existence d’une constante C ≥ 0 telle que xm − ym ≤ C
m−1
ζj ≤ CCh ,
j=0
pour tout 0 ≤ m ≤ M . On a donc bien sup x(tm ) − xm = 0 . lim h→0
216
0≤m≤M
2.35. Équations différentielles avec retard
6) Pour −n1 ≤ m ≤ 0, on a xm = φ(t−m ) = ym donc αm = xm − ym = 0. Pour 0 ≤ m ≤ M − 1, on a ⎧ ⎪ ⎨xm+1 = xm + hf (tm , xm , xm−n1 ) ⎪ ⎩
ym+1 = ym + hf (tm , ym , ym−n1 ) + ζm ,
d’où xm+1 −ym+1 ≤ xm −ym+hf (tm , xm , xm−n1 )−f (tm , ym , ym−n1 )+ζm . On a donc xm+1 −ym+1 ≤ αm +hL(αm +αm−n1 )+ζm = (1+hL)αm +hLαm−n1 +ζm , ce qui montre bien que xm+1 − ym+1 ≤ αm+1 . 7) a) On a, pour tout m ∈ [0, M −1], βm+1 (1 + hL)m+1 = (1 + hL)βm (1 + hL)m + hLβm−n1 (1 + hL)m−n1 + ζm , soit βm+1 = βm + ha(h)βm−n1 + εm avec a(h) = L(1 + hL)−n1 −1 et εm = ζm (1 + hL)−m−1 . On remarque que limh↓0 a(h) = Le−Lτ . b) Considérons la fonction θ(x) = 1 + a(h)xe−n1 x , on a θ (x) = a(h)e−n1 x (1 − n1 x), donc θ (0) = a(h). Comme Le−Lτ > 1, on obtient que pour tout h > 0 assez petit on a θ (0) > 1, impliquant que la fonction θ(x) − ex prend des valeurs positive pour x > 0 voisin de 0. Comme limx→+∞ (θ(x) − ex ) = −∞, il existe x ¯ > 0 tel que xe−n1 x¯ . ex¯ = 1 + a(h)¯ Choisissons c > 0 assez grand pour que Le−τ (L+c) < 1. Comme lim a(h)e−n1 ch = Le−τ (L+c) , h↓0
on a, pour tout h > 0 assez petit, a(h)e−n1 ch < 1, d’où ech ≥ 1 + ch > 1 + a(h)che−n1 ch = θ(ch), ¯ ≤ ch (on utilise le fait conduisant à θ(ch) − ech < 0, ce qui montre que x 1 x ¯ ). Posons alors Kh = , on a que θ(x) − ex est décroissante pour tout x ≥ n1 h Kh ≤ c et ehKh = 1 + a(h)hKh e−n1 hKh . (2.51) 217
Chapitre 2. Solutions
c) Posant alors βm = γm emhKh , on obtient après division par e(m+1)hKh et utilisant (2.51) γm+1 = e−hKh γm + (1 − e−hKh )γm−n1 + e−(m+1)hKh εm .
(2.52)
Posons, pour −n1 ≤ m ≤ M , γˆm = max−n1 ≤k≤m γk . On déduit de (2.52) que pour tout m ∈ [−n1 , M − 1], on a γˆm+1 ≤ γˆm + ζm (on a εj ≤ ζj ). Additionnant et notant que γˆ0 = 0, il vient γˆm ≤
m−1
ζj .
j=0
On obtient donc, pour tout m ∈ [1, M ], αm ≤ (1 + hl) e
m mhKh
m−1
εj ≤ (1 + hl) e
M M hKh
j=0
m−1
ζj
j=0
comme limh↓0 (1 + hL)M = eL(T −t0 ) et M h ≤ T − t0 et Kh ≤ c, il existe donc une constante C > 0 telle que (1 + hl)m emhKh ≤ C pour tout h > 0 assez petit. Il vient alors bien, xm − ym ≤ αm ≤ C
m−1
ζj .
j=0
2.36. Méthodes d’approximation de solutions d’équations différentielles EXERCICE La méthode de Runge-Kutta d’ordre 4 sur l’intervalle [a, a + h] avec N = 1 appliquée au problème de Cauchy : ⎧ ⎪ ⎨x (t) = f (t) ⎪ ⎩ 218
x(a) = 0,
2.36. Méthodes d’approximation de solutions d’équations différentielles
dont la solution est x(t) =
"t a
f (s) ds, conduit à
⎧ ⎪ ⎪k1 = f (a), ⎪ ⎪ h ⎪ ⎪ ⎪ t0,2 = a + ⎪ ⎪ 2 ⎪ ⎪ h ⎪ ⎪ k = x ⎪ 0,2 1 ⎪ ⎪ 2 ⎪ ⎪ h ⎪ ⎪ k2 = f (a + ) ⎪ ⎪ ⎪ 2 ⎪ ⎨ h x0,3 = k2 2 ⎪ ⎪ h ⎪ ⎪ k3 = f (a + ) ⎪ ⎪ 2 ⎪ ⎪ ⎪ ⎪ = h t 1 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪x0,4 = hk3 ⎪ ⎪ ⎪ ⎪ k4 = f (a + h) ⎪ ⎪ ⎪ ⎪ ⎩x = h k1 + 2k2 + 2k3 + k4 . 1 6 La valeur
h ) + f (a + h) 2 x1 = h 6 " a+h est alors une valeur approchée de x(a+h) = a f (s) dt, c’est la méthode d’intégration approchée de Simpson. On sait que l’ordre de l’erreur est en O(h4 ). f (a) + 4f (a +
PROBLÈME 1) L’application F est de classe C 3 car ses deux composantes le sont. Supposons que y est solution de y = f (y) avec y(a) = ya et y (a) = ya . Posant Y = (y, y ), on a Y (a) = (ya , ya ) et Y = (y , y ) = (y , f (y)) = F (Y ). Réciproquement, si Y = F (Y ), avec Y (a) = (ya , ya ), alors (y , y ) = (y , f (y)) donc y = f (y) et y(a) = ya , y (a) = ya . (δ1 + δ2 ) f (y). 2 Il en résulte bien que Φ(Y, 0) = F (Y ) si et seulement si δ1 + δ2 = 2. On en déduit alors que la méthode est consistante. 2) a) On a l1 (Y, 0) = l2 (Y, 0) = f (y), Φ1 (Y, 0) = z et Φ2 (Y, 0) =
b) Comme f est de classe C 3 , on a, pour tout y ∈ Rk et u ∈ Rk , f (y + u) − f (y) − Df (y)(u) −
u3 D2 f (y)(u, u) ≤C 2 6 219
Chapitre 2. Solutions
où C = supx∈[y,y+u] D3 f (x). Si y et y + v restent dans une boule fermée, on peut donc écrire D2 f (y)(u, u) + O(u3 ). 2 En particulier, on a donc, pour tout t ∈ [a, b] et pour tout h assez petit f (y + u) = f (y) + Df (y)(u) +
l2 (Y, h) = f (y + hα1 y + α2 h2 f (y) + hα1 Df (y)(y ) +
f (y) )= 2
α2 h2 h2 α21 2 Df (y)(f (y)) + D f (y)(y , y ) + O(h3 ). 2 2
Il en résulte que l2 (Y, h) = f (y) + hα1 Df (y)(y )+ h2 (α2 Df (y)(f (y)) + α21 D2 f (y)(y , y )) + O(h3 ). 2 c) On obtient alors y + hΦ1 (Y, h) = y + hy +
h2 (γ1 + γ2 )f (y)+ 2 h3 + γ2 α1 Df (y)(y ) + O(h4 ), 2
et y + hΦ2 (Y, h) = y + h
h2 δ1 + δ2 f (y) + δ2 α1 Df (y)(y)+ 2 2
h3 δ2 (α2 Df (y)(f (y)) + α21 D2 f (y)(y , y )) + O(h4 ). 4 Par ailleurs, on a y(t + h) = y + hy +
h2 h3 y + y + O(h4 ), 2 6
et
h2 h3 y + y + O(h4 ). 2 6 Comme y = f (y), on a y = Df (y)(y ) et y = D2 f (y)(y , y )+Df (y)(f (y)). On a donc y (t + h) = y + hy +
y(t + h) = y + hy +
h3 h2 f (y) + Df (y)(y ) + O(h4 ), 2 6
et y (t+h) = y +hf (y)+ 220
h2 h3 Df (y)(y )+ (D2 f (y)(y , y )+Df (y)(f (y)))+O(h4 ). 2 6
2.36. Méthodes d’approximation de solutions d’équations différentielles
3) En identifiant les coefficients dans les développements obtenus dans 2) c), on aura Y (t + h) − Y (t) − hΦ(Y (t), h) = O(h4 ), pourvu que ⎧ ⎪ γ1 + γ2 = 1 ⎪ ⎪ ⎪ ⎪ ⎪γ2 α1 = 1 ⎪ 3 ⎪ ⎪ ⎨δ + δ = 2 2 1 ⎪ α = 1 δ 2 1 ⎪ ⎪ ⎪ ⎪ ⎪ δ2 α2 = 23 ⎪ ⎪ ⎪ ⎩δ α2 = 2 . 2 1 3
(2.53)
4) La méthode donnée par ⎧ l1 = f (yn ), ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ l2 = f yn + ⎪ ⎪ ⎨
2hn yn 3
+
2h2n f (yn ) , 9
⎪ (l1 + l2 ) ⎪ ⎪ , yn+1 = yn + hn yn + h2n ⎪ ⎪ 4 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ (l1 + 3l2 ) ⎪ ⎩y n+1 = yn + hn 4 2 4 1 1 3 , α2 = , γ1 = γ2 = , δ1 = et δ2 = . Les rela3 9 2 2 2 tions (2.53) sont bien vérifiées, donc Y (t + h) − Y (t) − hΦ(Y (t), h) = O(h4 ) pour tout t ∈ [a, b], ce qui montre bien que la méthode proposée est d’ordre local 4 et d’ordre global 3. correspond à α1 =
5) On a k = 1 et f (y) = y. On a l1 = y0 = 1, l2 = 1 +
2h 3
+
2h2 9 .
On trouve
⎧ h2 h3 h4 ⎪ ⎪ ⎪ + + y1 = 1 + h + ⎪ ⎨ 2 6 18 ⎪ ⎪ ⎪ h2 h3 ⎪ ⎩y1 = 1 + h + + . 2 6
221
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
BIBLIOGRAPHIE
[1] D. Azé, Éléments d’analyse convexe et variationnelle, Ellipses, Paris, 1997. [2] D. Azé, Calcul différentiel ; équations différentielles, Cours polycopié, Université Paul Sabatier de Toulouse, http ://www.math-fonda.ups-tlse.fr/A0809/. [3] H. Cartan, Calcul différentiel, Hermann, Paris, 1977. [4] G. Christol, A. Cot, Ch.-M. Marle, Calcul différentiel, Ellipses, Paris, 1997. [5] P. Donato, Calcul différentiel pour la licence, Dunod, Paris, 2000. [6] M. Gostiaux, Cours de Mathématiques spéciales, tome 3, Presses Universitaires de France, Paris, 1995. [7] J.-B. Hiriart-Urruty, Les mathématiques du mieux faire, volume 1 : premiers pas en optimisation, Ellipses, Paris, 2007. [8] J.-B. Hiriart-Urruty, Calcul différentiel ; équations différentielles, polycopié d’un Cours, Université Paul Sabatier de Toulouse, tirage 1998. [9] M.W. Hirsch, S. Smale, Differential equations, dynamical systems and linear algebra, Academic Press, New York, 1974. [10] J. Hubbard, B. West, Équations différentielles et systèmes dynamiques, Cassini, 1999. [11] D. Leborgne, Calcul Différentiel et Géométrie, Presses Universitaires de France, Paris, 1982. [12] F. Rideau, Exercices de Calcul Différentiel, Hermann, Paris, 1979. [13] N. Rouché, J. Mahwin, Équations différentielles ordinaires, tome 1, Masson, Paris, 1973. [14] M. Schatzman, Analyse numérique. Cours et exercices pour la licence de mathématiques, Inter Éditions, Paris, 1991. [15] L. Schwartz, Analyse 2 : Calcul différentiel et équations différentielles, Hermann, Paris, 1992.
Calcul différentiel et équations différentielles
[16] P. Ver Eecke, Fondements du Calcul Différentiel, Presses Universitaires de France, Paris, 1985. [17] P. Ver Eecke, Applications du Calcul Différentiel, Presses Universitaires de France, Paris, 1985. [18] C. Wagschal, Calcul différentiel. Exercices et problèmes corrigés, Hermann, Paris, 1999. [4, 5] et les documents des auteurs [2, 8] sont les références qui nous semblent les mieux appropriées pour traiter le programme cité plus haut, compte tenu des populations d’étudiants arrivant ces dernières années en licences de mathématiques. [15] est très complet mais va bien au-delà de notre objectif. Il en est de même de la somme [16, 17]. Pour la partie sur les équations différentielles, [9, 13] sont des classiques qui résistent à l’épreuve du temps ; [6] illustre ce que nous disions en commentaire dans l’avant-propos sur les équations différentielles ; quant à [10], il sera difficile de faire mieux.
224