243 50 2MB
German Pages 214 Year 2013
Analysis II
Funktionen mehrerer Variablen
von
Prof. Dr. Friedmar Schulz Universität Ulm
Oldenbourg Verlag München
Prof. Dr. Friedmar Schulz war - nach Studium, Promotion und Habilitation in Mathematik an der Universität Göttingen – von 1985-1994 zunächst als Professor an der University of Iowa, Iowa City (USA), tätig. Seit 1994 ist er Professor und Direktor des Instituts für Analysis an der Universität Ulm, wo er auch Dekan der Fakultät für Mathematik und Wirtschaftswissenschaften und Studiendekan für die mathematischen Studiengänge war. Außerdem hat Professor Schulz verschiedene längere Auslandsaufenthalte u.a. an der University of Kentucky, Lexington (USA), Australian National University, Canberra (Australien), Universidad Nacional de Cuyo, Mendoza (Argentinien) und der Zhejiang University, Hangzhou (China), verbracht. Professor Schulz ist Hauptherausgeber der im Oldenbourg Verlag erscheinenden Zeitschrift Analysis. International mathematical journal of analysis and its applications.
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © 2013 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 143, D-81671 München Telefon: (089) 45051-0 www.oldenbourg-verlag.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Lektorat: Johannes Breimeier Herstellung: Tina Bonertz Einbandgestaltung: hauser lacour Gesamtherstellung: Grafik + Druck GmbH, München Dieses Papier ist alterungsbeständig nach DIN/ISO 9706. ISBN 978-3-486-58017-4 eISBN 978-3-486-71972-7
Vorwort Nach dem Erscheinen der zweiten Auflage der „Analysis I“ und der „Aufgabensammlung Analysis I“, freue ich mich, nun auch das ergänzende Lehrbuch Analysis II vorlegen zu können. Es ist hervorgegangen aus Vorlesungen über „Differential- und Integralrechnung II“ beziehungsweise „Analysis II“, welche ich an der Universität Ulm zuerst im Sommersemester 1995 und dann wiederholt für Studierende der Mathematik und Wirtschaftsmathematik und für Physikstudenten gehalten habe. Erkennbar ist hoffentlich immer noch der Stil meines akademischen Lehrers Professor Erhard Heinz, dem ich mich sehr verbunden fühle. Seine Anfängervorlesung „Differentialund Integralrechnung II“ habe ich im Sommersemester 1972 an der Universität Göttingen als Student gehört und im Sommersemester 1981 als Assistent betreut. Das Buch soll den Studierenden als Hilfestellung und ständigen Begleiter im Grundstudium dienen, auf welches sie auch im späteren Studium immer wieder zurückgreifen mögen. Deshalb wird der Lehrstoff der Analysis des zweiten Semesters ausführlicher dargestellt als dies in der Vorlesung selber möglich ist. Mathematische Ideen anschaulich zu motivieren und sie dann streng und systematisch zu fassen wird dabei – im Gegensatz zu bloßer Stoffvermittlung – als das eigentliche Ziel des Grundstudiums angesehen. Zum Bildungsanspruch der heutigen mathematischen Bachelor-Studiengänge sollte es gehören, Wissen im emphatischen Sinn zu lehren und lernen und nicht bloß Information zur raschen Verarbeitung und Ausbeutung bereitzustellen. Zum Inhalt hat der vorliegende Text den Lehrstoff der Analysis von Funktionen und Abbildungen mehrerer reeller Variablen des zweiten Semesters, nämlich den n-dimensionalen Zahlenraum Rn , die Theorie der stetigen Funktionen, die Differentialrechnung, die Abbildungssätze und das Riemannsche Integral. Die Darstellung ist meist konkret, das heißt, es wird die reell-mehrdimensionale Theorie entwickelt, mit anderen Worten: Es werden reelle Funktionen und Abbildungen f ∶ Rn → R beziehungsweise Rm betrachtet und nicht Abbildungen zwischen abstrakten Räumen. Allerdings werden die Begriffsbildungen meist so eingeführt, dass sie verallgemeinerungsfähig sind; es wird jedoch vermieden, diese auf Kosten der Anschaulichkeit schon gleich in abstrakten Räumen zu entwickeln. Auch werden allgemeine Verfahren bevorzugt. Gelegentlich wird jedoch darauf hingewiesen, wie sich die Analysis in abstrakten Räumen darstellt; diese Theorie sollte jedoch erst erst im Rahmen der Funktionalanalysis dargestellt werden.
VI
Vorwort
Im ersten Kapitel wird der n-dimensionale reelle Zahlenraum Rn mit seinen Strukturen vorgestellt. Zuerst die aus der Linearen Algebra bekannte Vektorraumstruktur mit dem für die Analysis wichtigen Begriff der Norm. Dann die metrische Struktur mit dem Konvergenzbegriff von Punktfolgen im Rn und schließlich die topologische Struktur. Kompakte Mengen werden wegen ihrer Bedeutung in einem abschließenden Abschnitt separat behandelt, ausführlich wird auf die drei Kompaktheitsbegriffe und ihre Beziehungen eingegangen. Das zweite Kapitel hat die Theorie der stetigen reellen Funktionen und Abbildungen zum Inhalt. Anhand von vielen Beispielen wird zunächst gezeigt, wie man sich Funktionen und Abbildungen veranschaulicht. Für die Bezeichnung von Polynomen und Multireihen führen wir die Multiindexschreibweise ein. Sie wird auch später zur Bezeichnung von höheren Ableitungen in der Taylorschen Formel verwendet. Dann wird der kontinuierliche Limes einer Funktion vorgestellt (im Gegensatz zum diskreten Grenzwert einer Punktfolge) sowie der Stetigkeitsbegriff. Der äußerst einfache Beweis des Kontraktionssatzes steht beispielhaft für ein verallgemeinerungsfähiges Verfahren. Zentral ist der Abschnitt über stetige Funktionen und Abbildungen auf kompakten Mengen mit dem Satz von Weierstraß vom Minimum und Maximum. Dieser wird mithilfe des Weierstraßschen Auswahlprinzips, also über die Folgen-Kompaktheit bewiesen, weil dies in der Variationsrechnung zu einem allgemeinen Prinzip führt. Erst dann wird der schwierige Begriff einer zusammenhängenden Menge ausführlich erklärt und der Zwischenwertsatz von Bolzano bewiesen. Im dritten Kapitel wird die Differentialrechnung dargestellt mit den drei Begriffen der partiellen, der reellen (oder totalen) Ableitung sowie der Richtungsableitung. Auf die geometrische Bedeutung des Gradienten wird ausführlich eingegangen. Ein zentraler Gegenstand der Differentialrechnung ist die Taylorsche Formel und deren Anwendungen in der „Kurvendiskussion“ mit den notwendigen und hinreichenden Kriterien für das Vorliegen eines lokalen Extremums. Abschließend findet sich eine ausführliche Darstellung der konvexen Funktionen. Im vierten Kapitel werden die Abbildungssätze behandelt: Zuerst der Satz über inverse Abbildungen, da er begrifflich leichter zu verstehen ist und im Gegensatz zum Satz über implizite Funktionen eine Entsprechung in der Analysis I besitzt. Der Satz über inverse Abbildungen wird schrittweise bewiesen, zunächst die lokale Injektivität, dann die lokale Surjektivität mithilfe der Methode der kleinsten Quadrate, also einem Minimierungprinzip, dann die Stetigkeit und schließlich die Differenzierbarkeit der Inversen; er wird also mit Methoden der klassischen Analysis bewiesen und nicht funktionalanalytisch mithilfe des Kontraktionssatzes. Abschließend werden mithilfe der Lagrangeschen Multiplikatiorenregel Extrema unter Nebenbedingungen diskutiert. Das fünfte Kapitel hat die Theorie des mehrdimensionalen Riemannschen Integrals zum Inhalt. Für die Darstellung sind die Bezeichnungen so gewählt, dass
Vorwort
VII
die Integrationstheorie für Funktionen von nur einer reellen Variablen zum Teil übernommen werden kann. Hier erweist sich die Verwendung der oben erwähnten Multiindexschreibweise als vorteilhaft. Mehrdimensionale Besonderheiten sind die Integration über Jordansche Bereiche, die Parameterintegrale und die sukzessive Integration. In dem vorliegenden Lehrbuch wird ganz bewußt auf eine Darstellung der Theorie der gewöhnlichen Differentialgleichungen verzichtet, diese ist Gegenstand einer separaten Vorlesung und es gibt eine Vielzahl von ausgezeichneten Lehrbüchern. Verzichtet wurde auch auf die Aufnahme von ausgewählten Kapiteln aus der Analysis, wie zum Beispiel einer Darstellung des Weierstraßschen Approximationssatzes im Rahmen einer Approximations- beziehungsweise Regularisierungstheorie, der Transformationsformel für n-fache Integrale und des Gaußschen Integralsatzes; allesamt Themen, welche üblicherweise in der Analysis III im dritten Semester behandelt werden und welche im zweiten Semester höchstens kurz angerissen werden können. Diese Themen und die Lebesguesche Integrationstheorie sollen zum Gegenstand eines ergänzenden Lehrbuchs „Analysis III“ werden. Ganz besonders herzlich möchte ich mich bei Frau Anette Lesle und Herrn Dr. Jan-Willem Liebezeit bedanken für ihre Hilfe, unermüdliche Geduld und Mühe bei der Erstellung des Manuskripts. Jan hat uns immer kundig unterstützt. Für sein Engagement bei der Anfertigung der Abbildungen, welche zum Teil auf Dr. Jens Dittrich zurückgehen, und der endgültigen LATEX-Gestaltung danke ich ihm besonders. Auch danke ich meinen Mitarbeitern Dipl.-Math. Lukas Bartholomäus und Frédéric Stoffers für ihre freundliche Hilfsbereitschaft sowie den Hörern meiner Vorlesungen, dass sie mir Korrekturen zu meinen Vorlesungsskripten haben zukommen lassen. Ich bitte die Leser dieses Buches, mir durch die Zusendung von Vorschlägen und Korrekturen an „[email protected]“ bei der Verbesserung des Textes behilflich zu sein. Ulm, Februar 2013
Friedmar Schulz „Die Mathematik ist eine gar herrliche Sache, aber die Mathematiker taugen oft den Henker nicht.“ Aphorismus von Georg Christoph Lichtenberg Sapere aude! Das heißt, habe den Mut, deinen Verstand zu benutzen.
Inhaltsverzeichnis Vereinbarungen
XI
1
Der n-dimensionale Euklidische Raum
1
1.1
Der Euklidische Vektorraum Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.2
Metrische Eigenschaften und Folgen im Rn . . . . . . . . . . . . . . . . . . . . . . .
7
1.3
Topologische Eigenschaften des R
1.4
Kompakte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2
Stetige Funktionen und Abbildungen
2.1
Funktionen und Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2
Der Limes von Funktionen und Abbildungen. . . . . . . . . . . . . . . . . . . . . . 38
2.3
Stetige Funktionen und Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.4
Der Banachsche Fixpunktsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.5
Stetige Funktionen und Abbildungen auf kompakten Mengen . . . . . 52
2.6
Stetige Funktionen und Abbildungen auf zusammenhängenden Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.7
Gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3
Differentialrechnung mehrerer Variablen
3.1
Partiell differenzierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.2
Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.3
Differenzierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.4
Richtungsableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.5
Totale Differentiale und die Taylorsche Formel . . . . . . . . . . . . . . . . . . . . 92
3.6
Lokale Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.7
Konvexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
n
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
27
67
X
Inhaltsverzeichnis
4
Differenzierbare Abbildungen
113
4.1
Differenzierbare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.2
Der Satz über inverse Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.3
Lokal und global umkehrbare Abbildungen. . . . . . . . . . . . . . . . . . . . . . . . 127
4.4
Der Satz über implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4.5
Extrema mit Nebenbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
5
Das Riemannsche Integral
5.1
Definition des Integrals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
5.2
Die Riemannsche Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
5.3
Eigenschaften integrierbarer Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 165
5.4
Jordansche Nullmengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
5.5
Integration über Jordansche Bereiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
5.6
Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
5.7
Grenzwertsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5.8
Parameterabhängige Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
5.9
Sukzessive Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
151
Literaturverzeichnis
191
Abbildungsverzeichnis
193
Schlagwortverzeichnis
197
Vereinbarungen Wir vereinbaren, dass folgende Ausdrücke in verkürzter Schreibweise wie folgt zu verstehen sind: • In Definitionen werden die Wörter „wenn“ beziehungsweise „falls“ anstelle des Ausdruckes „per definitionem genau dann, wenn“ verwendet, in Zeichen: „ ∶⇔“. • Das Zeichen „ ⇒“ bedeutet „wenn . . . , dann . . . “. • Das Zeichen „ ⇔“ bedeutet „genau dann, wenn“. • Das Ende eines Beweises kennzeichnen wir mit „ “. • δij ∶= {
1 für i = j 0 für i ≠ j.
ist das Kroneckersche δ-Symbol. • Vektoren x = (x1 , . . . , xn ) im Rn schreiben wir meist als Zeilenvektoren. ∂f ∂f Zum Beispiel ist der Gradient ∇f (x) = ( ∂x (x), . . . , ∂x (x)) einer dif1 n n ferenzierbaren Funktion f ∶ R → R ein Zeilenvektor. •
„ ⊺“
bezeichnet die Transposition von Matrizen. Ist x = (x1 , . . . , xn ) ein Zeilenvektor, so ist also ⎛ x1 ⎞ ⊺ x =⎜ ⋮ ⎟ ⎝xn ⎠ der dazugehörige Spaltenvektor. Meist unterscheiden wir sehr genau zwischen Zeilen- und Spaltenvektoren.
• Gelegentlich kann es aber vorkommen, dass wir nicht zwischen Zeilen- und Spaltenvektoren unterscheiden; wir sagen dann, dass wir sie „identifizieren“. Zum Beispiel schreiben wir manchmal statt A ○ (x − a)⊺ auch A ○ (x − a), dabei ist „ ○“ die Matrizenmultiplikation.
XII
Vereinbarungen • „o(⋅)“ bezeichnet das Landausche „klein-o-Symbol“. Ist zum Beispiel f ∶ Rn → R eine Funktion und a ein Punkt im Rn , so bedeutet f (x) = o(∣x − a∣) für x → a, dass lim
x→a
f (x) = 0. ∣x − a∣
1
Der n-dimensionale Euklidische Raum
Som m er
In der Analysis II behandeln wir Funktionen mehrerer unabhängiger Veränderlicher, insbesondere deren Differential- und Integralrechnung, weil in den Anwendungen eine abhängige Größe häufig von mehreren Parametern, den unabhängigen Variablen, bestimmt wird. Funktionen von mehreren Variablen eignen sich, solche Abhängigkeiten mathematisch zu modellieren. Misst man beispielsweise mit einem Sextanten den Kimmabstand des Sonnenunterrandes, so verändert sich dieser Höhenwinkel h mit der Zeit. Zwischen Sonnenauf- und Untergang ist er positiv und erreicht mittags sein Maximum bei der oberen Kulmination der Sonne. Der Höhenwinkel kann als Funktion allein der Zeit aufgefasst werden, wenn man von einer gegebenen Position des Beobachters ausgeht. Verändert man auch diese, so ist der Höhenwinkel h eine Funktion der drei Veränderlichen Zeit t, geographische Breite ϕ und Länge λ des Beobachters.
er int W Ost SO
Süd
SW West
h
Abbildung 1.1: Höhenwinkel und Sonnenstand
Zunächst werden wir uns mit dem Rn beschäftigen, welcher unser mathematisches Modell für einen Raum von n reellen Veränderlichen darstellt. Wir stellen die aus der Linearen Algebra bekannte Euklidische Vektorraumstruktur des Rn vor und wir untersuchen dann weitere Eigenschaften, insbesondere metrische und topologische Strukturen.
2
1 Der n-dimensionale Euklidische Raum
1.1 Der Euklidische Vektorraum Rn 1.1.1 Definition. Der n-dimensionale Raum Rn , n ∈ N, ist das n-fache Cartesische Produkt von R mit sich selbst,
Rn = R × ⋯ × R, ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¸ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¶ n-fach
das heißt, Vektoren oder Punkte im Rn sind geordnete n-Tupel x = (x1 , . . . , xn ) mit den Koordinaten oder Komponenten xi ∈ R, i = 1, . . . , n. 1.1.2 Lemma. (i) Seien x = (x1 , . . . , xn ) und x′ = (x′1 , . . . , x′n ) zwei Punkte im Rn . Dann ist x = x′ genau dann, wenn xi = x′i für i = 1, . . . , n. (ii) Der Rn ist ein n-dimensionaler Vektorraum oder linearer Raum mit dem Nullvektor oder Nullpunkt 0 ∶= (0, . . . , 0). Die Vektoraddition und die Multiplikation mit Skalaren sind für zwei Punkte x, x′ ∈ Rn und α ∈ R komponentenweise erklärt durch x + x′ ∶= (x1 + x′1 , . . . , xn + x′n ), αx ∶= (αx1 , . . . , αxn ). (iii) Die kanonischen Einheitsvektoren ek ∶= (0, . . . , 0, 1, 0, . . . , 0) , ↑ k-te Stelle k = 1, . . . , n, zeigen in Richtung der Koordinatenachsen und bilden die kanonische Basis des Rn . 1.1.3 Definition und Satz. Das Euklidische Skalarprodukt oder das innere Produkt auf dem Rn ist die Verknüpfung ( , ) ∶ Rn × Rn → R, definiert durch n
(x, x′ ) ↦ (x, x′ ) = x ⋅ x′ ∶= ∑ xi x′i . i=1
′
Dabei bezeichnet (x, x ) einerseits das geordnete Paar der Punkte x und x′ , andererseits auch das Skalarprodukt beider Vektoren. Für alle x, x′ , x′′ ∈ Rn und alle α, β ∈ R genügt es den Axiomen eines Skalarprodukts:
1.1 Der Euklidische Vektorraum Rn (i)
3
(αx + βx′ , x′′ ) = α(x, x′′ ) + β (x′ , x′′ ) (Linearität),
(ii) (x, x′ ) = (x′ , x) (Symmetrie), (iii) (x, x) ≥ 0, und (x, x) = 0 genau für x = 0 (Definitheit). 1.1.4 Definition. Ist (x, x′ ) = 0, so heißen x und x′ orthogonal, in Zeichen: x ⊥ x′ . 1.1.5 Beispiel. Wir betrachten die Ebene R2 und führen Polarkoordinaten ein. Sei x = (x1 , x2 ) = r (cos ϕ, sin ϕ), x′ = (x′1 , x′2 ) = r′ (cos ϕ′ , sin ϕ′ ) √ √ mit r = x21 + x22 , r′ = (x′1 )2 + (x′2 )2 , −π < ϕ, ϕ′ ≤ π. Dann ist nach dem Additionstheorem für den Cosinus
(x, x′ ) = x1 x′1 + x2 x′2 = rr′ (cos ϕ cos ϕ′ + sin ϕ sin ϕ′ ) = rr′ cos(ϕ − ϕ′ ). Also gilt (x, x′ ) = 0 genau dann, wenn einer der folgenden sechs Fälle eintritt: x = 0 oder x′ = 0 oder ϕ − ϕ′ = ±
π 3π oder ϕ − ϕ′ = ± . 2 2
1.1.6 Definition und Satz. Die Euklidische Norm oder der Absolutbetrag auf dem Rn ist die Abbildung ∣ ∣ ∶ Rn → R, definiert durch ¿ √ Án 2 À∑ x . x ↦ ∣x∣ ∶= (x, x) = Á i=1
i
Sie genügt für alle x, x′ ∈ Rn und alle α ∈ R den Axiomen einer Norm: (i)
∣x∣ ≥ 0, und ∣x∣ = 0 genau für x = 0 (Definitheit),
(ii) ∣αx∣ = ∣α∣ ∣x∣ (Homogenität), (iii) ∣x + x′ ∣ ≤ ∣x∣ + ∣x′ ∣ (Dreiecksungleichung). Beweis. Definitheit und Homogenität folgen sofort aus den Definitionen 1.1.3 und 1.1.6 von Skalarprodukt und Norm. Die Dreiecksungleichung ergibt sich aus der Cauchy-Schwarzschen Ungleichung, die wir wie folgt formulieren:
4
1 Der n-dimensionale Euklidische Raum
1.1.7 Lemma. Für alle x, x′ ∈ Rn gilt die Cauchy-Schwarzsche Ungleichung ∣(x, x′ )∣ ≤ ∣x∣ ∣x′ ∣ . Beweis. Seien x = (x1 , . . . , xn ), x′ = (x′1 , . . . , x′n ) ∈ Rn . Zu zeigen ist, dass ¿ ¿ n Án 2 Án ′ ′ À∑ x ⋅ Á À∑(x )2 . ∣ ∑ xi x ∣ ≤ Á i=1
i
i
i=1
i=1
i
Falls x = 0 oder x′ = 0, dann ist die Behauptung offensichtlich richtig. Seien also x ≠ 0 und x′ ≠ 0. Aufgrund der Linearität des Skalarprodukts ist die Behauptung dann äquivalent zu x x′ ∣( , ′ )∣ ≤ 1, ∣x∣ ∣x ∣ das heißt, zu zeigen ist lediglich, dass
¿ ¿ n Á Án ′ À∑ x2 = ∣x′ ∣ = Á À∑(x )2 = 1. ∣(x, x′ )∣ = ∣∑ xi x′i ∣ ≤ 1 für ∣x∣ = Á i i n
i=1
i=1
i=1
Dazu bemerken wir, dass aus (a − b)2 ≥ 0 folgt, dass 2ab ≤ a2 + b2 , weshalb xi x′i ≤ 12 (x2i + (x′i )2 ) für i = 1, . . . , n. Somit ist n
(x, x′ ) = ∑ xi x′i ≤ i=1
1 n 2 n ′ 2 1 (∑ xi + ∑(xi ) ) = (1 + 1) = 1 2 i=1 2 i=1
für ∣x∣ = ∣x′ ∣ = 1. Im Fall (x, x′ ) ≥ 0 ist die Behauptung damit bewiesen. Sonst betrachte man x und −x′ . Beweis der Dreiecksungleichung. Nach Definition von Skalarprodukt und Norm und wegen der Cauchy-Schwarzschen Ungleichung ist n
∣x + x′ ∣ = (x + x′ , x + x′ ) = ∑(xi + x′i )(xi + x′i ) 2
i=1
n
= ∑ (x2i + 2xi x′i + (x′i )2 ) = ∣x∣ + 2(x, x′ ) + ∣x′ ∣ i=1 2
2
2
≤ ∣x∣ + 2 ∣x∣ ∣x′ ∣ + ∣x′ ∣ = (∣x∣ + ∣x′ ∣) . 2
2
Hieraus folgt die Dreiecksungleichung ∣x + x′ ∣ ≤ ∣x∣ + ∣x′ ∣ . Aus der Dreiecksungleichung ergibt sich folgendes
1.1 Der Euklidische Vektorraum Rn
5
1.1.8 Korollar. Für alle x, x′ ∈ Rn gilt
∣∣x∣ − ∣x′ ∣∣ ≤ ∣x − x′ ∣ . Beweis. Aus ∣x∣ ≤ ∣x − x′ ∣ + ∣x′ ∣ folgt
∣x∣ − ∣x′ ∣ ≤ ∣x − x′ ∣ . Analog gilt ∣x′ ∣ − ∣x∣ ≤ ∣x − x′ ∣. Insgesamt haben wir also die behauptete Ungleichung ∣∣x∣ − ∣x′ ∣∣ ≤ ∣x − x′ ∣ . 1.1.9 Definition und Satz. Der Rn ist ein Euklidischer Raum, das heißt ein endlich-dimensionaler Vektorraum, in dem ein Skalarprodukt definiert ist. 1.1.10 Lemma. Sei x = (x1 , ..., xn ) ∈ Rn . Dann gilt (i) ∣xi ∣ ≤ ∣x∣ für i = 1, . . . , n. (ii) Aus ∣xi ∣ ≤ c für i = 1, . . . , n folgt, dass ∣x∣ ≤
√
nc.
√ Beweis. (I) Für i = 1, . . . , n ist offensichtlich ∣xi ∣ ≤
n
∑ x2i = ∣x∣.
i=1
(II) Aus ∣xi ∣ ≤ c für alle i = 1, . . . , n folgt, dass
¿ ¿ Án 2 Án À∑ x ≤ Á À∑ c2 = √nc. ∣x∣ = Á i i=1
i=1
1.1.11 Bemerkungen. (i) Ist auf einem (abstrakten) reellen Vektorraum V ein Skalarprodukt ( , ) ∶ V × V → R erklärt, welches für alle x, x′ , x′′ ∈ V und α, β ∈ R den obigen Axiomen eines Skalarprodukts genügt, so heißt V beziehungsweise das geordnete Paar (V, ( , )) ein Skalarproduktraum. (ii) Ein Vektorraum V heißt normiert, falls eine Norm ∥ ∥ ∶ V → R erklärt ist, welche für alle x, x′ ∈ V und alle α ∈ R den folgenden Axiomen einer Norm genügt: (a) ∥x∥ ≥ 0, und ∥x∥ = 0 genau für x = 0 (Definitheit) (b) ∥αx∥ = ∣α∣ ∥x∥ (Homogenität), (c) ∥x + x′ ∥ ≤ ∥x∥ + ∥x′ ∥ (Dreiecksungleichung).
6
1 Der n-dimensionale Euklidische Raum
(iii) Ein Skalarproduktraum wird durch die Setzung √ ∥x∥ ∶= (x, x) für alle x ∈ V zu einem normierten Vektorraum. ∥ ∥ heißt auch die durch ( , ) induzierte Norm. Es gilt dann die Cauchy-Schwarzsche Ungleichung; der obige Beweis kann allerdings nur im Fall eines endlich-dimensionalen Raumes übernommen werden. 1.1.12 Beispiele. (i) Der Rn ist, zusammen mit dem Euklidischen Skalarprodukt, ein Skalarproduktraum und deshalb, zusammen mit der Euklidischen Norm, ein normierter Vektorraum. (ii) Für jede reelle Zahl p ∈ R, 1 ≤ p < +∞, ist durch n
p
1 p
∥x∥p ∶= (∑ ∣xi ∣ ) i=1
für alle x = (x1 , . . . , xn ) ∈ Rn eine Norm, die p-Norm, auf dem Rn erklärt. Die Dreiecksungleichung heißt auch Minkowskische Ungleichung und bedarf eines Beweises. Der Fall p = 2 entspricht der Euklidischen Norm:
∥x∥2 = ∣x∣ für alle x ∈ Rn . (iii) Durch
∥x∥∞ ∶= max ∣xi ∣ i=1,...,n
ist auf dem R die Maximumsnorm erklärt. n
1.1.13 Beispiel. Auf dem Vektorraum Rm×n der reellen m × n-Matrizen
⎛ a11 ⋯ a1n ⎞ ⋮ ⎟ A = (ajk )j =1,...,m = ⎜ ⋮ k=1,...,n ⎝am1 ⋯ amn ⎠ ist durch
∥A∥ ∶= sup x∈R x≠0
n
∥ A ○ x∥ 2 ∣A ○ x∣ = sup n ∣x∣ ∥x∥2 x∈R x≠ 0
die Matrixnorm, genauer die Abbildungsnorm einer Matrix, erklärt. Dabei ⎛ x1 ⎞ ist ○ die Matrizenmultiplikation und x = ⎜ ⋮ ⎟ wird als Spaltenvektor aufgefasst. ⎝xn ⎠ Es gilt ∥A∥ = sup ∣A ○ x∣ = sup ∣A ○ x∣ = sup ∣A ○ x∣ . ∣x∣=1
∣x∣≤1
∣x∣ 0, kurz die offene ε-Umgebung von a. a heißt Zentrum von Uε (a). Kε (a) = U ε (a) ∶= { x ∈ Rn ∣ ∣x − a∣ ≤ ε } ist die abgeschlossene ε-Umgebung von a. (ii) Für a, b ∈ Rn , a = (a1 , . . . , an ), b = (b1 , . . . , bn ), ai < bi für i = 1, . . . , n, heißt
(a, b) ∶= { x ∈ Rn ∣ ai < xi < bi } = (a1 , b1 ) × ⋯ × (an , bn ) ein offenes, n-dimensionales Intervall, für n = 2 auch ein offenes Rechteck und für n = 3 ein offener Quader. Die Intervalle (a1 , b1 ), . . . , (an , bn ) heißen auch die Kanten von (a, b). Bei gleichen Kantenlängen, das heißt für b1 − a1 = ⋯ = bn − an , ist (a, b) für n = 2 ein offenes Quadrat und für n = 3 ein offener Würfel. Analog ist
[a, b] ∶= [a1 , b1 ] × ⋯ × [an , bn ] ein abgeschlossenes, n-dimensionales Intervall und
[a, b) ∶= [a1 , b1 ) × ⋯ × [an , bn ) , (a, b] ∶= (a1 , b1 ] × (a2 , b2 ] × ⋯ × (an , bn ] sind Beispiele halboffener, n-dimensionaler Intervalle. 1.2.3 Bemerkungen. (i) Ein Intervall bezeichnen wir oft durch I = Ia,b , insbesondere wenn nicht festgelegt wird, ob es offen, abgeschlossen oder halboffen sein soll.
8
1 Der n-dimensionale Euklidische Raum
(ii) Ein Intervall I = Ia,b heißt ausgeartet, falls es ein i ∈ { 1, . . . , n } gibt mit ai = bi . Wir schreiben a < b genau dann, wenn ai < bi für alle i = 1, . . . , n gilt. Diese Relation ist eine Ordnungsrelation, jedoch keine lineare Ordnung. Falls a < b gilt, so ist I = Ia,b nicht-ausgeartet. 1.2.4 Definition. (i) Eine Punktfolge (xk )k∈N , xk ∈ Rn , heißt beschränkt, falls es ein c ∈ R, c > 0, gibt mit
∣xk ∣ ≤ c für alle k ∈ N. (ii) Die Punktfolge (xk )k∈N heißt konvergent, wenn es einen Punkt x ∈ Rn gibt, so dass lim ∣xk − x∣ = 0 k→∞
gilt, das heißt, zu jedem ε > 0 gibt es ein N = N (ε) ∈ N mit ∣xk − x∣ < ε beziehungsweise xk ∈ Uε (x) für alle k ∈ N, k ≥ N , in Zeichen xk → x für k → ∞. (iii) (xk )k∈N heißt eine Cauchy-Folge, falls es zu jedem ε > 0 ein N = N (ε) ∈ N gibt mit ∣xk − x` ∣ < ε für alle k, ` ∈ N, k, ` ≥ N. Wir zeigen, dass die Konvergenz einer Punktfolge im Rn äquivalent zur komponentenweisen Konvergenz ist: (k )
(k )
1.2.5 Satz. (i) Eine Folge (xk )k∈N , xk = (x1 , . . . , xn ) ∈ Rn , konvergiert genau dann gegen einen Punkt x = (x1 , . . . , xn ) ∈ Rn , das heißt, es gilt xk → x für k → ∞, (k )
wenn für alle i = 1, . . . , n die Folge der i-ten Komponenten (xi )k∈N in R gegen xi ∈ R konvergiert, das heißt (k )
xi
→ xi für k → ∞ für alle i = 1, . . . , n.
(ii) Die Folge (xk )k∈N ist genau dann eine Cauchy-Folge im Rn , wenn die Folgen (k ) (xi )k∈N der Komponenten für alle i = 1, . . . , n Cauchy-Folgen in R sind. Beweis. Wir zeigen lediglich die Behauptung (i) mit Hilfe von Lemma 1.1.10. Der Beweis der Aussage (ii) ist analog.
1.2 Metrische Eigenschaften und Folgen im Rn
9
„ ⇒“ Sei xk → x für k → ∞. Dann folgt (k )
∣xi (k )
für i = 1, . . . , n, also xi
− xi ∣ ≤ ∣xk − x∣ → 0
→ xi für k → ∞. (k)
„ ⇐“ Umgekehrt folgt aus xi → xi für i = 1, . . . , n, dass ¿ Á n (k) À∑(x − xi )2 ≤ √n max ∣x(k) − xi ∣ → 0 für k → ∞. ∣xk − x∣ = Á i i i=1,...,n
i=1
Viele Eigenschaften konvergenter reeller Zahlenfolgen übertragen sich auf konvergente Punktfolgen im Rn . Als Korollar zu Satz 1.2.5 haben wir beispielsweise: 1.2.6 Lemma und Definition. (i) Der Limes oder Grenzwert x =∶ lim xk einer konvergenten Folge (xk )k∈N im Rn ist eindeutig bestimmt.
k→∞
(ii) Jede konvergente Folge (xk )k∈N im Rn ist beschränkt. 1.2.7 Cauchysches Konvergenzprinzip im Rn . Eine Folge (xk )k∈N im Rn ist genau dann konvergent, wenn sie eine Cauchy-Folge ist. Beweis. Die Folge (xk )k∈N sei konvergent im Rn . Aufgrund von Satz 1.2.5 (i) (k ) bedeutet dies, dass die Folgen (xi )k∈N für i = 1, . . . , n konvergieren. Weil das Cauchysche Konvergenzprinzip in R richtig ist, ist dies äquivalent dazu, dass die (k ) Folgen (xi )k∈N für i = 1, . . . , n Cauchy-Folgen in R sind. Wegen Satz 1.2.5 (ii) ist dies wiederum äquivalent dazu, dass (xk )k∈N eine Cauchy-Folge im Rn ist. 1.2.8 Weierstraßsches Auswahlprinzip. Jede beschränkte Folge (xk )k∈N im Rn besitzt einen Häufungswert x ∈ Rn , das heißt, sie enthält eine konvergente Teilfolge (xk` )`∈N , k` < k`+1 für ` ∈ N, mit xk` → x ∈ Rn für ` → ∞. (k)
Beweis. Wegen ∣xi ∣ ≤ ∣xk ∣ ≤ c < ∞ für i = 1, . . . , n, k ∈ N, gibt es nach dem Weierstraßschen Auswahlprinzip in R eine Teilfolge (xk`1 )`
1 ∈N
( k `1 )
x1
→ x1 ∈ R für `1 → ∞.
Weiterhin gibt es eine Teilfolge (xk`1 ` ) 2
(k`1 ` )
x2
2
`2 ∈N
von (xk`1 )`
→ x2 ∈ R für `2 → ∞,
1 ∈N
mit
von (xk )k∈N mit
10
1 Der n-dimensionale Euklidische Raum
und außerdem gilt natürlich (k`1 ` )
x1
2
→ x1 für `2 → ∞.
Durch n-faches Auswählen von Teilfolgen erhalten wir eine Teilfolge
(xk`1 ⋱ ) `n
`n ∈N
von (xk )k∈N mit (k`1 ⋱
xi
`n
)
→ xi ∈ R für `n → ∞
für i = 1, . . . , n, das heißt, es gilt xk`1 ⋱ Setzen wir ` = `n und
`n
→ (x1 , . . . , xn ) =∶ x ∈ Rn für `n → ∞. xk` ∶= xk`1 ⋱
`n−1 `
,
so haben wir xk` → x für ` → ∞ wie behauptet. 1.2.9 Definition und Lemma. Sei A eine Punktmenge im Rn . (i)
Dann heißt A beschränkt, falls es ein c ∈ R, c > 0, gibt mit
∣x∣ ≤ c für alle x ∈ A, das heißt A ⊂ Kc (0) = { x ∈ Rn ∣ ∣x∣ ≤ c }. (ii)
x ∈ Rn heißt ein Häufungspunkt von A, wenn es zu jedem ε > 0 ein x′ = x′ (ε) ∈ A gibt mit x′ ≠ x und x′ ∈ Uε (x), das heißt, es gibt eine Folge (xk )k∈N in A mit xk ≠ x für alle k ∈ N und xk → x für k → ∞. Die Menge aller Häufungspunkte von A wird mit H (A) bezeichnet.
(iii) x ∈ Rn heißt ein isolierter Punkt von A, wenn x ∈ A und x ∈/ H (A). (iv) Eine Teilmenge A ⊂ Rn heißt abgeschlossen oder folgen-abgeschlossen, wenn für jede Folge (xk )k∈N in A mit xk → x ∈ Rn folgt, dass x ∈ A, das heißt, wenn H (A) ⊂ A gilt. Abgeschlossene Mengen bezeichnen wir häufig mit dem Buchstaben F (französisch für abgeschlossen: fermé). (v)
Die Menge A¯ ∶= A ∪ H (A) heißt die abgeschlossene Hülle oder der Ab¯ wenn es eine schluss von A, das heißt, x ∈ Rn gehört genau dann zu A, Folge (xk )k∈N in A gibt mit xk → x für k → ∞.
1.2 Metrische Eigenschaften und Folgen im Rn
11
(vi) x ∈ Rn ist ein Randpunkt von A, wenn es zu jedem ε > 0 zwei Punkte x′ , x′′ ∈ Uε (x) gibt mit x′ ∈ A und x′′ ∈/ A, das heißt, es gibt Folgen (x′k )k∈N in A und (x′′k )k∈N in C A mit x′k → x und x′′k → x, das heißt x ∈ A¯ ∩ C A. Die Menge ∂A aller Randpunkte von A heißt der Rand von A. (vii) Eine Teilmenge B ⊂ A liegt dicht in A ⊂ Rn , wenn es zu jedem x ∈ A eine ¯ Folge (xk )k∈N in B gibt mit xk → x für k → ∞, das heißt, es gilt A ⊂ B. x2
{ λx0 ∣ λ ≥ 0 } ε 2 ε 2
x0
x′′
x′
Uε (x0 )
x1
U1 (0)
Abbildung 1.2: Der Rand der Einheitskugel
1.2.10 Beispiele. (i) Sei A = U1 (0) = { x ∈ Rn ∣ ∣x∣ < 1 } und sei x0 ∈ Rn mit ∣x0 ∣ = 1. Dann gilt x0 ∈ H (A), x0 ∈ H (C A) und x0 ∈ ∂A, denn für 0 < ε < 1 sei x′ ∶= (1 − 2ε ) x0 , x′′ ∶= (1 + 2ε ) x0 gesetzt (vergleiche Abbildung 1.2). Dann folgt ∣x′ ∣ = 1 − 2ε , ∣x′′ ∣ = 1 + 2ε , also x′ ∈ A, x′ ≠ x0 , x′′ ∈/ A, x′′ ≠ x0 und ∣x′ − x0 ∣ = 2ε , ∣x′′ − x0 ∣ = 2ε , also x′ , x′′ ∈ Uε (x0 ). Weiterhin gilt ∂A = ∂U1 (0) = { x ∈ Rn ∣ ∣x∣ = 1 } .
12
1 Der n-dimensionale Euklidische Raum
(ii) Die Menge A = KR (a) = { x ∈ Rn ∣ ∣x − a∣ ≤ R }, a ∈ Rn , R > 0, ist abgeschlossen: Denn sei (xk )k∈N eine Folge in A mit xk → x ∈ Rn . Zu zeigen ist, dass x ∈ A. Dazu sei ε > 0. Dann gibt es ein N ∈ N mit ∣xk − x∣ < ε für alle k ∈ N, k ≥ N . Außerdem gilt ∣xk − a∣ ≤ R für alle k ∈ N. Daraus folgt
∣x − a∣ ≤ ∣x − xk ∣ + ∣xk − a∣ < ε + R für alle ε > 0, also ∣x − a∣ ≤ R, das heißt x ∈ A. (iii) Der Abschluss von U1 (0) = { x ∈ Rn ∣ ∣x∣ < 1 } ist U1 (0) = U1 (0) ∪ { x ∈ Rn ∣ ∣x∣ = 1 } = { x ∈ Rn ∣ ∣x∣ ≤ 1 } = K1 (0). (iv) Sei A = { x ∈ Rn ∣ Außerdem ist
1 2
< ∣x∣ < 1 } ∪ { 0 }. Dann ist 0 ein isolierter Punkt von A. H (A) = { x ∈ Rn ∣
also
1 ≤ ∣x∣ ≤ 1 } , 2
1 A¯ = A ∪ H (A) = { x ∈ Rn ∣ ≤ ∣x∣ ≤ 1 } ∪ { 0 } . 2
Weiterhin gilt 1 oder ∣x∣ = 1 oder x = 0 } 2 = ∂U1 (0) ∪ ∂U 12 (0) ∪ { 0 } .
∂A = { x ∈ Rn ∣ ∣x∣ =
(v) Q liegt dicht in R. Genauso gilt: Qn liegt dicht im Rn . 1.2.11 Satz von Bolzano-Weierstraß für Punktmengen im Rn . Jede beschränkte unendliche Punktmenge A ⊂ Rn besitzt mindestens einen Häufungspunkt. 1.2.12 Lemma. Die Menge H (A) der Häufungspunkte einer Menge A ⊂ Rn ist stets abgeschlossen. Beweis. Sei (xk )k∈N eine Folge in H (A) mit xk → x ∈ Rn . Zu zeigen ist, dass x ∈ H (A). Dazu wähle zu jedem k ∈ N ein x′k ∈ A, x′k ≠ x, mit ∣x′k − xk ∣ < k1 . Dann folgt 1 ∣x′k − x∣ ≤ ∣x′k − xk ∣ + ∣xk − x∣ < + ∣xk − x∣ → 0 für k → ∞, k also ist x ∈ H (A).
1.2 Metrische Eigenschaften und Folgen im Rn
13
1.2.13 Lemma. Die abgeschlossene Hülle A¯ = A ∪ H (A) einer Menge A ⊂ Rn ist stets abgeschlossen. Beweis. Sei (xk )k∈N eine Folge in A¯ = A ∪ H (A) mit xk → x ∈ Rn . Es ist zu ¯ Zu jedem k ∈ N wähle ein x′ ∈ A mit ∣x′ − xk ∣ < 1 . Dann folgt zeigen, dass x ∈ A: k k k offenbar, dass ∣x′k − x∣ → 0 für k → ∞. Falls x′k ≠ x für alle k ∈ N gilt, dann ist ¯ Ist x′ = x für ein k, so ist x = x′ ∈ A ⊂ A. ¯ x ∈ H (A) ⊂ A. k
k
1.2.14 Lemma. Eine Menge A ⊂ Rn ist genau dann abgeschlossen, wenn eine, und somit alle, der folgenden Eigenschaften erfüllt ist: (i) H (A) ⊂ A, (ii) A¯ = A. Beweis. (I) Sei A abgeschlossen und sei x ∈ H (A). Dann gibt es eine Folge (xk )k∈N in A mit xk ≠ x für alle k ∈ N und xk → x für k → ∞. Weil A abgeschlossen ist, muss x ∈ A sein. Also gilt dann H (A) ⊂ A. (II) Aus H (A) ⊂ A folgt, dass A¯ = A ∪ H (A) ⊂ A, weshalb A¯ = A ist. ¯ also A dann abge(III) Sei A¯ = A. Wegen des vorigen Lemmas 1.2.13 ist A, schlossen. 1.2.15 Lemma. Die Menge ∂A aller Randpunkte von A ⊂ Rn ist stets abgeschlossen. Beweis. Sei (xk )k∈N eine Folge in ∂A mit xk → x ∈ Rn . Es ist zu zeigen, dass x ∈ ∂A. Dazu wähle für alle k ∈ N zwei Punkte x′k ∈ A, x′′k ∈/ A mit
∣x′k − xk ∣
0 gibt es ein N ∈ N mit xk ∈ Uε (x) für alle k ∈ N, k ≥ N. (v) Das Cauchysche Konvergenzprinzip und das Weierstraßsche Auswahlprinzip gilt in allgemeinen metrischen Räumen nicht. Ein metrischer Raum (X, d), in welchem jede Cauchy-Folge gegen einen Grenzwert x ∈ X konvergiert, das heißt das Cauchysche Konvergenzprinzip erfüllt, heißt vollständig. Ein vollständiger, normierter Vektorraum heißt ein Banachraum. (vi) Eine Teilmenge A ⊂ X heißt abgeschlossen oder auch vollständig, falls jede Cauchy-Folge in A einen Grenzwert in A besitzt. 1.2.17 Beispiele. (i) Bezeichnet d(x, x′ ) = ∣x − x′ ∣ für x, x′ ∈ Rn den Abstand auf dem Rn , so ist (Rn , d) ein vollständiger metrischer Raum. (ii) Jeder endlich-dimensionale Vektorraum wird, nach Wahl einer Basis, auf kanonische Weise zu einem vollständigen normierten Vektorraum, also zu einem Banachraum.
1.3 Topologische Eigenschaften des Rn
15
(iii) Sei X eine beliebige Menge. Dann heißt 1 d(x, x′ ) ∶= { 0
für x ≠ x′ für x = x′
die diskrete Metrik. Eine Folge (xk )k∈N konvergiert genau dann bezüglich der diskreten Metrik gegen x ∈ X, falls es ein N ∈ N gibt mit xk = x für alle k ∈ N, k ≥ N . Jede Teilmenge A ⊂ X ist bezüglich der diskreten Metrik abgeschlossen.
1.3 Topologische Eigenschaften des Rn 1.3.1 Definition und Lemma. Sei A eine Punktmenge im Rn . (i) Dann heißt x ∈ A ein innerer Punkt von A und A heißt eine Umgebung von x, wenn es ein ε > 0 gibt mit Uε (x) = { x′ ∈ Rn ∣ ∣x′ − x∣ < ε } ⊂ A. ˚ ⊂ A aller inneren Punkte von A ist das Innere oder der offene Die Menge A Kern von A. (ii) A ⊂ Rn heißt offen, wenn es zu jedem x ∈ A ein ε > 0 gibt mit Uε (x) ⊂ A, das ˚ gilt, das heißt, wenn A nur aus inneren Punkten besteht, heißt, wenn A = A mit anderen Worten, wenn A Umgebung jedes ihrer Punkte ist. (iii) A ⊂ Rn heißt (topologisch) abgeschlossen, wenn C A offen ist. 1.3.2 Beispiele. (i) Sei A = Uε (a), a ∈ Rn , ε > 0. Dann ist A offen. Denn sei x ∈ Uε (a). Dann ist ε′ ∶= ε − ∣x − a∣ > 0. Wir zeigen, dass Uε′ (x) ⊂ Uε (a) gilt, damit ist dann Uε (a) offen: Sei x′ ∈ Uε′ (x), also ∣x′ − x∣ < ε′ . Dann ist
∣x′ − a∣ ≤ ∣x′ − x∣ + ∣x − a∣ < ε′ + ∣x − a∣ = ε, das heißt x′ ∈ Uε (a) (vergleiche Abbildung 1.3). ˚ = { x ∈ Rn ∣ ∣x∣ < 1 }. A ist abgeschlos(ii) Sei A = { x ∈ Rn ∣ ∣x∣ ≤ 1 }. Dann ist A n sen, weil C A = { x ∈ R ∣ ∣x∣ > 1 } offen ist. Ohne Beweis erwähnen wir:
16
1 Der n-dimensionale Euklidische Raum
ε
a
∣x − a∣
Uε′ (x) x ε′
Uε (a)
Abbildung 1.3: Offene Kugeln sind offene Mengen
1.3.3 Satz. Eine nicht-leere Teilmenge A ⊂ R ist genau dann offen, wenn es abzählbar viele paarweise disjunkte offene Intervalle Ik = (ak , bk ), ak ∈ R∪{ −∞ }, bk ∈ R ∪ { +∞ }, ak < bk , gibt mit A = ⋃ Ik . k
Hierbei heißt eine Menge abzählbar, wenn sie endlich oder abzählbar unendlich ist. ˚ einer Menge A ⊂ Rn ist eine offene Menge. 1.3.4 Lemma. Das Innere A ˚ Dann gibt es ein ε > 0 mit Uε (x) ⊂ A. Für jedes x′ ∈ Uε (x) Beweis. Sei x ∈ A. ˚ Somit ist gibt es dann ein ε′ > 0 mit Uε′ (x′ ) ⊂ Uε (x) ⊂ A, weshalb x′ ∈ A. ˚ und deshalb offen. Uε (x) ⊂ A 1.3.5 Lemma. Eine Teilmenge A ⊂ Rn ist genau dann offen, wenn C A (topologisch) abgeschlossen ist. Beweis. Nach Definition 1.3.1 (iii) ist A = C(C A) genau dann offen, wenn C A abgeschlossen ist.
1.3 Topologische Eigenschaften des Rn
17
1.3.6 Satz. Eine Teilmenge A ⊂ Rn ist genau dann (topologisch) abgeschlossen, wenn sie folgen-abgeschlossen ist. Beweis. „ ⇒“ Sei A topologisch abgeschlossen und sei (xk )k∈N eine Folge in A mit xk → x ∈ Rn . Es ist zu zeigen, dass x ∈ A gilt: Angenommen x ∈/ A, das heißt x ∈ C A, wobei C A offen ist. Dann gibt es ein ε > 0 mit Uε (x) ⊂ C A. Aus der Konvergenz folgt jedoch, dass für hinreichend großes N ∈ N immer xN ∈ Uε (x) gilt. Das ergibt einen Widerspruch zu xN ∈ A. „ ⇐“ Sei A folgen-abgeschlossen. Es ist zu zeigen, dass C A offen ist. Wir gehen wieder indirekt vor. Angenommen es gibt ein x ∈ C A, so dass für alle ε > 0 gilt: Uε (x) ⊂/ C A. Für jedes k ∈ N gibt es also ein xk ∈ U k1 (x) mit xk ∈ A. Das hieße aber xk → x und somit auch x ∈ A, was unserer Annahme widerspricht. 1.3.7 Satz und Definition. Das Mengensystem T = { U ⊂ Rn ∣ U offen } aller offenen Teilmengen des Rn ist eine Topologie, das heißt, es genügt den folgenden Fundamentaleigenschaften: (i)
∅, Rn ∈ T , das heißt, die leere Menge und der gesamte Raum sind offen.
(ii) Sei T ′ ⊂ T ein Teilsystem offener Mengen. Dann ist auch ⋃ U ∈ T , das U ∈T ′
heißt, die Vereinigung beliebig vieler offener Mengen ist offen.
(iii) Sei T ′ ⊂ T ein endliches Teilsystem. Dann ist auch ⋂ U ∈ T , das heißt, U ∈T ′
der Durchschnitt endlich vieler offener Mengen ist offen. Beweis. (I) Die leere Menge ist offen, denn die Annahme x ∈ ∅ ist immer falsch. Der Rn ist offen, denn für alle x ∈ Rn gilt U1 (x) ⊂ Rn . (II) Sei x ∈ ⋃ U , das heißt, es gibt ein U ∈ T ′ mit x ∈ U . Da U offen ist, U ∈T ′
existiert ein ε > 0 mit Uε (x) ⊂ U ⊂ ⋃ U , das heißt, ⋃ U ist offen. U ∈T ′
U ∈T ′
(III) Sei x ∈ ⋂ U , das heißt x ∈ U für alle U ∈ T ′ . Dann gibt es zu jedem U ∈T ′
U ∈ T ′ ein ε = ε(U ) > 0 mit Uε (x) ⊂ U . Da T ′ endlich ist, existiert ε0 ∶= min { ε ∣ ε = ε(U ), U ∈ T ′ } > 0. Dann gilt aber Uε0 (x) ⊂ Uε (x) ⊂ U für alle U ∈ T ′ und folglich Uε0 (x) ⊂ ⋂ U , das heißt, ⋂ U ist offen. U ∈T ′
U ∈T ′
18
1 Der n-dimensionale Euklidische Raum
1.3.8 Satz. Das System F = { F ⊂ Rn ∣ F abgeschlossen } aller abgeschlossenen Teilmengen des Rn besitzt die folgenden Eigenschaften: (i)
∅, Rn ∈ F , das heißt, die leere Menge und der gesamte Raum sind abgeschlossen.
(ii) Sei F ′ ⊂ F ein Teilsystem abgeschlossener Mengen. Dann ist auch ⋂ F ∈ F ∈F ′
F , das heißt, der Durchschnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen. (iii) Sei F ′ ⊂ F ein endliches Teilsystem. Dann ist auch ⋃ F ∈ F , das heißt, F ∈F ′
die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen. Beweis. Die Aussagen folgen unmittelbar aus 1.3.7 mit Hilfe der De Morganschen Regeln. Die folgenden Aussagen beweise man zur Übung: 1.3.9 Lemma. (i)
A ⊂ Rn ist genau dann offen, wenn A ∩ ∂A = ∅.
(ii) A ist genau dann abgeschlossen, wenn ∂A ⊂ A. ˚ ist die größte offene Menge, die in A enthalten ist: (iii) A ˚ = ⋃ { U ∣ U ⊂ A, U offen } , A (iv) A¯ ist die kleinste abgeschlossene Menge, die A umfasst: A¯ = ⋂ { F ∣ F ⊃ A, F abgeschlossen } , (v)
˚ = A ∖ ∂A, A¯ = A ∪ ∂A. A
˚∪⋅ ∂A, ∂A = A¯ ∖ A, ˚ hierbei bedeutet ∪⋅ disjunkte Vereinigung. (vi) A¯ = A ˚) = C A, C(A¯) = (C˚A). (vii) C(A 1.3.10 Bemerkungen. (i) Es sei X eine (abstrakte) Menge und T ⊂ P(X ) ein System von Teilmengen von X, dabei ist P(X ) die Potenzmenge von X, das heißt die Menge aller Teilmengen von X. Dann heißt das Paar (X, T ) ein topologischer Raum, falls T den drei Axiomen einer Topologie genügt, das heißt, es gilt (a) ∅, X ∈ T ,
1.4 Kompakte Mengen (b) (c)
19
⋃ ∈ T für alle T ′ ⊂ T ,
U ∈T ′
⋂ ∈ T für jedes endliche T ′ ⊂ T .
U ∈T ′
Die Elemente von T heißen offene Mengen. (ii) Ein beliebiger metrischer Raum (X, d) wird automatisch zu einem topologischen Raum, beziehungsweise er induziert die kanonische Topologie auf X, wenn man eine Teilmenge A ⊂ X offen nennt, falls es zu jedem x ∈ A ein ε > 0 gibt mit Uε (x) = { x′ ∈ X ∣ d(x′ , x) < ε } ⊂ A. Damit ist dann auch jeder normierte Vektorraum (V, ∥ ∥) ein topologischer Raum. 1.3.11 Beispiele. (i) Die auf dem Rn durch die p-Normen für p ∈ R, 1 ≤ p ≤ +∞, induzierten Topologien sind alle gleich, das heißt, für 1 ≤ p ≤ +∞ ist eine Menge A ⊂ Rn genau dann offen (im üblichen Sinn), wenn es zu jedem (p) x ∈ A ein ε > 0 gibt mit Uε (x) = { x′ ∈ Rn ∣ ∥x′ − x∥p < ε } ⊂ A (vergleiche Beispiel 1.1.12). (ii) Die diskrete Metrik aus 1.2.17 (iii) induziert die diskrete Topologie T ∶= P(X ). Sie ist die feinste Topologie auf X, das heißt, jede Teilmenge A ⊂ X ist offen. (iii) T ∶= { ∅, X } ist die gröbste Topologie auf X.
1.4 Kompakte Mengen In diesem Abschnitt analysieren wir Teilmengen des Rn , welche die Weierstraßsche Auswahleigenschaft 1.2.8 erfüllen: 1.4.1 Definition. Eine Menge K ⊂ Rn heißt (folgen-)kompakt, wenn jede Folge (xk )k∈N in K einen Häufungswert x ∈ K besitzt, das heißt eine konvergente Teilfolge (xk` )`∈N , k` < k`+1 für ` ∈ N, enthält, deren Grenzwert x in K liegt. 1.4.2 Satz. Eine Menge K ⊂ Rn ist genau dann (folgen-)kompakt, wenn sie beschränkt und abgeschlossen ist. Beweis. „ ⇐“ Die Menge K sei beschränkt und abgeschlossen. Sei (xk )k∈N eine Folge in K. Wegen ∣x∣ ≤ c < +∞ für alle x ∈ K gibt es aufgrund des Weierstraßschen Auswahlprinzips 1.2.8 eine konvergente Teilfolge (xk` )`∈N mit xk` → x ∈ Rn . Da K (folgen-)abgeschlossen ist, gilt x ∈ K. Also ist K folgenkompakt.
20
1 Der n-dimensionale Euklidische Raum
„ ⇒“ Die Menge K sei folgen-kompakt. Sei (xk )k∈N eine konvergente Folge in K mit Grenzwert x ∈ Rn . Da K folgen-kompakt ist, muss x in K liegen, also ist K (folgen-)abgeschlossen. Es bleibt zu zeigen, dass K beschränkt ist. Angenommen K wäre nicht beschränkt. Dann gäbe es eine Folge (xk )k∈N in K mit ∣xk ∣ → +∞. Für eine Teilfolge (xk` )`∈N müsste jedoch xk` → x ∈ K gelten, also ∣xk` ∣ ≤ c < +∞, ein Widerspruch. Also ist K beschränkt. 1.4.3 Definition. (i) Der Durchmesser einer nicht-leeren Menge A ⊂ Rn ist δ (A) ∶= sup ∣x − x′ ∣ . x,x′ ∈A
(ii) Der Abstand oder die Distanz zweier nicht-leerer Mengen A, B ⊂ Rn ist d(A, B ) ∶= inf ∣x − x′ ∣ . x∈A x′ ∈ B
Wir schreiben d(x, A) für den Abstand von { x } und A. 1.4.4 Lemma. Sei K ⊂ Rn eine nicht-leere, kompakte Menge. Dann gibt es Punkte x, x′ ∈ K mit δ (K ) =
sup ∣x′′ − x′′′ ∣ = ∣x − x′ ∣ < +∞.
x′′ ,x′′′ ∈K
Beweis. Es gibt Folgen (xk )k∈N , (x′k )k∈N in K mit ∣xk − x′k ∣ → δ (K ) ∈ R∪{ +∞ }. Weil K kompakt ist, gibt es Teilfolgen (xk` )`∈N von (xk )k∈N und (x′k` )`∈N von (x′k )k∈N mit xk` → x ∈ K und x′k` → x′ ∈ K. Deshalb gilt
∣xk` − x′k` ∣ → ∣x − x′ ∣ = δ (K ) < +∞. Hier wählt man zunächst eine konvergente Teilfolge (xk` )`∈N von (xk )k∈N und dann eine konvergente Teilfolge (x′k` ) von (x′k` )`∈N . Die durch m
m∈N
xkm ∶= xk`m , x′km ∶= x′k`m für m ∈ N definierten Folgen leisten Gewünschtes. 1.4.5 Lemma. Sei F ≠ ∅ abgeschlossen, K ≠ ∅ kompakt und sei F ∩ K = ∅. Dann gibt es Punkte x ∈ F , x′ ∈ K mit d(F, K ) = inf ∣x′′ − x′′′ ∣ = ∣x − x′ ∣ > 0. ′′ x ∈F x′′′ ∈K
1.4 Kompakte Mengen
21
Beweis. Es gibt Folgen (xk )k∈N in F und (x′k )k∈N in K mit ∣xk − x′k ∣ → d(F, K ). Da K kompakt ist, gibt es eine Teilfolge (x′k` )`∈N von (x′k )k∈N mit x′k` → x′ ∈ K. Daher gibt es ein N ∈ N und ein c > 0 mit
∣xk` ∣ ≤ ∣xk` − x′k` ∣ + ∣x′k` ∣ ≤ ∣x′k` ∣ + d(F, K ) + 1 ≤ c < +∞ für alle ` ∈ N, ` ≥ N . Also gibt es eine Teilfolge (xk`m )m∈N der Folge (xk` )`∈N mit xk`m → x ∈ F . Weil F ∩ K = ∅ ist, folgt, dass
∣xk`m − x′k`m ∣ → ∣x − x′ ∣ = d(F, K ) > 0. 1.4.6 Beispiel. Die Mengen F = { (x, y ) ∈ R2 ∣ y ≤ 0 } und
F ′ = { (x, y ) ∈ R2 ∣ y ≥ 0, ∣x ⋅ y ∣ ≥ 1 }
sind abgeschlossen und es gilt F ∩ F ′ = ∅; jedoch ist d(F, F ′ ) = 0, denn für alle k ∈ N ist (k, 0) ∈ F , (k, k1 ) ∈ F ′ und es gilt ∣(k, 0) − (k, k1 )∣ = k1 → 0 für k → ∞. Deshalb gilt Lemma 1.4.5 nicht für zwei lediglich abgeschlossene Mengen (vergleiche Abbildung 1.4). 1.4.7 Definition. Eine Folge (K` )`∈N nicht-leerer, kompakter Teilmengen des Rn heißt eine kompakte Schachtelung, wenn K`+1 ⊂ K` für alle ` ∈ N gilt. 1.4.8 Cantorscher Durchschnittssatz. Es sei (K` )`∈N eine kompakte Schach∞
∞
`=1
`=1
telung. Dann ist ⋂ K` ≠ ∅. Gilt δ (K` ) → 0 für ` → ∞, so besteht ⋂ K` aus genau einem Punkt.
Beweis. (I) Zu jedem ` ∈ N wähle man ein x` ∈ K` . Wegen x` ∈ K` ⊂ K`−1 ⊂ ⋯ ⊂ K1 ist die Folge (x` )`∈N beschränkt. Aus dem Weierstraßschen Auswahlprinzip 1.2.8 folgt, dass eine konvergente Teilfolge (x`m )m∈N mit x`m → x ∈ Rn existiert. Wir zeigen, dass x ∈ K` für alle ` ∈ N gilt: Sei also ein beliebiges ` ∈ N fixiert. Wegen K`m ⊂ K` für alle `m ≥ ` und x`m ∈ K`m gilt auch x`m ∈ K` für alle `m ≥ `. Da K` abgeschlossen ist, haben wir deshalb x ∈ K` . ∞
(II) Angenommen x, x′ ∈ ⋂ K` . Dann ist ∣x − x′ ∣ ≤ δ (K` ) für alle ` ∈ N, weshalb `=1
x = x′ sein muss, falls δ (K` ) → 0 für ` → ∞. Eine Schachtelung erhält man beispielsweise folgendermaßen:
22
1 Der n-dimensionale Euklidische Raum y
y=
1 ∣x∣
F′
1 k
x
1 (k, ) k x
k F
Abbildung 1.4: Der Abstand zweier abgeschlossener Mengen kann 0 sein
1.4.9 Normalunterteilung eines n-dimensionalen Intervalls. (i) Sei I ein nicht-ausgeartetes, n-dimensionales, kompaktes Intervall, I = I1 × I2 × ⋯ × In = [a1 , b1 ] × [a2 , b2 ] × ⋯ × [an , bn ] = { x ∈ Rn ∣ ai ≤ xi ≤ bi , i = 1, . . . , n } , mit den Kantenlängen bi − ai für i = 1, . . . , n. Halbiert man jede der n Kanten Ii , bildet also ai + bi ai + bi ]∪[ , bi ] , 2 2 dann erhält man eine Partition von I in 2n n-dimensionale, kompakte Teilintervalle (α ) Iα1 ...αn = I1 1 × ⋯ × In(αn ) (1)
Ii = Ii
(2)
∪ Ii
= [ai ,
mit α1 , . . . , αn ∈ { 1, 2 } der Kantenlängen bi −2ai , das heißt, die Teilintervalle Iα1 ...αn sind nicht-überlappend und es gilt I=
⋃
α1 ,...,αn =1,2
Iα1 ...αn .
1.4 Kompakte Mengen
23
Ist das n-dimensionale Intervall J durch `-fache Normalunterteilung aus dem n-dimensionalen Intervall I entstanden, dann sind die Kantenlängen von J gleich bi2−`ai für i = 1, . . . , n. (ii) Für ein n-dimensionales, kompaktes Intervall I ist der Durchmesser von I gerade die Länge der räumlichen Diagonale, also ¿ Án À∑(bi − ai )2 . δ (I ) = Á i=1
Bei einer Normalunterteilung gilt also ¿ Á n bi − ai 2 1 À∑ ( δ (Iα1 ...αn ) = Á ) = δ (I ). 2 2 i=1 Ist I ein Würfel, das heißt gilt bi − ai = c für alle i = 1, . . . , n, dann ist √ δ (I ) = nc. Für das durch `-fache Normalunterteilung entstandene n-dimensionale Intervall J ist δ (I ) δ (J ) = ` , 2 beziehungsweise bei einem Würfel √ nc δ (J ) = ` . 2 1.4.10 Definition. Es sei A ⊂ Rn eine Punktmenge. Dann heißt ein System U von offenen Teilmengen U des Rn eine offene Überdeckung von A, wenn A ⊂ ⋃ U. U∈ U
1.4.11 Bemerkung. Sei U eine offene Überdeckung von A. Zu jedem x ∈ A gibt es dann ein U ∈ U mit x ∈ U . Wählen wir ein solches U mit x ∈ U und setzen Ux ∶= U , so gilt A ⊂ ⋃ Ux , x∈A
das heißt, das Mengensystem { Ux ∣ x ∈ A } ist eine offene Überdeckung von A. 1.4.12 Beispiele. Sei A ⊂ Rn . (i)
Die Topologie des Rn , T = { U ⊂ Rn ∣ U offen }, ist eine offene Überdeckung von A, denn der Rn überdeckt A und ist eine offene Menge.
24
1 Der n-dimensionale Euklidische Raum
(ii) Das System { Uε (x) ∣ x ∈ A, ε > 0 } von allen offenen ε-Umgebungen von allen x ∈ A ist eine offene Überdeckung von A. (iii) Das System { U k1 (x) ∣ x ∈ Qn , k ∈ N } ist ein offenes, abzählbares Überdeckungssystem von A. 1.4.13 Definition. Eine Punktmenge K ⊂ Rn heißt (topologisch) kompakt, wenn sie der Heine-Borelschen Überdeckungseigenschaft genügt, das heißt, jede offene Überdeckung U von K enthält eine endliche Teilüberdeckung U ′ = {U1 , . . . , UN } ⊂ U , das heißt, es gilt N
K ⊂ ⋃ Uk . k =1
1.4.14 Heine-Borelscher Überdeckungssatz. Eine Menge K ⊂ Rn ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist. Beweis. „ ⇐“ Sei K beschränkt und abgeschlossen. Wir führen den Beweis der Überdeckungseigenschaft indirekt. Sei also U eine offene Überdeckung von K, so dass K nicht durch endlich viele dieser U ∈ U überdeckt werden kann. Da K beschränkt ist, gibt es einen hinreichend großen n-dimensionalen Würfel I0 = { x ∈ Rn ∣ −c ≤ xi ≤ c } mit K ⊂ I0 . Durch Normalunterteilung von I0√erhalten wir 2n Teilwürfel Iα1 ...αn , αi = 1, 2, mit Durchmesser δ (Iα1 ...αn ) = nc. Für mindestens einen dieser Teilwürfel, das sei I1 = Iα1 ...αn , kann K1 ∶= I1 ∩ K nicht durch endlich viele der U ∈ U überdeckt werden. Dies Verfahren wenden wir jetzt auf K1 an und iterieren den Prozess (vergleiche Abbildung 1.5). So gelangen wir durch Normalunterteilung zu einer Folge (I` )`∈N0 von geschachtelten Intervallen und einer kompakten Schachtelung √ 2 nc (K` )`∈N0 mit K` = I` ∩ K, also δ (K` ) ≤ δ (I` ) = 2` , so dass kein K` durch endlich viele der U ∈ U überdeckt werden kann. ∞
Nach dem Cantorschen Durchschnittssatz gibt es ein x ∈ ⋂ K` . Sei Ux = U ∈ U `=0
mit x ∈ U gewählt. Da Ux offen ist, existiert ein ε > 0 mit Uε (x) ⊂ Ux . Wir untersuchen nun, für welche ` ∈ N die Inklusion I` ⊂ Uε (x) gilt. Dazu sei x′ ∈ I` . Wegen x ∈ I` haben wir dann √ 2 nc ′ ∣x − x∣ ≤ δ (I` ) = 0. Dann ist Uε (x) eine Umgebung von x mit N
Uε (x)∩ ⋃ Urk (xk ) = ∅, denn für x′′ ∈ Uε (x) gilt ∣x′′ − x∣ < rk für alle k = 1, . . . , N k=1
und folglich
∣x′′ − xk ∣ ≥ ∣x − xk ∣ − ∣x′′ − x∣ > 2rk − rk = rk .
Somit ist x′′ ∈/ Urk für alle k = 1, . . . , N . Damit gilt aber auch Uε (x) ∩ K = ∅ und folglich Uε (x) ⊂ C K. Weil x ∈ C K beliebig war, ist C K offen. 1.4.15 Bemerkung. In einem allgemeinen metrischen Raum ist eine Teilmenge K genau dann (topologisch) kompakt, wenn sie folgen-kompakt ist. Jede kompakte Menge ist notwendigerweise beschränkt und abgeschlossen, die Umkehrung ist im Allgemeinen falsch. Ein Beispiel ist die diskrete Metrik (vergleiche Beispiele 1.2.17 (iii) und 1.3.11 (ii)), bezüglich welcher jede Teilmenge A beschränkt und abgeschlossen, aber im Allgemeinen nicht kompakt ist. In allgemeinen topologischen Räumen sind kompakte Mengen notwendigerweise folgen-kompakt. Die Umkehrung gilt im Allgemeinen nicht.
2
Stetige Funktionen und Abbildungen
2.1 Funktionen und Abbildungen 2.1.1 Vorbemerkung. Sei D eine Punktmenge im Rn , n ≥ 1, mit typischem Punkt x = (x1 , . . . , xn ). Wir betrachten reelle Funktionen, das heißt reellwertige Funktionen f ∶ D → R, x = (x1 , . . . , xn ) ↦ y = f (x) = f (x1 , . . . , xn ), von n reellen Variablen x1 , . . . , xn mit dem Definitionsbereich D. Meist betrachten wir sogar gleich reelle Abbildungen f ∶ D → Rm , x = (x1 , . . . , xn ) ↦ y = (y1 , . . . , ym ) = f (x) = (f1 (x), . . . , fm (x)), das heißt Rm -wertige Abbildungen von n reellen Variablen, m ≥ 1, mit den Komponentenfunktionen fj ∶ D → R, x = (x1 , . . . , xn ) ↦ yj = fj (x) = fj (x1 , . . . , xn ) für j = 1, . . . , m. Diejenigen Definitionen und Sätze, welche für Funktionen und Abbildungen identische Formulierungen besitzen, werden gleich allgemein behandelt. Der Leser mag sich anfänglich auf den Spezialfall m = 1, das heißt auf Funktionen, beschränken. Lediglich der Satz vom Maximum von Weierstraß und der Zwischenwertsatz von Bolzano benutzen die Anordnungseigenschaft des Wertebereichs R, lassen sich also nicht beziehungsweise nicht direkt auf Abbildungen übertragen. Gelegentlich ist es vorteilhaft, eine Eigenschaft einer Abbildung f = (f1 , . . . , fm ) ∶ D → Rm als Eigenschaften ihrer Komponentenfunktionen fj ∶ D → Rm für j = 1, . . . , m anzusehen. Macht man sich diese Sichtweise zu eigen, so ergeben sich viele einschlägige Definitionen und Sätze für Abbildungen aus den entsprechenden Aussagen für Funktionen. 2.1.2 Veranschaulichung von Funktionen. (i) Eine Funktion f ∶ D → R, x = (x1 , . . . , xn ) ↦ y = f (x) = f (x1 , . . . , xn ), kann man sich im Fall n = 2 veranschaulichen, indem man ihren Graphen Gf ∶= { (x, f (x)) ∣ x ∈ D }
28
2 Stetige Funktionen und Abbildungen z c = f (a, b)
{ (x, y, z ) ∣ y = b }
{ (x, y, z ) ∣ x = a }
Gf ∩ { (x, y, z ) ∣ x = a } Gf
Gf ∩ { (x, y, z ) ∣ y = b }
b
a { (x, y ) ∣ x = a }
y
(a, b)
x
{ (x, y ) ∣ y = b }
Abbildung 2.1: Schnittmengen
zeichnet. Im Fall n ≥ 3 kann man zum Beispiel alle bis auf zwei Koordinaten, zum Beispiel x3 , . . . , xn , festhalten und so wenigstens den Graphen von f als Funktion der übrigen zwei Koordinaten, das heißt die Schnittmenge (englisch: slice) Gf ∩ { (x, y ) ∈ Rn+1 ∣ x3 = a3 , . . . , xn = an } zeichnen (vergleiche Abbildung 2.1). (ii) In den Fällen n = 2, 3 kann man für c ∈ R die Niveaumengen Γc = { x ∈ D ∣ f (x) = c } im Definitionsbereich D zeichnen (vergleiche Abbildung 2.2).
2.1 Funktionen und Abbildungen
29
z c = f (a, b) Gf ∩ { (x, y, z ) ∣ z = c }
b y
a
(a, b) x Γc = { (x, y ) ∈ D ∣ f (x, y ) = c } Abbildung 2.2: Niveaumengen
Im Fall n = 2 sind die Niveaumengen die Isolinien oder Höhenlinien beziehungsweise Isohypsen, das heißt die Verbindungslinien zwischen Orten mit gleicher Höhe. Weitere Beispiele sind die Isoklinen, das heißt die Verbindungslinien zwischen Orten mit gleicher Neigung der Magnetnadel, die Isobaren, das heißt die Verbindungslinien zwischen Orten gleichen Luftdrucks (vergleiche Abbildung 2.3), oder die Isothermen, das heißt die Verbindungslinien zwischen Orten mit gleicher Temperatur auf einer meteorologischen Karte. Im Fall n = 3 sind die Niveaumengen die Höhenflächen, wie zum Beispiel die Equipotentialflächen in der Physik. 2.1.3 Beispiele von Funktionen. (i) stante Funktion). (ii)
f ∶ Rn → R, f (x) ∶= c, c ∈ R (kon-
ϕi ∶ Rn → R, ϕi (x) ∶= xi (i-te Koordinatenfunktion) für i = 1, . . . , n.
30
2 Stetige Funktionen und Abbildungen
Abbildung 2.3: Wetterkarte mit Isobaren
Wir schreiben auch ϕi = xi , das heißt, es gilt xi (x) = xi für x ∈ Rn .
√
(iii)
∣ ∣ ∶ Rn → R, ∣x∣ ∶=
x21 + . . . + x2n (Absolutbetrag).
(iv)
` ∶ Rn → R, `(x) ∶= a ⋅ x + b (affine und für b = 0 lineare Funktion), dabei ist a = (a1 , . . . , an ) ∈ Rn , b ∈ R und a ⋅ x + b = a1 x1 + . . . + an bn + b.
(v)
P ∶ Rn → R, P (x) ∶= ∑ aα xα (Polynom), dabei ist α = (α1 , . . . , αn ) ein ∣α∣≤k
Multiindex mit α1 , . . . , αn ∈ { 0, 1, . . . , k }, k ∈ N, aα = aα1 ...αn ∈ R und wir setzen
∣α∣ ∶= α1 + . . . + αn , xα ∶= xα1 1 ⋅ . . . ⋅ xαnn
2.1 Funktionen und Abbildungen
31
für x = (x1 , . . . , xn ) ∈ Rn . Damit ist P (x) = ∑ aα xα = ∣α∣≤k
k
∑
α1 ,...,αn =0 ∣α∣≤k
aα1 ...αn xα1 1 ⋅ . . . ⋅ xαnn .
Im Fall k = 2 gilt zum Beispiel n
n
i,j =1
i=1
P (x) = ∑ aij xi xj + ∑ bi xi + c.
(vi)
σk ∶ Rn → R, σk (x) ∶=
∑
1≤i1 0, −π < ϕ ≤ π gibt, so dass die Polarkoordinatendarstellung gilt (vergleiche Abbildung 2.7). ϕ ϕ = 34 π
y ϕ=
Φ
π 2
ϕ=
ϕ = 34 π ϕ=
π 4
ϕ=π
0
π 4
ϕ=0 x
r r=1 r=2
ϕ = − π2
ϕ = − π2 ϕ = −π
r=1 r=2
Abbildung 2.7: Polarkoordinatenabbildung
(v) Φz ∶ { (r, ϕ, z ) ∣ r > 0, −π < ϕ ≤ π, z ∈ R } → R3 ∖ { (0, 0, z ) ∣ z ∈ R }, x = r cos ϕ⎫ ⎪ ⎪ ⎪ ⎪ y = r sin ϕ ⎬ (Zylinderkoordinaten), ⎪ ⎪ ⎪ ⎪ z=z ⎭ das heißt Φz (r, ϕ, z ) = (r cos ϕ, r sin ϕ, z ). Diese Darstellung ist eindeutig und Φz damit bijektiv (vergleiche Abbildung 2.8). (vi) Ψ ∶ { (ρ, ϕ, ϑ) ∣ ρ > 0, −π < ϕ ≤ π, 0 < ϑ < π } → R3 ∖ { (0, 0, z ) ∣ z ∈ R }, x = ρ cos ϕ sin ϑ⎫ ⎪ ⎪ ⎪ ⎪ y = ρ sin ϕ sin ϑ ⎬ (sphärische Koordinaten). ⎪ ⎪ ⎪ ⎪ z = ρ cos ϑ ⎭
36
2 Stetige Funktionen und Abbildungen z ϕ=π z
Φz
ϕ=
π 4
ϕ = −π ϕ
r=2 r=4 r
r=4 ϕ=
π 4
r=2
y
x
ϕ=π
Abbildung 2.8: Zylinderkoordinatenabbildung
Ψ erhält man, indem man zweimal hintereinander Zylinderkoordinaten einführt: Zunächst denkt man sich den Punkt (x, y, z ) auf die x, y-Ebene projiziert und führt dort Polarkoordinaten ein, das heißt im x, y, z-Raum Zylinderkoordinaten r, ϕ, z. Dann führt man in der z, r-Halbebene Polarkoordinaten ρ, ϑ ein, das heißt im z, r, ϕ-Raum Zylinderkoordinaten ρ, ϑ, ϕ. Man hat also x = r cos ϕ∣r=ρ sin ϑ = ρ cos ϕ sin ϑ y = r sin ϕ∣r=ρ sin ϑ = ρ sin ϕ sin ϑ z = z ∣z =ρ cos ϑ = ρ cos ϑ. (Vergleiche auch Abbildung 2.9.) Es gilt Ψ = Φz ○ Φϕ , dabei ist Φz die Zylinderkoordinatenabbildung aus (v) und Φϕ ∶ { (ρ, ϕ, ϑ) ∣ ρ > 0, −π < ϕ ≤ π, 0 < ϑ < π } → { (r, ϕ, z ) ∣ r > 0, −π < ϕ ≤ π, z ∈ R } , r = ρ sin ϑ ϕ=ϕ z = ρ cos ϑ.
2.1 Funktionen und Abbildungen
37
Als Verkettung von bijektiven Abbildungen ist Ψ bijektiv (vergleiche Abbildung 2.10). z
P = (x, y, z )
ϑ
y ϕ
x
Abbildung 2.9: Sphärische Koordinaten
θ=
π 3
ϕ=π
z
θ ϕ = − π4
ϕ=π
r=1
Ψ
r=2 θ=
π 3
r=2
ϕ
y r=1
r
x ϕ = − π4
Abbildung 2.10: Sphärische Koordinatenabbildung
38
2 Stetige Funktionen und Abbildungen
2.1.6 Rationale Operationen. Seien D, E ⊂ Rn . (i) Seien f ∶ D → R und g ∶ E → R reelle Funktionen. Dann sind die Summe f + g und das Produkt f ⋅ g für x ∈ D ∩ E definiert durch
(f + g ) (x) ∶= f (x) + g (x), (f ⋅ g ) (x) ∶= f (x) ⋅ g (x). Der Quotient
f g
ist für x ∈ D ∩ { x ∈ E ∣ g (x) ≠ 0 } erklärt durch f f ( x) (x) ∶= . g g (x)
(ii) Seien f ∶ D → Rm und g ∶ E → Rm Abbildungen und sei α ∈ R. Dann sind die Summe f + g, das skalare Vielfache αf = α ⋅ f und das innere Produkt (oder das Skalarprodukt) f ⋅ g = (f, g ) für x ∈ D ∩ E definiert durch
(f + g )(x) ∶= f (x) + g (x) = (f1 (x) + g1 (x), . . . , fm (x) + gm (x)), (αf )(x) = (α ⋅ f )(x) ∶= α ⋅ f (x) = (αf1 (x), . . . , αfm (x)), m
(f ⋅ g )(x) = (f, g )(x) ∶= (f (x), g (x)) = ∑ fj (x)gj (x). j =1
2.2 Der Limes von Funktionen und Abbildungen 2.2.1 Definition. Sei f ∶ D → R eine Funktion beziehungsweise f ∶ D → Rm , m ∈ N, eine Abbildung. Sei a ∈ Rn ein Häufungspunkt von D. Dann heißt c ∈ R beziehungsweise c = (c1 , . . . , cm ) ∈ Rm Limes oder Grenzwert von f an der Stelle a, oder f (x) konvergiert gegen c für x → a, in Zeichen c = lim f (x) oder f (x) → c für x → a, x→a
falls es zu jedem ε > 0 ein δ = δ (ε) > 0 gibt, so dass
∣f (x) − c∣ < ε für alle x ∈ D, ∣x − a∣ < δ, x ≠ a, das heißt f (x) ∈ Uε (c) ⊂ R beziehungsweise Rm für alle x ∈ D ∩ (Uδ (a) ∖ { a }) ⊂ Rn . 2.2.2 Bemerkungen. (i)
Der Limes ist eindeutig bestimmt.
(ii) Es ist nicht notwendig, aber zulässig, dass a ∈ D ist, in welchem Fall lim f (x) ≠ f (a) sein kann. x→a
2.2 Der Limes von Funktionen und Abbildungen
39
(iii) Falls a kein Häufungspunkt von D ist, das heißt, falls a ein isolierter Punkt von D ist, dann ist D ∩ (Uδ (a) ∖ { a }) = ∅ für genügend kleines δ > 0. Die Aussage der Definition ist dann für jedes c wahr; in diesem Fall definieren wir den Limes deshalb nicht. 2.2.3 Lemma. Sei f ∶ D → Rm , m ∈ N, eine Abbildung mit den Komponentenfunktionen f1 , . . . , fm ∶ D → R und sei a ∈ Rn ein Häufungspunkt von D. Dann ist c = (c1 , . . . , cm ) ∈ Rm genau dann der Limes von f an der Stelle a, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass
∣fj (x) − cj ∣ < ε für alle x ∈ D, ∣x − a∣ < δ, x ≠ a und alle j = 1, . . . , m gilt, das heißt, wenn cj ∈ R Limes von fj an der Stelle a für alle j = 1, . . . , m ist. 2.2.4 Folgenkriterium. Sei f ∶ D → Rm und sei a ∈ Rn ein Häufungspunkt von D. Dann ist c = (c1 , . . . , cn ) ∈ Rm genau dann der Limes von f an der Stelle a, wenn c = lim f (xk ) k→∞
für jede Punktfolge (xk )k∈N in D mit xk ≠ a und xk → a für k → ∞. Beweis. „ ⇒“ Sei ε > 0. Wähle δ = δ (ε) > 0 so, dass
∣f (x) − c∣ < ε für alle x ∈ D, ∣x − a∣ < δ, x ≠ a. Sei (xk )k∈N eine Folge in D mit xk ≠ a und xk → a für k → ∞. Dann gibt es ein N = N (δ ) ∈ N, so dass ∣xk − a∣ < δ für alle k ∈ N, k ≥ N . Also ist
∣f (xk ) − c∣ < ε für alle k ∈ N, k ≥ N, das heißt, es gilt lim f (xk ) = c. k→∞
„ ⇐“ Angenommen, c ist nicht der Limes von f an der Stelle a. Dann gibt es ein ε > 0, so dass zu jedem δ > 0 ein x = x(δ ) ≠ a existiert mit x ∈ D, ∣x − a∣ < δ, x ≠ a und ∣f (x) − c∣ ≥ ε. Wähle δ = k1 , k ∈ N, und setze xk = x( k1 ). Dann ist (xk )k∈N eine Punktfolge in D mit xk ≠ a, xk → a für k → ∞ und ∣f (xk ) − c∣ ≥ ε, was der Voraussetzung widerspricht.
40
2 Stetige Funktionen und Abbildungen
2.2.5 Grenzwertsätze für Funktionen. Seien f, g ∶ D → R Funktionen und sei a ∈ Rn ein Häufungspunkt von D. Existieren die Grenzwerte lim f (x) und x→a
lim g (x), so existieren die Grenzwerte lim (f + g ) (x) und lim (f ⋅ g ) (x) und es x→a x→a x→∞ gelten die Grenzwertbeziehungen lim (f + g ) (x) = lim f (x) + lim g (x)
x→a
x→a
x→a
und lim (f ⋅ g ) (x) = lim f (x) ⋅ lim g (x).
x→a
x→a
x→a
Falls lim g (x) ≠ 0 ist, dann gibt es ein δ > 0 mit g (x) ≠ 0 für alle x ∈ D, x→a
∣x − a∣ < δ, x ≠ a. Die Funktion Grenzwert
lim f (x) x→a g
f g
∶ { x ∈ D ∣ g (x) ≠ 0 } → R besitzt dann den
und es gilt lim f (x) f x→a (x) = . x→a g lim g (x) lim
x→a
Beweis. Sei ε ∶=
1 lim ∣g (x)∣ 2x →a
> 0. Nach der Definition des Limes lim g (x) gibt es x→a
ein δ > 0 mit ∣g (x) − lim g (x)∣ < ε, also ∣g (x)∣ > ε > 0 für alle x ∈ D, ∣x − a∣ < δ, x→a
x ≠ a, und somit g (x) ≠ 0. Der Rest des Beweises folgt aus dem Folgenkriterium 2.2.4 und den entsprechenden Eigenschaften des Grenzwerts von Folgen. 2.2.6 Grenzwertsätze für Abbildungen. Seien f, g ∶ D → Rm Abbildungen, sei α ∈ R und sei a ∈ Rn ein Häufungspunkt von D. Existieren die Grenzwerte lim f (x) und lim g (x), so existieren die Grenzwerte x→a
x→a
lim (f + g ) (x), lim (α ⋅ f ) (x) und lim (f, g ) (x)
x→a
x→a
x→a
und es gelten die Limesrelationen lim (f + g ) (x) = lim f (x) + lim g (x),
x→a
x→a
x→a
lim (α ⋅ f ) (x) = α ⋅ lim f (x),
x→a
x→a
lim (f, g ) (x) = ( lim f (x), lim g (x)) .
x→a
x→a
x→a
2.2 Der Limes von Funktionen und Abbildungen
41
2.2.7 Kettenregel für Grenzwerte. Seien D ⊂ Rn , E ⊂ Rm und seien f ∶ D → E, g ∶ E → Rk Abbildungen, n, m, k ∈ N. Sei a ∈ Rn ein Häufungspunkt von D und b ∈ Rm ein Häufungspunkt von E. Existieren die Grenzwerte lim f (x), x→a
lim g (y ) und gilt lim f (x) = b sowie x→a
y →b
lim g (y ) = g (b) oder f (x) ≠ b für x ∈ D, ∣x − a∣ < δ, x ≠ a,
y →b
so existiert der Grenzwert lim g ○ f (x) und es gilt die Grenzbeziehung x→a
lim (g ○ f )(x) = lim g (y ).
x→a
y →b
Beweis. Sei (xk )k∈N eine Folge in D mit xk ≠ a und xk → a für k → ∞. Dann gilt yk ∶= f (xk ) → b = lim f (x). x→a
Falls g (b) = lim g (y ) ist, so folgt y →b
g ○ f (xk ) = g (yk ) → g (b) für k → ∞ auch wenn yk ≠ b nicht immer erfüllt ist. Ist f (x) ≠ b für x ∈ D, ∣x − a∣ < δ, x ≠ a, so gibt es ein N ∈ N mit yk ≠ b für alle k ∈ N, k ≥ N , weshalb dann g ○ f (xk ) = g (yk ) → lim g (y ) y →b
wie behauptet. 2.2.8 Definition. Sei a ∈ Rn ein Häufungspunkt von D. Eine Funktion f ∶ D → R hat an der Stelle a den uneigentlichen Limes ±∞, mit anderen Worten f (x) konvergiert uneigentlich gegen ±∞ oder divergiert bestimmt gegen ±∞ für x → a, falls es zu jedem c > 0 ein δ = δ (c) > 0 gibt, so dass f (x) ≥ c beziehungsweise f (x) ≤ −c für alle x ∈ D, ∣x − a∣ < δ, x ≠ a. Im Folgenden sei R ⊂ R2 ein nicht-ausgeartetes Rechteck, (a, b) ∈ R und f = f (x, y ) sei eine in D ∶= { (x, y ) ∈ R ∣ x ≠ a, y ≠ b } erklärte Funktion.
42
2 Stetige Funktionen und Abbildungen
2.2.9 Satz über den iterierten Limes. Es existiere der Grenzwert c ∶=
lim
(x,y )→(a,b)
f (x, y ) =
lim
(x,y )→(a,b) x≠a,y ≠b
f (x, y )
und für jedes x mit (x, b) ∈ R, x ≠ a, existiere der Grenzwert c(x) ∶= lim f (x, y ) = y →b
lim f (x, y ). Dann existiert der Grenzwert lim c(x) = xlim c (x) und es gilt →a x→a
y →b y ≠b
x≠a
f (x, y ) = c = lim c(x) = lim (lim f (x, y )) .
lim
x→a
(x,y )→(a,b)
x→a y →b
Ebenso gilt lim
(x,y )→(a,b)
f (x, y ) = lim ( lim f (x, y )) , y →b x→a
falls lim f (x, y ) = xlim f (x, y ) für jedes y mit (a, y ) ∈ R, y ≠ b, existiert. →a x→a
x≠a
Beweis. Sei ε > 0. Dann gibt es ein δ > 0, so dass
∣f (x, y ) − c∣ < ε für alle (x, y ) ∈ D mit ∣x − a∣ , ∣y − b∣ < δ. Für jedes feste x mit (x, b) ∈ R, ∣x − a∣ < δ und x ≠ a, folgt dann durch Grenzübergang y → b, dass
∣c(x) − c∣ = ∣lim f (x, y ) − c∣ ≤ ε, y →b
das heißt, es gilt c = lim c(x) wie behauptet. x→a
2.2.10 Beispiele. (i)
Für die Funktion f (x, y ) ∶=
haben wir
weshalb
xy für x, y > 0 x+y
⎧ ⎪ 0 ⎪ ⎪ xy ⎪ 0≤ ≤ x + y → ⎨x ⎪ x+y ⎪ ⎪y ⎪ ⎩
für x, y → 0 für y → 0 für x → 0,
xy xy xy = lim (lim ) = lim ( lim ). x,y →0 x + y x→0 y →0 x + y y →0 x→0 x + y lim
2.2 Der Limes von Funktionen und Abbildungen (ii) Die Funktion f (x, y ) ∶=
43
x für x, y > 0 x+y
besitzt keinen Limes für x, y → 0, denn für x = y gilt f (x, y ) = 21 und für x = y 2 ist y2 y f (x, y ) ∶= 2 = → 0 für y → 0. y +y y+1 Für festes x dagegen gilt lim f (x, y ) = 1 und für festes y ist lim f (x, y ) = 0. y →0
Deshalb ergibt sich
x→0
x x ) = 1 ≠ 0 = lim ( lim ). y →0 x + y y →0 x→0 x + y
lim (lim
x→0
(iii) Für die Funktion f (x, y ) ∶=
xy für x, y > 0 2(x − y ) + xy
gilt lim (lim
x→0 y →0
xy xy ) = 0 = lim ( lim ). y →0 x→0 2(x − y ) + xy 2(x − y ) + xy
Dennoch besitzt f (x, y ) keinen Grenzwert für x, y → 0, denn für x = y ist f (x, y ) = 1 und für x = y+y 1 ist f (x, y ) = −1. 2.2.11 Definition. f = f (x, y ) konvergiert gleichmäßig in x für y → b gegen den Grenzwert c(x) ∶= lim f (x, y ), wenn es zu jedem ε > 0 ein δ = δ (ε) > 0 gibt, y →b
so dass
∣f (x, y ) − c(x)∣ < ε für alle (x, y ) ∈ D mit ∣y − b∣ < δ, y ≠ b. 2.2.12 Satz. Der Grenzwert c(x) ∶= lim f (x, y ) existiere gleichmäßig in x für y →b
alle x mit (x, b) ∈ R, x ≠ a. Außerdem existiere der Grenzwert c ∶= lim c(x). Dann existiert der Limes
lim
(x,y )→(a,b)
f (x, y ) =
x→a
lim
(x,y )→(a,b) x≠a,y ≠b
f (x, y ) und es gilt die
Grenzwertbeziehung lim
(x,y →(a,b)
f (x, y ) = c = lim c(x) = lim (lim f (x, y )) . x→a
x→a y →b
Existiert auch der Grenzwert lim f (x, y ) für alle y mit (a, y ) ∈ R, y ≠ b, so gilt x→a auch lim f (x, y ) = lim ( lim f (x, y )) . (x,y →(a,b)
y →b x→a
44
2 Stetige Funktionen und Abbildungen
Beweis. (I) Sei ε > 0. Dann gibt es ein δ > 0, so dass ε für alle (x, y ) ∈ D, ∣y − b∣ < δ, y ≠ b, 2 ε ∣c(x) − c∣ < für alle (x, b) ∈ R, ∣x − a∣ < δ, x ≠ a. 2
∣f (x, y ) − c(x)∣
0 x+y x+y
konvergiert für y → 0 gleichmäßig in x gegen den Grenzwert c(x) ∶= x, denn für ε > 0 setze δ ∶= ε. Dann gilt
∣f (x, y ) − c(x)∣ = (ii) Die Funktion f (x, y ) ∶=
xy ≤ y < ε für 0 < y < δ. x+y
x für x, y > 0 x+y
aus Beispiel 2.2.10 (ii) besitzt zwar für alle x > 0 den Grenzwert c(x) ∶= lim f (x, y ) = 1, aber die Konvergenz ist nicht gleichmäßig: Es gilt y →0
∣f (x, y ) − c(x)∣ =
1 für x = y. 2
Deshalb kann es zu gegebenem ε > 0 kein δ > 0 geben mit ∣f (x, y ) − c(x)∣ < ε für alle x > 0 und alle 0 < y < δ. Außerdem würde aus der gleichmäßigen Konvergenz nach Satz 2.2.12 die Existenz des Limes lim f (x, y ) fol(x,y )→(0,0) gen.
2.3 Stetige Funktionen und Abbildungen
45
(iii) Die Funktion f (x, y ) ∶= y sin besitzt den Limes
lim
(x,y )→(0,0)
1 für x ≠ 0 x
y sin x1 = 0, für festes x ≠ 0 ist
y sin
1 glm ÐÐ→ 0 für y → 0, x
und es gilt daher lim
(x,y )→(0,0)
y sin
1 1 = 0 = lim (lim y sin ) . x → 0 y → 0 x x
Allerdings hat f (x, y ) bei festem y ≠ 0 für x → 0 keinen Grenzwert. Der Limes lim f (x, y ) kann daher nicht in umgekehrter Reihenfolge auf(x,y )→(0,0)
gelöst werden.
2.3 Stetige Funktionen und Abbildungen 2.3.1 Definition. Sei f ∶ D → R eine Funktion bzw. f ∶ D → Rm , m ∈ N, eine Abbildung und sei a ∈ D. Dann heißt f stetig im Punkt a, wenn es zu jedem ε > 0 ein δ = δ (ε, a) > 0 gibt mit
∣f (x) − f (a)∣ < ε für alle x ∈ D, ∣x − a∣ < δ, das heißt f (x) ∈ Uε (f (a)) ⊂ R beziehungsweise Rm für alle x ∈ D ∩ Uδ (a). 2.3.2 Bemerkung. Ist a ein isolierter Punkt von D, so ist jede auf D erklärte Funktion stetig in a. 2.3.3 Satz. Sei f ∶ D → Rm und sei a ∈ D ein Häufungspunkt von D. Dann ist f genau dann im Punkt a stetig, wenn lim f (x) existiert und x→a
lim f (x) = f (a).
x→a
Beweis. Der Satz folgt unmittelbar aus den Definitionen von Stetigkeit und Grenzwert einer Funktion.
46
2 Stetige Funktionen und Abbildungen
2.3.4 Folgenkriterium. Sei f ∶ D → Rm und sei a ∈ D. Dann ist f genau dann im Punkt a stetig, wenn die Relation f (xk ) → f (a) für k → ∞ für alle Folgen (xk )k∈N in D mit xk → a für k → ∞ gilt. Ist a ein Häufungspunkt von D, so gilt dies genau dann, wenn f (xk ) → f (a) für alle Folgen in D mit xk ≠ a, xk → a für k → ∞. Beweis. Der Satz folgt unmittelbar aus den Definitionen von Stetigkeit einer Funktion, Grenzwert einer Folge und dem Folgenkriterium 2.2.4 für Grenzwerte. 2.3.5 Satz. Seien f, g ∶ D → R stetige Funktionen im Punkt a ∈ D. Dann sind die Funktionen f + g und f ⋅ g in a stetig. Falls g (a) ≠ 0 gilt, dann gibt es ein δ > 0, so dass g (x) ≠ 0 für alle x ∈ D mit ∣x − a∣ < δ, und die Funktion f g ∶ { x ∈ D ∣ g (x) ≠ 0 } → R ist stetig in a. Beweis. Folgt aus Satz 2.3.3 in Verbindung mit Satz 2.2.5, das heißt den entsprechenden Grenzwertsätzen für Funktionen. 2.3.6 Satz. Seien f, g ∶ D → Rm stetige Abbildungen im Punkt a ∈ D und sei α ∈ R. Dann sind die Abbildungen f + g und α ⋅ f und die Funktion f ⋅ g = (f, g ) stetig in a. Beweis. Folgt aus Satz 2.3.3 zusammen mit Satz 2.2.6, das heißt den Grenzwertsätzen für Abbildungen. 2.3.7 Kettenregel für stetige Abbildungen. Seien D ⊂ Rn , E ⊂ Rm und seien f ∶ D → E, g ∶ E → Rk Abbildungen n, m, k ∈ N. f sei stetig in a ∈ D, g sei stetig in b = f (a) ∈ E. Dann ist die Abbildung g ○ f ∶ D → Rk , (g ○ f )(x) = g (f (x)) stetig in a, und, falls a ein Häufungspunkt von D und b ein Häufungspunkt von E ist, dann gilt die Limesrelation
(g ○ f )(a) = lim (g ○ f )(x) = lim g (y ) = g (b). x→a
y →b
Beweis. Sei (xk )k∈N eine Punktfolge in D mit xk → a. Aus der Stetigkeit von f in a folgt yk = f (xk ) → f (a) = b für k → ∞. Aus der Stetigkeit von g in b folgt dann g (yk ) = g (f (xk )) = (g ○ f )(xk ) → g (b) = (g ○ f )(a) für k → ∞.
2.3 Stetige Funktionen und Abbildungen
47
2.3.8 Definition. Eine Funktion f ∶ D → R beziehungsweise eine Abbildung f ∶ D → Rm heißt stetig in D, in Zeichen f ∈ C 0 (D) beziehungsweise f ∈ C 0 (D, Rm ), wenn f stetig in allen Punkten von D ist, das heißt, zu jedem x ∈ D und ε > 0 gibt es ein δ = δ (x, ε) > 0, so dass f (x′ ) ∈ Uε (f (x)) ⊂ R beziehungsweise Rm für alle x′ ∈ D ∩ Uδ (x). 2.3.9 Definition und Satz. Sei A ⊂ Rn eine Punktmenge. Dann ist
T = TA = { A ∩ U ∣ U ⊂ Rn offen } eine Topologie für A und heißt die relative Topologie, bzw. das Paar (A, T ) ist ein topologischer Raum. Die Mengen A ∩ U , U ⊂ Rn offen, heißen relativ ˜ ⊂ A ist also genau dann relativ offen in A, wenn offen in A. Eine Teilmenge U ˜ = U ∩ A. es eine offene Teilmenge U ⊂ Rn gibt mit U 2.3.10 Satz. Eine Funktion f ∶ D → R beziehungsweise eine Abbildung f ∶ D → Rm ist genau dann stetig in D, wenn das Urbild f −1 (V ) jeder offenen Menge V ⊂ Rm relativ offen in D ist, das heißt, es gibt eine offene Menge U ⊂ Rn mit f −1 (V ) = U ∩ D. Beweis. „ ⇒“ Sei f stetig in D und V ⊂ Rm eine offene Menge. Es ist zu zeigen, dass eine offene Menge U ⊂ Rn existiert, so dass f −1 (V ) = { x ∈ D ∣ f (x) ∈ V } = D ∩ U. Sei x ∈ f −1 (V ), das heißt f (x) ∈ V . Dann gibt es ein ε > 0 mit Uε (f (x)) ⊂ V . Wegen f ∈ C 0 (D) gibt es ein δ = δ (ε, x) > 0, so dass f (x′ ) ∈ Uε (f (x)) ⊂ V für alle x′ ∈ D ∩ Uδ (x). Für diese x′ gilt also x′ ∈ f −1 (V ), weshalb D ∩ Uδ (x) ⊂ f −1 (V ). Wir betrachten die offene Menge U ∶=
⋃
x∈f −1 (V )
Uδ (x).
Dann gilt offensichtlich D∩U =D∩
⋃
x∈f −1 (V )
Uδ (x) =
⋃
x∈ f − 1 ( V )
(D ∩ Uδ (x)) = f −1 (V ).
48
2 Stetige Funktionen und Abbildungen
„ ⇐“ Sei x ∈ D und sei ε > 0. Betrachte die offene Menge V ∶= Uε (f (x)) ⊂ Rm . Dann gibt es eine offene Menge U ⊂ Rn , so dass f −1 (Uε (f (x))) = D ∩ U, das heißt, es gilt x′ ∈ D ∩ U genau dann, wenn f (x′ ) ∈ Uε (f (x)). Insbesondere gilt x ∈ U , und somit gibt es ein δ > 0, so dass Uδ (x) ⊂ U , also f (x′ ) ∈ Uε (f (x)) für alle x′ ∈ D ∩ Uδ (x) ⊂ D ∩ U. Da x ∈ D und ε > 0 beliebig gewählt waren, ist f stetig in D. 2.3.11 Beispiele. (i) Seien A, U ⊂ R2 mit A = { (x, y ) ∈ R2 ∣ x2 + y 2 ≤ 1 } und ˜1 = U1 ∩ A = U1 sowohl relativ offen in A als U1 = { x2 + y 2 < 12 }. Dann ist U auch eine offene Teilmenge des R2 . Wählen wir U2 = { (x − 1)2 + y 2 < 1 }, so ˜2 = { x2 + y 2 ≤ 1, (x − 1)2 + y 2 < 1 } relativ offen in A, aber keine offene ist U Teilmenge des R2 (vergleiche Abbildung 2.11). y 1
O
˜1 U1 = U
1 2
˜2 U
x
1
U2
A Abbildung 2.11: Relativ offene Mengen I
(ii) Seien A = { (x, y ) ∈ R2 ∣ y = x2 , −1 < x ≤ 1 } und U1 = { x2 + y 2 < 14 }. Dann √ ˜1 = { y = x2 , ∣x∣ < √1 − 1 } relativ offen in A, ist aber keine offene Teilist U 2 2 √ 2 ˜1 gehören nicht zu menge des R . Die Endpunkte (± √12 − 12 , √12 − 12 ) von U
2.4 Der Banachsche Fixpunktsatz
49
˜1 . Für U2 = { (x − 2)2 + y 2 < 4 } gilt U ˜2 = { y = x2 , 0 < x ≤ 1 }, der EndU ˜2 , (1, 1) gehört jedoch dazu (vergleiche Abbilpunkt (0, 0) gehört nicht zu U dung 2.12). y
y
A
˜2 U
A
˜1 U U1
1 2
1
x
1
x
U2 Abbildung 2.12: Relativ offene Mengen II
2.4 Der Banachsche Fixpunktsatz 2.4.1 Definition. Eine Abbildung f ∶ D → Rm heißt dehnungsbeschränkt oder Lipschitz-stetig in D, falls sie einer Lipschitz-Bedingung der Form
∣f (x) − f (x′ )∣ ≤ L ∣x − x′ ∣ für alle x, x′ ∈ D mit einer Lipschitz-Konstanten L > 0 genügt. f heißt kontrahierend, falls L < 1 gewählt werden kann. Eine Abbildung f ∶ D → D, das heißt, es gilt Imf ⊂ D, heißt eine Selbstabbildung. 2.4.2 Beispiel. Sei
⎛ a11 ⋯ a1n ⎞ ⋮ ⎟ ∈ Rm×n A = (ajk )j =1...m = ⎜ ⋮ k=1...n ⎝am1 ⋯ amn ⎠ ⎛ b1 ⎞ eine reelle m × n-Matrix und sei b = ⎜ ⋮ ⎟ ∈ Rm . Wir betrachten die affine ⎝bm ⎠
50
2 Stetige Funktionen und Abbildungen
Abbildung f ∶ Rn → Rm ,
⎛ a11 ⋯ a1n ⎞ ⎛ x1 ⎞ ⎛ b1 ⎞ ⋮ ⎟○⎜ ⋮ ⎟+⎜ ⋮ ⎟ f (x) ∶= A ○ x + b = ⎜ ⋮ ⎝am1 ⋯ amn ⎠ ⎝xn ⎠ ⎝bm ⎠ n
⎛ ∑ a1k xk + b1 ⎞ ⎜ k =1 ⎟ ⎜ ⎟ ⋮ ⎟, =⎜ ⎜n ⎟ ⎜ ⎟ a x + b ∑ m mk k ⎝k=1 ⎠ wobei wir Vektoren im Rn und Rm als Spaltenvektoren auffassen (vergleiche Beispiel 2.1.5 (iii)). Dann ist f Lipschitz-stetig und die Matrixnorm (vergleiche Beispiel 1.1.13) ∣A ○ x∣ ∥A∥ = sup ∣x∣ x∈Rn x≠0
ist eine Lipschitz-Konstante für f . Es gilt sogar
∥A∥ = [f ]0,1 ∶= inf { L > 0 ∣ ∣f (x) − f (x′ )∣ ≤ L ∣x − x′ ∣ für alle x, x′ ∈ Rn } . [f ]0,1 heißt auch die Lipschitz-Halbnorm oder -Seminorm von f . Denn einerseits haben wir für alle x, x′ ∈ Rn , x ≠ x′ , dass ∣f (x) − f (x′ )∣ = ∣A ○ (x − x′ )∣ = ≤ ∥A∥ ∣x − x′ ∣ .
∣A ○ (x − x′ )∣ ∣x − x′ ∣ ∣x − x′ ∣
Deshalb ist f Lipschitz-stetig und es gilt die Ungleichung [f ]0,1 ≤ ∥A∥. Umgekehrt folgt aus ∣f (x) − f (x′ )∣ ≤ [f ]0,1 ∣x − x′ ∣ für alle x, x′ ∈ Rn , dass
∣A ○ x∣ = ∣f (x) − b∣ = ∣f (x) − f (0)∣ ≤ [f ]0,1 ∣x∣ und hieraus die Ungleichung ∥A∥ ≤ [f ]0,1 . 2.4.3 Kontraktionssatz. Sei F ⊂ Rn eine abgeschlossene Menge und f ∶ F → F eine kontrahierende Selbstabbildung. Dann besitzt f genau einen Fixpunkt, das heißt, die Gleichung f (x) = x besitzt genau eine Lösung x ∈ F . Dieser kann durch die Iteration xk+1 ∶= f (xk ) für k ∈ N0 gewonnen werden, wobei x0 ∈ F ein beliebig gewählter Startpunkt ist, das heißt es gilt dann xk → x für k → ∞. Außerdem gilt die Fehlerabschätzung
∣xk − x∣ ≤
Lk ∣x1 − x0 ∣ . 1−L
2.4 Der Banachsche Fixpunktsatz f
51 f
x=y
b x1 = f (x0 )
x=y
b
Gf
x2 = f (x1 )
Gf a
a a
x0 x2
x1 b
Abbildung 2.13: Kontraktionssatz
x
a x′
x′′ x′′′ b
x
Abbildung 2.14: In diesem Beispiel gibt es drei Fixpunkte.
Beweis. (I) Eindeutigkeit. Angenommen x, x′ seien zwei Fixpunkte, das heißt, es gilt f (x) = x, f (x′ ) = x′ . Dann haben wir
∣x − x′ ∣ = ∣f (x) − f (x′ )∣ ≤ L ∣x − x′ ∣ mit 0 < L < 1. Dies kann aber nur für x = x′ gelten. (II) Existenz. Sei die Folge (xk )k∈N0 wie oben erklärt. Dann haben wir für alle k ∈ N0
∣xk+1 − xk ∣ = ∣f (xk ) − f (xk−1 ∣ ≤ L ∣xk − xk−1 ∣ = ⋯ ≤ ⋯ ≤ Lk ∣x1 − x0 ∣ . Ähnlich gilt für alle `, k ∈ N0 , ` > k, dass
∣x` − xk ∣ ≤ ∣x` − x`−1 ∣ + ⋯ + ∣xk+2 − xk+1 ∣ + ∣xk+1 − xk ∣ `−1
≤ ∑ Lm ∣x1 − x0 ∣ . m=k
Weil die geometrische Reihe konvergiert, ist die Folge (xk )k∈N0 also eine CauchyFolge. Wegen der Abgeschlossenheit von F gilt xk → x ∈ F . Für ` → ∞ folgt, dass ∞ Lk ∣x − xk ∣ ≤ ∑ Lm ∣x1 − x0 ∣ = ∣x1 − x0 ∣ 1−L m=k wie behauptet.
52
2 Stetige Funktionen und Abbildungen
2.4.4 Bemerkung. Der Kontraktionssatz gilt auch in einem vollständig normierten Vektorraum, das heißt in einem Banachraum und heißt dann Banachscher Fixpunktsatz. Es braucht lediglich die Vollständigkeit der Teilmenge F (vergleiche Bemerkung 1.2.16 (vi)) angenommen werden. Allgemeiner gilt der Kontraktionssatz in metrischen Räumen für vollständige Teilmengen F . Der Beweis des Kontraktionssatzes 2.4.3 kann wörtlich übernommen werden, es ist lediglich ∣x − x′ ∣ durch ∥x − x′ ∥ beziehungsweise d(x, x′ ) zu ersetzen.
2.5 Stetige Funktionen und Abbildungen auf kompakten Mengen 2.5.1 Definition. Eine Funktion f ∶ D → R beziehungsweise Abbildung f ∶ D → Rm heißt gleichmäßig stetig auf D, wenn es zu jedem ε > 0 ein δ = δ (ε) > 0 gibt, so dass
∣f (x) − f (x′ )∣ < ε für alle x, x′ ∈ D, ∣x − x′ ∣ < δ. 2.5.2 Bemerkungen. (i) Lipschitz-stetige Funktionen beziehungsweise Abbildungen sind gleichmäßig stetig. (ii) Jede auf D gleichmäßig stetige Abbildung f ist stetig auf D. Die Umkehrung ist im Allgemeinen falsch, wie das Beispiel f (x) = x1 für 0 < x ≤ 1 zeigt. 2.5.3 Satz. Sei K ⊂ Rn eine kompakte Menge und f ∶ K → Rm sei eine stetige Abbildung auf K. Dann ist f auf K gleichmäßig stetig. Beweis. Sei ε > 0 vorgegeben. Da f in jedem Punkt a ∈ K stetig ist, gibt es zu jedem ε > 0 ein δ = δ (ε, a) > 0, so dass f (x) ∈ U 2ε (f (a)) für alle x ∈ Uδ (a) ∩ K. Jedem a ∈ K ordnen wir die Kugelumgebung Ua ∶= U δ2 (a), δ = δ (ε, a) > 0 zu. Dann ist U ∶= { Ua ∣ a ∈ K } eine offene Überdeckung von K. Nach dem HeineBorelschen Überdeckungssatz 1.4.14 enthält U eine endliche Teilüberdeckung von K, das heißt, es gibt endlich viele Punkte a1 , . . . , aN ∈ K mit N
K ⊂ ⋃ Uak . k=1
Sei δ (ε) ∶= 12 min { δ (ε, a1 ), . . . , δ (ε, aN ) } > 0. Seien x, x′ ∈ K mit ∣x − x′ ∣ < δ. Dann gibt es ein k ∈ { 1, . . . , N } mit x ∈ Uak , das heißt ∣x − ak ∣ < 12 δ (ε, ak ). Weiterhin gilt 1 ∣x′ − ak ∣ < ∣x′ − x∣ + ∣x − ak ∣ < δ + δ (ε, ak ) ≤ δ (ε, ak ), 2
2.5 Stetige Funktionen und Abbildungen auf kompakten Mengen weshalb also
53
ε ε ∣f (x′ ) − f (ak )∣ < , ∣f (x) − f (ak )∣ < , 2 2
∣f (x) − f (x′ )∣ < ε für alle x, x′ ∈ K, ∣x − x′ ∣ < δ.
Folglich ist f gleichmäßig stetig auf K. 2.5.4 Satz. Sei K ⊂ Rn kompakt und f ∶ K → Rm eine stetige Abbildung. Dann ist f (K ) kompakt. Beweis. Sei (yk )k∈N eine Folge in f (K ), das heißt, es gilt yk = f (xk ), xk ∈ K. Es ist zu zeigen, dass eine Teilfolge (yk` )`∈N mit yk` → y ∈ f (K ) für ` → ∞ existiert: Wegen der Kompaktheit von K gibt es eine Teilfolge (xk` )`∈N von (xk )k∈N mit xk` → x ∈ K für ` → ∞. Da f stetig ist, folgt yk` = f (xk` ) → f (x) = y ∈ f (K ) für ` → ∞, weshalb f (K ) kompakt ist. 2.5.5 Satz von Weierstraß. Sei K eine nicht-leere, kompakte Teilmenge des Rn und f ∶ K → R eine stetige Funktion auf K. Dann gibt es zwei Punkte x+ , x− ∈ K mit f (x− ) ≤ f (x) ≤ f (x+ ) für alle x ∈ K, das heißt, es gilt f (x− ) = inf f (x) = min f (x), +
x∈ K
x∈K
f (x ) = sup f (x) = max f (x). x∈K
x∈K
Beweis. Wir zeigen die Existenz von x− . Um die Existenz von x+ zu zeigen, betrachte man zum Beispiel die Funktion −f . Nach dem verallgemeinerten Infimumsprinzip existiert y − ∶= inf f (K ) = inf f (x) ∈ R ∪ { ∞ } x∈K
und es gibt eine Folge (yk )k∈N in f (K ) mit yk = f (xk ), xk ∈ K und yk → y − für k → ∞. Weil K kompakt ist, besitzt die Minimalfolge (xk )k∈N nach dem Weierstraßschen Auswahlprinzip 1.2.8 eine Teilfolge (xk` )`∈N mit xk` → x− ∈ K für ` → ∞. Also folgt aus der Stetigkeit von f , dass f (xk` ) → f (x− ) = y − . Deshalb ist y − ∈ R und es gilt die Ungleichung f (x− ) = y − ≤ f (x) für alle x ∈ K.
54
2 Stetige Funktionen und Abbildungen
Zweiter Beweis. Wegen Satz 2.5.4 ist f (K ) kompakt. Deshalb ist f beschränkt und y − ∶= inf f (K ) ∈ R. Es gibt eine Folge (yk )k∈N in f (K ) mit yk → y − für k → ∞. Aufgrund der Abgeschlossenheit von f (K ) ist deshalb auch y − ∈ f (K ), das heißt, es gibt ein x− ∈ K mit f (x− ) = y − ≤ f (x) für alle x ∈ K. y
(−2, 4)
f (x, y ) = 4
(2, 4)
f (x, y ) =
Γ
(1, 1)
−4 − 12
225 4
97 4
4 f (x, y ) =
x
17 4
f (x, y ) =
45 4
−4
Abbildung 2.15: Bestimmung der Extremwerte unter einer Nebenbedingung
2.5.6 Beispiel. Zu bestimmen sind die Extremwerte der Funktion f (x, y ) ∶= (x− 2 4)2 + (y + 12 ) auf der Parabel Γ = { (x, y ) ∈ R2 ∣ y = x2 , ∣x∣ ≤ 2 }. Nach dem Satz von Weierstraß nimmt f (x, y ) auf dem Kompaktum Γ Minimum und Maximum an. Um diese zu bestimmen, betrachten wir die Funktion 1 2 f˜(x) ∶= f (x, y (x)) = f (x, x2 ) = (x − 4)2 + (x2 + ) 2
2.5 Stetige Funktionen und Abbildungen auf kompakten Mengen
55
für ∣x∣ ≤ 2 und berechnen die Ableitung 1 f˜′ (x) = 2(x − 4) + 2 (x2 + ) 2x = 4(x − 1)(x2 + x + 2). 2 Damit gilt f˜′ (x) = 0 genau für x = 1. Wir bestimmen die Werte von f˜ im Punkt x = 1 und in den Randpunkten x = 1, 2: 45 f˜(1) = f (1, 1) = , 4 225 f˜(−2) = f (−2, 4) = , 4 97 f˜(2) = f (2, 4) = . 4 Deshalb nimmt f (x, y ) das Minimum 45 4 im Punkt (1, 1) und das Maximum im Punkt (−2, 4) an (vergleiche Abbildung 2.15).
225 4
Wir behandeln noch eine Version des Satzes von Weierstraß für nicht-kompakte Mengen: 2.5.7 Satz. Sei U ⊂ Rn eine beschränkte offene Menge und sei F = C U = Rn ∖ U . Sei f ∶ F → R eine stetige Funktion mit f (x) → ∞ für ∣x∣ → ∞, das heißt, es gilt f (xk ) → +∞ für ∣x∣ → ∞. Dann gibt es ein a ∈ F , so dass f (a) = inf f (x) = min f (x). x∈F
Beweis. Sei
x∈ F
b ∶= inf f (x) ∈ R ∪ { −∞ } . x∈F
Für ` ∈ N betrachten wir die Kreisringe R` ∶= K` (0) ∖ U`−1 (0) = { x ∈ Rn ∣ ` − 1 ≤ ∣x∣ ≤ ` } , wobei wir U0 (0) ∶= ∅, also R1 = K1 (0) setzen. Wir wählen N ∈ N so groß, dass U ⊂ KN (0) und erhalten nach dem Satz von Weierstraß 2.5.5 für alle ` ≥ N + 1 ein a` ∈ R` mit b` ∶= f (a` ) = inf f (x) = min f (x). x∈ R `
x∈ R `
Wegen ∣a` ∣ → +∞ für ` → ∞ muss b` → +∞ gelten. Ohne Beschränkung der Allgemeinheit sei b` > b für alle ` ≥ N + 1. Dann gibt es ein a ∈ KN (0) ∩ F mit b = inf f (x) = x∈F
weshalb auch b ∈ R ist.
inf
x∈KN (0)∩F
f (x) =
min
x∈KN (0)∩F
f (x) = f (a),
56
2 Stetige Funktionen und Abbildungen
2.5.8 Satz. Sei K ⊂ Rn kompakt und f ∶ K → Rm eine stetige und injektive Abbildung. Dann ist f −1 ∶ f (K ) → Rn stetig. Beweis. Sei (yk )k∈N eine Folge in f (K ). Sei yk = f (xk ), b = f (a), xk , a ∈ K mit yk → b ∈ f (K ). Nach dem Folgenkriterium 2.3.4 ist zu zeigen, dass xk = f −1 (yk ) → f −1 (b) = a. Angenommen, xk → / a. Dann gibt es ein ε0 > 0 und eine Teilfolge (xk` )`∈N mit ∣xk` − a∣ ≥ ε0 > 0 für alle ` ∈ N. Weil K kompakt ist, gibt es eine Teilfolge (xk`m )m∈N dieser Teilfolge mit xk`m → ξ ∈ K, ξ ≠ a. Aus der Stetigkeit von f folgt dann aber, dass yk`m = f (xk`m ) → f (ξ ) = b = f (a), im Widerspruch zur Injektivität von f . 2.5.9 Bemerkungen. (i) pakte Menge.
In Satz 2.5.8 ist f (K ) wegen Satz 2.5.4 eine kom-
(ii) f und f −1 sind wegen Satz 2.5.3 gleichmäßig stetige Abbildungen. (iii) f ist ein Homöomorphismus oder eine topologische Abbildung von K auf f (K ), das heißt, f ist bijektiv und f und f −1 sind stetige Abbildungen auf ihren Definitionsbereichen. 2.5.10 Bemerkung. Im Fall m = n gilt ein entsprechender Satz auch, wenn f eine stetige injektive Abbildung auf einem offenen Definitionsbereich ist. Der Beweis erfordert allerdings Hilfsmittel aus der algebraischen Topologie beziehungsweise nichtlinearen Funktionalanalysis, die uns nicht zur Verfügung stehen. Der Spezialfall m = n = 1 wurde in der Analysis I in Abschnitt 4.6 über monotone Funktionen behandelt.
2.6 Stetige Funktionen und Abbildungen auf zusammenhängenden Mengen 2.6.1 Vorbemerkung. Wir erinnern uns an den Zwischenwertsatz von Bolzano, welcher besagt, dass die nichtlineare Gleichung f ( x) = c
2.6 Stetige Funktion u. Abb. auf zusammenhängenden Mengen
57
stets eine Lösung besitzt, wenn f eine stetige Funktion auf einem kompakten Intervall [a, b] ⊂ R, a < b, und c eine Konstante aus dem Intervall [f (a), f (b)] ist, wobei wir annehmen, dass f (a) ≤ f (b) gilt. Ist f eine streng monotone Funktion, so ist die Lösung sogar eindeutig bestimmt. Ziel dieses Paragraphen ist die Verallgemeinerung dieses Satzes auf eine Gleichung von mehreren Variablen f (x1 , . . . , xn ) = c. Die Eindeutigkeit ist im Allgemeinen nicht gewährleistet. In der Linearen Algebra ergibt eine einschränkende Bedingung für n freie Parameter eine wenigstens n − 1-dimensionale Lösungsmenge. Wir erwarten also, dass die Niveaumenge { x ∈ Rn ∣ f (x) = c } höchstens „n − 1-dimensional“ ist, was auch immer damit gemeint sein mag. Für den Satz von Bolzano ist entscheidend, dass der Definitionsbereich [a, b] eine “zusammenhängende“ Menge ist. Wir werden uns zunächst mit diesem Begriff auseinandersetzen müssen. 2.6.2 Definition. Eine Punktmenge A ⊂ Rn heißt wegweise zusammenhängend, falls es zu beliebig gegebenen a, b ∈ A eine parametrisierte Kurve (Weg) in A gibt, der a und b verbindet, das heißt, es gibt eine stetige Abbildung γ ∶ [0, 1] → Rn mit γ (t) ∈ A für alle t ∈ [0, 1] und γ (0) = a, γ (1) = b. 2.6.3 Definition. Eine Punktmenge A ⊂ Rn heißt (topologisch) zusammenhängend, falls es keine zwei in A relativ offene, disjunkte und nicht-leere Teil˜ und V˜ von A gibt, so dass mengen U ˜ ∪ V˜ = A U gilt, das heißt, falls es keine zwei offenen Mengen U, V ⊂ Rn gibt mit U ∩ V ∩ A = ∅, U ∩ A ≠ ∅, V ∩ A ≠ ∅ und A ⊂ U ∪ V. 2.6.4 Satz. Wenn A ⊂ Rn wegweise zusammenhängend ist, dann ist A zusammenhängend. Beweis. Angenommen, A sei nicht zusammenhängend. Dann gibt es offene Mengen U, V ⊂ Rn mit U ∩ V ∩ A = ∅, U ∩ A ≠ ∅, V ∩ A ≠ ∅ und A ⊂ U ∪ V. Seien a ∈ U ∩ A, b ∈ V ∩ A gewählt. Dann gibt es eine stetige Abbildung γ ∶ [0, 1] → A mit γ (0) = a ∈ U , γ (1) = b ∈ V . Wegen U ∩ V ∩ A = ∅ ist γ (1) ∈/ U . Sei τ ∶= sup { t ∣ γ (t) ∈ U } .
58
2 Stetige Funktionen und Abbildungen
Dann ist τ < 1, denn aus der Stetigkeit von γ und γ (1) ∈ V folgt, dass es ein 0 < δ < 1 gibt mit γ (t) ∈ V für alle t ∈ (1 − δ, 1]. Insbesondere ist also γ (1 − 2δ ) ∈ V und somit τ ≤ 1 − 2δ < 1. Analog zeigt man, dass τ > 0. Es gilt γ (τ ) ∈/ U , denn andernfalls wäre γ (τ ) ∈ U , und somit existierte ein 0 < δ < 1 − τ mit γ (t) ∈ U für alle t ∈ [0, τ + δ ], also insbesondere γ (τ + 2δ ) ∈ U , was der Definition von τ widerspricht. Es gilt γ (τ ) ∈/ V , denn andernfalls wäre γ (τ ) ∈ V , und somit existierte ein 0 < δ < τ mit γ (t) ∈ V für alle t ∈ (τ − δ, τ ], also insbesondere γ (τ − 2δ ) ∈ V , was der Definition von τ widerspricht. Wegen γ (τ ) ∈ A ⊂ U ∪ V erhalten wir einen Widerspruch. 2.6.5 Bemerkung. Die Umgekehrung gilt im Allgemeinen nicht, das heißt, wenn A zusammenhängend ist, dann ist A nicht notwendig wegweise zusammenhängend. Das zeigt das Beispiel A = A1 ∪ A2 , A1 ∶= { (x, y ) ∈ R2 ∣ x = 0, ∣y ∣ ≤ 1 } , 1 A2 ∶= { (x, y ) ∈ R2 ∣ x > 0, y = sin( ) } . x Im Folgenden zeigen wir, dass für Teilmengen der reellen Zahlen R und für offene Mengen im Rn die Begriffe „zusammenhängend“ und „wegweise zusammenhängend“ äquivalent sind: 2.6.6 Lemma. Eine Teilmenge A ⊂ R ist genau dann zusammenhängend, wenn für alle a, b ∈ A, a ≤ b, folgt, dass [a, b] ⊂ A. Beweis. „ ⇒“ Sei A ⊂ R zusammenhängend, seien a, b ∈ A, x ∈ R, a < x < b. Es ist zu zeigen, dass x ∈ A gilt: Wäre x ∈/ A, dann folgt A ⊂ (−∞, x) ∪ (x, +∞), (−∞, x) ∩ (x, +∞) = ∅, a ∈ (−∞, x) ∩ A, b ∈ (x, +∞) ∩ A, im Widerspruch zur Annahme, dass A zusammenhängend ist. „ ⇐“ Gilt für alle a, b ∈ A, a ≤ b, dass [a, b] ⊂ A, dann ist A wegweise zusammenhängend, denn γ (t) ∶= (1 − t)a + tb, t ∈ [0, 1], verbindet a und b. Also ist A nach Satz 2.6.4 zusammenhängend. Als Korollar erhalten wir:
2.6 Stetige Funktion u. Abb. auf zusammenhängenden Mengen
59
2.6.7 Satz. (i) Eine Teilmenge A ⊂ R ist genau dann zusammenhängend, wenn sie wegweise zusammenhängend ist. (ii) Die zusammenhängenden Teilmengen von R sind:
∅, R, (a, b), [a, b), (a, b], [a, b], (−∞, a), (−∞, a], (a, +∞), [a, +∞), dabei sind a, b ∈ R, a ≤ b. 2.6.8 Definition. (i) Eine Abbildung der Form γ ∶ [0, 1] → Rn , γ (t) = (1 − t)a + tb = a + t(b − a), 0 ≤ t ≤ 1, heißt parametrisierte Gerade von a nach b, auch: Verbindungsgerade, orientierte Gerade oder gerichtete Strecke, a heißt Anfangspunkt, b Endpunkt. Das Bild σ (a, b) ∶= γ ([0, 1]) = { γ (t) ∣ 0 ≤ t ≤ 1 } heißt die a und b verbindende Gerade oder Strecke (englisch: line segment). (ii) Eine Kurve, die aus endlich vielen Strecken besteht, heißt Polygonzug oder Streckenzug. 2.6.9 Satz. Eine offene Menge U ⊂ Rn ist genau dann zusammenhängend, wenn sich je zwei Punkte a, b ∈ U durch einen Polygonzug verbinden lassen. Beweis. „ ⇒“ Sei U zusammenhängend und sei a ein beliebiger Punkt aus U . Wir zeigen: Die Menge U (a) aller Punkte aus U , die sich mit a durch einen Polygonzug in U verbinden lassen, ist offen: Ist nämlich b ∈ U (a), so gibt es ein δ > 0, so dass Uδ (b) ⊂ U , und alle x ∈ Uδ (b) lassen sich durch eine Strecke mit b, also durch einen Polygonzug mit a verbinden, das heißt Uδ (b) ⊂ U (a), also ist U (a) offen. Genauso ist die Menge V (a) aller Punkte aus U , die sich nicht mit a durch einen Polygonzug verbinden lassen, eine offene Menge: Ist nämlich b ∈ V (a), so gibt es ein δ > 0, so dass Uδ (b) ⊂ U , und alle x ∈ Uδ (b) lassen sich mit b durch eine Strecke verbinden, aber nicht mit a durch einen Polygonzug, da auch a nicht mit b durch einen Polygonzug verbindbar ist. Damit sind U (a) und V (a) offene Mengen mit U (a) ∩ V (a) = ∅, U (a) ∩ U ≠ ∅, U = U (a) ∪ V (a). Da U zusammenhängend ist, muss V (a) ∩ U = ∅
60
2 Stetige Funktionen und Abbildungen
gelten, also ist V (a) = ∅, und damit ist U = U (a) wie behauptet. „ ⇐“ Sei U polygonal zusammenhängend. Weil ein Polygonzug eine parametrisierte Kurve ist, ist U wegweise zusammenhängend und aufgrund von Satz 2.6.4 zusammenhängend. Als Korollar erhalten wir: 2.6.10 Satz. Eine offene Teilmenge des Rn ist genau dann zusammenhängend, wenn sie wegweise zusammenhängend ist. 2.6.11 Definition. Eine Punktmenge G ⊂ Rn heißt Gebiet, falls G offen und zusammenhängend ist. 2.6.12 Satz. Sei D ⊂ Rn wegweise zusammenhängend und sei f ∶ D → Rm eine stetige Abbildung. Dann ist auch f (D) wegweise zusammenhängend. Beweis. Seien c, d ∈ f (D), das heißt c = f (a), d = f (b), a, b ∈ D. Dann gibt es eine stetige Abbildung γ ∶ [0, 1] → D mit γ (0) = a, γ (1) = b. Sei
̃ γ ∶= f ○ γ ∶ [0, 1] → Rm . Dann ist ̃ γ stetig mit ̃ γ ([0, 1]) ⊂ f (D) und
̃ γ (0) = f (γ (0)) = f (a) = c, ̃ γ (1) = f (γ (1)) = f (b) = d. 2.6.13 Satz. Sei D ⊂ Rn zusammenhängend und sei f ∶ D → Rm eine stetige Abbildung. Dann ist auch f (D) zusammenhängend. Beweis. Angenommen, die Behauptung wäre falsch. Dann gibt es offene Mengen U, V ⊂ Rm mit U ∩ V ∩ f (D) = ∅, U ∩ f (D) ≠ ∅, V ∩ f (D) ≠ ∅, f (D) ⊂ U ∪ V. Aufgrund der Stetigkeit von f , beziehungsweise aufgrund von Satz 2.3.10, sind f −1 (U ) und f −1 (V ) ⊂ Rn relativ offen in D, und es folgt, dass f −1 (U ) ∩ f −1 (V ) = f −1 (U ∩ V ) = ∅, f −1 (U ) ≠ ∅, f −1 (V ) ≠ ∅, D = f −1 (f (D)) ⊂ f −1 (U ∪ V ) = f −1 (U ) ∪ f −1 (V ) ⊂ D, was im Widerspruch dazu steht, dass D zusammenhängend ist.
2.7 Gleichmäßige Konvergenz
61
2.6.14 Zwischenwertsatz von Bolzano. Sei D ⊂ Rn zusammenhängend und sei f ∶ D → R eine stetige Funktion auf D. Seien a, b ∈ D mit f (a) ≤ f (b). Dann gibt es zu jedem c ∈ [f (a), f (b)] ein x ∈ D mit f (x) = c. Beweis. Wegen Satz 2.6.13 ist f (D) zusammenhängend. Nach Lemma 2.6.6 gilt deshalb [f (a), f (b)] ⊂ f (D), mit anderen Worten gibt es zu jedem c ∈ [f (a), f (b)] ein x ∈ D mit f (x) = c wie behauptet.
2.7 Gleichmäßige Konvergenz 2.7.1 Definition. Seien fk ∶ D → Rm und f ∶ D → Rm Abbildungen auf einer Punktmenge D ⊂ Rn , k ∈ N. (i) Dann heißt die Funktionenfolge (fk )k∈N (punktweise) konvergent gegen f , wenn für alle x ∈ D gilt, dass fk (x) → f (x) für k → ∞. (ii) Die Folge (fk )k∈N heißt gleichmäßig konvergent gegen f , in Zeichen glm
fk ÐÐ→ f oder fk → f glm. für k → ∞ oder f (x) = lim fk (x) glm. für alle x ∈ D, k→∞
wenn es zu jedem ε > 0 ein N = N (ε) ∈ N gibt mit
∣fk (x) − f (x)∣ < ε für alle k ∈ N, k ≥ N und alle x ∈ D. 2.7.2 Lemma. Die Konvergenz fk → f ist genau dann gleichmäßig auf D, wenn lim (sup ∣fk (x) − f (x)∣) = 0.
k→∞
x∈ D
2.7.3 Cauchysches Konvergenzkriterium. Eine Folge (fk )k∈N von Abbildungen fk ∶ D → Rm auf D konvergiert genau dann gleichmäßig gegen eine Abbildung f ∶ D → Rm , wenn es zu jedem ε > 0 ein N = N (ε) gibt mit
∣fk (x) − f` (x)∣ < ε für alle k, ` ∈ N, k, ` ≥ N und alle x ∈ D.
62
2 Stetige Funktionen und Abbildungen
Beweis. Die Notwendigkeit des Cauchyschen Konvergenzkriteriums folgt mit Hilfe der Dreiecksungleichung direkt aus der Definition 2.7.1 (ii) für gleichmäßige Konvergenz. Wir zeigen, dass die Bedingung auch hinreichend ist: Für jedes feste x ∈ D ist (fk (x))k∈N eine Cauchy-Folge. Wegen der Vollständigkeit des Rm existiert f (x) ∶= lim fk (x) für alle x ∈ D. k→∞
Sei ε > 0. Wegen ∣fk (x) − f` (x)∣ < ε für alle k, ` ∈ N, k, ` ≥ N und x ∈ D folgt durch Grenzübergang ` → ∞, dass
∣fk (x) − f (x)∣ < ε für alle k ∈ N, k ≥ N und x ∈ D. Also konvergiert (fk )k∈N gleichmäßig gegen f . 2.7.4 Satz. Sei fk → f gleichmäßig auf D und sei a ∈ Rn ein Häufungspunkt von D. Existieren die Grenzwerte ck ∶= lim fk (x) ∈ Rm für alle k ∈ N, x→a
dann existiert der Grenzwert c ∶= lim f (x) ∈ Rm und es gilt die Grenzwertbeziex→a hung lim f (x) = lim ck , x→a
k→∞
mit anderen Worten, lim ( lim fk (x)) = lim ( lim fk (x)).
x→a k→∞
k→∞ x→a
Beweis. Sei ε > 0. Wähle N ∈ N so, dass
∣fk (x) − f` (x)∣
0 so klein wählen, dass x→a
∣fN (x) − cN ∣
0. Ist a ∈ K, dann gibt es ein N = N (ε, a) ∈ N, so dass ε 0 ≤ fN (a) < . 2
64
2 Stetige Funktionen und Abbildungen
Weil fN stetig ist, gibt es ein δ = δ (ε, a) > 0 mit
∣fN (x) − fN (a)∣
n ≥ N.
Dann ist
m
m
k=n+1
k=n+1
∣sm − sn ∣ = ∣ ∑ fk (x)∣ ≤ ∑ Mk < ε für alle m, n ∈ N, m > n ≥ N und x ∈ D. Also konvergiert (sn )∞ n=0 nach dem Cauchyschen Konvergenzkriterium 2.7.3 gleichmäßig auf D.
3
Differentialrechnung mehrerer Variablen
Wir wollen nun die Differentialrechnung für reelle Funktionen in Abhängigkeit von n Variablen x1 , . . . , xn entwickeln. Dabei betrachten wir immer Funktionen f ∶ U → R, x ↦ y = f (x) = f (x1 , . . . , xn ), die in einer offenen Teilmenge U des Rn , n ∈ N, erklärt sind.
3.1 Partiell differenzierbare Funktionen 3.1.1 Definition. (i) Sei f ∶ U → R eine in einer offenen Menge U ⊂ Rn erklärte Funktion, a = (a1 , . . . , an ) ein Punkt in U und i ∈ { 1, . . . , n }. Existiert der Grenzwert ∂f f (a1 , . . . , ai−1 , t, ai+1 , . . . , an ) − f (a) (a) = fxi (a) ∶= lim , t→ai ∂xi t − ai so heißt f im Punkt oder an der Stelle a nach xi partiell differenzierbar ∂f und ∂x (a) ist die partielle Ableitung von f nach xi . i (ii)
∂f ∂f Existieren alle partiellen Ableitungen ∂x (a), . . . , ∂x (a) von f nach 1 n x1 , . . . , xn , so heißt f im Punkt a partiell differenzierbar. Der Vektor
∇f (a) ∶= (
∂f ∂f (a), . . . , (a)) ∂x1 ∂xn
heißt Gradient von f an der Stelle a. (iii)
∂f ∂f Wenn die partiellen Ableitungen ∂x (x), . . . , ∂x (x) für alle x ∈ U exis1 n tieren, so heißt f in U partiell differenzierbar; stellen sie in U stetige Funktionen dar, so heißt f in U stetig (partiell) differenzierbar, in Zeichen f ∈ C 1 (U ).
∂f 3.1.2 Bemerkungen. (i) ∂xi (a) ist die Änderungsrate von f an der Stelle a in Richtung der xi -Achse (vergleiche Abbildungen 3.1 und 3.2).
(ii)
∂f Die partielle Ableitung ∂x (a) ist in dem folgenden Sinn eine gewöhnliche: i Sei ε > 0 so klein, dass Uε (a) = { x ∈ Rn ∣ ∣x − a∣ < ε } ⊂ U gilt. Sei weiter
68
3 Differentialrechnung mehrerer Variablen z
{ (x, y, z ) ∣ y = b }
c = f (a, b)
tan ϕ =
∂f ∂x (a, b)
ϕ
Gf ∩ { (x, y, z ) ∣ y = b }
b
a
(a, b)
x Abbildung 3.1:
y
{ (x, y ) ∣ y = b } ∂f (a, b) ∂x
ist die Änderungsrate von f in Richtung der x-Achse.
γi ∶ (ai − ε, ai + ε) → Uε (a), γi (t) ∶= (a1 , . . . , ai−1 , t, ai+1 , . . . , an ), eine Gerade durch a parallel zur xi -Achse und sei die Funktion fi ∶ (−ε, ε) → R definiert durch
fi (t) ∶= (f ○ γi )(t) = f (a1 , . . . , ai−1 , t, ai+1 , . . . , an )
für ∣t∣ < ε.
3.1 Partiell differenzierbare Funktionen
69
z
{ (x, y, z ) ∣ x = a }
c = f (a, b)
Gf ∩ { (x, y, z ) ∣ x = a }
tan ϕ =
ϕ
∂f ∂y (a, b)
b
a { (x, y ) ∣ x = a }
y
(a, b)
x Abbildung 3.2:
∂f (a, b) ∂y
ist die Änderungsrate von f in Richtung der y-Achse
Existiert die Ableitung von fi an der Stelle ai , so gilt fi (t) − fi (ai ) t − ai f (a1 , . . . , ai−1 , t, ai+1 , . . . , an ) − f (a) = lim t→ai t − ai ∂f = (a). ∂xi
fi′ (ai ) = lim
t→ai
(iii)
∂f Um die partielle Ableitung ∂x (a) der Funktion f an der Stelle a für ein i i ∈ { 1, . . . , n } erklären zu können genügt es, dass die Funktion f auf einer Teilmenge D ⊂ Rn definiert ist, für welche a ∈ D ein Häufungspunkt
70
3 Differentialrechnung mehrerer Variablen von D ∩ { (a1 , . . . , ai−1 , t, aa+1 , . . . , an ) ∣ t ∈ R } ist. Wir wollen aber annehmen, dass der Definitionsbereich von f eine offene Menge ist, weil dies im Allgemeinen sinnvoller und anschaulicher ist.
3.1.3 Beispiel. Seien p, q ∈ N. Sei f (x) = f (x1 , x2 ) ∶= xp1 xq2 für x = (x1 , x2 ) ∈ R2 . Wir wollen die Definition der Differenzierbarkeit im Punkt a = (a1 , a2 ) durchspielen: Gemäß Bemerkung 3.1.2 (i) betrachtet man die Funktion f1 (t) ∶= f (t, a2 ) = tp aq2 für t ∈ R. f1 ist auf R differenzierbar und es gilt f1′ (t) = ptp−1 aq2 , weshalb
f1′ (a1 ) = pap1−1 aq2 .
Deshalb ist f im Punkt a partiell nach x1 differenzierbar und es gilt ∂f (a) = f1′ (a) = pap1−1 aq2 . ∂x1 Natürlich geht man in der Praxis so vor, dass man sich die Variable x2 lediglich als festgehalten denkt und unmittelbar ∂ (xp1 xq2 ) ∂f = ∂x1 ∂x1 berechnet, weshalb
xq2 =const
=
pxp1−1 xq2
∂f (a) = pxp1−1 xq2 ∣ = pap1−1 aq2 . x=a ∂x1
3.1.4 Lemma und Definition. (i) Sei f ∶ U → R im Punkt a ∈ U nach xi partiell differenzierbar, das heißt, für dieses i ∈ { 1, . . . , n } existiert die ∂f partielle Ableitung ∂x (a). Dann ist f im Punkt a in Richtung der xi i Achse stetig, das heißt, es gilt lim f (a1 , . . . , ai−1 , t, ai+1 , . . . , an ) = f (a).
t→ai
(ii)
(3.1)
Ist f im Punkt a ∈ U partiell differenzierbar, das heißt, existieren alle ∂f ∂f partiellen Ableitungen ∂x (a), . . . , ∂x (a), so ist f im Punkt a in allen 1 n Achsenrichtungen stetig, das heißt, die Limesrelation (3.1) gilt für alle i = 1, . . . , n.
3.1 Partiell differenzierbare Funktionen
71
3.1.5 Beispiel. Die Funktion
⎧ 2xy ⎪ ⎪ 2 2 f (x, y ) ∶= ⎨ x +y ⎪ ⎪ ⎩0
für (x, y ) ≠ (0, 0) für (x, y ) = (0, 0)
ist für alle (x, y ) ≠ (0, 0) partiell differenzierbar, zum Beispiel ist dort fx (x, y ) =
(x2 + y 2 )2y − 2xy ⋅ 2x 2y 3 − 2x2 y = 2 . (x2 + y 2 )2 (x + y 2 )2
Wegen f (x, 0) = 0 = f (0, y ) für alle x, y ∈ R ist f auch im Punkt (x, y ) = (0, 0) partiell differenzierbar und es gilt fx (0, 0) = 0 = fy (0, 0). Aber f ist nicht im Punkt (0, 0) stetig, denn in Polarkoordinaten x = r cos ϕ, y = r sin ϕ gilt für (x, y ) ≠ (0, 0): f (x, y ) =
2r2 cos ϕ sin ϕ = sin 2ϕ. r2
f ist unabhängig von r und gleich 0 für ϕ = 0, ± π2 , π und beispielsweise gleich 1 für ϕ = π4 . Zur Formulierung der Kettenregel ist es sinnvoll, m Funktionen f1 , . . . , fm , m ∈ N, zu einer Abbildung f = (f1 , . . . , fm ) ∶ U → Rm , x ↦ y = f (x) ∶= (f1 (x), . . . , fm (x)) zusammenzufassen. Die partielle Differenzierbarkeit von solchen Abbildungen ist komponentenweise erklärt: 3.1.6 Definition. (i) Eine Abbildung f = (f1 , . . . , fm ) ∶ U → Rm , m ∈ N, heißt im Punkt oder an der Stelle a ∈ U partiell differenzierbar, wenn ∂f1 ∂f1 m die partiellen Ableitungen ∂x (a), ∂x (a), . . . , ∂f ∂xn (a) der Komponenten1 2 funktionen f1 , . . . , fm ∶ U → R an der Stelle a existieren. (ii)
∂f1 ∂f1 m Wenn die partiellen Ableitungen ∂x (x), ∂x (x), . . . , ∂f ∂xn (x) für alle x ∈ U 1 2 existieren, so heißt f in U partiell differenzierbar. f gehört zur Klasse C 1 (U, Rm ) der in U stetig (partiell) differenzierbaren Abbildungen, falls alle Komponentenfunktionen f1 , . . . , fm zur Klasse C 1 (U ) gehören.
72
3 Differentialrechnung mehrerer Variablen
3.1.7 Satz. Seien U ⊂ Rn , V ⊂ Rm offene Mengen. Sei f ∶ U → Rm eine in U partiell differenzierbare Abbildung mit f (U ) ⊂ V und sei g ∶ V → R eine C 1 Funktion auf V . Dann ist die Funktion h ∶= g ○ f ∶ U → R, h(x) = g (f (x)), in U partiell differenzierbar und für alle x ∈ U und alle i = 1, . . . , n gilt die Kettenregel m ∂fj ∂h ∂g (x) = ∑ (f (x)) (x). ∂xi ∂xi j =1 ∂yj Beweis. Es genügt, den Fall n = 1 und U ⊂ R ein offenes Interval zu untersuchen. Zu zeigen ist die partielle Differenzierbarkeit von h = g ○ f ∶ U → R sowie die Darstellung m ∂g h′ ( x ) = ∑ (f (x))fj′ (x). ∂y j j =1 Sei a ∈ U und sei b ∶= f (a) ∈ V . Sei V (b) = Vε (b) eine offene Kugel im Rm mit V (b) ⊂ V . Als differenzierbare Abbildung einer Variablen ist f auf U stetig. Deshalb gibt es ein offenes Intervall I (a) = Iδ (a) ⊂ U mit f (I (a)) ⊂ V (b). Für alle x ∈ I (a) gilt dann y = (y1 , . . . , ym ) = f (x) = (f1 (x), . . . , fm (x)) ∈ V (b) sowie h(x) − h(a) = g (f (x)) − g (f (a)) = g (y ) − g (b) = g (y1 , . . . , ym ) − g (y1 , . . . , ym−1 , bm ) + g (y1 , . . . , ym−1 , bm ) − g (y1 , . . . , ym−2 , bm−1 , bm ) +⋯ + g (y1 , b2 , . . . , bm ) − g (b1 , . . . , bm )
= g (y (m) ) − g (y (m−1) ) + g (y (m−1) ) − g (y (m−2) ) +⋯ + g (y (1) ) − g (y (0) ) , wobei die Punkte y (0) ∶= b, y (j ) ∶= (y1 , . . . , yj , bj +1 , . . . , bm ) für j = 1, . . . , m − 1 und y (m) ∶= y in V (b) liegen (vergleiche Abbildung 3.3). Wir betrachten nun die Funktionen gj (t) ∶= g (y1 , . . . , yj −1 , t, bj +1 , . . . , bm ) für t ∈ J und j = 1, . . . , m, dabei ist J ∶= {
(bj − , yj + ) für yj ≥ bj , (yj − , bj + ) für bj > yj .
3.1 Partiell differenzierbare Funktionen
73
y3 b3
y (2)
σ2
y (1) σ1
σ3
b
y3 y y2
b2 y2
y1
b1 y1 Abbildung 3.3: Beweis der Kettenregel
> 0 ist dabei so klein gewählt, dass die Segmente σj ∶= { (y1 , . . . , yj −1 , t, bj +1 , . . . , bm ) ∣ t ∈ J } noch in V (b) liegen. Wir haben dann gj (yj ) = g (y (j ) ) und gj (bj ) = g (y (j −1) ). Wendet man auf die Differenzen den Mittelwertsatz der Differentialrechnung einer Variablen an, so ergibt sich, dass m
h(x) − h(a) = ∑ (gj (yj ) − gj (bj )) j =1 m
= ∑ gj′ (τ (j ) ) (yj − bj ) j =1 m
∂g (j ) (ξ ) (fj (x) − fj (a)) ∂y j j =1
=∑
mit Zwischenstellen ξ (j ) = (y1 , . . . , yj −1 , τ (j ) , bj +1 , . . . , bn ), ∣τ (j ) − bj ∣ < ∣yj − bj ∣, für welche deshalb ∣ξ (j ) − b∣ < ∣y − b∣ für j = 1, . . . , m gilt. Aufgrund der Stetigkeit von f auf dem Intervall I hat man also ξ (j ) → b = f (a) für x → a und deshalb
74
3 Differentialrechnung mehrerer Variablen
folgt, dass m h(x) − h(a) m ∂g (j ) fj (x) − fj (a) ∂g =∑ (ξ ) →∑ (b)fj′ (a) x−a x−a j =1 ∂yj j =1 ∂yj
für x → a, x ≠ a, wegen der Stetigkeit der partiellen Ableitungen von g und der Differenzierbarkeit von f , womit die Behauptung bewiesen ist. 3.1.8 Beispiele. (i)
Wir betrachten die Funktionen g (y ) ∶= y12 + y22 für y = (y1 , y2 ) ∈ R2 , y1 = f1 (x) = f1 (x1 , x2 ) ∶= x1 cos x2 , y2 = f2 (x) = f2 (x1 , x2 ) ∶= x2 sin x1
für x = (x1 , x2 ) ∈ R2 . Sei h(x) ∶= g (f (x)), f (x) = (f1 (x), f2 (x)). Nach der Kettenregel ist zum Beispiel ∂h ∂g ∂f1 ∂g ∂f2 (x) = (f (x)) (x) + (f (x)) (x) ∂x1 ∂y1 ∂x1 ∂y2 ∂x1
= 2y1 ∣ =
cos x2 + 2y2 ∣ x2 cos x1 y1 =x1 cos x2 y2 =x2 sin x1 2x1 cos2 x2 + 2x22 cos x1 sin x1 .
Dies kann man auch durch direktes Einsetzen so berechnen: Es gilt h(x) = g (f (x)) = g (y )∣
= weshalb
(ii)
Sei
(y12
y =f (x)
+ y22 )∣y1 =x1 cos x2 = x21 cos2 x2 + x22 sin2 x1 , y2 =x2 sin x1
∂h = 2x1 cos2 x2 + 2x22 sin x1 cos x1 . ∂x1 h(x) ∶= exp(x21 + x1 x2 + x22 ).
Wir können die partiellen Ableitungen natürlich direkt berechnen, lösen den Ausdruck aber auf und setzen y1 = f1 (x1 , x2 ) ∶= x21 , y2 = f2 (x1 , x2 ) ∶= x1 x2 , y3 = f3 (x1 , x2 ) ∶= x22 , z = g (y ) = g (y1 , y2 , y3 ) ∶= exp(y1 + y2 + y3 ).
3.1 Partiell differenzierbare Funktionen
75
Nach der Kettenregel ist ∂h ∂g ∂f1 ∂g ∂f2 (x) = (f (x)) (x) + (f (x)) (x) ∂x1 ∂y1 ∂x1 ∂y2 ∂x1 ∂g ∂f3 + (f (x)) ( x) ∂y3 ∂x1 = (exp(y1 + y2 + y3 ) ⋅ 2x1 + exp(y1 + y2 + y3 ) ⋅ x2 RRR + exp(y1 + y2 + y3 ) ⋅ 0) RRRRR RRRyy=1 =xxx21 2 1 2
=
y3 =x22 (2x1 + x2 ) exp(x21 + x1 x2 + x22 ).
3.1.9 Mittelwertsatz. Sei f ∶ U → R eine C 1 -Funktion. Seien x, x′ zwei Punkte in U , so dass das Segment σ (x, x′ ) = { (1 − t)x + tx′ ∣ t ∈ [0, 1] } in U liegt. Dann gibt es einen Punkt ξ ∈ σ (x, x′ ), ξ ≠ x, x′ , mit n
∂f (ξ )(x′i − xi ) = ∇f (ξ ) ⋅ (x′ − x), i=1 ∂xi
f (x′ ) − f (x) = ∑
das heißt, es gibt ein t ∈ (0, 1) mit f (x′ ) − f (x) = ∇f ((1 − t)x + tx′ ) ⋅ (x′ − x). Beweis. Sei γ (t) ∶= (1 − t)x + tx′ für 0 ≤ t ≤ 1 eine Parametrisierung von σ (x, x′ ). Sei h(t) ∶= f (γ (t)) = f ((1 − t)x + tx′ ). Dann ist nach der Kettenregel, Satz 3.1.7, h ∈ C 1 (0, 1), also insbesondere differenzierbar in (0, 1) und als Funktion einer Variablen dort auch stetig. h ist sogar stetig auf [0, 1], weil das Segment { (1 − t)x + tx′ ∣ t ∈ (−, 1 + ) } für hinreichend kleines > 0 noch in U liegt. Aus dem Mittelwertsatz der Differentialrechnung einer Variablen und der Kettenregel folgt deshalb, dass f (x′ ) − f (x) = h(1) − h(0) = h′ (t) n
∂f ((1 − t)x + tx′ )(x′i − xi ) ∂x i i=1
=∑
= ∇f ((1 − t) x + tx′ ) ⋅ (x′ − x) mit einem t ∈ (0, 1).
3.1.10 Satz. Jede stetig differenzierbare Funktion f ∶ U → R ist in U stetig, das heißt, aus f ∈ C 1 (U ) folgt, dass f ∈ C 0 (U ).
76
3 Differentialrechnung mehrerer Variablen
Beweis. Dies ist ein Korollar zum Mittelwertsatz. 3.1.11 Mittelwertsatz in Integralform. Sei f ∶ U → R stetig differenzierbar in U . Seien x, x′ ∈ U mit σ (x, x′ ) ⊂ U . Dann gilt n
f (x′ ) − f (x) = ∑ ∫ i=1
=∫
1 0
1 0
∂f ((1 − t)x + tx′ )dt (x′i − xi ) ∂xi
∇f ((1 − t)x + tx′ )dt ⋅ (x′ − x).
Beweis. Es sei h(t) ∶= f (γ (t)) = f ((1 − t)x + tx′ ) für 0 ≤ t ≤ 1. Dann ist nach der Kettenregel n
∂f ((1 − t) x + tx′ ) (x′i − xi ) = ∇f ((1 − t)x + tx′ )) ⋅ (x′ − x). ∂x i i=1
h′ (t) = ∑
Aus dem Hauptsatz der Differential- und Integralrechnung folgt, dass f (x′ ) − f (x) = h(1) − h(0) 1
=∫
0 n
h′ (t)dt
= ∑∫ i=1
=∫
1 0
1 0
∂f ((1 − t)x + tx′ )dt (x′i − xi ) ∂xi
∇f ((1 − t)x + tx′ )dt ⋅ (x′ − x).
3.1.12 Bemerkung. In dieser Form gilt der Mittelwertsatz auch für vektorwertige Abbildungen f ∶ U → Rm . Beim gewöhnlichen Mittelwertsatz hätte man im Allgemeinen verschiedene Zwischenstellen ξ (1) , . . . , ξ (m) für die Komponentenfunktionen f1 , . . . , fm .
3.2 Höhere Ableitungen 3.2.1 Definition. (i) Seien i, j ∈ { 1, . . . , n }. f sei eine in U erklärte Funkti∂f on, deren partielle Ableitung ∂x = fxi in U existiert. Außerdem existiere i die partielle Ableitung
∂fxi ∂xj (a)
=
∂2f ∂xj ∂xi (a)
an der Stelle a ∈ U . Dann heißt
∂2f (a) = fxi xj (a) ∂xj ∂xi die zweite partielle Ableitung von f nach xi und xj an der Stelle a ∈ U .
3.2 Höhere Ableitungen (ii)
77
Sei k ∈ N, k ≥ 2 und sei (i1 , . . . , ik ) ein k-Tupel natürlicher Zahlen mit i1 , . . . , ik ∈ { 1, . . . , n }. Existieren die partiellen Ableitungen ∂fxi1 ∂f ∂2f = fxi1 , = fxi1 xi2 = ,... ∂xi1 ∂xi2 ∂xi1 ∂xi2 ...,
∂fxi1 ...xik−2 ∂ k −1 f = fxi1 ⋯xik−1 = ∂xik−1 ⋯∂xi1 ∂xik−1
in U , so heißt ∂fxi1 ⋯xik−1 ∂kf (a) = fxi1 ⋯xik (a) = (a), ∂xik ⋯∂xi1 ∂xik falls existent, die partielle Ableitung der Ordnung k von f nach xi1 ⋯xik an der Stelle a ∈ U . (iii)
Sei k ∈ N. Existieren alle partiellen Ableitungen
∂f ∂f ∂x1 (x), ∂x2 (x),
...,
∂kf ∂xkn (x)
von f bis zur Ordnung k für alle x ∈ U und stellen die Ableitungen der Ordnung k stetige Funktionen dar (weshalb alle Ableitungen bis zur Ordnung k stetig sind), so heißt f in U k-mal stetig (partiell) differenzierbar, in Zeichen f ∈ C k (U ). f heißt ∞-oft stetig (partiell) differenzierbar, in Zeichen f ∈ C ∞ (U ), falls dies für alle k ∈ N gilt. Das folgende Beispiel zeigt, dass die gemischten partiellen Ableitungen
∂2f ∂y∂x (a, b)
2
∂ f und ∂x∂y (a, b) für eine Funktion f = f (x, y ) nicht immer gleich sind. Deshalb geben wir anschließend eine Bedingung an, welche die Gleichheit garantiert.
3.2.2 Beispiel. Sei
⎧ x3 y −xy 3 ⎪ für (x, y ) ≠ (0, 0) ⎪ x2 + y 2 f (x, y ) ∶= ⎨ ⎪ für (x, y ) = (0, 0). ⎪ ⎩0 f ist für (x, y ) ≠ (0, 0) stetig partiell differenzierbar. Wegen f (x, 0) = 0 = f (0, y ) für alle x, y existieren die partiellen Ableitungen nach x und y im Punkt (0, 0) ∂f und es gilt ∂f ∂x (0, 0) = 0 = ∂y (0, 0). Für y ≠ 0 gilt ∂f (0, y ) = lim t→0 ∂x
t3 y −ty 3 t2 +y 2
t
−0
= −y
und für x ≠ 0 ist ∂f ∂y (x, 0) = x. Hieraus folgt die Existenz der gemischten zweiten Ableitungen nach x und y im Punkt (0, 0) und es gilt ∂2f −t − 0 ∂2f (0, 0) = lim = −1 ≠ 1 = (0, 0). t→0 ∂y∂x t ∂x∂y
78
3 Differentialrechnung mehrerer Variablen
3.2.3 Lemma über den 2. Differenzenquotienten. Es sei f = f (x, y ) eine in U ⊂ R2 erklärte Funktion, deren partielle Ableitungen fx und fxy in U existieren. Außerdem sei fxy an der Stelle (a, b) ∈ U stetig. Dann gilt die Gleichung fxy (a, b) = xlim ∆(x, y ) →a y →b
mit ∆(x, y ) = ∆(x, y, a, b) ∶=
f (x, y ) − f (a, y ) − f (x, b) + f (a, b) (x − a)(y − b)
für (x, y ) ∈ U , x ≠ a, y ≠ b. x2
x1 = a
x1 = ξ
y η
x2 = y
b
x2 = b U (a, b)
a ξ x
x1
Abbildung 3.4: Bildung des 2. Differenzenquotienten
Beweis. Da U offen ist, gibt es eine offene Kreisscheibe U (a, b) = Uδ (a, b) ⊂ U . Sei (x, y ) ∈ U (a, b), x ≠ a, y ≠ b. Wir wollen den Ausdruck ∆(x, y ) geeignet umschreiben. Dazu betrachten wir die Funktion ϕ(t) ∶= f (t, y ) − f (t, b) im Intervall I ∶= [min { a, x } , max { a, x }] und schreiben ∆(x, y ) =
1 ϕ(x) − ϕ(a) . y−b x−a
Da fx in U existiert, ist ϕ(t) in I stetig und differenzierbar. Der Mittelwertsatz der Differentialrechnung einer Variablen liefert ϕ(x) − ϕ(a) = ϕ′ (ξ ) = fx (ξ, y ) − fx (ξ, b) x−a
3.2 Höhere Ableitungen
79
mit einem ξ ∈ ˚ I, das heißt, es gilt ∣ξ − a∣ < ∣x − a∣. Es folgt ∆(x, y ) =
1 ϕ(x) − ϕ(a) fx (ξ, y ) − fx (ξ, b) = . y−b x−a y−b
Abermalige Anwendung des Mittelwertsatzes auf die Funktion ψ (s) = fx (ξ, s) im Intervall J ∶= [min { b, y } , max { b, y }] ergibt ∆(x, y ) =
ψ (y ) − ψ (b) = ψ ′ (η ) = fxy (ξ, η ) y−b
˚ das heißt ∣η − b∣ < ∣y − b∣ (vergleiche Abbildung 3.4). Wegen der mit einem η ∈ J, Stetigkeit von fxy im Punkt (a, b) folgt, dass fxy (a, b) = xlim ∆(x, y ) →a y →b
wie behauptet. 3.2.4 Satz über die Vertauschbarkeit der Differentiationsreihenfolge (H. A. Schwarz). Es sei f (x, y ) eine in einer offenen Menge U ⊂ R2 erklärte Funktion, deren partielle Ableitungen fx , fy und fxy existieren. Außerdem sei fxy an der Stelle (a, b) ∈ U stetig. Dann existiert auch fyx an der Stelle (a, b) und es gilt die Gleichung fyx (a, b) = fxy (a, b). Beweis. Aufgrund von Lemma 3.2.3 und dem Satz über den iterierten Limes 2.2.9 gilt fxy (a, b) = xlim ∆(x, y ) →a y →b
= lim (lim ∆(x, y )) x→a y →b
fy (x, b) − fy (a, b) x−a = fyx (a, b).
= lim
x→a
Hieraus ergibt sich das folgende hinreichende Kriterium für die Gleichheit der gemischten Ableitungen:
80
3 Differentialrechnung mehrerer Variablen
3.2.5 Satz. Es sei f ∈ C k (U ) in einer offenen Menge U ⊂ Rn , k ∈ N, k ≥ 2, das heißt, die partiellen Ableitungen von f bis zur Ordnung k existieren und sind in U stetig. Sei (i1 , . . . , i` ) ein `-Tupel natürlicher Zahlen 1 ≤ ` ≤ k mit i1 , . . . , i` ∈ { 1, . . . , n }. Ist (j1 , . . . , j` ) eine Permutation von (i1 , . . . , i` ), dann gilt für alle x ∈ U die Gleichung fxi1 ⋯xi` (x) =
∂`f ∂`f (x) = (x) = fxj1 ⋯xj` (x). ∂xi` ⋯∂xi1 ∂xj` ⋯∂xj1
3.2.6 Bezeichnung. Ist f ∈ C k (U ), so können aufgrund von Satz 3.2.5 alle partiellen Ableitungen von f bis zur Ordnung k in der Form Dα f =
∂ ∣α∣ f ∂xαnn ⋯∂xα1 1
geschrieben werden, dabei ist α = (α1 , . . . , αn ) ∈ Nn0 ∶= N0 ×⋯×N0 ein Multiindex mit ∣α∣ ∶= α1 + ⋯ + αn ≤ k. Zur Einübung der Multiindexschreibweise betrachten wir die Binomial- und allgemeiner die Multinomialformel (manchmal auch Polynomialformel genannt). 3.2.7 Beispiele. (i)
Wir zeigen die Binomische Formel k k (a + b)k = ∑ ( )a` bk−` `=0 `
für a, b ∈ R, k ∈ N. Dazu betrachten wir a, b als variabel und erhalten k
(x + y )k = (x + y ) ⋅ (x + y ) ⋅ . . . ⋅ (x + y ) = ∑ Ak` x` y k−` , `=0
wobei Ak` die Anzahl derjenigen Produkte von k Faktoren x, y ist, wo der Faktor x genau `-mal und der Faktor y genau k − `-fach vorkommt. Aufgrund des Kommutativgesetzes lassen sich diese Produkte alle in der Form x` y k−` schreiben. Wir differenzieren nun m-mal nach x und k − m-mal nach y, 0 ≤ m ≤ k, und erhalten k! =
k ∂k ∂k k k (x` y k−` ) ( x + y ) = A ∑ ` k−m ∂xm ∂y k−m ∂xm ∂y `=0
= Akm m!(k − m)!, weshalb Akm =
k! k =( ) m!(k − m)! m
3.2 Höhere Ableitungen
81
beziehungsweise Ak` = (ii)
k! k = ( ). `!(k − `)! `
Ähnlich gilt die Multinomialformel k
n
(∑ ai ) = (a1 + . . . + an )k i=1
=
k
∑
α1 ,...,αn =0 α1 +...+αn =k
k! aα1 ⋅ . . . ⋅ aαnn α1 ! ⋅ . . . ⋅ αn ! 1
k! α a ∣α∣=k α!
= ∑
k = ∑ ( )aα ∣α∣=k α für a1 , . . . , an ∈ R, k ∈ N: Betrachtet man a1 , . . . , an als variabel, dann erhält man k
n
( ∑ xi ) = i=1
= = =
⎛ n ⎞ ⎛ n ⎞ ⎛ n ⎞ ∑ x i1 ⋅ ∑ x i2 ⋅ . . . ⋅ ∑ x ik ⎝i1 =1 ⎠ ⎝i2 =1 ⎠ ⎝ik =1 ⎠ n
∑
i1 ,...,ik =1
xi1 ⋅ xi2 ⋅ . . . ⋅ xik
k
Akα1 ⋯αn xα1 1 ⋅ xα2 2 ⋅ . . . ⋅ xαnn
∑
α1 ,...,αn =0 α1 +...+αn =k k α ∑ Aα x , ∣α∣=k
dabei ist Akα = Akα1 ⋯αn die Anzahl derjenigen Produkte von k Faktoren x1 , . . . , xn , wo der Faktor xi genau αi -mal vorkommt, i = 1, . . . , n. Durch βi fache Differentiation nach xi für i = 1, . . . , n ergibt sich für β1 + . . . + βn = k, dass k! =
= =
∂k ∂xβnn ⋯∂xβ1 1 k
∑
α1 ,...,αn =0
k
n
( ∑ xi ) i=1
Akα1 ⋯αn
∂k ∂xβnn ⋯∂xβ1 1
α1 +...+αn =k Akβ1 ⋯βn β1 ! ⋅ . . . ⋅ βn !,
(xα1 1 ⋅ . . . ⋅ xαnn )
82
3 Differentialrechnung mehrerer Variablen also Akβ = Akβ1 ⋯βn =
k! k! k = =( ) β1 ! ⋅ . . . ⋅ βn ! β! β
Akα = Akα1 ⋯αn =
k! k! k = = ( ). α1 ! ⋅ . . . ⋅ αn ! α! α
beziehungsweise
3.3 Differenzierbare Funktionen 3.3.1 Definition und Lemma. (i) Sei f ∶ U → R eine in einer offenen Menge U ⊂ Rn erklärte Funktion. f heißt total, reell oder einfach nur differenzierbar im Punkt a ∈ U , wenn es einen Vektor A = (A1 , . . . , An ) ∈ Rn gibt, so dass der Grenzwert lim
x→a
f (x) − f (a) − A ⋅ (x − a) ∣x − a∣ n
existiert und gleich 0 ist. Dabei ist A ⋅ (x − a) = ∑ Ai (xi − ai ). i=1
(ii)
A ist eindeutig bestimmt und heißt die (totale) Ableitung von f im Punkt a. Wir schreiben A = Df (a) = (D1 f (a), . . . , Dn f (a)).
(iii)
Wenn die totale Ableitung von f, Df (x), existiert, so heißt f in U total differenzierbar.
Beweis der Eindeutigkeit. Seien A = (A1 , . . . , An ), A′ = (A′1 , . . . , A′n ) ∈ Rn mit f (x) − f (a) − A′ ⋅ (x − a) f (x) − f (a) − A ⋅ (x − a) lim = lim . x→a x→a ∣x − a∣ ∣x − a∣ Dann folgt für die Differenz, dass
(A − A′ ) ⋅ (x − a) = 0, x→a ∣x − a∣ lim
also insbesondere durch Spezialisierung xi > ai , xj = aj für j ≠ i: Ai = A′i für i = 1, . . . , n.
3.3 Differenzierbare Funktionen
83
Unmittelbar ergibt sich die folgende Charakterisierung: 3.3.2 Lemma. Eine Funktion f ∶ U → R ist im Punkt a ∈ U genau dann total differenzierbar, wenn für alle x ∈ U eine Darstellung der Form f (x) = f (a) + A ⋅ (x − a) + ϕ(x) ∣x − a∣ gilt mit einem Vektor A ∈ Rn und mit einer im Punkt a stetigen Funktion ϕ = ϕa ∶ U → R mit lim ϕ(x) = ϕ(a) = 0. x→a
A ist eindeutig bestimmt und es ist A = Df (a). Deshalb ist f im Punkt a genau dann total differenzierbar, wenn für alle x ∈ U : f (x) = f (a) + Df (a) ⋅ (x − a) + ϕ(x) ∣x − a∣ .
(3.2)
3.3.3 Bemerkung. (Totale) Differenzierbarkeit im Punkt a ∈ U bedeutet also, dass die Tangentialebene τ (x) = f (a) + Df (a) ⋅ (x − a) den Graphen von f von 1. Ordnung approximiert (vergleiche Abbildung 3.5). Der Restterm (Fehler) r(x) = ra (x) ∶= ϕ(x) ∣x − a∣ ist von höherer als erster Ordnung, wir schreiben r(x) = o(∣x − a∣) für x → a mit dem Landauschen “klein-o-Symbol“, das heißt, es gilt lim
x→a
3.3.4 Beispiele. (i)
r ( x) = 0. ∣x − a∣
Wir betrachten die Funktion 2xy ⎧ ⎪ ⎪ (x2 +y2 ) 14 f (x, y ) ∶= ⎨ ⎪ ⎪ ⎩0
für (x, y ) ≠ (0, 0) für (x, y ) = (0, 0).
Wegen f (x, 0) = 0 = f (0, y ) für alle x, y ∈ R ist f im Punkt (0, 0) partiell differenzierbar und es gilt fx (0, 0) = 0 = fy (0, 0).
84
3 Differentialrechnung mehrerer Variablen z τ (x, y ) = f (a, b) + Df (a, b) ⋅ (x − a, y − b)
c = f (a, b)
b y
a
(a, b) x Abbildung 3.5: Tangentialebene
In Polarkoordinaten gilt für (x, y ) ≠ (0, 0), dass f (x, y ) =
3 2r2 cos ϕ sin ϕ = 2r 2 cos ϕ sin ϕ, 1 r2
weshalb f (x, y ) − f (0, 0) − 0 ⋅ ((x, y ) − (0, 0)) 2r3/2 cos ϕ sin ϕ = ∣(x, y ) − (0, 0)∣ r √ = r sin 2ϕ → 0 für (x, y ) → (0, 0) beziehungsweise r → 0. Deshalb ist f im Nullpunkt total differenzierbar und es gilt Df (0, 0) = 0 = (0, 0).
3.3 Differenzierbare Funktionen (ii)
85
Betrachten wir die Funktion 2xy ⎧ ⎪ ⎪ (x2 +y2 ) 12 f (x, y ) ∶= ⎨ ⎪ ⎪ ⎩0
für (x, y ) ≠ (0, 0) für (x, y ) = (0, 0),
so ist sie im Nullpunkt partiell differenzierbar und es gilt fx (0, 0) = 0 = fy (0, 0). Sie ist aber dort nicht total differenzierbar, denn aufgrund des folgenden Lemmas müsste die totale Ableitung sonst gleich 0 sein, aber f (x, y ) − f (0, 0) − 0 ⋅ ((x, y ) − (0, 0)) = sin 2ϕ → / 0 ∣(x, y ) − (0, 0)∣ für (x, y ) → (0, 0) im Widerspruch zur Definition der totalen Differenzierbarkeit. 3.3.5 Lemma. Ist f ∶ U → R im Punkt a ∈ U total differenzierbar, so ist f im Punkt a stetig und partiell differenzierbar, das heißt, alle partiellen Ableitungen ∂f ∂f ∂x1 (a), . . . , ∂xn (a) existieren und es gilt ∂f ∂f (a), . . . , (a)) ∂x1 ∂xn = Df (a) = (D1 f (a), . . . , Dn f (a)).
∇f (a) = (
Beweis. (I) Es gilt die Darstellung (3.2), nämlich f (x) = f (a) + Df (a) ⋅ (x − a) + ϕ(x) ∣x − a∣ mit einer im Punkt a stetigen Funktion ϕ ∶ U → R mit ϕ(a) = 0. Wegen lim (Df (a) ⋅ (x − a) + ϕ(x) ∣x − a∣) = 0
x→a
folgt also, dass
lim f (x) = f (a).
x→a
(II) Sei i ∈ { 1, . . . , n }. Setzen wir in der Darstellung (3.2) x = (a1 , . . . , ai−1 , t, ai+1 , . . . , an ), dann erhalten wir f (a1 , . . . , ai−1 , t, ai+1 , . . . , an ) = f (a) + Di f (a)(t − ai ) + ϕ(a1 , . . . , t, . . . , an ) ∣t − ai ∣ .
86
3 Differentialrechnung mehrerer Variablen
Daher existiert die partielle Ableitung
∂f ∂xi (a)
und es gilt
∂f f (a1 , . . . , t, . . . , an ) − f (a) (a) = lim t → a ∂xi t − ai i
= lim (Di f (a) + ϕ(a1 , . . . , t, . . . , an ) t→ai
∣t − ai ∣ ) t − ai
= Di f (a). 3.3.6 Lemma. Es sei f ∶ U → R in U partiell differenzierbar und alle partiellen ∂f ∂f Ableitungen ∂x (x), . . . , ∂x (x) seien im Punkt a ∈ U stetig. Dann ist f im Punkt 1 n a total differenzierbar und es gilt Df (a) = ∇f (a). Beweis. Sei U (a) = Uε (a) eine offene Kugel in U und sei x ∈ U (a). Dann gilt f (x) − f (a) = f (x1 , . . . , xn ) − f (a1 , x2 , . . . , xn ) + f (a1 , x2 , . . . , xn ) − f (a1 , a2 , x3 , . . . , xn ) + ... + f (a1 , . . . , an−1 , xn ) − f (a1 , . . . , an ). Man beachte, dass f in den Achsenrichtungen differenzierbar und stetig ist und wende den Mittelwertsatz der Differentialrechnung einer Variablen auf die Differenzen an. Es folgt, dass n
∂f (i) (ξ )(xi − ai ), ∂x i i=1
f (x) − f (a) = ∑
mit Zwischenstellen ξ (i) ∈ U (a), für die ∣ξ (i) − a∣ < ∣x − a∣ für i = 1, . . . , n gilt (vergleiche auch den Beweis der Kettenregel, Satz 3.1.7). Deshalb haben wir n
f (x) = f (a) + ∇f (a) ⋅ (x − a) + ∑ ( i=1
∂f (i) ∂f (ξ ) − (a)) (xi − ai ) ∂xi ∂xi
= f (a) + ∇f (a) ⋅ (x − a) + r(x). Wegen der Stetigkeit der partiellen Ableitungen
∂f ∂xi
im Punkt a gilt
∂f (i) ∂f (ξ ) = (a) für i = 1, . . . , n, x→a ∂xi ∂xi lim
weshalb lim
x→a
r(x) = 0. ∣x − a∣
Deshalb ist f im Punkt a total differenzierbar und es gilt Df (a) = ∇f (a).
3.3 Differenzierbare Funktionen
87
3.3.7 Beispiel. Die Funktion
⎧ 2xy ⎪ ⎪ x2 +y2 f (x, y ) ∶= ⎨ ⎪ ⎪ ⎩0
für (x, y ) ≠ (0, 0) für (x, y ) = (0, 0)
aus Beispiel 3.1.5 ist für alle (x, y ) ≠ (0, 0) stetig partiell differenzierbar und deshalb dort auch total differenzierbar. Sie ist aber im Nullpunkt nicht total differenzierbar, obwohl dort die partiellen Ableitungen existieren, denn sie ist im Nullpunkt nicht stetig. Als Korollar zu Lemma 3.3.6 ergibt sich 3.3.8 Lemma und Definition. f ∶ U → R ist genau dann stetig partiell differenzierbar in U , das heißt, es gilt f ∈ C 1 (U ), wenn f in U stetig total differenzierbar ist, das heißt D1 f, . . . , Dn f ∈ C 0 (U ). Deshalb heißt f in diesem Fall einfach stetig differenzierbar. 3.3.9 Definition. Eine Abbildung f ∶ U → Rm , m ∈ N, mit den Komponentenfunktionen f1 , . . . , fm ∶ U → R, heißt im Punkt a ∈ U (total oder reell) differenzierbar, falls es die Komponentenfunktionen sind, das heißt, für alle j = 1, . . . , m existieren die totalen Ableitungen Dfj (a) = (D1 fj (a), . . . , Dn fj (a)) der Komponentenfunktionen im Punkt a. 3.3.10 Satz. Seien U ⊂ Rn und V ⊂ Rm offene Mengen. f ∶ U → Rm sei im Punkt a ∈ U total differenzierbar, g ∶ V → R sei im Punkt b = f (a) ∈ V total differenzierbar. Dann ist h ∶= g ○ f ∶ U → R im Punkt a total differenzierbar und es gilt die Kettenregel m
Di h(a) = ∑ Dj g (f (a))Di fj (a)). j =1
Diese Version der Kettenregel ergibt sich direkt, indem man eine Darstellung der Form (3.2) für h herleitet unter Benutzung einer solchen für f1 , . . . , fm und g. Dies sei dem Leser zur Übung überlassen. Anschließend kann man den Beweis des Mittelwertsatzes 3.1.9 übernnehmen und erhält so die folgende Version: 3.3.11 Mittelwertsatz. Sei f ∶ U → R total differenzierbar in U . Seien x, x′ ∈ U mit σ (x, x′ ) ⊂ U . Dann gibt es ein ξ ∈ σ (x, x′ ), ξ ≠ x, x′ mit n
f (x′ ) − f (x) = ∑ Di f (ξ )(x′i − xi ) = Df (ξ ) ⋅ (x′ − x) i=1 n
∂f (ξ )(x′i − xi ) = ∇f (ξ ) ⋅ (x′ − x). i=1 ∂xi
=∑
88
3 Differentialrechnung mehrerer Variablen
3.4 Richtungsableitungen 3.4.1 Definition. Sei U ⊂ Rn eine offene Menge und sei f ∶ U → R eine Funktion auf U , a ∈ U und e = (e1 , . . . , en ) ∈ Rn ein Richtungsvektor, das heißt, es gilt ∣e∣ = 1. Dann heißt, falls existent, ∂f f (a + he) − f (a) (a) ∶= lim+ h→0 ∂e h die Ableitung von f im Punkt a in Richtung e. 3.4.2 Bemerkung. Obwohl dies nicht immer erforderlich ist, nehmen wir weiterhin an, dass der Definitionsbereich von f eine offene Teilmenge U ⊂ Rn ist. Um die Richtungsableitung ∂f ∂e (a) definieren zu können, genügt es, dass f auf dem Segment { x ∈ Rn ∣ x = a + he, 0 ≤ h ≤ ε } für ein ε > 0 erklärt ist, beziehungsweise eigentlich sogar, dass f ∶ D → R und a ∈ D ein Häufungspunkt von { x ∈ D ∣ x = a + he, h > 0 } ist. 3.4.3 Beispiel. Die Funktion f (x, y ) =
√
x2 + y 2 für (x, y ) ∈ R2
besitzt für alle e = (e1 , e2 ), e21 + e22 = 1, die Richtungsableitung ∂f f (h(e1 , e2 )) − f (0, 0) (0, 0) = lim+ h→0 ∂e h √ 2 2 h e1 + e2 = lim+ = 1. h→0 h Es gilt
∂f ∂f (0, 0) = 1 = (0, 0). ∂e ∂ (−e)
f ist im Nullpunkt nicht partiell differenzierbar und deshalb auch nicht total differenzierbar. 3.4.4 Lemma und Definition. Sei f ∶ U → R und sei a ∈ U . Der Grenzwert lim f (a+heh)−f (a) existiert genau dann, wenn die Richtungsableitungen ∂f ∂e (a) und h→0 ∂f ∂ (−e) (a)
existieren und ∂f ∂f (a) = − (a) ∂ (−e) ∂e
gilt. In diesem Fall schreiben wir De f (a) ∶=
∂f ∂f (a) = − (a). ∂e ∂ (−e)
3.4 Richtungsableitungen
89
3.4.5 Satz. Es sei f ∶ U → R total differenzierbar im Punkt a ∈ U . Dann ist f im Punkt a in jede Richtung e differenzierbar und es gilt ∂f ∂f (a) = − (a) = De f (a) = Df (a) ⋅ e = ∇f (a) ⋅ e. ∂e ∂ (−e) Beweis. Aus der Darstellung (3.2) folgt für h ∈ R, dass f (a + he) = f (a) + Df (a) ⋅ eh + ϕ(a + he) ∣h∣ mit lim ϕ(a + he) = 0. Daher existiert der Grenzwert lim h→0
h→0
haben
f (a+he)−f (a) h
und wir
f (a + he) − f (a) = Df (a) ⋅ e. h→0 h lim
Das folgende Beispiel zeigt, dass die Umkehrung im Allgemeinen nicht richtig ist. 3.4.6 Beispiel. Wir betrachten die Funktion
⎧ xy 2 ⎪ ⎪ x2 + y 2 f (x, y ) ∶= ⎨ ⎪ ⎪ ⎩0
für (x, y ) ≠ (0, 0) für (x, y ) = (0, 0).
In Polarkoordinaten x = r cos ϕ, y = r sin ϕ gilt für (x, y ) ≠ (0, 0): f (x, y ) = r cos ϕ sin2 ϕ. Für eϕ ∶= (cos ϕ, sin ϕ) haben wir ∂f h cos ϕ sin2 ϕ − 0 (0, 0) = lim+ = cos ϕ sin2 ϕ, h→0 ∂eϕ h insbesondere gilt für ϕ = π4 , dass ∂f 1 1 1 (0, 0) = √ ⋅ = √ ≠ 0. ∂eπ/4 2 2 ( 2)3 Außerdem ist
(3.3)
∂f ∂f =− für alle ∣e∣ = 1. ∂ (−e) ∂e
Die partiellen Ableitungen von f nach x und y im Punkt (0, 0) existieren und es ∂f gilt ∂f ∂x (0, 0) = 0 = ∂y (0, 0), aber f ist im Punkt (0, 0) nicht total differenzierbar, denn sonst wäre ja zu (3.3).
∂f ∂e (0, 0)
= Df (0, 0) ⋅ e = 0 für alle ∣e∣ = 1 im Widerspruch
90
3 Differentialrechnung mehrerer Variablen
3.4.7 Bemerkung. Ist f ∶ U → R total differenzierbar im Punkt a ∈ U , so folgt aus der Kettenregel, Satz 3.3.10, dass De f (a) =
d f (a + he)∣h=0 = Df (a) ⋅ e = ∇f (a) ⋅ e. dh
3.4.8 Satz. Sei f ∶ U → R total differenzierbar im Punkt a ∈ U und sei Df (a) = ∇f (a) ≠ 0. Sei e∇ die Richtung des Gradienten von f im Punkt a, e∇ = e∇ (f, a) ∶=
∇f (a) . ∣∇f (a)∣
Dann gilt ∂f ∂f (a) ≤ (a) = ∣∇f (a)∣ für alle ∣e∣ = 1, ∂e ∂e∇ das heißt ∂f ∂f (a) = max (a) = ∣∇f (a)∣ , ∣e∣=1 ∂e ∂e∇ mit anderen Worten zeigt der Gradient ∇f (a) in die Richtung des stärksten Anstiegs der Funktion f im Punkt a. Beweis. Nach Satz 3.4.5 und der Cauchy-Schwarzschen Ungleichung gilt einerseits ∂f (a) = ∇f (a) ⋅ e ≤ ∣∇f (a)∣ für ∣e∣ = 1. ∂e Wegen ∇f (a) ≠ 0 gilt andererseits ∂f ∇f (a) (a) = ∇f (a) ⋅ = ∣∇f (a)∣ . ∂e∇ ∣∇f (a)∣ Also ist
∂f ∂e (a)
maximal für e = e∇ und es gilt
∂f ∂e∇ (a)
= ∣∇f (a)∣.
Als Pendant dazu beweisen wir: 3.4.9 Lemma. Sei f ∶ U → R total differenzierbar im Punkt a ∈ U und γ ∶ (−ε, ε) → U sei differenzierbar an der Stelle 0 mit γ (0) = a. γ sei eine Höhenlinie durch a, das heißt, es gilt f (γ (t)) = f (γ (0)) = f (a) = const für ∣t∣ < ε. Dann sind ∇f (a) und γ ′ (0) orthogonal, das heißt, es gilt
∇f (a) ⋅ γ ′ (0) = 0, mit anderen Worten steht ∇f (a) senkrecht auf der Höhenlinie γ im Punkt γ (0) = a (γ ′ (0) ist eine Tangente von γ im Punkt γ (0) = a).
3.4 Richtungsableitungen
91
z c = f (a, b) Gf ∩ { (x, y, z ) ∣ z = c }
b y Df (a, b) a
(a, b) x Γc = { (x, y ) ∈ D ∣ f (x, y ) = c } Abbildung 3.6: Geometrische Bedeutung des Gradienten
Beweis. Die Funktion h(t) ∶= f (γ (t)) ist konstant für ∣t∣ < ε. Nach der Kettenregel 3.3.10 gilt für t = 0 deshalb 0 = h′ (0) = Df (γ (0)) ⋅ γ ′ (0) = ∇f (a) ⋅ γ ′ (0). 3.4.10 Bemerkung. Interessant ist dieses Lemma für den Fall γ ′ (0) ≠ 0 und ∇f (a) ≠ 0. Ist f ∈ C 1 (U ) und gilt ∇f (a) ≠ 0, so kann man zeigen (vergleiche Satz 4.4.7), dass die Niveaumenge Γc = { x ∈ U ∣ f (x) = f (a) = c } in einer Umgebung U (a) von a ∈ U ein Graph ist. Es gilt dort, dass xk = g (x1 , . . . , xk−1 , xk+1 , . . . , xn ) für ein k ∈ { 1, . . . , n }. Im Fall n = 2 folgt hieraus,
92
3 Differentialrechnung mehrerer Variablen
dass
Γc ∩ U (a) = γ (−ε, ε)
mit einem differenzierbaren Weg γ ∶ (−ε, ε) → U (a) mit γ (0) = a und γ ′ (t) ≠ 0 für alle ∣t∣ < ε.
3.5 Totale Differentiale und die Taylorsche Formel 3.5.1 Definition. Sei f ∶ U → R im Punkt a ∈ U total differenzierbar. Dann versteht man unter dem totalen Differential df = df (a) von f an der Stelle a die Linearform (lineare Funktion) df (a) ∶ Rn → R, n
h = (h1 , . . . , hn ) ↦ df (a, h) ∶= Df (a) ⋅ h = ∑ Di f (a)hi . i=1
Wir schreiben auch n
df (a, h) = ((h ⋅ D)f )(a) = ((∑ hi Di ) f ) (a). i=1
3.5.2 Beispiele. (i)
Sei ϕi = xi ∶ Rn → R, ϕi (x) = xi (x) = xi ,
die i-te Koordinatenfunktion, i = 1, . . . , n. Dann gilt Dj ϕi = für i, j = 1, . . . , n, dabei ist 1 für i = j δij = { 0 für i ≠ j. das Kroneckersche δ-Symbol. Also ist dϕi (a, h) = dxi (a, h) = hi oder in Kurzform
dxi = hi .
Es gilt also n
n
i=1
i=1
df (a, h) = ∑ Di f (a)hi = ∑ Di f (a)dxi (a, h) oder in Kurzform
n
df = ∑ Di f dxi = Df ⋅ dx. i=1
∂ϕi ∂xj
= δij
3.5 Totale Differentiale und die Taylorsche Formel (ii)
93
Wir wollen die Kettenregel auf Differentiale übertragen. Seien U ⊂ Rn , V ⊂ Rm offene Mengen, seien f ∶ U → Rm im Punkt a ∈ U total differenzierbar und g ∶ V → R im Punkt b = f (a) ∈ V total differenzierbar. Dann gilt m
Di (g ○ f )(a) = ∑ Dj g (b)Di fj (a), j =1
also n
d(g ○ f )(a, h) = ∑ Di (g ○ f ) (a)hi i=1 n m
= ∑ ∑ Dj g (b)Di fj (a)hi i=1 j =1 m
n
= ∑ Dj g (b) ∑ Di fj (a)dxi (a, h) j =1 m
i=1
= ∑ Dj g (b)dfj (a, h) j =1 m
= ∑ Dj g (b) ⋅ dyj (a), j =1
wobei wir auch y = y (x) = f (x), das heißt yj = yj (x) = fj (x) beziehungsweise dyj (a, b) = dfj (a, b) für j = 1, . . . , m schreiben. In Kurzform m
d(g ○ f ) = ∑ Dj gdyj = Dg ⋅ dy, dy = Df ⋅ dx. j =1
(iii)
Der Mittelwertsatz lautet unter den entsprechenden Voraussetzungen in der neuen Schreibweise n
f (x′ ) − f (x) = ∑ Di f (ξ )(x′i − xi ) i=1
= Df (ξ ) ⋅ (x′ − x) = df (ξ, x′ − x) = (((x′ − x) ⋅ D)f )(ξ ). 3.5.3 Definition. (i) tung
Sei f ∶ U → R total differenzierbar in U mit der AbleiDf = (D1 f, . . . , Dn f ) = (fx1 , . . . , fxn ).
Existieren die totalen Ableitungen D(D1 f )(a) = Dfx1 (a), . . . , D(Dn f )(a) = Dfxn (a), so heißt f im Punkt a ∈ U zweimal (total) differenzierbar.
94 (ii)
3 Differentialrechnung mehrerer Variablen Sei k ∈ N, k ≥ 2. Ist f in U k − 1-mal total differenzierbar und existieren die totalen Ableitungen D (Dik−1 ⋯Di1 ) f (a) = Dfxi1 ⋯xik−1 (a) für alle k − 1-Tupel (i1 , . . . , ik−1 ) mit i1 , . . . , ik−1 ∈ { 1, . . . , n }, dann heißt f im Punkt a k-mal (total) differenzierbar.
Zur bequemen Formulierung der Taylorschen Formel definieren wir: 3.5.4 Definition. Sei f ∶ U → R k-mal total differenzierbar im Punkt a ∈ U . Dann ist das Differential k-ter Ordnung dk f = dk f (a) von f an der Stelle a definiert durch dk f (a, h) ∶= ((h ⋅ D)k f ) (a) k
⎛ n ⎞ = (∑ hi Di ) f (a) ⎝ i=1 ⎠ = =
⎛⎛ n ⎞ ⎛ n ⎞ ⎞ ∑ hik Dik ⋯ ∑ hi1 Di1 f (a) ⎝⎝ik =1 ⎠ ⎝i1 =1 ⎠ ⎠ n
∑
i1 ,...,ik =1
Di1 ⋯ik f (a)hi1 ⋅ . . . ⋅ hik .
3.5.5 Lemma. Sei f ∈ C k (U ). Dann gilt
dk f (a, h) =
k
∑
α1 ,...,αn =0 α1 +⋯+αn =k
k! Dαn ⋯D1α1 f (a)hα1 1 ⋅ . . . ⋅ hαnn α1 ! ⋅ . . . ⋅ αn ! n
k! α D f (a)hα α! ∣α∣=k
= ∑
k = ∑ ( )Dα f (a)hα . α ∣α∣=k
3.5 Totale Differentiale und die Taylorsche Formel
95
Beweis. Wegen der Vertauschbarkeit der Differentiationsreihenfolge, Satz 3.2.5, berechnen wir k
⎛ n ⎞ dk f (a, h) = (∑ hi Di ) f (a) ⎝ i=1 ⎠ = = =
n
∑
i1 ,...,ik =1
Di1 ⋯ik f (a)hi1 ⋅ . . . ⋅ hik
k
Akα1 ⋯αn Dnαn ⋯D1α1 f (a)hα1 1 α1 ,...,αn =0 α1 +⋯+αn =k k α α ∑ Aα D f (a)h , ∣α∣=k
∑
⋅ . . . ⋅ hαnn
dabei ist Akα = Akα1 ⋯αn die Anzahl derjenigen Terme, in denen f genau αi -fach nach xi abgeleitet wird und der Faktor hi genau αi -mal auftritt, i = 1, . . . , n. Wir erkennen die Analogie zur Multinomialformel aus Beispiel 3.2.7 (ii) und lassen uns von deren Beweis leiten: Wir differenzieren dk f (a, h) βi -mal nach hi für i = 1, . . . , n mit β1 + ⋯ + βn = k und erhalten k!Dnβn ⋯D1β1 f (a)
= =
k
∂k ∂hβnn ⋯∂hβ1 1 k
∑
α1 ,...,αn =0 α+⋯+αn =k
⎛ n ⎞ (∑ hi Di ) f (a) ⎝ i=1 ⎠
Akα1 ⋯αn Dnαn ⋯D1α1 f (a)
∂k ∂hβnn ⋯∂hβ1 1
(hα1 1 ⋅ . . . ⋅ hαnn )
= Akβ1 ⋯βn Dnβn ⋯D1β1 f (a)β1 ! ⋅ . . . ⋅ βn !. Da Akβ1 ⋯βn unabhängig von f ist, führt die Wahl f (x) = xβ = xβ1 1 ⋅ . . . ⋅ xβnn zu Akβ = Akβ1 ⋯βn =
k! k! k = =( ) β1 ! ⋅ . . . ⋅ βn ! β! β
Akα = Akα1 ⋯αn =
k! k! k = = ( ). α1 ! ⋅ . . . ⋅ αn ! α! α
beziehungsweise
96
3 Differentialrechnung mehrerer Variablen
3.5.6 Der Taylorsche Satz. Sei f ∈ C N (U, R), N ∈ N. Seien a, x ∈ U , so dass das Segment σ (a, x) = { (1 − t)a + tx ∣ t ∈ [0, 1] } zu U gehört. Dann gilt die Taylorsche Formel N −1
f ( x) = ∑
k=0
=
dk f (a, x − a) + RN (a, x) k!
Dα f (a) (x − a)α + RN (a, x). α! ∣α∣≤N −1
∑
Dabei ist dN f (ξ, x − a) N! Dα f (ξ ) = ∑ (x − a)α α! ∣α∣=N
RN (a, x) ∶=
mit einem ξ = (1 − t)a + tx ∈ σ (a, x), ξ ≠ a, x, t ∈ (0, 1), das Lagrangesche Restglied. Beweis. Wir betrachten die Funktion g (t) ∶= f (γ (t)) = f (a + t(x − a)) = f ((1 − t)a + tx) für t ∈ [0, 1]. Dann ist g ∈ C N [0, 1] und nach der Kettenregel 3.1.7 gilt g ′ (t) = Df (γ (t))γ ′ (t) n
= ∑ Di f (a + t(x − a))(xi − ai ) i=1 n
= (∑(xi − ai )Di f ) (a + t(x − a)) i=1
= (((x − a) ⋅ D) f ) (a + t(x − a)) = df (a + t(x − a), x − a). Durch wiederholte Differentiation ergibt sich k
g
(k )
⎛ n ⎞ (t) = (∑(xi − ai )Di ) f (a + t(x − a)) ⎝ i=1 ⎠ k
= ((x − a) ⋅ D) f (a + t(x − a)) = dk f (a + t(x − a), x − a)
3.5 Totale Differentiale und die Taylorsche Formel
97
für k = 0, 1, . . . , N . Nach der Taylorschen Formel mit dem Lagrangeschen Restglied für Funktionen einer Variablen (vergleiche Analysis I, Abschnitte 5.6 und 8.6) folgt, dass N −1 ( k ) g (0) g (N ) (τ ) f (x) = g (1) = ∑ + k! N! k =0 mit einem τ ∈ (0, 1) und somit N −1
f ( x) = ∑
k =0
dk f (a, x − a) dN f (ξ, x − a) + k! N!
mit einem ξ ∈ σ (a, x), ξ ≠ a, x. Wir schreiben das Restglied noch in eine handlichere Form um: 3.5.7 Satz. Sei f ∈ C N (U, R). Seien a, x ∈ U , so dass das Segment σ (a, x) = { (1 − t)a + tx ∣ t ∈ [0, 1] } zu U gehört. Dann gilt die Darstellung f ( x) = ∑
∣α∣≤N
Dα f (a) N (x − a)α + o(∣x − a∣ ), α!
(3.4)
dabei ist o das Landausche „klein-o-Symbol“, das heißt, es gilt N
lim
x→a
o (∣x − a∣ ) N
∣x − a∣
= 0.
Beweis. Sei U (a) = Uε (a) ⊂ U eine offene Kugelumgebung von a. Sei x ∈ U (a). Nach dem Taylorschen Satz gibt es ein ξ ∈ σ (a, x), ξ ≠ x, a, also ξ ∈ U (a) mit f (x) =
Dα f (a) D α f (ξ ) (x − a)α + ∑ (x − a)α α! α! ∣α∣≤N −1 ∣α∣=N
∑
= ∑
∣α∣≤N
Dα f (a) Dα f (ξ ) − Dα f (a) (x − a)α + ∑ (x − a)α . α! α! ∣α∣=N
Setzen wir nun Dα f (ξ )−Dα f (a) ⎧ (x − a)α ⎪ ∑ ⎪ α! ⎪ ⎪∣α∣=N α RN (a, x) ∶= ⎨ f (a) ⎪ f (x) − ∑ D α! (x − a)α ⎪ ⎪ ⎪ ∣ α ∣≤ N ⎩
für x ∈ U (a) für x ∈ U ∖ U (a),
so gilt RN (a, x) = o(∣x − a∣) für x → a wegen der Stetigkeit von Dα f (x) für ∣α∣ = N , und wir haben die gewünschte Darstellung für alle x ∈ U .
98
3 Differentialrechnung mehrerer Variablen
3.6 Lokale Extrema Wir wollen nun einen Aspekt der „Kurvendiskussion“ von reellen Funktionen f ∶ U → R mit hinreichend guten Differenzierbarkeitseigenschaften behandeln, nämlich die Frage nach notwendigen und hinreichenden Bedingungen an die zweiten Ableitungen von f für das Vorliegen eines lokalen Extremums in einem inneren Punkt a ∈ U . Dabei ist U ⊂ Rn eine offene Menge. Zunächst formulieren wir die Taylorsche Formel (3.4) für den Fall N = 2 um: 3.6.1 Bemerkung und Definition. Sei f ∈ C 2 (U, R). Seien a, x ∈ U , so dass das Segment σ (a, x) = { (1 − t)a + tx ∣ t ∈ [0, 1] } zu U gehört. Dann gilt die Darstellung n
f (x) = f (a) + ∑ Di f (a)(xi − ai )
+
i=1 n
1 2 ∑ Dij f (a)(xi − ai )(xj − aj ) + o(∣x − a∣ ) 2 i,j =1
1 = f (a) + Df (a) ⋅ (x − a) + (x − a) ○ D2 f (a) ○ (x − a)⊺ 2 2 + o(∣x − a∣ ) 1 2 = f (a) + ∇f (a)(x − a) + (x − a)D2 f (a)(x − a)⊺ + o (∣x − a∣ ) . 2 Dabei definieren wir die Hessesche Matrix von f im Punkt a ∈ U durch
⎛ D11 f ⋯ D1n f ⎞ ⋮ ⎟ (a) D2 f (a) ∶= (Dij f (a))ni,j =1 = ⎜ ⋮ ⎝Dn1 f ⋯ Dnn f ⎠ und für ξ = (ξ1 , . . . , ξn ) ∈ Rn ist n
ξD2 f (a)ξ ⊺ = ∑ Dij f (a)ξi ξj i,j =1
die Hessesche Form. Dies bedeutet, dass der Paraboloid (Schmiegeparaboloid) 1 π (x) = f (a) + ∇f (a)(x − a) + (x − a)D2 f (a)(x − a)⊺ 2 den Graphen von f an der Stelle a von zweiter Ordnung approximiert.
3.6 Lokale Extrema
99
3.6.2 Definition. Sei f ∶ D → R eine Funktion mit Definitionsbereich D ⊂ Rn . Dann besitzt f ein (absolutes) Maximum im Punkt a ∈ D, wenn die Ungleichung f (x) ≤ f (a) für alle x ∈ D gilt. f hat ein lokales Maximum im Punkt a ∈ D, wenn es eine offene Umgebung U (a) ⊂ Rn gibt, so dass f (x) ≤ f (a) für alle x ∈ D ∩ U (a). Das Maximum ist isoliert, falls f (x) < f (a) für alle x ∈ D ∩ U (a), x ≠ a gilt. Entsprechend sind absolutes, lokales und isoliertes Minimum erklärt. In beiden Fällen hat f ein absolutes, lokales beziehungsweise isoliertes Extremum im Punkt a ∈ D. 3.6.3 Satz von Fermat. Sei U ⊂ Rn eine offene Menge. Die Funktion f ∶ U → R besitze im Punkt a ∈ U ein lokales Extremum. Außerdem sei f im Punkt a partiell differenzierbar. Dann gilt
∇f (a) = 0, das heißt ∂f ∂f (a) = ⋯ = (a) = 0. ∂x1 ∂xn Beweis. Sei Uε (a) ⊂ U . Der Beweis ergibt sich unmittelbar aus der Differentialrechnung einer Variablen, weil die Funktionen fi (t) ∶= f (γi (t)) = f (a1 , . . . , ai−1 , t, ai+1 , . . . , an ) für ∣t − ai ∣ < ε, i = 1, . . . , n, jeweils an der Stelle t = ai ein lokales Maximum beziehungsweise Minimum haben. 3.6.4 Definition. Gilt ∇f (a) = 0, so heißt f an der Stelle a beziehungsweise im Punkt (a, f (a)) kritisch oder stationär. Dass f an der Stelle a kritisch ist, ist also eine notwendige Bedingung für das Vorliegen eines lokalen Extremums in einem inneren Punkt des Definitionsbereichs.
100
3 Differentialrechnung mehrerer Variablen
3.6.5 Notwendiges zweite-Ableitungskriterium. Sei f ∈ C 2 (U ). f besitze im Punkt a ∈ U ein lokales Maximum beziehungsweise Minimum. Dann gilt n
ξD2 f (a)ξ ⊺ = ∑ Dij f (a)ξi ξj ≤ 0 beziehungsweise ≥ 0 i,j =1
für alle ξ ∈ Rn , das heißt, die Hessesche Form ist im Punkt a negativ beziehungsweise positiv semi-definit. Beweis. Nach dem Satz 3.6.3 von Fermat ist Df (a) = ∇f (a) = 0, also reduziert sich die Taylorsche Formel (3.4) auf die in 3.6.1 angegebene Form 1 2 f (x) = f (a) + (x − a)D2 f (a)(x − a)⊺ + o(∣x − a∣ ) 2
(3.5)
für alle x ∈ U . Wir betrachten den Fall eines lokalen Maximums an der Stelle a. Sei U (a) ⊂ U , so dass f (x) ≤ f (a) für x ∈ U (a). Sei ξ ∈ Rn . Für hinreichend kleines ε > 0 ist dann x ∶= a + εξ ∈ U (a), so dass ε2 2 2 ξD f (a)ξ ⊺ + o(ε2 ∣ξ ∣ ) = f (x) − f (a) ≤ 0. 2 Der Grenzübergang ε → 0 liefert ξD2 f (a)ξ ⊺ ≤ 0. 3.6.6 Hinreichendes zweite-Ableitungskriterium. Sei f ∈ C 2 (U ) und sei a ∈ U ein kritischer Punkt, das heißt, es gilt
∇f (a) = 0. Außerdem sei
ξD2 f (a)ξ ⊺ < 0 beziehungsweise > 0
für alle ξ ∈ Rn , ξ ≠ 0, das heißt, die Hessesche Form ist im Punkt a negativ beziehungsweise positiv definit. Dann besitzt f an der Stelle a ein isoliertes lokales Maximum beziehungsweise Minimum. Beweis. Die Funktion g (ξ ) ∶= ξD2 f (a)ξ ⊺ ist stetig auf der (kompakten) Einheitssphäre S n−1 ∶= { ξ ∈ Rn ∣ ∣ξ ∣ = 1 }, nimmt also nach dem Satz von Weierstraß 2.5.5 ihr Minimum λ ∶= min g (S n−1 ) = min ξD2 f (a)ξ ⊺ n−1 ξ ∈S
3.6 Lokale Extrema
101
an. Betrachten wir den Fall, dass g (ξ ) = ξD2 f (a)ξ ⊺ > 0 für alle ξ ∈ Rn , ξ ≠ 0 ist, dann muss deshalb λ > 0 sein. Für alle ξ ∈ Rn , ξ ≠ 0 folgt, dass ξD2 f (a)ξ ⊺ = ∣ξ ∣
2
⊺
ξ 2 ξ 2 D f (a) ( ) ≥ λ ∣ξ ∣ . ∣ξ ∣ ∣ξ ∣
Wegen ∇f (a) = 0 ergibt sich durch Anwendung der Taylorschen Formel (3.5), dass 1 2 f (x) = f (a) + (x − a)D2 f (a)(x − a)⊺ + o(∣x − a∣ ) 2 λ 2 2 ≥ f (a) + ∣x − a∣ + o(∣x − a∣ ). 2 für alle x ∈ U . Sei ε > 0 so gewählt, dass 2
∣
o(∣x − a∣ ) 2
∣x − a∣
∣≤
λ 4
für alle x ∈ Uε (a), x ≠ a. Dann folgt f (x) ≥ f (a) +
λ 2 ∣x − a∣ > f (a) 4
für x ∈ Uε (a), x ≠ a, weshalb ein isoliertes Minimum vorliegt. 3.6.7 Satz und Definition. Sei f ∈ C 2 (U ) und sei a ∈ U ein kritischer Punkt. Ist die Hessesche Form von f im Punkt a indefinit, das heißt weder positiv noch negativ semidefinit, das heißt, es gibt ξ, η ∈ Rn mit ξD2 f (a)ξ ⊺ > 0, ηD2 f (a)η ⊺ < 0, dann besitzt f in a kein lokales Extremum (im Fall n = 2 heißt a ein Sattelpunkt). Beweis. Folgt unmittelbar aus Satz 3.6.5. 3.6.8 Bemerkungen. (i)
Die Voraussetzung
ξD2 f (a)ξ ⊺ < 0 beziehungsweise > 0 lässt sich in Satz 3.6.6 nicht durch die schwächere Voraussetzung ξD2 f (a)ξ ⊺ ≤ 0 beziehungsweise ≥ 0 ersetzen. Betrachte zum Beispiel die Funktion f ∶ R → R, f (x) = x3 . Im Punkt x = 0 ist f ′ (0) = 0, f ′′ (0) = 0, jedoch liegt weder ein relatives Minimum noch Maximum vor.
102 (ii)
3 Differentialrechnung mehrerer Variablen In Satz 3.6.5 gilt nicht die stärkere Aussage ξD2 f (a)ξ ⊺ < 0 beziehungsweise > 0. Betrachte zum Beispiel die Funktion f ∶ R → R, f (x) = x4 . Im Punkt x = 0 ist f ′ (0) = 0, f ′′ (0) = 0 und f hat ein relatives Minimum bei x = 0.
(iii)
Im Fall n = 2 gilt: 2
∑ Dij f (a)ξi ξj > 0
i,j =1
für alle ξ ∈ Rn , ξ ≠ 0, genau dann, wenn 2 D11 f (a) > 0, D11 f (a)D22 f (a) − D12 f (a) > 0.
Wir behandeln noch einige Beispiele zum Satz von Fermat, wo mithilfe des Zusatzes zum Satz von Weierstraß, Satz 2.5.7, eine kritische Stelle als extremal erkannt wird: 3.6.9 Beispiel. Seien a1 , . . . , ak ∈ Rn . Betrachte die Summe der Abstandsquadrate k
2
k
n
(`) 2
f (x) ∶= ∑ ∣x − a` ∣ = ∑ ∑ (xi − ai ) `=1 i=1
`=1
für x ∈ Rn . Dann besitzt f ein Minimum im Mittelpunkt a ∶= berechnen wir
1 k
k
∑ a` : Dazu
`=1
k k ∂f (`) (`) (x) = 2 ∑ (xi − ai ) = 2 (kxi − ∑ ai ) = 0 ∂xi `=1 `=1
genau für xi =
1 k (`) ∑a , k `=1 i
i = 1, . . . , n. Wegen f (x) → +∞ für ∣x∣ → ∞ muss im Punkt a ein globales Minimum vorliegen (vergleiche Satz 2.5.7).
3.6 Lokale Extrema
103
3.6.10 Beispiel. Sei
⎛ a11 ⋯ a1n ⎞ ⋮ ⎟. A = (ajk )j =1...m = ⎜ ⋮ k=1...n ⎝am1 ⋯ amn ⎠ Mithilfe der Methode der kleinsten Quadrate wollen wir zeigen, dass das inhomogene Gleichungssystem
⎛ a11 ⋯ a1n ⎞ ⎛ x1 ⎞ ⋮ ⎟○⎜ ⋮ ⎟ Ax = A ○ x = ⎜ ⋮ ⎝am1 ⋯ amn ⎠ ⎝xn ⎠ n
⎛ ∑ a1k xk ⎞ ⎜ k =1 ⎟ ⎛ b1 ⎞ ⎜ ⎟ ⋮ ⎟=⎜ ⋮ ⎟=b =⎜ ⎜n ⎟ ⎝ ⎠ ⎜ ⎟ bm a x mk k ⎠ ⎝k∑ =1 für alle b lösbar ist, wenn das transponiert homogene System
⎛ a11 ⋯ am1 ⎞ ⎛ y1 ⎞ ⋮ ⎟○⎜ ⋮ ⎟ A⊺ y = A⊺ ○ y = ⎜ ⋮ ⎝a1n ⋯ amn ⎠ ⎝ym ⎠ m
⎛ ∑ aj1 yj ⎞ ⎜ j =1 ⎟ ⎛0⎞ ⎜ ⎟ ⋮ ⎟ = ⎜⋮⎟ = 0 =⎜ ⎜m ⎟ ⎝ ⎠ ⎜ ⎟ 0 a y jn j ⎠ ⎝j∑ =1 nur die Nullösung besitzt. Dazu betrachten wir die lineare Abbildung f ∶ Rn → ⎛ x1 ⎞ ⎛ y1 ⎞ Rm , f (x) ∶= A ○ x = Ax, wobei wir x = ⎜ ⋮ ⎟ ∈ Rn und y = ⎜ ⋮ ⎟ ∈ Rm als ⎝xn ⎠ ⎝ym ⎠ Spaltenvektoren schreiben und betrachten das Abstandsquadrat 2
2
g (x) ∶= ∣f (x) − b∣ = ∣A x − b∣ m
2
n
= ∑ ( ∑ ajk xk − bj ) . j =1 k =1
Die Idee ist, dass Aa = b genau dann gilt, wenn g (a) = 0 = minn g (x). Wegen g (x) → +∞ für ∣x∣ → ∞ gibt es ein a ∈ Rn mit g (a) = infn g (x) = minn g (x), x∈R
x∈R
x∈R
104
3 Differentialrechnung mehrerer Variablen
siehe Satz 2.5.7. Wir differenzieren: Für i = 1, . . . , n gilt m n ∂g (x) = 2 ∑ ( ∑ ajk xk − bj ) aji ∂xi j =1 k =1 m
= 2 ∑ a⊺ij (Ax − b)j j =1
= 2 (A⊺ ○ (Ax − b))i . Also haben wir
∂g (a) = 2 (A⊺ (Aa − b))i , ∂xi
0= weshalb
A⊺ (A a − b) = 0.
Aber aus A⊺ y = 0 folgt dass y = 0 gilt. Deshalb muss A ○ a = b sein. Als Anwendung des Satzes von Fermat beweisen wir noch einen Satz, der in der Theorie der Hauptachsentransformation eine große Rolle spielt. 3.6.11 Satz. Jede reelle symmetrische Matrix A = (ajk )nj,k=1 besitzt einen reellen Eigenwert λ, das heißt, es gibt einen Vektor a ∈ Rn , a ≠ 0, mit Aa = A ○ a = λa, dabei schreiben wir Vektoren im Rn als Spaltenvektoren. Beweis. Wir betrachten die Funktion g (x) ∶=
x⊺ Ax 2
∣x∣
⊺
x x x = ( ) A = g( ) ∣x∣ ∣x∣ ∣x∣
für x ∈ Rn , x ≠ 0. Als stetige Funktion auf der Sphäre S n−1 = { ξ ∈ Rn ∣ ∣ξ ∣ = 1 } nimmt g ∣S n−1 nach dem Satz von Weierstraß 2.5.5 ihr Minimum λ in einem Punkt a ∈ S n−1 an. Deshalb nimmt auch g in a ihr Minimum an, das heißt, es gilt n
g (a) = a⊺ Aa = ∑ ajk aj ak = λ = min g (ξ ) = minn g (x). ∣ξ ∣=1
j,k=1
x∈R x≠0
Nach dem Satz von Fermat 3.6.3 muss ∇g (a) = 0 sein. Wir berechnen 2
∂g (a) = ∂xi
n
n
2
∣x∣ ( ∑ ajk xj xk ) − ∑ ajk xj xk (∣x∣ ) j,k=1
j,k=1
xi
4
∣x∣
xi
3.7 Konvexe Funktionen
105
für i = 1, . . . , n und weiter 2
(∣x∣ )
xi
⎛ ⎞ ∑ ajk xj xk ⎝j,k=1 ⎠ n
⎛n ⎞ = ∑ x2j ⎝j =1 ⎠
= 2xi ,
xi
n
= ∑ ajk (δij xk + xj δik )
xi
j,k=1 n
n
n
k=1
j =1
k=1
= ∑ aik xk + ∑ aji xj = 2 ∑ aik xk , dabei ist
1 für i = j δij = { 0 für i ≠ j.
das Kroneckersche δ-Symbol. Daher gilt 2 n
∂g (a) = ∂xi
n
2 ∣x∣ ∑ aik xk − 2xi ∑ ajk xj xk k =1
j,k=1
4
∣x∣
.
n
Wegen ∣a∣ = 1 und ∑ ajk aj ak = λ folgt also j,k=1
0=
n n ⎛n ⎞ ∂g (a) = 2 ∑ aik ak − ai ∑ ajk aj ak = 2 ( ∑ aik ak − λai ) , ∂xi ⎝k=1 ⎠ j,k=1 k =1
das heißt
n
∑ aik ak = λai für i = 1, . . . , n,
k=1
also Aa = λa.
3.7 Konvexe Funktionen Wir wollen einige nützliche Kriterien für konvexe Funktionen zusammenstellen. 3.7.1 Definition. (i) Eine Teilmenge A ⊂ Rn heißt konvex, falls mit x′ , x′′ ∈ A auch das Segment σ (x′ , x′′ ) = { (1 − t)x′ + tx′′ ∣ 0 ≤ t ≤ 1 } zu A gehört. (ii)
Eine in einer konvexen Menge A ⊂ Rn erklärte Funktion f ∶ A → R heißt konvex auf A, falls die Ungleichung f ((1 − t)x′ + tx′′ ) ≤ (1 − t)f (x′ ) + tf (x′′ )
(3.6)
106
3 Differentialrechnung mehrerer Variablen für alle x′ , x′′ ∈ A und alle t ∈ [0, 1] gilt. f heißt streng konvex, falls die strikte Ungleichung für alle x′ ≠ x′′ und alle t ∈ (0, 1) gilt. f heißt konkav beziehungsweise streng konkav, wenn die jeweilige umgekehrte Ungleichung gilt.
3.7.2 Bemerkungen. (i) Die Konvexitätsbedingung (3.6) braucht nur für ′ ′′ ′ alle x , x ∈ A mit x ≠ x′′ und alle t ∈ (0, 1) gefordert werden. (ii)
Ist f konkav, so ist −f konvex. Deshalb betrachten wir im Folgenden nur konvexe Funktionen.
(iii)
Anschaulich bedeutet die Konvexität einer Funktion f , dass kein Punkt der P ′ = (x′ , f (x′ )) und P ′′ = (x′′ , f (x′′ )) verbindenden Sekante σP ′ ,P ′′ = { (1 − t)P ′ + tP ′′ ∣ t ∈ [0, 1] } unterhalb des Graphen von f , das heißt unterhalb von { ((1 − t)x′ + tx′′ ), f ((1 − t)x′ + tx′′ ) ∣ t ∈ [0, 1] } liegt (siehe Abbildung 3.7). y
f
σP
a
′ ,P
x′
′′
x′′ b
x
Abbildung 3.7: Konvexe Funktion mit Sekante
Wir betrachten nun die Steigungen von Sekanten konvexer Funktionen und zeigen unter anderem, dass für zwei aufeinanderfolgende Sekanten σP ′ ,P , σP,P ′′ die Steigung der zweiten stets größer oder gleich der der ersten ist. Dabei ist P ′ = (x′ , f (x′ )), P ′′ = (x′′ , f (x′′ )), x′ , x′′ ∈ A, x′ ≠ x′′ , P = (x, f (x)), x ∈ σ (x′ , x′′ ), x ≠ x′ , x′′ (vergleiche Abbildung 3.8). 3.7.3 Lemma. Sei A ⊂ Rn ein konvexe Menge und sei f ∶ A → R eine konvexe Funktion. Dann gilt für alle x′ , x′′ ∈ A, x′ ≠ x′′ und alle x ∈ σ (x′ , x′′ ), x ≠ x′ , x′′ : f (x) − f (x′ ) f (x′′ ) − f (x′ ) f (x′′ ) − f (x) ≤ ≤ . ∣x − x′ ∣ ∣x′′ − x′ ∣ ∣x′′ − x∣ Ist f streng konvex, so gelten die strikten Ungleichungen.
3.7 Konvexe Funktionen
107
y
σP
,P
′′
f
σP ′ ,P
a
x′
x
x′′ b
x
Abbildung 3.8: Aufeinanderfolgende Sekanten einer konvexen Funktion
Beweis. Seien x′ , x′′ ∈ A, x′ ≠ x′′ , und sei 0 < t < 1. Wir setzen x ∶= (1 − t)x′ + tx′′ . Dann gilt ∣x − x′ ∣ ∣x′′ − x∣ t = ′′ , 1 − t = (3.7) ∣x − x′ ∣ ∣x′′ − x′ ∣ und
∣x − x′ ∣ + ∣x′′ − x∣ = ∣x′′ − x′ ∣ .
Aus der Konvexitätsbedingung (3.6) folgt, dass
∣x′′ − x′ ∣ f (x) ≤ ∣x′′ − x∣ f (x′ ) + ∣x − x′ ∣ f (x′′ ), also
∣x′′ − x′ ∣ (f (x) − f (x′ )) ≤ (∣x′′ − x∣ − ∣x′′ − x′ ∣)f (x′ ) + ∣x − x′ ∣ f (x′′ ) = ∣x − x′ ∣ (f (x′′ ) − f (x′ )), woraus sich die Ungleichung f (x) − f (x′ ) f (x′′ ) − f (x′ ) ≤ ∣x − x′ ∣ ∣x′′ − x′ ∣ ergibt. Genauso folgt aus (3.8), dass
∣x′′ − x′ ∣ (f (x) − f (x′′ )) ≤ ∣x′′ − x∣ f (x′ ) + (∣x − x′ ∣ − ∣x′′ − x′ ∣)f (x′′ ) = ∣x′′ − x∣ (f (x′ ) − f (x′′ )), also
f (x′′ ) − f (x′ ) f (x′′ ) − f (x′ ) ≤ . ∣x′′ − x′ ∣ ∣x′′ − x′ ∣
(3.8)
108
3 Differentialrechnung mehrerer Variablen
3.7.4 Lemma. Sei A ⊂ Rn eine konvexe Menge. Eine Funktion f ∶ A → R ist genau dann konvex, wenn für alle x′ , x′′ ∈ A, x′ ≠ x′′ , und alle x ∈ σ (x′ , x′′ ), x ≠ x′ , x′′ : f (x) − f (x′ ) f (x′′ ) − f (x) ≤ . (3.9) ∣x − x′ ∣ ∣x′′ − x∣ f ist genau dann streng konvex, wenn die strikte Ungleichung gilt. Beweis. „ ⇒“ Diese Implikation wurde in Lemma 3.7.3 bewiesen. „ ⇐“ Aus (3.9) folgt mithilfe von (3.7), dass
(1 − t)(f (x) − f (x′ )) ≤ t(f (x′′ ) − f (x)), also die behauptete Konvexitätsbedingung f (x) ≤ (1 − t)f (x′ ) + tf (x′′ ) für alle x′ , x′′ ∈ A, x′ ≠ x′′ , und alle t ∈ (0, 1), dabei ist x = (1 − t)x′ + tx′′ . 3.7.5 Monotoniekriterium. Sei U ⊂ Rn eine konvexe, offene Menge und sei f ∶ U → R eine differenzierbare Funktion. Dann gelten die folgenden Aussagen: (i)
f ist genau dann konvex auf U , wenn für alle a ∈ U und alle e ∈ Rn , ∣e∣ = 1, die Richtungsableitung ∂f ∂e auf der Geraden σa,e ∶= { x ∈ U ∣ x = a + te, t ∈ R } monoton wächst.
(ii)
f ist genau dann streng konvex, wenn ist.
∂f ∂e
auf σa,e streng monoton wachsend
Beweis. Seien a ∈ U , e ∈ Rn , ∣e∣ = 1. Seien x′ , x′′ ∈ σa,e mit x′ = a+t′ e, x′′ = a+t′′ e, t′ , t′′ ∈ R, t′ < t′′ . Schließlich sei x ∈ σa,e mit x = a + te, t′ < t < t′′ . Dann gilt e=
x − x′ x − x′ x′′ − x x′′ − x = , e = = . ∣x − x′ ∣ t − t′ ∣x′′ − x∣ t′′ − t
(I) Sei f konvex auf U . Wegen Lemma 3.7.3 haben wir die Ungleichungen f (x) − f (x′ ) f (x′′ ) − f (x′ ) f (x′′ ) − f (x) ≤ ≤ . ∣x − x′ ∣ ∣x′′ − x′ ∣ ∣x′′ − x∣
3.7 Konvexe Funktionen
109
Durch Ausführen der separaten Grenzübergänge x → x′ und x → x′′ , das heißt t → t′ und t → t′′ folgt hieraus, dass ∂f ′ f (x) − f (x′ ) (x ) = lim′ t→t ∂e t − t′ ′′ f (x ) − f (x′ ) ≤ ∣x′′ − x′ ∣ f (x) − f (x′′ ) ≤ − lim′′ t→t t − t′′ ∂f =− (x′′ ) ∂ (−e) ∂f ′′ = (x ). ∂e Dabei haben wir Satz 3.4.5 beziehungsweise Lemma 3.4.4 benutzt, obwohl dies nicht nötig ist, weil wir U als offen vorausgesetzt haben. (II) Sei ∂f ∂e monoton wachsend auf σa,e . Dann besitzt die differenzierbare Funktion g (t) ∶= f (a + te) auf dem offenen Intervall { t ∈ R ∣ a + te ∈ U } eine monoton wachsende Ableitung g ′ (t) = ∇f (a + te) ⋅ e = ∂f ∂e (a + te). Nach dem Mittelwertsatz gibt es deshalb Zwischenstellen ξ1 , ξ2 ∈ σa,e , ξ1 = a + t1 e, ξ2 = a + t2 e, t′ < t1 < t < t2 < t′′ , so dass f (x) − f (x′ ) g (t) − g (t′ ) ∂f = = g ′ (t1 ) = (ξ1 ), ′ ′ ∣x − x ∣ t−t ∂e f (x′′ ) − f (x) g (t′′ ) − g (t) ∂f = = g ′ (t2 ) = (ξ2 ). ′′ ′′ ∣x − x∣ t −t ∂e Aus der Monotonie der Ableitung folgt daher die Ungleichung f (x) − f (x′ ) f (x′′ ) − f (x) ≤ . ∣x − x′ ∣ ∣x′′ − x∣ Weil a ∈ U und e ∈ Rn , ∣e∣ = 1, beliebig sind, gilt diese für alle x′ , x′′ ∈ U , x′ ≠ x′′ , x = (1 − t)x′ + tx′′ , t ∈ (0, 1). Aufgrund von Lemma 3.7.4 ist f daher konvex auf U. (III) Ist f streng konvex auf U , so haben wir nach Teil (I) die Ungleichungen ∂f ′ f (x′′ ) − f (x′ ) ∂f ′′ (x ) ≤ ≤ (x ), ∂e ∣x′′ − x′ ∣ ∂e also wegen f (x′′ ) ≠ f (x′ ) die strenge Monotonie der Richtungsableitung σa,e .
∂f ∂e
auf
110
3 Differentialrechnung mehrerer Variablen
(IV) Aus der strengen Monotonie von ∂f ∂e auf σa,e folgt wie in Teil (II) die strikte Ungleichung f (x) − f (x′ ) f (x′′ ) − f (x) < . ∣x − x′ ∣ ∣x′′ − x∣ Aus Lemma 3.7.4 folgt daher die strikte Konvexität von f auf U . 3.7.6 Bemerkung. Der Einfachheit halber haben wir in 3.7.5 vorausgesetzt, dass der Definitionsbereich von f eine offene Menge U und dass f in U total differenzierbar ist. Man kann mithilfe von Lemma 3.7.3 leicht zeigen, dass konvexe Funktionen in jedem Punkt a ihres Definitionsbereichs A Ableitungen ∂f ∂e (a) in jede Richtung e ∈ Rn , ∣e∣ = 1, besitzen, für die { t > 0 ∣ a + te ∈ A } ≠ ∅ gilt. Interessant wäre es, weitere Regularitätsaussagen für konvexe Funktionen zu beweisen, wie zum Beispiel, dass konvexe Funktionen immer (lokal) Lipschitzstetig sind. 3.7.7 Tangentenkriterium. Sei U ⊂ Rn eine konvexe, offene Menge und f ∶ U → Rn in U differenzierbar. Dann gelten die folgenden Aussagen: (i)
f ist genau dann konvex auf U , wenn für alle a ∈ U die Tangentialebene τa (x) ∶= f (a) + ∇f (a) ⋅ (x − a) eine Stützebene ist, mit anderen Worten in ganz U nicht oberhalb des Graphen von f liegt, das heißt, für alle a ∈ U und alle x ∈ U gilt die Ungleichung f (x) ≥ τa (x) = f (a) + ∇f (a) ⋅ (x − a).
(ii)
f ist genau dann streng konvex, wenn die Tangentialebene τa (x) für alle x ≠ a unterhalb des Graphen von f liegt, das heißt, für alle x ≠ a gilt die strikte Ungleichung.
Beweis. (I) Angenommen, f ist in U konvex. Dann gilt für alle a, x ∈ U und t ∈ [0, 1] die Ungleichung f ((1 − t)a + tx) ≤ (1 − t)f (a) + tf (x) = f (a) + t(f (x) − f (a)), weshalb
f (a + t(x − a)) − f (a) ≤ f (x) − f (a). t Für t → 0 erhalten wir mit der Kettenregel 3.3.10, dass d f (a + t(x − a))∣t=a dt ≤ f (x) − f (a),
∇f (a) ⋅ (x − a) =
also die Ungleichung f (x) ≥ τa (x) für alle a, x ∈ U .
3.7 Konvexe Funktionen
111
(II) Sei f (x) ≥ f (a) + Df (a) ⋅ (x − a) für alle a, x ∈ U . Seien x, x′ ∈ U , x ≠ x′ , t ∈ (0, 1) und sei a = (1 − t)x + tx′ = x + t(x′ − x) ∈ σ (x, x′ ). Betrachte den Richtungsvektor x′ − a a−x e ∶= ′ = . ∣x − a∣ ∣a − x∣ Dann gilt f (x′ ) ≥ τa (x′ ) = f (a) + ∇f (a) ⋅ (x′ − a), also
∇f (a) ⋅ e ≤
f (x′ ) − f (a) ∣x′ − a∣
sowie f (x) ≥ τa (x) = f (a) + ∇f (a) ⋅ (x − a), also
∇f (a) ⋅ e ≥ weshalb
f (a) − f (x) , ∣a − x∣
f (a) − f (x) f (x′ ) − f (a) ≤ . ∣a − x∣ ∣x′ − a∣
Nun gilt a − x = t(x′ − x), a − x′ = (1 − t)(x − x′ ), also t= Hieraus folgt, dass und deshalb gilt
∣a − x∣ ∣x′ − a∣ , 1 − t = . ∣x′ − x∣ ∣x′ − x∣
f (a) − f (x) f (x′ ) − f (a) ≤ t 1−t
f ((1 − t)x + tx′ ) = f (a) ≤ (1 − t)f (x) + tf (x′ ) für alle x, x′ ∈ U , x ≠ x′ , t ∈ (0, 1), weshalb f in U konvex ist. (III) Sei f streng konvex in U . Angenommen, es gilt die Gleichheit f (x) = f (a) + ∇f (a) ⋅ (x − a) für ein x ≠ a. Dann gibt es nach dem Mittelwertsatz ein ξ ∈ σ (a, x), ξ ≠ a, x, mit f (x) − f (a) = ∇f (ξ ) ⋅ (x − a). Daraus folgt aber, dass (∇f (ξ ) − ∇f (a)) ⋅ (x − a) = 0, also ∂f ∂f (ξ ) = (a) ∂e ∂e x− a . ∣x−a∣ ∂f ∂e auf
für e =
Dies widerspricht aber der strengen Monotonie der Richtungsablei-
tung
dem Segment σ (a, x).
112
3 Differentialrechnung mehrerer Variablen
(IV) Gilt die strikte Ungleichung f (x) > τa (x) für alle x ≠ a, so folgt wie in Teil (II), dass f streng konvex ist. 3.7.8 Zweite-Ableitungskriterium. Sei U ⊂ Rn eine konvexe, offene Menge und f ∶ U → R in U zweimal stetig differenzierbar. Dann gelten die folgenden Aussagen: (i)
f ist genau dann konvex in U , wenn die Hessesche Form in U positiv semi-definit ist, das heißt, für alle a ∈ U und ξ ∈ Rn gilt: n
ξD2 f (a)ξ ⊺ = ∑ Dij f (a)ξi , ξj ≥ 0. i,j =1
(ii)
Ist die Hessesche Form in U positiv definit, das heißt gilt ξD2 f (a)ξ ⊺ > 0, so ist f streng konvex.
Beweis. (I) Angenommen, f ist in U konvex. Wir betrachten die Taylor-Formel zweiter Ordnung aus der Bemerkung 3.6.1 1 2 f (x) = f (a) + ∇f (a) ⋅ (x − a) + (x − a) ○ D2 f (a) ○ (x − a)⊺ + o(∣x − a∣ ) 2 für a, x ∈ U . Wegen des Tangentenkriteriums 3.7.7 ist f (x) ≥ f (a)+∇f (a)⋅(x − a), also 1 2 (x − a)D2 f (a)(x − a)⊺ + o(∣x − a∣ ) ≥ 0. 2 Setzen wir x ∶= a + εξ, ξ ∈ Rn und ε > 0 so klein, dass x ∈ U gilt, dann haben wir ε2 2 2 ξD f (a)ξ ⊺ + o (ε2 ∣ξ ∣ ) ≥ 0, 2 also für ε → 0, dass ξD2 f (a)ξ ⊺ ≥ 0 für alle a ∈ U , ξ ∈ Rn . (II) Gilt umgekehrt, dass ξD2 f (a)ξ ⊺ ≥ 0 für alle a ∈ U , ξ ∈ Rn , so erinnern wir uns an die Taylor-Formel mit dem Lagrangeschen Restglied, Satz 3.5.6: Für alle a, x ∈ U gilt 1 f (x) = f (a) + Df (a) ⋅ (x − a) + (x − a) ○ D2 f (ξ ) ○ (x − a)⊺ 2 mit einem ξ ∈ σ (a, x), ξ ≠ a, x. Daraus folgt sofort, dass f (x) ≥ τa (x) = f (a) + ∇f (a) ⋅ (x − a), weshalb f nach dem Tangentenkriterium konvex ist. (III) Gilt die positive Definitheit von D2 f (a), so folgt wie in Teil (II) die strenge Konvexität von f .
4
Differenzierbare Abbildungen
4.1 Differenzierbare Abbildungen In diesem Kapitel betrachten wir Abbildungen f = (f1 , . . . , fm ) ∶ U → Rm einer offenen Teilmenge U des Rn in den Rm mit den Komponentenfunktionen f1 , . . . , fm ∶ U → R, n, m ∈ N. Es sollen Eigenschaften von Abbildungen f untersucht werden, die sich nicht ausschließlich auf ihre Komponentenfunktionen f1 , . . . , fm beziehen und welche man deshalb als wirkliche Abbildungseigenschaften bezeichnen kann. Beim Begriff der partiellen Differenzierbarkeit einer Abbildung, welchen wir schon in Definition 3.1.6 erklärt hatten, ist das noch nicht der Fall: 4.1.1 Definition. (i) Eine Abbildung f = (f1 , . . . , fm ) ∶ U → Rm heißt partiell differenzierbar im Punkt a = (a1 , . . . , an ) ∈ U , falls die partiellen Ableitungen der Komponentenfunktionen f1 , . . . , fm nach x1 , . . . , xn im ∂f1 ∂f1 m Punkt a, ∂x (a), ∂x (a), . . . , ∂f ∂xn (a), existieren. 1 2 (ii)
Die Funktionalmatrix oder Jacobi-Matrix von f im Punkt a ist die m × n-Matrix ∂f1 (a) ⋯ ⎛ ∂x 1 ∂fj ⋮ ( (a)) =⎜ j =1,...,m ⎜ ∂f ∂xi ⎝ ∂xm1 (a) ⋯ i=1,...,n
∂f1 ∂xn (a) ⎞
⋮
⎟. ⎟
∂fm ⎠ ∂xn (a)
Im Fall n = m heißt n ∂fj ∂ (f1 , . . . , fn ) Jf (a) = (a) ∶= det ( (a)) ∂ (x1 , . . . , xn ) ∂xi j,i=1
die Funktionaldeterminante oder Jacobi-Determinante von f im Punkt a. (iii)
f heißt partiell differenzierbar in U , falls alle Komponentenfunktionen f1 , . . . , fm in U partiell differenzierbar sind. Stellen die partiellen Ablei∂f1 ∂f1 m (x), ∂x (x), . . . , ∂f tungen ∂x ∂xn (x) stetige Funktionen in U dar, so heißt f 1 2 stetig (partiell) differenzierbar in U , in Zeichen f ∈ C 1 (U, Rm ).
114
4 Differenzierbare Abbildungen
4.1.2 Definition und Lemma. (i) Eine Abbildung f ∶ U → Rm heißt total oder reell oder einfach nur differenzierbar im Punkt a ∈ U , falls es eine m × n-Matrix
⎛ a11 ⋯ a1n ⎞ ⋮ ⎟ ∈ Rm×n A = (aji )j =1,...,m = ⎜ ⋮ i=1,...,n ⎝am1 ⋯ amn ⎠ gibt, so dass für alle x ∈ U eine Darstellung der Form f (x) = f (a) + A ○ (x − a)⊺ + ϕ(x) ∣x − a∣ gilt, dabei ist ϕ = ϕa ∶ U ∖ { a } → Rm eine Abbildung mit lim ϕ(x) = lim ϕa (a) = 0.
x→a
(ii)
x→a
A ist eindeutig bestimmt und heißt totale Ableitung von f . Wir bezeichnen sie durch
⎛ D1 f1 (a) ⋯ Dn f1 (a) ⎞ ⋮ ⋮ ⎟ Df (a) = (Di fj (a))j =1,...,m = ⎜ i=1,...,n ⎝D1 fm (a) ⋯ Dn fm (a)⎠ ⎛ a11 ⋯ a1n ⎞ ⋮ ⎟ = A. ∶= ⎜ ⋮ ⎝am1 ⋯ amn ⎠ 4.1.3 Bemerkungen. (i)
„ ⊺“
ist die Transposition von Matrizen,
⎛ x1 − a1 ⎞ (x − a)⊺ = ⎜ ⋮ ⎟ , (x − a) = (x1 − a1 , . . . , xn − an ). ⎝xn − an ⎠ „Identifizieren“ wir Spalten- und Zeilenvektoren, so können wir statt A ○ (x − a)⊺ auch A ○ (x − a) schreiben. (ii)
f ist stetig differenzierbar, falls Df ∶ U → Rm×n , x ↦ Df (x), in U stetig ist. Hierfür „identifizieren“ wir den Rm×n mit Rnm .
(iii)
f ist genau dann (stetig) total differenzierbar, wenn alle Komponentenfunktionen f1 , . . . , fm (stetig) total differenzierbar sind. Folglich sind viele einschlägige Aussagen über skalare Funktionen auch für Abbildungen gültig, wie zum Beispiel die Lemmata 3.3.5 und 3.3.6, aber nicht ohne weiteres der Mittelwertsatz (vergleiche hierzu die Bemerkung 3.1.12).
4.1 Differenzierbare Abbildungen (iv)
115
Ist f ∶ U → Rm im Punkt a ∈ U total differenzierbar, so ist f im Punkt a partiell differenzierbar und es gilt (vergleiche Lemma 3.3.5) Df (a) = (Di fj (a))j =1...m = ( i=1...n
∂fj ) . ∂xi j =1...m i=1...n
Die Kettenregel für Abbildungen formulieren wir wie folgt (vergleiche Satz 3.3.10: 4.1.4 Satz. Seien U ⊂ Rn und V ⊂ Rm offene Mengen. f ∶ U → V sei total differenzierbar im Punkt a ∈ U und g ∶ V → Rk total differenzierbar im Punkt b ∶= f (a) ∈ V . Sei h ∶= g ○ f . Dann gilt die Kettenregel Dh(a) = Dg (b) ○ Df (a), das heißt 1 ⎛ ∂h ∂x1 ⋯ ⎜ ⋮ ⎜ k ⎝ ∂h ∂x1 ⋯
∂g ⎛ ∂y11 ⋯ ⎜ ⋮ ⎟ ⎟ (a) = ⎜ ⋮ ∂hk k ⎝ ∂g ∂xn ⎠ ∂y1 ⋯ ∂h1 ∂xn ⎞
∂g1 ∂ym ⎞
∂f1 ⋯ ⎛ ∂x 1 ⎜ ⋮ ⋮ ⎟ ( b ) ○ ⎟ ⎜ ∂gk m ⎠ ⎝ ∂f ∂ym ∂x1 ⋯
∂f1 ∂xn ⎞
⋮ ⎟ ⎟ (a),
∂fm ⎠ ∂xn
beziehungsweise m ∂fj ∂h` ∂g` (a) = ∑ (b) (a) für ` = 1, . . . , k, i = 1, . . . , n. ∂xi ∂xi j =1 ∂yj
4.1.5 Beispiele. (i)
Wir betrachten die Polarkoordinatenabbildung
Φ ∶ { (r, ϕ) ∈ R2 ∣ r > 0, −π < ϕ < π } → R2 ∖ { (x, 0) ∈ R2 ∣ x ≤ 0 } , x = r cos ϕ y = r sin ϕ. Φ ist bijektiv, stetig differenzierbar und es gilt x x cos ϕ −r sin ϕ DΦ(r, ϕ) = ( r ϕ ) = ( ), yr yϕ sin ϕ r cos ϕ JΦ(r, ϕ) = r(cos2 ϕ + sin2 ϕ) = r ≠ 0. Ohne die Gleichungen x = r cos ϕ, y = r sin ϕ explizit auflösen zu müssen, können wir unter der Annahme der Differenzierbarkeit von Φ−1 die Funktionalmatrix DΦ−1 mit Hilfe der Kettenregel 4.1.4 bestimmen. Es muss nämlich 10 DΦ−1 (x, y ) ○ DΦ(r, ϕ) = D(Φ−1 ○ Φ)(r, ϕ) = D idR2 = ( ) 01
116
4 Differenzierbare Abbildungen gelten, also
r r cos ϕ −r sin ϕ 10 ( x y)○( ) = ( ), ϕx ϕy sin ϕ r cos ϕ 01
weshalb DΦ
−1
−1
r r cos ϕ −r sin ϕ = ( x y) = ( ) ϕx ϕy sin ϕ r cos ϕ x
⎛ √x2 +y2 cos ϕ sin ϕ = ( sin ϕ cos ϕ ) = y − r ⎝ − x2 + y 2 r
=
1 r cos ϕ r sin ϕ ( ) r − sin ϕ cos ϕ
y ⎞ x2 +y 2 . x x2 + y 2 ⎠
√
Wir prüfen dies nach: Es gilt √ x vx = ( x2 + y 2 ) = √ , x x2 + y 2 √ y ry = ( x2 + y 2 ) = √ . 2 y x + y2 Für − π2 < ϕ
0, −π < ϕ < π, z ∈ R }
→ R3 ∖ { (x, 0, z ) ∣ x ≤ 0, z ∈ R } , x = r cos ϕ y = r sin ϕ z = z, ist ebenfalls bijektiv und es gilt
⎛xr xϕ xz ⎞ ⎛cos ϕ −r sin ϕ 0⎞ DΦz = ⎜ yr yϕ yz ⎟ = ⎜ sin ϕ r cos ϕ 0⎟ , ⎝ z r zϕ zz ⎠ ⎝ 0 0 1⎠ JΦz = JΦ = r ≠ 0.
4.1 Differenzierbare Abbildungen (iii)
117
Wir betrachten sphärische Koordinaten (vergleiche Beispiel 2.1.5 (vi)) Ψ ∶ { (ρ, ϕ, ϑ) ∣ ρ > 0, −π < ϕ < π, 0 < ϑ < π }
→ R3 ∖ { (x, 0, z ) ∣ x ≤ 0, z ∈ R } , x = ρ cos ϕ sin ϑ y = ρ sin ϕ sin ϑ z = ρ cos ϑ. Dann gilt
⎛xρ xϕ xϑ ⎞ DΨ = ⎜ yρ yϕ yϑ ⎟ ⎝ zρ zϕ zϑ ⎠ ⎛cos ϕ sin ϑ −ρ sin ϕ sin ϑ ρ cos ϕ cos ϑ⎞ = ⎜ sin ϕ sin ϑ ρ cos ϕ sin ϑ ρ sin ϕ cos ϑ ⎟ . ⎝ cos ϑ 0 −ρ sin ϑ ⎠ Entwicklung nach der letzten Zeile liefert
−ρ sin ϕ sin ϑ ρ cos ϕ cos ϑ JΨ = cos ϑ ∣ ∣ ρ cos ϕ sin ϑ ρ sin ϕ cos ϑ cos ϕ sin ϑ −ρ sin ϕ sin ϑ − ρ sin ϑ ∣ ∣ sin ϕ sin ϑ ρ cos ϕ sin ϑ
= −ρ2 cos2 ϑ sin ϑ − ρ2 sin3 ϑ = −ρ2 sin ϑ ≠ 0. (iv)
Wir betrachten noch einmal sphärische Koordinaten: Sei Φϕ ∶ { (ρ, ϕ, ϑ) ∣ ρ > 0, −π < ϕ < π, 0 < ϑ < π } → { (r, ϕ, z ) ∣ r > 0, −π < ϕ < π, z ∈ R } , r = ρ sin ϑ ϕ=ϕ z = ρ cos ϑ. Dann ist Φϕ bijektiv und es gilt
⎛ rρ rϕ rϑ ⎞ ⎛ sin ϑ 0 ρ cos ϑ ⎞ 0 ⎟, DΦϕ = ⎜ϕρ ϕϕ ϕϑ ⎟ = ⎜ 0 1 ⎝ zρ zϕ zϑ ⎠ ⎝cos ϑ 0 −ρ sin ϑ⎠ JΦϕ = −ρ ≠ 0.
118
4 Differenzierbare Abbildungen Schreiben wir die sphärische Koordinatenabbildung Ψ als Verknüpfung von Φϕ und Φz wie in Beispiel 2.1.5 (vi), das heißt Ψ = Φz ○ Φϕ beziehungsweise x = ρ cos ϕ sin ϑ = r cos ϕ∣r=ρ sin ϑ
= r sin ϕ∣r=ρ sin ϑ
y = ρ sin ϕ sin ϑ
= z ∣z =ρ cos ϑ ,
z = ρ cos ϑ dann haben wir nach der Kettenregel DΨ = DΦz ○ DΦϕ
⎛cos ϕ −r sin ϕ 0⎞RRRR ⎛ sin ϑ 0 ρ cos ϑ ⎞ 0 ⎟ = ⎜ sin ϕ r cos ϕ 0⎟RRRRR ○⎜ 0 1 ⎝ 0 0 1⎠RRRRr=ρ sin ϑ ⎝cos ϑ 0 −ρ sin ϑ⎠ ⎛cos ϕ sin ϑ −ρ sin ϕ sin ϑ ρ cos ϕ cos ϑ⎞ = ⎜ sin ϕ sin ϑ ρ cos ϕ sin ϑ ρ sin ϕ cos ϑ ⎟ , ⎝ cos ϑ 0 −ρ sin ϑ ⎠
also
JΨ = JΦz ⋅ JΦϕ = r∣r=ρ sin ϑ ⋅(−ρ) = −ρ2 sin ϑ ≠ 0.
4.2 Der Satz über inverse Abbildungen 4.2.1 Vorbemerkung. Wir erinnern uns an das Umkehrproblem für Funktionen f ∶ [a, b] → R, dabei ist [a, b] ⊂ R, a < b, ein nicht-ausgeartetes, kompaktes Intervall: Jede stetige, (streng) monoton wachsende Funktion f ∶ [a, b] → [f (a), f (b)] ist bijektiv und f −1 ist stetig und (streng) monoton (vergleiche Analysis I, Abschnitt 4.6). Ist zusätzlich f differenzierbar im Punkt x mit f ′ (x) ≠ 0, so ist auch f −1 differenzierbar im Bildpunkt y = f (x) und es gilt die Umkehrformel (vergleiche Analysis I, Abschnitt 5.2)
(f −1 )′ (y ) =
1 f ′ ( x)
.
4.2 Der Satz über inverse Abbildungen
119
4.2.2 Fragestellung. In diesem Abschnitt betrachten wir den Fall m = n und untersuchen die Frage der (lokalen) Umkehrbarkeit von Abbildungen f ∶ U → Rn , dabei ist U ⊂ Rn eine offene Menge. Mit anderen Worten wird danach gefragt, ob es zu gegebenen Punkten a ∈ U , b ∶= f (a) offene Umgebungen U (a), V (b) ⊂ Rn gibt, so dass f ∣U (a) ∶ U (a) → V (b) bijektiv ist. Unter der Annahme der stetigen Differenzierbarkeit und dem Nichtverschwinden der Jacobi-Determinante Jf von f werden wir diese Frage positiv beantworten. Ferner wird untersucht, ob die inverse Abbildung f −1 differenzierbar ist. Das Hauptproblem dabei ist die Frage der lokalen Lösbarkeit der Gleichung f (x) = y beziehungsweise des nichtlinearen quadratischen Systems f1 (x1 , . . . , xn ) = y1 ⋮ fn (x1 , . . . , xn ) = yn von n Gleichungen mit den n Unbekannten x1 , . . . , xn . Dabei nehmen wir an, dass das System für y = b = (b1 , . . . , bn ) durch x = a = (a1 , . . . , an ) gelöst wird, das heißt, es gilt f (a) = b, und zeigen, dass es dann für alle y = (y1 , . . . , yn ) aus einer offenen Umgebung V (b) eine Lösung x = (x1 , . . . , xn ) ∈ U besitzt. Außerdem stellt sich die Frage der eindeutigen Lösbarkeit, welche wir zuerst beantworten werden. Das Existenzproblem lösen wir mithilfe der Methode der kleinsten Quadrate. Wie in Beispiel 3.6.10 betrachten wir dabei zu gegebenem y den quadratischen Abstand 2 g (x) ∶= ∣f (x) − y ∣ von y zu allen Bildpunkten f (x) für x ∈ U (vergleiche den Beweis von Lemma 4.2.5. Die Idee dabei ist, dass die Gleichung f (x) = y genau dann eine Lösung x ∈ U besitzt, wenn g (x) = 0 = inf g (x′ ) = min g ( x′ ) ′ ′ x ∈U
x ∈U
gilt. Notwendig für das Vorliegen eines lokalen Minimums ist nach dem Satz von Fermat 3.6.3 das Verschwinden des Gradienten
∇g (x) = 0 im Punkt x ∈ U . Dieses System diskutieren wir mit Hilfe der Cramerschen Regel. Vorab müssen wir allerdings sicherstellen, dass die Funktion g (x) tatsächlich ein lokales Minimum in U annimmt. Um den Satz von Weierstraß 2.5.5 anwenden zu können, müssen wir eine kleine Hilfsbetrachtung anstellen.
120
4 Differenzierbare Abbildungen
4.2.3 Beispiel. Ist f ∶ Rn → Rn eine lineare Abbildung, das heißt
⎛ a11 ⋯ a1n ⎞ ⎛ x1 ⎞ ⋮ ⎟⎜ ⋮ ⎟ f (x) = A ○ x = ⎜ ⋮ ⎝an1 ⋯ ann ⎠ ⎝xn ⎠ beziehungsweise
n
fj (x) = ∑ ajk xk für j = 1, . . . , n, k =1
dann besagt die Cramersche Regel, dass die Gleichung f (x) = A ○ x = y, das heißt das quadratische Gleichungssystem a11 x1 + ⋯ + a1n xn = y1 ⋮ an1 x1 + ⋯ + ann xn = yn , genau dann eine eindeutige Lösung x = (x1 , . . . , xn )⊺ besitzt, wenn det A = det(ajk )nj,k=1 ≠ 0 gilt. Die Lösung ist gegeben durch x = A−1 ○ y, das heißt xk =
=
⎛ a11 ⋯ a1k−1 y1 a1k+1 ⋯ a1n ⎞ 1 ⋮ ⋮ ⋮ ⋮ ⎟ det ⎜ ⋮ det A ⎝an1 ⋯ ank−1 yn ank+1 ⋯ ann ⎠ n 1 ∑ Ajk yj , det A j =1
dabei ist
Ajk
⎛ a11 ⎜ ⋮ ⎜a ⎜ = (−1)j +k det ⎜ j −11 ⎜aj +11 ⎜ ⎜ ⋮ ⎝ an1
⋯ a1k−1
a1k+1
⋯ aj −1k−1 aj −11k+1 ⋯ aj +1k−1 aj +11k+1 ⋯ ank−1
ank+1
⋯ a1n ⎞ ⋮ ⎟ ⋯ aj −1n ⎟ ⎟ ⎟. ⋯ aj +1n ⎟ ⎟ ⋮ ⎟ ⋯ ann ⎠
Für die Abbildung f ∶ Rn → Rn bedeutet dies, dass sie genau dann bijektiv ist, wenn det A ≠ 0. Die Inverse f −1 ∶ Rn → Rn ist gegeben durch f −1 (x) = A−1 ○ x. Es gilt
∂f1 ⋯ ⎛ ∂x 1 ⋮ Df (x) = ⎜ ⎜ n ⎝ ∂f ∂x1 ⋯
∂f1 ∂xn ⎞
⎛ a11 ⋯ a1n ⎞ ⋮ ⎟ ⋮ ⎟ = A, = ⎟ ⎜ ⋮ ∂fn ⎝ a ⋯ a ⎠ n1 nn ⎠ ∂xn
das heißt, f ist genau dann bijektiv, wenn Jf ≠ 0 gilt.
4.2 Der Satz über inverse Abbildungen
121
Das Nichtverschwinden der Funktionaldeterminante Jf wird auch im allgemeinen Fall von entscheidender Bedeutung sein, vergleiche den Fall n = 1 und die Tatsache, dass f durch die affine Abbildung τ (x) ∶= f (a) + Df (a) ⋅ (x − a) approximiert wird. Als Erstes behandeln wir die Frage der lokalen Injektivität. 4.2.4 Lemma. Es sei f ∈ C 1 (U, Rn ), außerdem sei a ∈ U mit Jf (a) ≠ 0. Dann ist f lokal injektiv, das heißt, es gibt eine offene Umgebung U (a) ⊂ U von a, so dass f ∣U (a) ∶ U (a) → Rn injektiv ist. Beweis. Seien x, x′ ∈ U zwei Punkte mit der Eigenschaft, dass das Segment σ (x, x′ ) = { (1 − t)x + tx′ ∣ 0 ≤ t ≤ 1 } in U liegt und sei f (x) = f (x′ ). Dann gibt es nach dem Mittelwertsatz 3.1.9 beziehungsweise 3.3.11, angewandt auf die Komponentenfunktionen f1 , . . . , fm , Zwischenstellen ξ1 , . . . , ξn ∈ σ (x, x′ ), so dass n
∂fj (ξj )(x′i − xi ) ∂x i i=1
0 = fj (x′ ) − fj (x) = Dfj (ξj )(x′ − x) = ∑ für j = 1, . . . , n, das heißt ∂f1 (ξ1 ) ⋯ ⎛ ∂x 1 ⎜ ⋮ ⎜ ∂fn ⎝ ∂x1 (ξn ) ⋯
∂f1 ′ ∂xn (ξ1 ) ⎞ ⎛ x1
− x1 ⎞ ⎛0⎞ ⎟⎜ ⋮ ⎟ = ⎜⋮⎟. ⋮ ⎟ ′ ∂fn ⎠ ⎝xn − xn ⎠ ⎝0⎠ ( ξ ) n ∂xn
Wegen der Stetigkeit der Ableitungen Jf (a) ≠ 0 gibt es ein ρ > 0 mit det (
∂fj ∂xi
in U für j = 1, . . . , m, i = 1, . . . , n und
n ∂fj (ξj )) ≠0 ∂xi j,i=1
für alle ξ1 , . . . , ξn ∈ Uρ (a). Nach der Cramerschen Regel folgt also für alle x, x′ ∈ Uρ (a) mit f (x) = f (x′ ), dass x′i − xi = 0 für i = 1, . . . , n, also x = x′ , das heißt, f ist injektiv auf Uρ (a).
122
4 Differenzierbare Abbildungen
Mit Hilfe der Methode der kleinsten Quadrate lösen wir nun das Hauptproblem der lokalen Surjektivität. 4.2.5 Lemma. Sei f ∈ C 1 (U, Rn ) injektiv, so dass Jf (x) ≠ 0 für alle x ∈ U gilt. Für alle a ∈ U ist b ∶= f (a) dann ein innerer Punkt von f (U ), das heißt, es gibt eine offene Umgebung V (b) mit V (b) ⊂ f (U ), mit anderen Worten gibt es zu jedem y ∈ V (b) (genau) eine Lösung x ∈ U der Gleichung f (x) = y. Beweis. (I) Sei y ∈ Rn . Wir betrachten die Hilfsfunktion g ∶ U → R, 2
n
g (x) = gy (x) ∶= ∣f (x) − y ∣ = ∑ (fj (x) − yj )2 j =1
und nehmen zunächst an, dass g in einem Punkt x ∈ U ein Minimum annimmt. Nach dem Satz von Fermat 3.6.3 muss ∇g (x) = 0 sein, das heißt, für i = 1, . . . , n haben wir 0=
n ∂fj ∂ ⎛n 2⎞ (x), ∑ (fj (x) − yj ) = 2 ∑ (fj (x) − yj ) ∂xi ⎝j =1 ∂xi ⎠ j =1
das heißt (f (x) − y ) ○ Df (x) = 0, beziehungsweise Df (x)⊺ ○ (f (x) − y )⊺ = 0. Wegen Jf (x) = det Df (x) ≠ 0 folgt aus der Cramerschen Regel, dass (f (x) − y )⊺ = 0 ist, das heißt y = f (x). (II) Sei b ∶= f (a), a ∈ U . Wir zeigen nun, dass es dann ein σ > 0 gibt, so dass die Funktion g = gy für alle y ∈ V (b) ∶= Uσ (b) ein Minimum in U annimmt. Zusammen mit Teil (I) ergibt sich so ein Beweis des Satzes: Sei ρ > 0 so klein, dass die kompakte Kugel Kρ (a) = Uρ (a) = { x ∈ Rn ∣ ∣x − a∣ ≤ ρ } noch in U liegt. Wir betrachten die Hilfsfunktion h ∶ ∂Uρ (a) → R, h(x) ∶= ∣f (x) − b∣ = dist(f (x), b), dabei ist ∂Uρ (a) = { x ∈ Rn ∣ ∣x − a∣ = ρ }. Aus der Injektivität von f folgt, dass h(x) > 0 für alle x ∈ ∂Uρ (a). Da ∂Uρ (a) kompakt und h stetig ist, gibt es eine positive Zahl σ > 0 mit h(x) ≥ 2σ für alle x ∈ ∂Uρ (a), das heißt, es gilt ∣f (x) − b∣ ≥ 2σ > 0.
4.2 Der Satz über inverse Abbildungen
123
f a
b
∂Uρ (a)
2σ
ρ
f (∂Uρ (a))
U f (U ) Abbildung 4.1: Zum Beweis der lokalen Surjektivität
Sei y ∈ Uσ (b). Für x ∈ ∂Uρ (a) haben wir dann
∣f (x) − y ∣ ≥ ∣f (x) − b∣ − ∣b − y ∣ > 2σ − σ = σ, das heißt, es gilt Andererseits ist
g (x) > σ 2 für alle x ∈ ∂Uρ (a). 2
g (a) = ∣f (a) − y ∣ < σ 2 .
Die in Kρ (a) stetige Funktion g besitzt nach dem Satz von Weierstraß 2.5.5 in Kρ (a) ein Minimum, welches also wie behauptet in einem inneren Punkt x ∈ Uρ (a) angenommen wird. Als Korollar ergibt sich die folgende Aussage: 4.2.6 Lemma. Sei f ∈ C 1 (U, Rn ) (global) injektiv mit Jf (x) ≠ 0 für alle x ∈ U . Dann ist das Bild f (U ) eine offene Menge und f ∶ U → f (U ) ist ein Homöomorphismus, das heißt, f ist bijektiv, stetig und f −1 ∶ f (U ) → U ist eine stetige Funktion. Beweis. Wegen Lemma 4.2.5 ist jeder Punkt y ∈ f (U ) ein innerer Punkt von f (U ), weshalb f (U ) offen ist. Dies gilt für beliebige offene Teilmengen von U , das heißt, für jede offene Menge U ′ ⊂ U ist f (U ′ ) = (f −1 )−1 (U ′ ) offen. Das heißt aber gerade, dass das Urbild von U ′ unter f −1 offen ist. Nach Satz 2.3.10 ist die Inverse f −1 deshalb eine stetige Funktion.
124
4 Differenzierbare Abbildungen
Kombinieren wir nun Lemmata 4.2.4 und 4.2.6, so erhalten wir, weil die Menge { x ∈ U ∣ Jf (x) ≠ 0 } offen ist, die folgende Aussage: 4.2.7 Lemma. Sei f ∈ C 1 (U, Rn ) und sei a ∈ U mit Jf (a) ≠ 0. Dann gibt es offene Umgebungen U (a) ⊂ U von a, V (b) ⊂ f (U ) von b = f (a), so dass Jf (x) ≠ 0 für alle x ∈ U (a) und f ∣U (a) ∶ U (a) → V (b) ein Homöomorphismus ist. Wir wenden uns nun der Frage der Differenzierbarkeit der inversen Abbildung f −1 zu. 4.2.8 Lemma. Sei f ∈ C 1 (U, Rn ) injektiv mit Jf (x) ≠ 0 für alle x ∈ U wie in Lemma 4.2.6. Dann ist f −1 ∶ f (U ) → U stetig differenzierbar und für alle y = f (x) ∈ f (U ) gilt die Umkehrformel −1
n
Df
−1
∂f −1 ∂fj n (y ) = ( k ) = (Df (x))−1 = (( ) ) ∂y` k,`=1 ∂xi j,i=1
.
Beweis. (I) Sei y = f (x) ∈ f (U ). Seien Kugelumgebungen V (y ) = Vσ (y ) ⊂ f (U ) von y und U (x) = Uρ (x) ⊂ U von x = f −1 (y ) so gewählt, dass f −1 (V (y )) ⊂ U (x). Für y ′ ∈ V (y ) ist dann x′ = f −1 (y ′ ) ∈ U (x), also insbesondere σ (x, x′ ) ⊂ U (x). Nach dem Mittelwertsatz 3.1.9 beziehungsweise 3.3.11, angewandt auf die Komponentenfunktionen f1 , . . . , fm , folgt für j = 1, . . . , n, dass n
∂fj (ξj )(x′i − xi ) i=1 ∂xi
yj′ − yj = fj (x′ ) − fj (x) = ∑
mit Zwischenstellen ξ1 , . . . , ξn ∈ σ (x, x′ ). Wir setzen n ∂fj Df (ξ1 , . . . , ξn ) ∶= ( (ξj )) , ∂xi j,i=1 n ∂fj Jf (ξ1 , . . . , ξn ) ∶= det ( (ξj )) ∂xi j,i=1
und schreiben das Gleichungssystem (4.1) in der Form
(y ′ − y )⊺ = Df (ξ1 , . . . , ξn ) ○ (x′ − x)⊺ .
(4.1)
4.2 Der Satz über inverse Abbildungen
125
∂f1 ∂f1 ∂fn Wegen der Stetigkeit der partiellen Ableitungen ∂x , ∂x2 , . . . , ∂x in U und da 1 n Jf (x) ≠ 0 ist, kann ρ > 0 so klein gewählt werden, dass Jf (ξ1 , . . . , ξn ) ≠ 0 für alle ξ1 , . . . , ξn ∈ U (x) = Uρ (x) gilt. Dann wählen wir σ > 0 so klein, dass
f −1 (Vσ (y )) = f −1 (V (y )) ⊂ U (x). Nach der Cramerschen Regel wird deshalb das Gleichungssystem (4.1) für k = 1, . . . , n gelöst durch x′k − xk =
1 ⋅ Jf (ξ1 , . . . , ξn ) ∂f1 (ξ1 ) ⋯ ⎛ ∂x 1 ⋮ ⋅ det ⎜ ⎜ ∂fn ⎝ ∂x1 (ξn ) ⋯
y1′ − y1 ⋮ ⋮ ∂fn ′ ∂xk−1 (ξn ) yn − yn ∂f1 ∂xk−1 (ξ1 )
∂f1 ∂xk+1 (ξ1 )
⋮
∂fn ∂xk+1 (ξn )
⋯
∂f1 ∂xn (ξ1 ) ⎞
⋯
∂fn ⎠ ∂xn (ξn )
⋮
⎟. ⎟
(II) Setzen wir y ′ = y + he` , dabei ist e` = (0, . . . , 0, 1, 0, . . . , 0) der `-te kanonische Einheitsvektor und h ≠ 0, so folgt fk−1 (y ′ ) − fk−1 (y ) x′k − xk 1 = = ⋅ h h Jf (ξ1 , . . . , ξn ) ∂f ⎛ ∂x11 (ξ1 ) ⋯ ⎜ ⎜ ⋮ det ⎜ ⎜ ⎜ ⎜ n ⎝ ∂f ∂x1 (ξn ) ⋯
∂f1 ∂xk−1 (ξ1 )
0 ⋮ ⋮ 1 ⋮ ∂fn ∂xk−1 (ξn ) 0
∂f1 ∂xk+1 (ξ1 )
⋯
∂f1 ∂xn (ξ1 ) ⎞
⎟ ⎟ ⎟, ⋮ ⋮ ⎟ ⎟ ⎟ ∂fn ∂fn ⎠ ∂xk+1 (ξn ) ⋯ ∂xn (ξn )
hierbei besteht die k-te Spalte der Determinante im Zähler bis auf die 1 in der `-ten Zeile aus lauter Nullen. Auflösung nach dieser Spalte liefert x′k − xk A`k (ξ1 , . . . , ξn ) = , h Jf (ξ1 , . . . , ξn ) dabei ist A`k (ξ1 , . . . , ξn ) gleich (−1)`+k mal dem algebraischen Komplement von ∂f` ∂xk (ξ` ) in der Matrix Df (ξ1 , . . . , ξn ). Für h → 0 gilt y ′ = y + he` → y und x′ → x, ξ1 , . . . , ξn → x. Wegen der Stetigkeit ∂fn ∂f1 ∂f1 , ∂x2 , . . . , ∂x und Jf (x) ≠ 0 in U folgt daher, dass der partiellen Ableitungen ∂x 1 n fk−1 (y + he` ) − fk−1 (y ) x′k − xk A`k (ξ1 , . . . , ξn ) = = h h Jf (ξ1 , . . . , ξn ) A`k (x) A`k (f −1 (y )) → = , Jf (x) Jf (f −1 (y ))
126
4 Differenzierbare Abbildungen
dabei ist A`k (x) gleich (−1)`+k mal dem algebraischen Komplement von
∂f` ∂xk (x)
∂f
in der Funktionalmatrix Df (x) = ( ∂xji (x)): ∂f1 ⋯ ⎛ ∂x 1 ⎜ ⋮ ⎜ ⎜ `−1 ⋯ A`k (x) = det ⎜ ∂f ⎜ ∂x1 ⎜ ⋮ ⎜ n ⎝ ∂f ∂x1 ⋯
∂f1 ∂f1 ∂xk−1 ∂xk+1
⋮
⋮
⋮
⋮
∂f`−1 ∂f`−1 ∂xk−1 ∂xk+1 ∂fn ∂fn ∂xk−1 ∂xk+1
⋯
∂f1 ∂xn
⎞ ⋮ ⎟ ⎟ `−1 ⎟ ⋯ ∂f (x). ∂xn ⎟ ⎟ ⎟ ⋮ ⎟ ∂fn ⎠ ⋯ ∂x n
Deshalb ist f −1 an der Stelle y partiell differenzierbar und es gilt −1 ∂fk−1 ∂fj A`k (f −1 (y )) A`k (x) (y ) = = = ( ( x )) ∂y` Jf (f −1 (y )) Jf (x) ∂xi k`
für k, ` = 1, . . . , n. Die Umkehrformel lautet also Df −1 (y ) = (Df (x))−1 . Da Zähler und Nenner stetige Funktionen in x ∈ U beziehungsweise in y ∈ f (U ) sind, sind die partiellen Ableitungen stetig. Also gehört f −1 zur Klasse C 1 (f (U )). 4.2.9 Bemerkung. Unter der Annahme, dass f −1 differenzierbar ist, folgt aus der Kettenregel 4.1.4, dass O⎞ ⎛1 ⎜ ⋱ ⎟ = D idRn = D((f −1 ○ f )(x)) = Df −1 (y ) ○ Df (x), ⎝O 1⎠ daher ist
Df −1 (y ) = (Df (x))−1 .
Die Frage der höheren Differenzierbarkeit der Inversen f −1 lässt sich nun folgendermaßen beantworten: 4.2.10 Lemma. Sei f ∈ C p (U, Rn ), p ∈ N, injektiv mit Jf (x) ≠ 0 für alle x ∈ U . Dann ist auch die inverse Abbildung f −1 p-mal stetig differenzierbar, das heißt f −1 ∈ C p (f (U ), Rn ). Beweis. (I) Für p = 1 ist die Behauptung schon bewiesen und es gilt ∂fk−1 A`k (f −1 (y )) (y ) = für k, ` = 1, . . . , n. ∂y` Jf (f −1 (y ))
4.3 Lokal und global umkehrbare Abbildungen
127 ∂f
(II) Die Funktionen A`k (x) und Jf (x) sind Polynome in ∂xji (x), also p − 1-mal stetig differenzierbar in U . Da Jf (x) ≠ 0 für x ∈ U (a) gilt, sind die Funktionen Rk` (x) ∶=
A`k (x) für k, ` = 1, . . . , n Jf (x)
p − 1-mal stetig differenzierbar in U und für y ∈ f (U ) gilt ∂fk−1 (y ) = Rk` (f −1 (y )) = (Rk` ○ f −1 ) (y ). ∂y`
(4.2)
(III) Ist f −1 ∈ C q (f (U )), q ≤ p − 1, so folgt aus der Kettenregel 3.1.7 bezie∂f −1 hungsweise 3.3.10, dass ∂yk` ∈ C q (f (U )), das heißt f −1 ∈ C q+1 (f (U )). Also schließt man durch vollständige Induktion über q für 1 ≤ q ≤ p − 1, dass f −1 ∈ C p (f (U )). Zusammengenommen ergeben die Lemmata 4.2.7 und 4.2.10 das folgende Hauptresultat: 4.2.11 Satz über inverse Abbildungen. Sei U ⊂ Rn eine offene Menge und die Abbildung f ∶ U → Rn gehöre zur Klasse C p (U, Rn ), p ∈ N, außerdem sei a ∈ U mit Jf (a) ≠ 0. Dann gibt es offene Umgebungen U (a) ⊂ U von a und V (b) ⊂ Rn von b ∶= f (a), so dass f ∣U (a) ∶ U (a) → V (b) ein Diffeomorphismus der Klasse C p (U (a), V (b)) ist, das heißt, die Abbildung f ∣U (a) ∶ U (a) → V (b) ist bijektiv, f ∣U (a) ∈ C p (U (a), V (b)) und f −1 ∶= −1
(f ∣U (a) ) mel
∈ C p (V (b), U (a)), und für alle y = f (x) ∈ f (U ) gilt die Umkehrfor−1
Df −1 (y ) = (Df (x)) ∣x=f −1 (y) .
4.3 Lokal und global umkehrbare Abbildungen Aus den Lemmata 4.2.6 und 4.2.10 ergibt sich die folgende Aussage: 4.3.1 Satz. Sei f ∈ C p (U, Rn ) (global) injektiv mit Jf (x) ≠ 0 für alle x ∈ U . Dann ist das Bild f (U ) eine offene Menge und f ∶ U → f (U ) ist ein Diffeomorphismus der Klasse C p (U, f (U )).
128
4 Differenzierbare Abbildungen
4.3.2 Beispiel. Wir betrachten die Abbildung f ∶ R2 → R2 , u = x2 − y 2 , v = 2xy der x, y-Ebene in die u, v-Ebene. Es gilt u u 2x −2y Df (x, y ) = det ( x y ) = det ( ) = 4(x2 + y 2 ) ≠ 0 vx vy 2y 2x für (x, y ) ≠ (0, 0). Außerhalb des Nullpunktes ist f also lokal invertierbar. f ist jedoch nicht global invertierbar, denn wegen f (x, y ) = (x2 − y 2 , 2xy ) = f (−x, −y ) für alle (x, y ) ∈ R2 ist f nicht injektiv. In diesem Fall kann man “die“ Umkehrfunktion explizit bestimmen. Es gilt
¿√ Á u2 + v 2 + u Á À x=± , 2 ¿√ Á u2 + v 2 − u Á À y = ±ε 2
(4.3)
1 für v ≥ 0 mit ε = { . Für (x, y ) = (a, b) = (1, 1) ist zum Beispiel u = 0, v = 2, −1 für v < 0 also ε = 1 zu wählen und wegen
¿√ ¿√ Á u2 + v 2 + u Á u2 + v 2 − u Á Á À À =1= 2 2 in (4.3) jeweils das Vorzeichen +, das heißt, die Umkehrabbildung ist in einer Umgebung von (a, b) = (1, 1) gegeben durch
¿√ Á u2 + v 2 + u Á À x= , 2 ¿√ Á u2 + v 2 − u Á À y= . 2
4.3 Lokal und global umkehrbare Abbildungen
129
4.3.3 Beispiel. Für die Abbildung f ∶ R3 → R3 , u = x + ey v = y + ez w = z + ex des x, y, z-Raumes in den u, v, w-Raum haben wir y ⎛ ux uy uz ⎞ ⎛1 e 0⎞ Df (x, y, z ) = det ⎜ vx vy vz ⎟ = det ⎜ 0 1 ez ⎟ = 1 + ex+y+z ≠ 0 ⎝wx wy wz ⎠ ⎝ex 0 1 ⎠
für alle (x, y, z ) ∈ R3 . f ist also überall lokal umkehrbar. Wir zeigen, dass f sogar global umkehrbar ist: Sei f (x, y, z ) = f (x′ , y ′ , z ′ ). Dann haben wir ′
x − x′ = e y − e y = e η ( y ′ − y ) , ′
y − y ′ = ez − ez = eζ (z ′ − z ), ′
z − z ′ = ex − ex = eξ (x′ − x) nach dem Mittelwertsatz mit ξ, η, ζ zwischen x und x′ , y und y ′ beziehungsweise z und z ′ . Die Annahme x > x′ führt zum Widerspruch, genauso die Annahme x′ > x. Also muss x = x′ sein, woraus y = y ′ und z = z ′ folgt. Damit ist f injektiv und deshalb global umkehrbar. Mithilfe der Methode der kleinsten Quadrate (vergleiche 3.6.10) zeigen wir, dass f surjektiv ist. Dazu betrachten wir die Hilfsfunktion g (x, y, z ) = (x + ey − u)2 + (y + ez − v )2 + (z + ex − w)2 für einen beliebig vorgegebenen Punkt (u, v, w) ∈ R3 . Man zeigt leicht, dass √ g (x, y, z ) → +∞ für x2 + y 2 + z 2 → ∞, deshalb besitzt g ein globales Minimum, welches in einem Punkt (x, y, z ) ∈ R3 angenommen wird. Deshalb haben wir ∂g (x, y, z ) = 2(x + ey − u) + 2(z + ex − w)ex , ∂x ∂g 0= (x, y, z ) = 2(y + ez − v ) + 2(x + ey − u)ey , ∂y ∂g 0= (x, y, z ) = 2(z + ex − w) + 2(y + ez − v )ez . ∂z 0=
130
4 Differenzierbare Abbildungen
Die Annahme x + ey − u > 0 führt zum Widerspruch, ähnlich die Annahme x + ey − u < 0. Also muss x + ey = u gelten, woraus insgesamt u = x + ey , v = y + ez , w = z + ex
(4.4)
folgt, das heißt, das Gleichungssystem (4.4) besitzt für alle (u, v, w) ∈ R3 eine Lösung (x, y, z ) ∈ R3 . Damit ist f auch surjektiv. 4.3.4 Beispiel. Sei U ⊂ R2 eine horizontal einfache offene Menge, das heißt, es gibt ein nicht-leeres, offenes Intervall J ⊂ R, so dass die Schnittmengen Uy ∶= { x ∈ R ∣ (x, y ) ∈ U } für alle y ∈ J nicht-leere, offene Intervalle sind. Es gilt U = ⋃ Uy × { y } . y ∈J
f ∶ U → R2 sei eine horizontal einfache Abbildung, das heißt, sie ist von der Form u = ϕ(x, y ), v=y (vergleiche Abbildung 4.2). Sei ϕ ∈ C 1 (U ) und ϕx ≠ 0 in U . Aus dem Zwischenwertsatz von Bolzano, angewandt auf die Schnittfunktionen ϕy ∶ Uy → R, ϕy (x) ∶= ϕ(x, y ), folgt, dass Vy ∶= ϕy (Uy ) = ϕ(Uy × { y }) für alle y ∈ J Intervalle sind, weshalb V ∶= f (U ) horizontal einfach ist. Es gilt V = ⋃ f (Uy × { y }) y ∈J
= ⋃ ϕ(Uy × { y }) × { y } y ∈J
= ⋃ Vy × { y } y ∈J
sowie für alle (x, y ) ∈ U .
ϕ ϕ Jf (x, y ) = det ( x y ) = ϕx (x, y ) ≠ 0 0 1
4.3 Lokal und global umkehrbare Abbildungen y
131
v f
Uy0 × { y0 } v0 = y0
y0
J
J
U x0 Uy 0
Vy0 × { y0 }
V
x
u0 Vy 0
u
Abbildung 4.2: Eine horizontal einfache Abbildung
Nach dem Satz über inverse Abbildungen 4.2.11 ist f deshalb lokal umkehrbar, das heißt, f besitzt in einer Umgebung eines jeden Punktes von U eine Inverse, welche auch horizontal einfach, also von der Form x = ξ (u, v ), y=v ist. f ∶ U → V ist sogar global umkehrbar, denn f ist in U injektiv. Um dies zu zeigen, seien (x, y ) und (x′ , y ′ ) zwei verschiedene Punkte in U . Ist y ≠ y ′ , so folgt sofort, dass f (x, y ) ≠ f (x′ , y ′ ). Im Fall y = y ′ ist x ≠ x′ und aus der strengen Monotonie der Schnittfunktion ϕy (x) = ϕ(x, y ) (es gilt ϕx ≠ 0) folgt, dass ϕ(x, y ) ≠ ϕ(x′ , y ), also in jedem Fall f (x, y ) ≠ f (x′ , y ). Damit ist f injektiv. Die Existenz der Inversen f −1 ∶ V → U kann hier offensichtlich ohne Benutzung des Satzes über inverse Abbildungen gezeigt werden. Dieser liefert aber sofort, dass f −1 ∈ C 1 (V ), also die C 1 -Abhängigkeit von ξ auch von v. Wir berechnen noch die Ableitung von f −1 : ϕ
1 − y ξ ξ Df −1 = ( u v ) = ( ϕx ϕx ) 0 1 0 1
132
4 Differenzierbare Abbildungen
4.3.5 Beispiel. Seien U, V ⊂ R2 offene Mengen und sei f ∶ U → R2 , u = ϕ(x, y ), v = ψ (x, y ) eine Abbildung der Klasse C 1 mit ϕx ≠ 0 in U . Sei g ∶ U → W ∶= g (U ) der dazugehörige horizontal einfache Diffeomorphismus u = ϕ(x, y ), v=y für (x, y ) ∈ U . Wir nehmen an, dass W = I × J, I, J ⊂ R offene Intervalle, ein Rechteck ist – sonst wählen wir ein Rechteck W ⊂ g (U ) und betrachten statt U die offene Menge g −1 (W ) (vergleiche Abbildung 4.3). Die Inverse g −1 ∶ W → U v=y
y g
Uy0 × { y0 } v0 = y0
y0
J
J
U x0 Uy 0
I × { y0 }
x
W u0
Abbildung 4.3: Der horizontal einfache Faktor g
sei gegeben durch x = ξ (u, v ), y = v. U ist dann horizontal einfach und es gilt U = ⋃ Uy × { y } , y ∈J
Uy = ξ (I × { y }).
I
u
4.3 Lokal und global umkehrbare Abbildungen
133
Für (u, v ) ∈ W berechnen wir f ○ g −1 (u, v ) = (ϕ (g −1 (u, v )) , ψ (g −1 (u, v )))
= (u, ψ (ξ (u, v ), v )) =∶ (u, η (u, v )) =∶ h(u, v ), dabei ist h ∶ W → R2 eine vertikal einfache Abbildung (vergleiche Abbildung 4.4). V ∶= h(W ) ist vertikal einfach und es gilt v=y
v
{ u0 } × J
{ u0 } × Vu0
h v0
v 0 = y0 Vu0 V J
W u0
u
I
u0
I
u
Abbildung 4.4: Der vertikal einfache Faktor h
V = ⋃ { u } × Vu , u∈I
Vu = η ({ u } × J ) . Außerdem haben wir die Zerlegung f =h○g von f ∶ U → V als Hintereinanderausführung des horizontal einfachen Diffeomorphismus g ∶ U → W und der vertikal einfachen Abbildung h ∶ W → V (vergleiche Abbildung 4.5). Nach der Kettenregel 4.1.4 berechnen wir für die
134
4 Differenzierbare Abbildungen y
{ u0 } × Vu0
v g
−1
({ u0 } × J )
f =h○g v0
Uy0 × { y0 }
y0
f (Uy0 × { y0 })
V U x0
x
u0
u
Abbildung 4.5: Faktorisierung von f = h ○ g
Faktoren Dg und Dh der Ableitung Df : Df = Dh ○ Dg 1 0 ϕ ϕ =( ) ○ ( x y) ηu ηv 0 1 1 0 ϕ ϕ =( ) ○ ( x y) ψx ξu ψx ξv + ψy 0 1 1 = ( ψx ϕx
0 ϕx ϕy ). ϕ ψ )○( 0 1 ψy − ϕy x x
4.3.6 Faktorisierungslemma. Sei U ⊂ Rn eine offene Menge, f ∈ C 1 (U, Rn ) und sei a ∈ U mit ∂f1 ⋯ ⎛ ∂x 1 ⋮ Ann (a) = det ⎜ ⎜ ⎝ ∂f∂xn−1 1 ⋯
∂f1 ∂xn−1 ⎞
⋮
⎟ (a) ≠ 0. ⎟
∂fn−1 ⎠ ∂xn−1
Dann gibt es eine horizontal einfache offene Umgebung U (a) ⊂ U von a der Form U (a) = ⋃ Uxn × { xn } , xn ∈ J ′
Uxn = { x ∈ Rn−1 ∣ (x′ , xn ) ∈ U (a) } ,
4.3 Lokal und global umkehrbare Abbildungen
135
dabei ist J ⊂ R ein offenes Intervall und Uxn ⊂ Rn−1 für xn ∈ J eine offene Menge und eine vertikal einfache offene Umgebung V (b) ⊂ f (U ) von b = f (a) der Form V (b) = ⋃ { y ′ } × Vy′ , y ′ ∈I
Vy′ = { yn ∈ R ∣ (y ′ , yn ) ∈ V (b) } , dabei ist I ⊂ Rn−1 ein n−1-dimensionales und Vy′ ⊂ Rn für y ′ ∈ I ein eindimensionales Intervall, so dass die horizontal einfache Abbildung g ∶ U (a) → W ∶= I × J, y1 ∶= f1 (x), . . . , yn−1 ∶= fn−1 (x), yn ∶= xn für x ∈ U (a) ein Diffeomorphismus ist. Weiterhin gibt es eine vertikal einfache Abbildung h ∶ W → V (b) ∶= h(W ) der Form y1 = x1 , . . . , yn−1 = xn−1 , yn = ϕ(x), so dass sich f ∶ U (a) → V (b) in der Form f =h○g zerlegen lässt. Ist Jf (a) ≠ 0, so kann W so gewählt werden, dass h ein Diffeomorphismus zwischen W und V (b) und f = h ○ g ein Diffeomorphismus zwischen U (a) und V (b) ist. Beweis. (I) Sei g ∶ U → R2 definiert durch y1 ∶= f1 (x), . . . , yn−1 ∶= fn−1 (x), yn ∶= x1 . Dann berechnen wir ∂f ⎛ ∂x11 ⋯ ⎜ ⋮ Jg (a) = det ⎜ ⎜ ∂fn−1 ⋯ ⎜ ∂x1 ⎝ 0 ⋯
∂f1 ∂xn−1
⋮
∂fn−1 ∂xn−1
0
∂f1 ∂xn
⎞ ⋮ ⎟ ⎟ ∂fn−1 ⎟ (a) ∂xn ⎟ 1 ⎠
= Ann (a) ≠ 0. Nach dem Satz über inverse Abbildungen 4.2.11 gibt es offene Umgebungen U (a) ⊂ U von a und W ⊂ V von (b′ , an ) = g (a), so dass g ∶ U (a) → W ein Diffeomorphismus der Klasse C 1 ist. Wir wählen W als n-dimensionales Intervall der Form W = I × J, dabei ist I ⊂ Rn−1 ein n − 1-dimensionales und J ⊂ R ein eindimensionales Intervall. Die Umkehrabbildung g −1 ∶ W → U (a) ist von der Form x1 = ξ1 (y ), . . . , xn−1 = ξn−1 (y ), xn = yn . U (a) ist horizontal einfach und lässt sich in der behaupteten Form schreiben.
136
4 Differenzierbare Abbildungen
(II) Für alle y ∈ W berechnen wir f ○ g −1 (y ) = (f1 (g −1 (y )) , . . . , fn−1 (g −1 (y )) , fn (g −1 (y )))
= (y1 , . . . , yn−1 , fn ○ g −1 (y )) =∶ (y ′ , ϕ(y )) =∶ h(y ), dabei ist ϕ ∶= fn ○ g −1 ∶ W → R, h ∶= f ○ g −1 ∶ W → h(W ) =∶ V (b). V (b) ist vertikal einfach, es gilt die Zerlegung f = h ○ g und alle weiteren behaupteten Aussagen ergeben sich.
4.4 Der Satz über implizite Funktionen 4.4.1 Beispiel. Wir betrachten die Funktion f ∶ R2 → R, f (x, y ) ∶= x2 + y 2 , und für c = r2 , r > 0, die Niveaumenge (Höhenlinie) Γc ∶= { (x, y ) ∈ R2 ∣ f (x, y ) = x2 + y 2 = r2 } . Durch Auflösen der impliziten Gleichung x2 + y 2 = r2 nach y oder x haben wir √ √ y = ± r2 − x2 beziehungsweise x = ± r2 − y 2 . Genauer gilt Folgendes: Ist (a, b) ein Punkt auf der Kreislinie Γc , das heißt gilt a2 + b2 = r2 , so kann in einer Umgebung U = U (a, b) von (a, b) der Kreisbogen Γc ∩ U als Graph einer Funktion y = g (x) oder x = g (y ) geschrieben werden. Ist zum Beispiel b > 0, dann sei U = U (a, b) ∶= { (x, y ) ∈ R2 ∣ ∣x − a∣ < ra , ∣y − b∣ < rb } ein Rechteck mit sowie Dann gilt
ra ∶= r − ∣a∣ , rb ∶= b
√ g (x) ∶= + r2 − x2 für ∣x − a∣ < ra . Γc ∩ U = { (x, y ) ∈ U ∣ y = g (x), ∣x − a∣ < ra } .
Andererseits haben wir für a > 0 Γc ∩ U = { (x, y ) ∈ U ∣ x = g (y ), ∣y − b∣ < rb } ,
4.4 Der Satz über implizite Funktionen
137
wobei ra ∶= a, rb ∶= r − ∣b∣ und
√ g (y ) ∶= + r2 − y 2 für ∣y − b∣ < rb .
4.4.2 Problemstellung. Allgemeiner wenden wir uns jetzt dem Problem der lokalen Lösbarkeit eines nichtlinearen impliziten Gleichungssystems von m nichtlinearen Gleichungen mit n Unbekannten f1 (x1 , . . . , xm , xm+1 , . . . , xn ) = 0 ⋮ fm (x1 , . . . , xm , xm+1 , . . . , xn ) = 0 zu, dabei nehmen wir an, dass n > m ist. Es ist mit anderen Worten eine Abbildung f = (f1 , . . . , fm ) ∶ U → Rm mit f (a) = 0 für ein a = (a1 , . . . , an ) ∈ U ⊂ Rn gegeben. Die Auflösung der Gleichung f (x) = 0 bedeutet, unter einer geeigneten Bedingung zum Beispiel die ersten m Variablen x′ = (x1 , . . . , xm ) als abhängig von den restlichen n − m unabhängigen Variablen x′′ = (xm+1 , . . . , xn ) so zu schreiben, dass f (g (x′′ ), x′′ ) = 0 gilt. Genauer ist gesucht eine Zylinderumgebung U (a) = U (a′ ) × U (a′′ ) von a, U (a′ ) ⊂ Rm , U (a′′ ) ⊂ Rn−m , a = (a1 , . . . , am , am+1 , . . . , an ) = (a′ , a′′ ), sowie eine auflösende Abbildung g ∶ U (a′′ ) → U (a′ ), x′ = g (x′′ ), so dass
{ x ∈ U (a) ∣ f (x) = 0 } = { x ∈ U (a) ∣ x′ = g (x′′ ), x′′ ∈ U (a′′ ) } .
138
4 Differenzierbare Abbildungen
Wir betrachten zunächst den linearen Fall: 4.4.3 Bemerkung. Sei
⎛ a11 ⋯ a1m a1m+1 ⋯ a1n ⎞ ⋮ ⋮ ⋮ ⎟ A = (A , A ) = ⎜ ⋮ ⎝am1 ⋯ amm amm+1 ⋯ amn ⎠ ′
′′
eine m × n-Matrix vom Rang m, sei
⎛ a11 ⋯ a1m ⎞ ⋮ ⎟ ≠ 0. det A′ = det ⎜ ⋮ ⎝am1 ⋯ amm ⎠ Wir betrachten das lineare homogene Gleichungssystem A ○ x = (A′ , A′′ ) ○ (
x′ ) x′′
⎛ a11 ⋯ a1m a1m+1 ⋮ ⋮ =⎜ ⋮ ⎝am1 ⋯ amm amm+1
⎛ x1 ⎞ ⋮ ⎟ ⋯ a1n ⎞ ⎜ ⎜ x ⎟ ⎛0⎞ ⎜ m ⎟ ⋮ ⎟⎜ ⎟ = ⎜⋮⎟, ⎜xm+1 ⎟ ⎝ ⎠ ⎟ ⋯ amn ⎠ ⎜ 0 ⎜ ⋮ ⎟ ⎝ xn ⎠
wobei wir Vektoren als Spaltenvektoren schreiben. Bestimmen wir die Lösungsmenge mit Hilfe des Gauß-Verfahrens, so ist O a ˜1m+1 ⋯ a ˜1n ⎞ ⎛1 ⋮ ⋮ ⎟ = (I, A˜) ⎜ ⋱ ⎝O 1 a ˜mm+1 ⋯ a ˜mn ⎠ wegen der Rangbedingung die Zeilenstufenform von A. Das System A ○ x = 0 kann deshalb nach den ersten m Variablen x′ = (x1 , . . . , xm ) aufgelöst werden und die übrigen Variablen x′′ = (xm+1 , . . . , xn ) parametrisieren die Lösungsmenge. Genauer gilt { x ∈ Rn ∣ A ○ x = 0 } = { x ∈ Rn ∣ x′ = −A˜ ○ x′′ , x′′ ∈ Rn−m } . Ist f ∶ Rn → Rm , f (x) ∶= A ○ x, die zugehörige lineare Abbildung, so haben wir
{ x ∈ Rn ∣ f (x) = 0 } = { x ∈ Rn ∣ x′ = g (x′′ ), x′′ ∈ Rn−m } , dabei ist g = (g1 , . . . , gm ) ∶ Rn−m → Rm , g1 (x′′ ) ∶= −a ˜1m+1 xm+1 − . . . − a ˜1n xn ⋮ ′′ gm (x ) ∶= −a ˜mm+1 xm+1 − . . . − a ˜mn xn .
4.4 Der Satz über implizite Funktionen
139
Die Rolle des Punktes a beim nichtlinearen Problem übernimmt hier der Nullvektor: Es gilt A ○ 0 = 0. Außerdem ist U = Rn . Wir berechnen noch die Funktionalmatrix von f : ∂f ⎛ ∂x11 ⋯ Df (x) = ⎜ ⎜ ⋮ m ⎝ ∂f ∂x1 ⋯
∂f1 ∂fn
⎞ ⎛ a11 ⋯ a1n ⎞ ⋮ ⎟ ⋮ ⎟. ⎟ (x) = ⎜ ⋮ ∂fm ⎝am1 ⋯ amn ⎠ ⎠ ∂fn
Die Rangbedingung det A′ ≠ 0 bedeutet gerade, dass ∂fj n det ( ) ≠ 0. ∂xi j,i=1 Im nichtlinearen Fall erwarten wir, dass dies hinreichend dafür ist, dass die Gleichung f (x) = 0 lokal, das heißt in einer Umgebung eines Punktes a mit f (a) = 0, nach den ersten Variablen x′ = (x1 , . . . , xm ) aufgelöst werden kann. 4.4.4 Satz über implizite Funktionen. Es sei U ⊂ Rn eine offene Menge und die Abbildung f ∶ U → Rm , m ∈ N, m < n, gehöre zur Klasse C p (U, Rm ), p ∈ N. Ferner sei a ∈ U mit f (a) = 0 und det (
m ∂fj (a)) ≠ 0. ∂xi j,i=1
Dann gibt es eine offene Rechtecksumgebung U (a) = U (a′ ) × U (a′′ ) ⊂ Rn von a, U (a′ ) ⊂ Rm , U (a′′ ) ⊂ Rn−m , a = (a1 , . . . , am , am+1 , . . . , an ) = (a′ , a′′ ), und eine (auflösende) Abbildung g ∶ U (a′′ ) → U (a′ ), x′ = g (x′′ ), der Klasse C p , so dass die Gleichung f (x) = 0 in U (a) nach x′ aufgelöst wird, das heißt, ist x′′ ∈ U (a′′ ), so genügt x = (g (x′′ ), x′′ ) der Gleichung f (x) = 0, weshalb f (g (x′′ ), x′′ ) = 0 für x′′ ∈ U (a′′ ). Gilt umgekehrt f (x) = 0 für x ∈ U (a), so ist dort x′ = g (x′′ ). Mit anderen Worten:
{ x ∈ U (a) ∣ f (x) = 0 } = { x ∈ U (a) ∣ x′ = g (x′′ ) } .
140
4 Differenzierbare Abbildungen
Beweis. Wir betrachten die Abbildung F ∶ U → Rn , F1 (x) ∶= f1 (x), . . . , Fm (x) ∶= fm (x), Fm+1 (x) ∶= xm+1 , . . . , Fn (x, y ) ∶= xn . Dann ist F ∈ C p (U, Rn ) und es gilt ∂f1 ⎛ ∂x1 ⋯ ⎜ ⋮ ⎜ ∂f ⎜ m ⋯ JF (a) = det ⎜ ⎜ ∂x1 ⎜ ⎜ ⎜ O ⎝
∂f1 ∂xm
⋮
∂fm ∂xm
⎞ ⎟ ⎟ m ⎟ ⎟ (a) = det ( ∂fj (a)) ≠ 0. ⎟ ∂xi 1 O⎟ j,i=1 ⎟ ⋱ ⎟ O 1⎠ ∗
Nach dem Satz über inverse Abbildungen 4.2.11 gibt es offene Umgebungen U (a) ⊂ U von a und V (b) ⊂ Rn von b ∶= F (a) = (0, a′′ ), so dass F ∣U (a) ∶ U (a) → V (b) ein Diffeomorphismus der Klasse C p ist. Die Umkehrabbildung sei durch F −1 ∶ V (b) → U (a) gegeben. Dann gilt −1 −1 Fm +1 (y ) = ym+1 , . . . , Fn (y ) = yn für y ∈ V (b).
Wir wählen U (a) als Rechteck beziehungsweise Zylinder U (a) = U (a′ ) × U (a′′ ), U (a′ ) ⊂ Rm , U (a′′ ) ⊂ Rn−m Kugelumgebungen von a′ beziehungsweise a′′ . Für x ∈ U (a) gilt dann f (x) = 0 ⇔ F (x) = (0, x′′ )
⇔ x = F −1 (0, x′′ ) −1 ⇔ x′ = (F1−1 (0, x′′ ), . . . , Fm (0, x′′ )).
Setzen wir nun g = (g1 , . . . , gm ) ∶ U (a′′ ) → U (a′ ), −1 x′ = g (x′′ ) = (g1 (x′′ ), . . . , gm (x′ ) ∶= (F1−1 (0, x′′ ), . . . , Fm (0, x′′ )),
so haben wir für alle x ∈ U , dass f (x) = 0 genau dann, wenn x′ = g (x′′ ), mit anderen Worten
{ x ∈ U ∣ f (x) = 0 } = { x ∈ U ∣ x′ = g (x′′ ) } wie behauptet.
4.4 Der Satz über implizite Funktionen
141
4.4.5 Bemerkungen. (i) Die Variablen, nach denen aufgelöst wurde, sind natürlich nur der Bequemlichkeit halber jeweils zuerst aufgelistet worden. Allgemeiner kann man unter der Annahme m
∂fj det ( (a)) ≠ 0. ∂xik j,k=1 für eine Permutation (i1 , . . . , in ) von (1, . . . , n) nach den Variablen x′ = (xi1 c . . . , xim ) auflösen. (ii)
Wegen
{ x ∈ U ∣ f (x) = 0 } = { x ∈ U ∣ F (x) = (0, x′′ ) }
nennen wir F auch eine geradebiegende Abbildung. 4.4.6 Implizite Differentiation. Sei f ∈ C p (U, Rm ) wie im Satz über implizite Funktionen und sei g ∈ C p (U (a′ ), U (a′′ )) die auflösende Abbildung. Dann gilt m
∂fj ∂fj ∂gi ′′ (a) (a ) + (a) = 0 ∂xk ∂xk i=1 ∂xi
∑
für j = 1, . . . , m, k = m + 1, . . . , n, das heißt
(
∂gj ′′ (a )) ∂xk
j =1,...,m k=m+1,...,n
= −(
−1 ∂fj ∂fj (a)) ○( (a)) ∂xi ∂x k j,i=1,...,n
j =1,...,m k=m+1,...,n
.
Beweis. Dies folgt sofort durch Differenzieren der Gleichungen fj (g (x′′ ), x′′ ) = 0 für alle x′′ ∈ U (a′′ ) nach xk für j = 1, . . . , m, k = m + 1, . . . , n nach der Kettenregel 3.1.7 beziehungsweise 3.3.10. Wir betrachten noch einmal Niveaumengen Γc = { x ∈ U ∣ f (x) = c } von Funktionen f ∶ U → R (vergleiche Lemma 3.4.9 und Bemerkung 3.4.10): 4.4.7 Satz. Sei U ⊂ R2 eine offene Menge, f ∶ U → R stetig differenzierbar in U , (a, b) ∈ U mit ∇f (a, b) ≠ 0 und sei c ∶= f (a, b). Dann gibt es eine offene Umgebung U (a, b) ⊂ U von (a, b), ein ε > 0 und eine C 1 -Kurve γ ∶ (−ε, ε) → U (a, b) mit γ (0) = (a, b), so dass
{ (x, y ) ∈ U (a, b) ∣ f (x, y ) = c } = { (x, y ) ∈ U (a, b) ∣ (x, y ) = γ (t), ∣t∣ < ε } .
142
4 Differenzierbare Abbildungen
Beweis. Ohne Beschränkung der Allgemeinheit sei ∂f ∂x (a, b) ≠ 0. Sei g ∶ U (b) → U (a), U (b) = (b − ε, b + ε), die auflösende Funktion aus dem Satz über implizite Funktionen, welchen wir auf f − c anwenden. Sei γ (t) ∶= (g (t + b), t + b) für ∣t∣ < ε. Dann gilt
{ (x, y ) ∈ U (a, b) ∣ f (x, y ) = c } = { (x, y ) ∈ U (a, b) ∣ x = g (y ) } = { (x, y ) ∈ U (a, b) ∣ (x, y ) = γ (t), ∣t∣ < ε } wie behauptet.
4.5 Extrema mit Nebenbedingungen 4.5.1 Beispiele. (i) Wir wollen die Funktion f ∶ R2 → R, f (x, y ) ∶= x2 + 2 y auf der Kurve Γ = { (x, y ) ∈ R2 ∣ g (x, y ) = x2 − y + 1 = 0 } minimieren. Zeichnet man die Niveaumengen Γc = { (x, y ) ∈ R2 ∣ f (x, y ) = c } für c > 0 y g (x, y ) = 0
f (x, y ) = 9 f (x, y ) = 4 f (x, y ) = 1
x
Abbildung 4.6: Extrema unter Nebenbedingungen I
und die Parabel Γ, so erkennt man, dass f (0, 1) = 1 minimal ist (vergleiche Abbildung 4.6). Im Punkt (0,1) berühren sich die Kurven Γ1 = { (x, y ) ∈ R2 ∣ x2 + y 2 = 1 } und Γ = { (x, y ) ∈ R2 ∣ y = x2 + 1 }. Ihre Tangenten sind im Berührungspunkt parallel, das heißt, die Gradienten ∇f (0, 1)
4.5 Extrema mit Nebenbedingungen
143
und ∇g (0, 1) sind parallel. Deshalb existiert ein λ ∈ R mit ∇f (0, 1) = λ∇g (0, 1). (ii)
Minimieren wir die Funktion f ∶ R2 → R, f (x, y ) ∶= x2 + y 2 auf der Kurve Γ = { (x, y ) ∈ R2 ∣ g (x, y ) = xy − 1 = 0 }, so erkennen wir, dass f (1, 1) = f (−1, −1) = 2 minimal ist (vergleiche Abbildung 4.7). y g (x, y ) = 0
f (x, y ) = 1 f (x, y ) = 2
x
f (x, y ) = 4 f (x, y ) = 9
Abbildung 4.7: Extrema unter Nebenbedingungen II
4.5.2 Lagrangesche Multiplikatorenregel. Sei U ⊂ Rn eine offene Menge, f ∈ C 1 (U, R), g ∈ C 1 (U, Rm ), m < n. Sei a ∈ U ein Punkt mit g (a) = 0 und derart, dass der Rang der Matrix
(
∂gj (a)) j =1,...,m ∂xi i=1,...,n
maximal, das heißt gleich m ist. Die Funktion f besitze im Punkt a ein lokales Extremum unter der Nebenbedingung g (x) = 0, das heißt, es gibt eine Umgebung U (a), so dass f (x) ≥ f (a) beziehungsweise f (x) ≤ f (a) für alle x ∈ U (a) mit g (x) = 0. Dann gibt es Konstanten λ1 , . . . , λm ∈ R (Lagrange-Multiplikatoren) mit
∇f (a) = λ1 ∇g1 (a) + . . . + λm ∇gm (a).
144
4 Differenzierbare Abbildungen
Beweis. (I) Ohne Beschränkung der Allgemeinheit sei m ∂gj det ( (a)) ≠ 0. ∂xi j,i=1
Dann besitzt das Gleichungssystem m
∑ λk
k=1
∂gk ∂f (a) = (a) ∂xj ∂xj
(4.5)
für j = 1, . . . , m genau eine Lösung (λ1 , . . . , λm ). (II) Nach dem Satz über implizite Funktionen 4.4.4 kann die Gleichung g (x) = 0 lokal nach x′ = (x1 , . . . , xm ) aufgelöst werden, das heißt, es gibt eine offene Umgebung U (a) = U (a′ ) × U (a′′ ), U (a′ ) ⊂ Rm , U (a′′ ) ⊂ Rn−m , und eine C 1 Abbildung h ∶ U (a′′ ) → U (a′ ), so dass
{ x ∈ U (a) ∣ g (x) = 0 } = { x ∈ U (a) ∣ x′ = h(x′′ ) } .
Für alle x′′ ∈ U (a′′ ) haben wir die Relation g (h(x′′ ), x′′ ) = 0. Durch Differenzieren nach xi erhalten wir m
∂hj ′′ ∂gk ∂gk (a) (a ) + (a) ∂xi ∂xi j =1 ∂xj
0=∑
(4.6)
für k = 1, . . . , m, i = m + 1, . . . , n. (III) Wir betrachten die Funktion f˜(x′′ ) ∶= f (h(x′′ ), x′′ ) für x′′ ∈ U (a′′ ). Dann ist f˜ ∈ C 1 (U (a′′ )) und es gilt f˜(x′′ ) ≥ f˜(a′′ ) für alle x′′ ∈ U (a′′ ). Aus ∂ f˜ dem Satz von Fermat 3.6.3 folgt, dass ∇f˜(a′′ ) = 0, das heißt ∂x (a′′ ) = 0 für i i = m + 1, . . . , n. Nach der Kettenregel 3.1.7 beziehungsweise 3.3.10 ist für i = m + 1, . . . , n m ∂hj ′′ ∂ f˜ ′′ ∂f ∂f 0= (a ) = ∑ (a) (a ) + (a). ∂xi ∂x ∂x ∂x j i i j =1
4.5 Extrema mit Nebenbedingungen
145
Unter Benutzung von (4.5) und (4.6) folgt deshalb,dass m ∂hj ′′ ∂f ∂f (a) = − ∑ (a) (a ) ∂xi ∂xi j =1 ∂xj m m
= − ∑ ∑ λk j =1 k =1 m
= ∑ λk k =1
∂hj ′′ ∂gk (a) (a ) ∂xj ∂xi
∂gk (a) ∂xi
für i = m + 1, . . . , n. Zusammen mit (4.5) bedeutet dies, dass m
∇f (a) = ∑ λk ∇gk (a) k =1
wie behauptet. 4.5.3 Beispiel (vergleiche Satz 3.6.11). Wir zeigen noch einmal, dass jede reelle symmetrische Matrix A = (ajk )nj,k=1 einen reellen Eigenwert λ besitzt. Dazu betrachten wir die Funktionen f (x) ∶= xAx⊺ , g (x) ∶= ∣x∣ − 1 2
für x ∈ Rn . Nach dem Satz von Weierstraß 2.5.5 nimmt f ein Minimum in 2 einem Punkt a ∈ S n−1 = { x ∈ Rn ∣ ∣x∣ = 1 } = { x ∈ Rn ∣ g (x) = 0 } an. Nach der Lagrangeschen Multiplikationsregel gibt es ein λ ∈ R mit
∇f (a) = λ∇g (a). Wir berechnen n ∂f ∂ n = ∑ ajk xj xk = 2 ∑ aik xk , ∂xi ∂xi j,k=1 j =1
∂g = 2xi , ∂xi weshalb
n
∑ aik ak = λai
k =1
für i = 1, . . . , n, das heißt, es gilt A ○ a = λa. Dabei schreiben wir Vektoren im Rn als Spaltenvektoren.
146
4 Differenzierbare Abbildungen
4.5.4 Beispiel. Wir wollen die Ungleichung ¿ n Á 1 n n Á À ∏ ai ≤ ∑ ai n i=1 i=1
(4.7)
zwischen dem geometrischen und arithmetischen Mittel von n positiven reellen Zahlen a1 , . . . , an > 0 zeigen. Zunächst bemerken wir, dass dies nur für 1 n ∑ ai = 1 n i=1 gezeigt werden muss, denn für beliebige Zahlen b1 , . . . , bn > 0 setzt man ai ∶=
Dann hat man folgt, dass
1 n
bi 1 n
für i = 1, . . . , n.
n
∑ bj
j =1
n
n
∑i=1 ai = 1 und wenn die Ungleichung ∏ ai ≤ 1 gezeigt ist, dann i=1
√ n
1 n
n
¿ Án = Á ∏ Á n Á À i=1 b ∑ j ∏ bi
i=1 n
j =1
bi 1 n
n
∑ bj
¿ n Á n À = Á ∏ ai ≤ 1. i=1
j =1
Deshalb betrachten wir die Funktionen n
f (x) ∶= ∏ xi , g (x) ∶= i=1
1 n ∑ xi . n i=1
Unter der Nebenbedingung g (x) = 1 nimmt f auf dem Kompaktum K ∶= { x ∈ Rn ∣ x1 , . . . , xn ≥ 0, g (x) = 1 } sein Maximum in einem Punkt a = (a1 , . . . , an ) mit a1 , . . . , an > 0 an. Deshalb folgt aus der Lagrangeschen Multiplikatorenregel, dass ∇f (a) = λ∇g (a) ist, also f (a) λ ∂f ∂f (a) = ∏ ai = = =λ (a) ∂xk ak n ∂xk i≠k für k = 1, . . . , n beziehungsweise ak =
λ = const. nf (a)
4.5 Extrema mit Nebenbedingungen
147
Aus der Nebenbedingung folgt, dass a1 = ⋯ = an = 1 und deshalb n
∏ xi = f (x) ≤ f (a) = 1 i=1
für alle x1 , . . . , xn > 0 mit g (x) = 1, das heißt ¿ n Á 1 n n Á À ∏ xi ≤ 1 für alle x1 , . . . , xn mit ∑ xi = 1 n i=1 i=1 wie behauptet. 4.5.5 Beispiel. Die allgemeine Youngsche Ungleichung
(ab)r ap bq ≤ + r p q gilt für alle a, b > 0 und p, q > r > 0 mit p1 + 1q = 1r . Zum Beweis vereinfachen wir die Behauptung, indem wie die rlinke Seite zu Eins normieren: Division der behaupteten Ungleichung durch (abr) liefert 1≤
ap−r b−r 2
= mit s = pr , t =
q r
(a
bq−r a−r q r 2
r− rp
=
+
p r
− rp
b p r t
)
p r
2
r− rq
+
(b
2
− rq
a
)
q r
q r
xs y + s t
(4.8)
sowie x = ar(1− s ) b− s , 1
r
y = br(1− t ) a− t . 1
Es gilt
1 s
+
1 t
r
= 1 und xy = 1.
Die Ungleichung (4.8) beweisen wir nun durch Minimierung der Funktion f (x, y ) ∶= unter der Nebenbedingung
xs y t + für x, y > 0 s t
g (x, y ) ∶= xy = 1.
148
4 Differenzierbare Abbildungen
Weil f (x, y ) → +∞ für x → 0 oder y → 0 und xy = 1, gibt es λ ∈ R, a, b > 0 mit ab = 1, so dass ∇f (a, b) = λ∇g (a, b), das heißt
as−1 = λb, bt−1 = λa.
Hieraus folgt aber, dass λ = as (ab)−1 = as und λ = bt , also as = bt = a−t , weshalb a = 1 ist. Daher ist auch λ = 1 und das Minimum von f (x, y ) unter der Nebenbedingung g (x, y ) = 1 ist gleich as bt λab λab + = + = 1. s t s t 4.5.6 Beispiele. (i) Zu bestimmen sind die Extremwerte von f (x, y ) ∶= x2 + 3 4y auf der Ellipse g (x, y ) ∶= x2 + 2y 2 − 1 = 0: Zu lösen ist dann
∇f (x, y ) = λ∇g (x, y ), g (x, y ) = 0, das heißt, zu lösen ist das System 2x = 2λx 12y 2 = 4λy x2 + 2y 2 = 1. Angefangen mit der Fallunterscheidung x = 0 oder x ≠ 0, in welchem Fall √ λ = 1 gilt, rechnet man leicht aus, dass das Maximum 2 im Punkt (0, √12 ) √ und das Minimum − 2 im Punkt (0, − √12 ) angenommen wird. (ii)
Zu bestimmen sind die Extremwerte von f (x, y ) ∶= 3x2 + 2y 2 − 4y + 1 auf der Kreisscheibe x2 + y 2 ≤ 16: Wegen fx (x, y ) = 6x = 0 fy (x, y ) = 4y − 4 = 0 gibt es im Inneren der Kreisscheibe höchstens im Punkt (0, 1) einen Extremwert f (0, 1) = −1. Auf der Kreislinie x2 + y 2 = 16 bestimmen wir die Lösungen von
∇f (x, y ) = λ∇g (x, y ),
4.5 Extrema mit Nebenbedingungen
149
das heißt von 6x = 2λx 4y − 4 = 2λy x2 + y 2 = 16. Angefangen mit der Fallunterscheidung ≠ 0 ergeben sich als √ x = 0 oder x √ Lösungen die Punkte (0, 4), (0, −4), ( 12, −2) und (− 12, −2). Man √ √ rechnet aus, dass das Maximum 53 in den Punkten ( 12, −2) und (− 12, −2) und das Minimum −1 im Punkt (0, 1) angenommen wird. (iii)
Zu bestimmen ist das Maximum von f (x, y, z ) ∶= xyz auf der Ebene g (x, y, z ) ∶= 2x + 2y + z − 108 = 0 für x ≥ 0, y ≥ 0, z ≥ 0: Zu lösen sind dann die Gleichungen yz = 2λ xz = 2λ xy = λ 2x + 2y + z = 108. Da x, y, z > 0 in einem Punkt gilt, wo f (x, y, z ) ein Maximum hat, folgt y = x, z = 2x, und weiter, dass das Maximum 11664 im Punkt (18, 18, 36) angenommen wird.
(iv)
Gesucht ist der √ Abstand des Ursprungs (0, 0, 0) von der Fläche g (x, y, z ) ∶= xy + 2xz − 5 5 = 0: Dazu minimieren wir die Funktion f (x, y, z ) ∶= x2 + y 2 + z 2 unter der Nebenbedingung g (x, y, z ) = 0. Zu lösen sind die Gleichungen 2x = λ(y + 2z ) 2y = λx 2z = 2λx √ xy + 2xz = 5 5. Weil λ ≠ 0 gilt, folgt z =√2y. Hieraus folgt y ≠√0, und man rechnet leicht √ nach, dass der Abstand 10 in den Punkten ( 5, 1, 2) und (− 5, −1, −2) angenommen wird.
(v)
Zu minimieren ist die Funktion f (x, y, z ) ∶= z − x2 − y 2 auf dem Kreis g1 (x, y, z ) ∶= x2 + y 2 − 4 = 0, g2 (x, y, z ) ∶= z − x − y = 0.
150
4 Differenzierbare Abbildungen Dazu sind diese Gleichungen, zusammen mit den Gleichungen
−2x = 2λ1 x − λ2 −2y = 2λ1 y − λ2 1 = λ2 zu lösen. Es folgt also
2(λ1 + 1)x = 1 = 2(λ1 + 1)y, x = y.
√ √ √ Also √ ergeben sich als Lösungen √ die√Punkte √ ±( 2, 2, 2 2). Das Minimum −2 2 − 4 wird im Punkt (− 2, − 2, −2 2) angenommen.
5
Das Riemannsche Integral
5.1 Definition des Integrals In diesem Kapitel soll das mehrdimensionale Riemannsche Integral vorgestellt werden. Für die Darstellung sind die Bezeichnungen so gewählt, dass die Integrationstheorie für Funktionen von nur einer reellen Variablen zum Teil übernommen werden kann. So nennen wir zum Beispiel, wie schon in Definition 1.2.2 (ii), einen mehrdimensionalen Quader (oder Rechteck) ein n-dimensionales Intervall oder auch einfach nur ein Intervall (vergleiche Definition 5.1.2) und nicht ein Rechtflach, wie dies manchmal üblich ist. Bei der Definition einer Zerlegung oder Partition eines Intervalls (vergleiche Definition 5.1.3) verwenden wir jedoch die schon bei der Bezeichnung von Polynomen und Multireihen in 2.1.3 und von höheren Ableitungen in der Taylorschen Formel 3.5.6 benutzte Multiindexschreibweise. y
y
a
b
x
a
b
x
Abbildung 5.1: Integral als Flächeninhalt Abbildung 5.2: Flächeninhalt des Halbkreises
5.1.1 Vorbemerkung. Ähnlich wie in der Analysis I wollen wir die Integrationstheorie unter dem Aspekt der Berechnung von Flächeninhalt und Volumen sehen. Dazu erinnern wir uns an die folgende Situation: Ist [a, b] ⊂ R, a < b, ein kompaktes Intervall und f ∶ [a, b] → [0, +∞) eine stetige, nicht-negative Funkb tion, dann ist das Riemannsche Integral ∫a f (x) dx anschaulich der Inhalt der Fläche zwischen der x-Achse und dem Graphen von f .
152
5 Das Riemannsche Integral
Um diesen Flächeninhalt zu berechnen, wird das Intervall [a, b] in p Teilintervalle aufgeteilt: a = x0 < x1 < ⋯ < xp = b. Jedem Intervall [xk−1 , xk ] für k = 1, . . . , p wird eine Zwischenstelle ξk ∈ [xk−1 , xk ] entnommen, der dazugehörige Zwischenwert f (ξk ) bestimmt und dann die Riemannsche Näherungssumme p
∑ f (ξk )(xk − xk−1 )
k =1
gebildet, das heißt, es wird der elementargeometrische Flächeninhalt einer Rechtecksvereinigung berechnet. Bei unbegrenzter Verfeinerung der Einteilung von [a, b] konvergieren die Näherungssummen gegen den gesuchten Flächeninhalt. Bei einem Rechteck [a, b] × [c, d] ⊂ R2 , a < b, c < d, wird das Intervall [a, b] in p Teilintervalle a = x0 < x1 < ⋯ < xp = b und das Intervall [c, d] in q Teilintervalle c = y0 < y1 < ⋯ < yq = d aufgeteilt. Ist f ∶ [a, b] × [c, d] → [0, +∞) eine stetige, nicht-negative Funktion, so erwarten wir analog, dass der Inhalt des Volumens zwischen dem Graphen von f und dem Rechteck [a, b] × [c, d] angenähert wird durch die Summe p
q
∑ ∑ f (ξk , η` )(xk − xk−1 )(y` − y`−1 )
k=1 `=1
mit Zwischenstellen (ξk , η` ) ∈ [xk−1 , xk ] × [y`−1 , y` ] und den dazugehörigen Zwischenwerten f (ξk , η` ). Unter diesem Inhaltsaspekt wollen wir Integrale für Funktionen im Rn definieren. 5.1.2 Definition. In diesem Kapitel ist ein Intervall I = I (1) ×⋯×I (n) immer ein kompaktes, nicht-ausgeartetes n-dimensionales Intervall (im Fall n = 2 ein Rechteck, für n = 3 ein Quader), das heißt, es gilt I (i) = [ai , bi ] = { t ∈ R ∣ ai ≤ t ≤ bi } mit ai < bi , i = 1, . . . , n, beziehungsweise I = { x = (x1 , . . . , xn ) ∈ Rn ∣ ai ≤ xi ≤ bi } .
5.1 Definition des Integrals
153
z f (ξ1 , η1 )
f (ξ1 , η4 ) f (ξ3 , η4 )
y0 = c x0 = a x1
y1
y2
(ξ1 , η1 )
y3
y4 = d y
(ξ1 , η4 )
x2 x3 = b
(ξ3 , η4 )
x
Abbildung 5.3: Bildung einer Riemannschen Näherungssumme
Der elementargeometrische Inhalt von I ist definiert durch n
n
i=1
i=1
∣I ∣ ∶= ∏(bi − ai ) = ∏ ∣I (i) ∣ . Der Durchmesser von I ist die Länge der räumlichen Diagonalen ¿ Án À∑(bi − ai )2 . δ (I ) ∶= Á i=1
5.1.3 Definition. Sei I = I (1) × ⋯ × I (n) ein Intervall, I (i) = [ai , bi ] mit ai < bi für i = 1, . . . , n. Seien die Intervalle I (i) aufgeteilt in pi Teilintervalle (αi −1)
Iα(ii) ∶= [xi
( αi )
, xi
],
154
5 Das Riemannsche Integral
1 ≤ αi ≤ pi , so dass (0)
ai = xi
(1)
< xi
(pi −1)
< ⋯ < xi
(pi )
< xi
= bi
für i = 1, . . . , n. Dann definieren wir eine Partition oder Zerlegung π von I durch die Menge der n-dimensionalen Teilintervalle { Iα ∣ α ∈ Nnp }, (αi −1)
Iα ∶= Iα(11) × ⋯ × Iα(nn) = { x = (x1 , . . . , xn ) ∈ I ∣ xi ∈ [xi
(αi )
, xi
], i = 1, . . . , n }
für α = (α1 , . . . , αn ) ∈ Nnp = Np1 × ⋯ × Npn , das heißt 1 ≤ αi ≤ pi für i = 1, . . . , n, hierbei bezeichnet Nnp den p-ten Abschnitt von Nn . x2
(3)
x2 = b2 (2)
x2
I(2,2)
I(4,2)
(1)
x2
I(3,1) (0)
x2 = a2 x1 (0)
(1)
x1 = a1 x1
(2)
x1
(3)
x1
(4)
x1
(5)
x1 = b1
Abbildung 5.4: Partition eines Rechtecks
5.1.4 Bemerkungen. (i) Es ist äquivalent, die Menge der Zerlegungspunkte ( α1 ) (α ) (Gitterpunkte) xα = (x1 , . . . , xn n ) für α = (α1 , . . . , αn ), 0 ≤ αi ≤ pi , i = 1, . . . , n, als Partition π zu bezeichnen. (ii)
Die Anzahl der Teilintervalle ist gleich der Anzahl der Gitterpunkte xα für 1 ≤ αi ≤ pi , i = 1, . . . , n, beziehungsweise Elemente der Menge Nnp = Np1 × ⋯ × Npn , also gleich p1 ⋅ . . . ⋅ pn .
5.1 Definition des Integrals (iii)
155
Der Inhalt eines Teilintervalls Iα ist n
( αi )
∣Iα ∣ = ∏(xi i=1
(αi −1)
− xi
).
5.1.5 Definition. Ist π = { Iα ∣ α ∈ Nnp } eine Partition von I, dann heißt ¿ Á n ( αi ) (α −1) À∑(x δ (π ) ∶= max δ (Iα ) = max Á − x i )2 α∈Nn p
α∈Nn p
i
i=1
i
der Durchmesser oder die Feinheit der Partition π. 5.1.6 Lemma. Es sei π = { Iα ∣ α ∈ Nnp } eine Partition von I ⊂ Rn . Dann sind die Teilintervalle nicht-überlappend, das heißt, je zwei Teilintervalle Iα und Iβ haben für α ≠ β höchstens Randpunkte gemeinsam, das heißt, es ist ˚ Iα ∩ ˚ Iβ = ∅ für α ≠ β. Weiterhin gilt I = ⋃ Iα , ∣I ∣ = ∑ ∣Iα ∣ . α∈Nn p
α∈Nn p
Beweis. Wegen α = (α1 , . . . , αn ) ≠ β = (β1 , . . . , βn ) gibt es ein k ∈ { 1, . . . , n }, so dass αk ≠ βk . Dann ist (k ) Iα(kk) ≠ Iβk (k )
(k)
und nach Konstruktion können die Intervalle Iαk , Iβk höchstens Randpunkte gemeinsam haben. Es sei nun x = (x1 , . . . , xn ) ∈ ˚ Iα ein innerer Punkt von Iα . (k ) (k) ˚ ˚ Dann gilt xk ∈ Iα , also xk ∈/ I , weshalb x ∈/ ˚ Iβ . Nach Definition 5.1.2 ist deshalb
βk
k
n
n
i=1
i=1
n
pi
∣I ∣ = ∏(bi − ai ) = ∏ ∣I (i) ∣ = ∏ ∑ ∣Iα(ii) ∣ =
∑
α=(α1 ,...,αn )∈Nn p
i=1 αi =1
∣Iα(11) ∣ ⋅ . . . ⋅ ∣Iα(nn) ∣
= ∑ ∣Iα ∣ . α∈Nn p
5.1.7 Definition. Es sei π = { Iα ∣ α ∈ Nnp } eine Partition des Intervalls I, und f ∶ I → R sei eine beschränkte Funktion, das heißt, es gibt ein M ≥ 0, so dass ∣f (x)∣ ≤ M für alle x ∈ I. Wir setzen Mα ∶= sup f (x), mα ∶= inf f (x) x∈ I α
x∈ I α
für α ∈ Nnp und definieren wir die Riemannsche oder Riemann-Darbouxsche Ober- und Untersumme von f bezüglich π (vergleiche Abbildung 5.5) durch S (π, f ) ∶= ∑ Mα ∣Iα ∣ , s(π, f ) ∶= ∑ mα ∣Iα ∣ . α∈Nn p
α∈Nn p
156
5 Das Riemannsche Integral y
S (π, f ) Mk mk s(π, f )
a
xk − 1
xk
b
x
Abbildung 5.5: Ober- und Untersummen
5.1.8 Bemerkungen. (i)
Für alle α ∈ Nnp gilt mα ≤ Mα , weshalb s(π, f ) ≤ S (π, f ).
(ii)
Sei m ≤ f (x) ≤ M für alle x ∈ I, zum Beispiel sei M ∶= sup f (x), m ∶= inf f (x). I
I
Dann ist m ≤ mα ≤ Mα ≤ M für alle α ∈
Nnp
und daher
S (π, f ) = ∑ Mα ∣Iα ∣ ≤ M ∑ ∣Iα ∣ = M ∣I ∣ , α
α
s(π, f ) = ∑ mα ∣Iα ∣ ≥ m ∑ ∣Iα ∣ = m ∣I ∣ , α
weshalb (iii)
α
m ∣I ∣ ≤ s(π, f ) ≤ S (π, f ) ≤ M ∣I ∣ .
Wir suchen einen Zusammenhang zwischen Ober- und Untersummen und berechnen s(π, −f ) = ∑ inf (−f (x)) ∣Iα ∣ = ∑(− sup (f (x))) ∣Iα ∣ α x∈Iα
α
= − ∑ Mα ∣Iα ∣ = −S (π, f ). α
x∈Iα
5.1 Definition des Integrals
157
Deshalb können wir uns bei den folgenden Überlegungen auf Obersummen beschränken. 5.1.9 Heuristik. Wir wollen die Änderung der Obersumme S (π, f ) beim Übergang zu einer anderen, feineren Partition π ′ , das heißt, es gilt δ (π ′ ) < δ (π ), untersuchen (vergleiche Abbildung 5.6). Es ist S (π, f ) = ∑ Mα ∣Iα ∣ , S (π ′ , f ) = ∑ Mβ′ ∣Iβ′ ∣ . α
β
Anschaulich ist klar, dass für diejenigen Teilintervalle Iβ′ von π ′ , die in einem Teilintervall Iα von π liegen ′
′
∑ Mβ ∣Iβ ∣ ≤ Mα ∣Iα ∣ gilt. Diejenigen Teilintervalle von π ′ , die nicht ganz in einem Teilintervall von π liegen, ergeben einen Störterm, der klein gemacht werden kann, wenn nur δ (π ′ ) klein genug ist. Im folgenden Hilfssatz ist π ′ ist nicht notwendig feiner als π! x2
b2 (2) ′
I(2,3)
x2
(2)
x2
(1) ′
x2
(1)
I(3,1)′
x2
a2 x1 a1
(1) ′ x1
(1)
x1
(2) ′ x1
b1
Abbildung 5.6: Zwei Partitionen eines Rechtecks
5.1.10 Lemma. Sei f ∶ I → R eine beschränkte Funktion mit m ≤ f ≤ M und seien π, π ′ zwei Partitionen von I. Dann gilt S (π ′ , f ) ≤ S (π, f ) + κ(π )(M − m)δ (π ′ ), wobei κ(π ) eine nur von der Partition π abhängige Konstante ist.
158
5 Das Riemannsche Integral
Beweis. (I) Ohne Beschränkung der Allgemeinheit sei m = 0, denn sonst gehen wir zu der Funktion g (x) ∶= f (x) − m, x ∈ I, über. Seien π = { Iα ∣ α ∈ Nnp }, π ′ = { Iβ′ ∣ β ∈ Nnp′ } zwei Partitionen von I. Außerdem sei Mα ∶= sup f (x), Mβ′ ∶= sup f (x) x∈Iβ′
x∈Iα
und S (π, f ) = ∑ Mα ∣Iα ∣ , S (π ′ , f ) = ∑ Mβ′ ∣Iβ′ ∣ . α
β
(II) Sei β ∈ Nnp′ . Dann können zwei Fälle eintreten: 1. Fall: Es gibt ein eindeutig bestimmtes Intervall Iα , α ∈ Nnp , mit Iβ′ ⊂ Iα , das ( i)
( i)
heißt I ′ βi ⊂ Iαi für i = 1, . . . , n. In diesem Fall sagen wir, dass β zur Klasse A gehört, das heißt
A ∶= { β ∈ Nnp′ ∣ ∃α ∈ Nnp ∶ Iβ′ ⊂ Iα } . (k)
2. Fall: Es gibt ein k ∈ { 1, . . . , n }, so dass das Intervall I ′ βk einen der Punkte (1)
(p −1)
xk , . . . , xk k der Partition des Intervalls [ak , bk ] = I (k) im Inneren enthält. In diesem Fall vereinbaren wir, dass β zur Klasse B gehört, das heißt ( αk )
B ∶= { β ∈ Nnp′ ∣ ∃k ∈ { 1, . . . , n } , ∃αk ∈ { 1, . . . , pk − 1 } ∶ xk
(k )
∈ I˚′ βk } .
(III) Wir betrachten zunächst die Klasse B und setzen für k = 1, . . . , n ( αk )
Bk ∶= { β ∈ Nnp ∣ ∃αk ∈ { 1, . . . , pk − 1 } ∶ xk
(k)
∈ I˚′ βk } .
n
Dann ist B = ⋃ Bk und für die Anzahl der Elemente von Bk gilt: #(Bk ) ≤ pk − 1. k =1
Weiterhin haben wir n
n
′ ′ ⋃ Iβ = ⋃ ⋃ Iβ = ⋃
β ∈B
k=1 β ∈Bk
⋃
k=1 βk ∶β ∈Bk βi =1,...,p′i i≠k
(1)
(k )
(n)
I ′ β1 × ⋯ × I ′ βk × ⋯ × I ′ βn ,
5.1 Definition des Integrals
159
weshalb n
′ ∑ ∣Iβ ∣ ≤ ∑
β ∈B
(1)
∑
k=1 βk ∶β ∈Bk βi =1,...,p′i i≠k n n
(k )
(n)
∣I ′ β1 ∣ ⋅ . . . ⋅ ∣I ′ βk ∣ ⋅ . . . ⋅ ∣I ′ βn ∣
= ∑ ∏(bi − ai ) ⋅ k =1 i=1 i≠k n
(k )
′ ∑ ∣I βk ∣
βk ∶β ∈Bk
∣I ∣ ⋅ #(Bk ) ⋅ δ (π ′ ) b − a k k k =1
≤∑
∣I ∣ (pk − 1)δ (π ′ ) =∶ κ(π )δ (π ′ ). b − a k k k =1 n
≤∑
(IV) Nun wollen wir die Klasse A untersuchen. Zunächst sei α ∈ Nnp fest gewählt. Für alle β ∈ Nnp′ mit Iβ′ ⊂ Iα haben wir ′ ∑ ∣Iβ ∣ =
Iβ′ ⊂Iα
∑
(1)
i=1,...,n I ′(βii) ⊂Iα(ii)
(n)
∣I ′ β1 ∣ ⋅ . . . ⋅ ∣I ′ βn ∣
⎛ ⎞ ⎛ ⎞ (1) (n) = ⎜ ∑ ∣I ′ β1 ∣⎟ ⋅ . . . ⋅ ⎜ ∑ ∣I ′ βn ∣⎟ ⎝I ′ (β1) ⊂Iα(11) ⎠ ⎝I ′ (βn) ⊂Iα(nn) ⎠ n
1
≤
∣Iα(11) ∣ ⋅ . . . ⋅ ∣Iα(nn) ∣
= ∣Iα ∣ .
Weil Mβ′ ≤ Mα für Iβ′ ⊂ Iα gilt, haben wir deshalb ′ ′ ∑ Mβ ∣Iβ ∣ = ∑
′ ′ ∑ Mβ ∣Iβ ∣
′ α∈Nn p Iβ ⊂Iα
β ∈A
≤ ∑ Mα ∑ ∣Iα′ ∣ ≤ ∑ Mα ∣Iα′ ∣ . α∈Nn p
Iβ′ ⊂Iα
α∈Nn p
(V) Zusammengenommen erhalten wir die zu beweisende Ungleichung: Es ist S (π ′ , f ) = ∑ Mβ′ ∣Iβ′ ∣ β ∈Nn p′
= ∑ Mβ′ ∣Iβ′ ∣ + ∑ Mβ′ ∣Iβ′ ∣ β ∈A
β ∈B
≤ ∑ Mα ∣Iα ∣ + M κ(π )δ (π ′ ) α∈Nn p
= S (π, f ) + M κ(π )δ (π ′ ), weil Mβ′ ≤ M für alle β ∈ Nnp′ .
160
5 Das Riemannsche Integral
5.1.11 Definition. Sei f ∶ I → R eine beschränkte Funktion. Dann setzen wir – S (f ) = ∫ f (x) dx ∶= inf S (π, f ), I
π
s(f ) = ∫ f (x) dx ∶= sup s(π, f ), π –I – und nennen ∫ f (x)dx beziehungsweise ∫ f (x)dx das obere beziehungsweise I –I untere Riemann- oder Riemann-Darboux-Integral von f über I. S (f ), s(f ) existieren immer, denn für jede Par-
5.1.12 Bemerkungen. (i) tition π von I gilt
m ∣I ∣ ≤ s(π, f ) ≤ S (π, f ) ≤ M ∣I ∣ . (ii)
Die noch zu beweisende Ungleichung s(f ) ≤ S (f ) ist nicht offensichtlich! Sie ist äquivalent dazu, dass jede Obersumme größer oder gleich jeder Untersumme ist: s(π, f ) ≤ S (π ′ , f ) für alle Partitionen π, π ′ .
(iii)
Wegen s(−f ) = −S (f ) brauchen wir uns nur mit S (f ) beschäftigen.
5.1.13 Satz und Definition. Sei f ∶ I → R eine beschränkte Funktion und (πk )k∈N eine ausgezeichnete Partitionsfolge, das heißt, es gilt δ (πk ) → 0 für k → ∞. Dann ist S (f ) = lim S (πk , f ), s(f ) = lim s(πk , f ). k→∞
k→∞
Beweis. Wir brauchen nur die Gleichheit für S zu beweisen. Nach Definition von S (f ) ∶= inf S (π, f ) gibt es eine Partitionsfolge (πk′ )k∈N mit lim S (πk′ , f ) = S (f ). π
Nach Lemma 5.1.10 gilt für k, ` ∈ N die Ungleichung
k→∞
S (πk , f ) ≤ S (π`′ , f ) + κ(π`′ )(M − m)δ (πk ). Für k → ∞, ` ∈ N fest folgt hieraus, dass lim sup S (πk , f ) ≤ S (π`′ , f ), k→∞
also für ` → ∞, dass
lim sup S (πk , f ) ≤ S (f ). k→∞
5.2 Die Riemannsche Definition
161
Nach Definition von S (f ) gilt S (πk , f ) ≥ S (f ) für alle k ∈ N, also gilt auch, dass lim inf S (πk , f ) ≤ S (f ). k→∞
Es folgt die Existenz des Grenzwertes lim S (πk , f ) = S (f ). k→∞
5.1.14 Satz. Sei f ∶ I → R eine beschränkte Funktion. Dann gilt für zwei Partitionen π, π ′ von I, dass s(π, f ) ≤ s(f ) ≤ S (f ) ≤ S (π ′ , f ). Beweis. Es ist nur die mittlere Ungleichung zu zeigen: Sei also (πk )k∈N eine ausgezeichnete Partitionsfolge. Wegen Satz 5.1.13 ist dann S (f ) = lim S (πk , f ), s(f ) = lim s(πk , f ). k→∞
k→∞
Für jedes k ∈ N gilt s(πk , f ) ≤ S (πk , f ). Der Grenzübergang k → ∞ liefert dann die Behauptung s(f ) ≤ S (f ). 5.1.15 Definition. Sei f ∶ I → R eine beschränkte Funktion. Dann heißt f über oder in I Riemann-integrierbar, wenn – s(f ) = ∫ f (x) dx = ∫ f (x) dx = S (f ). I –I In diesem Fall heißt der gemeinsame Wert
∫ f (x) dx ∶= s(f ) = S (f ) I
das Riemann-Integral oder einfach Integral von f über I. 5.1.16 Bemerkung. Es stellt sich die Frage nach praktischen Integrabilitätskriterien, beziehungsweise Klassen von integrierbaren Funktionen zu finden, denn nicht jede beschränkte Funktion ist Riemann-integrierbar, wie das Beispiel der Dirichletschen Sprungfunktion zeigt.
5.2 Die Riemannsche Definition 5.2.1 Definition. Sei f ∶ I → R eine beschränkte Funktion und π eine Partition von I, π = { Iα ∣ α ∈ Nnp }. Dann ist ω (I, f ) ∶= sup ∣f (x) − f (x′ )∣ x,x′ ∈I
162
5 Das Riemannsche Integral
die Oszillation oder Schwankung von f über I und ω (π ) = ω (π, f ) ∶= ∑ ω (Iα , f ) ∣Iα ∣ α∈Nn p
die Oszillations- oder Schwankungssumme von f über I bezüglich π. 5.2.2 Lemma. Ist f ∶ I → R eine beschränkte Funktion, so gilt ω (I, f ) = M − m = sup f − inf f I
I
und ω (π, f ) = ∑ (Mα − mα ) ∣Iα ∣ = S (π, f ) − s(π, f ). α∈Nn p
5.2.3 Riemannsches Integrabilitätskriterium. Die Funktion f ∶ I → R sei beschränkt. Dann ist f genau dann Riemann-integrierbar, wenn es zu jedem ε > 0 eine Partition πε von I gibt mit ω (πε , f ) = S (πε , f ) − s(πε , f ) < ε. Beweis. „ ⇐“ Angenommen, zu jedem ε > 0 gibt es eine Partition πε , so dass S (πε , f ) − s(πε , f ) < ε. Wegen – s(πε , f ) ≤ ∫ f (x) dx ≤ ∫ f (x) dx ≤ S (πε , f ) I –I folgt dann – 0 ≤ ∫ f (x) dx − ∫ f (x) dx < ε I –I für alle ε > 0, also die Gleichheit – ∫ f (x) dx = ∫ f (x) dx, I –I das heißt, f ist Riemann-integrierbar. „ ⇒“ Sei f über I Riemann-integrierbar, und (πk )k∈N sei eine ausgezeichnete Partitionsfolge, das heißt, es gilt δ (πk ) → 0 für k → 0. Dann gilt nach Satz 5.1.13, dass s(πk , f ) = lim S (πk , f ), ∫ f (x) dx = klim →∞ k→∞ I
also
lim (S (πk , f ) − s(πk , f )) = 0.
k→∞
Zu jedem ε > 0 gibt es deshalb ein k = k (ε) und eine Partition πε ∶= πk(ε) mit 0 ≤ S (πε , f ) − s(πε , f ) < ε.
5.2 Die Riemannsche Definition
163
Aus dem Beweis ergibt sich die folgende Verschärfung des Riemannschen Integrabilitätskriteriums: 5.2.4 Satz. Sei f ∶ I → R eine beschränkte Funktion. Wenn für eine ausgezeichnete Partitionsfolge (πk )k∈N von I die Relation lim ω (πk , f ) = 0
(5.1)
k→∞
gilt, dann ist f Riemann-integrierbar. Ist umgekehrt f Riemann-integrierbar, dann gilt die Limesrelation (5.1) für jede ausgezeichnete Partitionsfolge (πk )k∈N . 5.2.5 Definition. Sei f ∶ I → R eine beschränkte Funktion und π eine Partition von I, π = { Iα ∣ α ∈ Nnp }. Seien ferner Zwischenstellen ξα ∈ Iα für α ∈ Nnp gewählt. Dann heißt ξ = (ξα )α∈Nnp ein Zwischenstellenvektor und σ (π, f ) = σ (π, f, ξ ) ∶= ∑ f (ξα ) ∣Iα ∣ α∈Nn p
eine Riemannsche Approximations- oder Zwischensumme. 5.2.6 Riemannsche Definition des Integrals. Sei f ∶ I → R eine beschränkte Funktion. Dann ist f genau dann über I Riemann-integrierbar, wenn für jede ausgezeichnete Partitionsfolge (πk )k∈N und jede Wahl der Zwischenstellen ξ (k) = (k ) (k) (k ) (ξα )α∈Nnp , ξα ∈ Iα , p = p(k ), k ∈ N, die Riemannsche Summenfolge σ (πk , f ) = σ (πk , f, ξ (k) ) = ∑ f (ξα(k) ) ∣Iα(k) ∣ α∈Nn p
konvergiert. In diesem Fall haben alle Summenfolgen denselben Grenzwert und es gilt lim σ (πk , f ) = ∫ f (x) dx. k→∞
I
Beweis. „ ⇒“ Sei f Riemann-integrierbar, (πk )k∈N eine ausgezeichnete Partiti(k ) (k ) (k) onsfolge und ξ (k) = (ξα )α∈Nnp , ξα ∈ Iα , p = p(k ), k ∈ N. Dann gilt m(αk) ≤ f (ξα(k) ) ≤ Mα(k) , m(αk) = inf f, Mα(k) = sup f, Iα
also
Iα
s(πk , f ) ≤ σ (πk , f ) ≤ S (πk , f ).
Wegen s(πk , f ) = lim S (πk , f ) ∫ f (x) dx = klim →∞ k→∞ I
164
5 Das Riemannsche Integral
folgt lim σ (πk , f ) = ∫ f (x) dx
k→∞
I
aus dem Vergleichsprinzip. „ ⇐“ Sei (σ (πk , f ))k∈N konvergent für jede Wahl der Zwischenstellen ξ (k) = (k ) (k ) (k ) (ξα )α∈Nnp , ξα ∈ Iα , p = p(k ), k ∈ N. Wegen m(αk) = inf f, Mα(k) = sup f Iα(k)
(k)
(k)
(k )
gibt es dann ξα , ξ ′ α ∈ Iα
Iα(k)
mit
0 ≤ Mα(k) − f (ξα(k) )
0 ein δ > 0, so dass
∣f (x′ ) − f (x′′ )∣ < ε für alle ∣x′ − x′′ ∣ < δ. Ist π eine Partition von I mit δ (π ) < δ, so folgt ω (π, f ) = ∑ ω (Iα , f ) ∣Iα ∣ ≤ ε ∑ ∣Iα ∣ = ε ∣I ∣ . α∈Nn p
α∈Nn p
Ist also (πk )k∈N eine ausgezeichnete Partitionsfolge, so gilt lim ω (πk , f ) = 0 und k→∞
deshalb ist f Riemann-integrierbar.
5.3.2 Satz. Sind f, g ∶ I → R beschränkt und Riemann-integrierbar, dann sind es auch die Funktionen 1 1 f + g, f ⋅ g, ∣f ∣ , f + ∶= (f + ∣f ∣), f − ∶= (∣f ∣ − f ). 2 2 Ist ∣f (x)∣ ≥ c > 0 für alle x ∈ I, dann ist auch
1 f
Riemann-integrierbar.
Ferner gilt für α, β ∈ R die Linearitätsrelation
∫ (αf (x) + βg (x)) dx = α ∫ f (x) dx + β ∫ g (x) dx. I
I
I
166
5 Das Riemannsche Integral
Beweis. (I) Wir zeigen die Riemann-Integrierbarkeit von f ⋅ g: Sei ∣f ∣ , ∣g ∣ ≤ M < +∞. Dann gilt für x, x′ ∈ I:
∣(f ⋅ g )(x) − (f ⋅ g )(x′ )∣ ≤ ∣f (x)g (x) − f (x′ )g (x)∣ + ∣f (x′ )g (x) − f (x′ )g (x′ )∣ ≤ M (∣f (x) − f (x′ )∣ + ∣g (x) − g (x′ )∣), Ist π = { Iα ∣ α ∈ Nnp } eine Partition von I, dann folgt, dass ω (Iα , f ⋅ g ) ≤ M (ω (Iα , f ) + ω (Iα , g )), und daher
ω (π, f ⋅ g ) ≤ M (ω (π, f ) + ω (π, g )).
Ist (πk )k∈N eine ausgezeichnete Partitionsfolge, dann folgt aus dem Riemannschen Integrabilitätskriterium 5.2.3, dass ω (πk , f ⋅ g ) ≤ M (ω (πk , f ) + ω (πk , g )) → 0 für k → ∞. Aus Satz 5.2.3 folgt, dass f ⋅ g Riemann-integrierbar ist. (II) Für x, x′ ∈ I gilt
∣
1 1 ∣f (x′ ) − f (x)∣ 1 − ∣ = ≤ 2 ∣f (x) − f (x′ )∣ , f (x) f (x′ ) ∣f (x)f (x′ )∣ c
also folgt die Riemann-Integrierbarkeit von
1 f.
(III) Wir zeigen die Linearität des Integrals: Die Integrierbarkeit der Funktion αf + βg ist klar. Sei (πk )k∈N eine ausgezeichnete Partitionsfolge und seien ξ (k) = (k ) (k ) (k ) (ξα )α∈Nnp , ξα ∈ Iα , p = p(k ), k ∈ N, beliebig gewählte Zwischenstellen. Dann gilt (k ) (k) (k ) ∑ (αf (ξα ) + βg (ξα )) ∣Iα ∣ ∫ (αf (x) + βg (x)) dx = klim →∞
I
α∈Nn p
= α lim ∑ f (ξα(k) ) ∣Iα(k) ∣ + β lim ∑ g (ξα(k) ) ∣Iα(k) ∣ k→∞ α∈Nn
k→∞ α∈Nn
p
p
= α ∫ f (x) dx + β ∫ g (x) dx I
I
wegen der Riemannschen Definition des Integrals, Satz 5.2.6. 5.3.3 Satz. Ist f ∶ I → R beschränkt und Riemann-integrierbar, g ∶ f (I ) → R Lipschitz-stetig, das heißt, es gilt
∣g (y ) − g (y ′ )∣ ≤ L ∣y − y ′ ∣ für alle y, y ′ ∈ f (I ), so ist auch g ○ f ∶ I → R Riemann-integrierbar.
5.3 Eigenschaften integrierbarer Funktionen
167
Beweis. Für alle x, x′ ∈ I gilt
∣g (f (x)) − g (f (x′ ))∣ ≤ L ∣f (x) − f (x′ )∣ . Ist π = { Iα ∣ α ∈ Nnp } eine Partition von I, so folgt daher, dass ω (Iα , g ○ f ) ≤ L ω (Iα , f ) für alle α ∈
Nnp
und daher ω (π, g ○ f ) ≤ L ω (π, f ).
Ist (πk )k∈N eine ausgezeichnete Partitionsfolge, so folgt die Behauptung unmittelbar wie im Beweis von Satz 5.3.1. 5.3.4 Bemerkung. Satz 5.3.3 gilt auch, wenn g gleichmäßig stetig auf f (I ) ist. 5.3.5 Satz. Für jede beschränkte und Riemann-integrierbare Funktion f ∶ I → R gilt die Dreiecksungleichung für Integrale
∣∫ f (x) dx∣ ≤ ∫ ∣f (x)∣ dx. I
I
Beweis. Es sei (πk )k∈N eine ausgezeichnete Partitionsfolge von I und ξ (k) = (k ) (k ) (ξα )α∈Nnp , ξαk ∈ Iα , α ∈ Nnp , p = p(k ), k ∈ N, seien beliebig gewählte Zwischenstellen. Dann gilt RRR RRR RRR (k ) (k ) (k) RRR ∣σ (πk , f, ξ )∣ = RR ∑ f (ξα ) ∣Iα ∣RR RRRα∈Nn RRR R p R ≤ ∑ ∣f (ξα(k) )∣ ∣Iα(k) ∣ = σ (πk , ∣f ∣ , ξ (k) ). α∈Nn p
Durch Grenzübergang k → ∞ folgt die Behauptung. 5.3.6 Mittelwertsatz der Integralrechnung. Sei f ∶ I → R beschränkt und Riemann-integrierbar mit m ≤ f (x) ≤ M für alle x ∈ I. Dann genügt das Integralmittel 1 µ ∶= ∫ f (x) dx ∣I ∣ I den Ungleichungen m ≤ µ ≤ M, das heißt, es gilt m ∣I ∣ ≤ ∫ f (x) dx ≤ M ∣I ∣ . I
Ist f stetig, so gibt es ein ξ ∈ I mit µ = f (ξ ), das heißt, es gilt
∫ f (x) dx = f (ξ ) ∣I ∣ . I
168
5 Das Riemannsche Integral y M
µ
m
a ξ′
ξ ′′
ξ ′′′
b
x
Abbildung 5.7: Mittelwertsatz für Integrale, in diesem Beispiel ist f (ξ ′ ) = f (ξ ′′ ) = f (ξ ′′′ ) = µ
5.3.7 Erweiterter Mittelwertsatz der Integralrechnung. Die Funktionen f, p ∶ I → R seien beschränkt und Riemann-integrierbar, p sei nicht-negativ, p(x) ≥ 0 für x ∈ I, und m ≤ f (x) ≤ M für alle x ∈ I. Dann gilt m ∫ p(x) dx ≤ ∫ f (x)p(x) dx ≤ M ∫ p(x) dx, I
I
I
das heißt, es gibt ein µ ∈ [m, M ] mit
∫ f (x)p(x) dx = µ ∫ p(x) dx. I
I
Beweis. Es sei (πk )k∈N eine ausgezeichnete Partitionsfolge von I und ξ (k) = (k ) (k) (k ) (ξα )α∈Nnp , ξα ∈ Iα , p = p(k ), k ∈ N, seien beliebig gewählte Zwischenstellen. Dann gilt m ∑ p(ξα(k) ) ∣Iα(k) ∣ ≤ ∑ f (ξα(k) )p(ξα(k) ) ∣Iα(k) ∣ α∈Nn p
α∈Nn p
≤ M ∑ p(ξα(k) ) ∣Iα(k) ∣ , α∈Nn p
das heißt
mσ (πk , p, ξ (k) ) ≤ σ (πk , f ⋅ p, ξ (k) ) ≤ M σ (πk , p, ξ (k) ).
5.4 Jordansche Nullmengen
169
Für k → ∞ folgt daraus m ∫ p(x) dx ≤ ∫ f (x)p(x) dx ≤ M ∫ p(x) dx. I
I
I
5.3.8 Zusatz. Ist f ∈ C 0 (I ), dann gibt es ein ξ ∈ I mit
∫ f (x)p(x) dx = f (ξ ) ∫ p(x) dx. I
I
Beweis. Da I kompakt ist, gibt es x+ , x− ∈ I mit f (x+ ) = sup f, f (x− ) = inf f. I
I
Also gibt es ξ ∈ I, ξ = (1 − t)x− + tx+ , t ∈ [0, 1] mit f (ξ ) = µ ∈ [inf f, sup f ] ⊂ [m, M ]. I
I
5.4 Jordansche Nullmengen 5.4.1 Definition. Eine Punktmenge N ⊂ Rn heißt Jordansche Nullmenge, wenn es zu jedem ε > 0 eine endliche Anzahl p = p(ε) von n-dimensionalen Intervallen I1 , . . . , Ip gibt, so dass p
(i)
N ⊂ ⋃ Ik ,
(ii)
∑ ∣Ik ∣ < ε.
k=1
p
k=1
Mit anderen Worten, N lässt sich durch endlich viele Intervalle mit beliebig kleiner Intervallsumme überdecken. 5.4.2 Bemerkungen. (i) Jede Teilmenge N ′ ⊂ N einer Jordanschen Nullmenge N ist wieder eine Jordansche Nullmenge. (ii)
p
Sind N1 , . . . , Np Jordansche Nullmengen, so ist auch die Vereinigung ⋃ Nk eine Jordansche Nullmenge.
(iii)
k =1
Die Intervalle I1 , . . . , Ip können beliebig, also offen, abgeschlossen oder halboffen gewählt werden.
170
5 Das Riemannsche Integral
Abbildung 5.8: Jordansche Nullmenge, bestehend aus einer Kurve und zwei isolierten Punkten
(iv)
[0, 1] ∩ Q ist keine Jordansche Nullmenge, aber eine Lebesguesche Nullmenge.
5.4.3 Satz. Es sei N ⊂ Rn eine kompakte Teilmenge des Rn . Zu jedem Punkt a ∈ N gebe es ein k ∈ { 1, . . . , n }, ein kompaktes, nicht-ausgeartetes n-dimensionales Intervall I = Ia = { x ∈ Rn ∣ ∣xi − ai ∣ ≤ ri , i = 1, . . . , n } und eine stetige Funktion ϕ = ϕa ∶ I ′ → R, I ′ ∶= { x′ = (x1 , . . . , xk−1 , xk+1 , . . . , xn ) ∈ Rn ∣ ∣xi − ai ∣ ≤ ri , i = 1, . . . , n, i ≠ k } , so dass
N ∩ Ia ⊂ Gϕ ∶= { x ∈ Ia ∣ xk = ϕ(x′ ), x′ ∈ I ′ } .
Dann ist N eine Jordansche Nullmenge, mit anderen Worten N ⊂ Rn , N kompakt, ist eine Jordansche Nullmenge, falls sie in der Umgebung eines jeden ihrer Punkte in einem stetigen Graphen enthalten ist. Beweis. (I) Das Mengensystem { ˚ Ia ∣ a ∈ N } ist eine offene Überdeckung von N . Da N kompakt ist, gibt es nach dem Satz von Heine-Borel 1.4.14, endlich
5.4 Jordansche Nullmengen
171 p
viele Punkte a1 , . . . , ap ∈ N mit N ⊂ ⋃ Iak . Deshalb ist k =1
p
N ⊂ ⋃ (N ∩ Iak ) ⊂ Gϕak , k=1
und der Beweis des Satzes ist erbracht, wenn wir zeigen, dass Gϕ , ϕ = ϕak , eine Jordansche Nullmenge ist. (II) Sei ϕ ∈ C 0 (I ′ , R). Sei ε > 0. Weil ϕ gleichmäßig stetig auf I ′ ist, gibt es eine Partition π ′ = { Iα′ ∣ α ∈ Nnp −1 } von I ′ mit ω (Iα′ ′ , ϕ) = Mα − mα < ε für alle α ∈ Nnp −1 , dabei ist Mα ∶= max ϕ, mα ∶= min ϕ. ′ ′ Iα
Iα
Setzen wir Iα′′ ∶= [mα , Mα ], dann haben wir Gϕ = { x ∈ I ′ × R ∣ xk = ϕ(x′ ) } ⊂
′ ′′ ⋃ Iα × Iα ,
−1 α∈Nn p
und es gilt ′ ′′ ∑ ∣Iα × Iα ∣ =
α
−1 ∈Nn p
′ ′′ ′ ′ ∑ ∣Iα ∣ ⋅ ∣Iα ∣ < ε ∑ ∣Iα ∣ = ε ∣I ∣ .
−1 α∈Nn p
−1 α∈Nn p
Also ist Gϕ eine Jordansche Nullmenge. 5.4.4 Beispiele. (i) (ii)
S n−1 ∶= { x ∈ Rn ∣ ∣x∣ = 1 } (Einheitssphäre) 2
2
{ x ∈ Rn ∣ ( x1r−1a1 ) + . . . + ( xnr−nan ) = 1 } (Ellipse)
5.4.5 Satz. Sei f ∶ I → R eine beschränkte Funktion, die bis auf eine Jordansche Nullmenge N ⊂ I stetig ist. Dann ist f Riemann-integrierbar. Beweis. (I) Es sei ε > 0 vorgegeben. Dann gibt es p = p(ε) relativ offene Intervalle I1 , . . . , Ip ⊂ I mit p
p
k =1
k =1
N ⊂ I ′ ∶= ⋃ Ik , ∑ ∣Ik ∣ < ε. ′
Außerdem ist I ∖ I abgeschlossen und es gilt (I ∖ I ′ ) ∩ N = ∅. Für k = 1, . . . , p sei (1) (n) (k) (k) Ik = Ik × ⋯ × Ik = [a1 , b1 ] × ⋯ × [a(nk) , b(nk) ].
172
5 Das Riemannsche Integral
(II) Sei π = { Iα ∣ α ∈ Nnp }, p = (p1 , . . . , pn ) ∈ Nn , eine Partition von I mit (αi −1)
Iα = Iα(11) × ⋯ × Iα(nn) , Iα(ii) = [xi
( αi )
, xi
],
1 ≤ αi ≤ pi für i = 1, . . . , n. Wir betrachten die Partition π ′ , die dadurch entsteht, dass für i = 1, . . . , n den Teilungspunkten (0)
xi (k )
(1)
(pi )
= ai , xi , . . . , xi
= bi
(k)
die Punkte ai , bi , k = 1, . . . , p, p = p(ε), hinzugefügt werden. π ′ heißt Verfeinerung von π. Es sei π ′ = { Iα′ ∣ α ∈ Nnp′ }, p′ = (p′1 , . . . , p′n ) ∈ Nn , (1)
(n)
( i)
(αi −1)
Iα′ = I ′ α1 × ⋯ × I ′ αn , I ′ αi = [x′ i
( αi )
, x′ i
],
1 ≤ αi ≤ p′i für i = 1, . . . , n. Die Partition π ′ hat folgende Eigenschaften: Es gilt p′i ≤ pi + 2p für i = 1, . . . , n, δ (π ′ ) ≤ δ (π ) und I˚′ α ∩ ∂Ik = ∅ für alle α ∈ Nnp und alle k = 1, . . . , p(ε). Also gilt entweder Iα′ ⊂ Ik für ein k = 1, . . . , p oder Iα′ ⊂ I ∖ Ik für alle k = 1, . . . , p, das heißt entweder ist p
Iα′ ⊂ I ′ = ⋃ Ik oder Iα′ ⊂ I ∖ I ′ . k =1
(III) Für die Oszillationssumme ergibt sich nun ω (π ′ , f ) = ∑ ω (Iα′ , f ) ∣Iα′ ∣ α∈Nn p′
= ∑ ω (Iα′ , f ) ∣Iα′ ∣ + α∶I ′
α
⊂I ′
∑
α∶I ′
α
⊂I ∖I ′
ω (Iα′ , f ) ∣Iα′ ∣ .
Wegen ∣f (x)∣ ≤ M für x ∈ I folgt, dass ω (Iα′ , f ) ≤ 2M für alle α ∈ Nnp′ , also ′ ′ ′ ∑ ω (Iα , f ) ∣Iα ∣ ≤ 2M ∑ ∣Iα ∣
α∶Iα′ ⊂I ′
α∶Iα′ ⊂I ′ ′
≤ 2M ∣I ∣ ≤ 2M ε. Zur Abschätzung des zweiten Terms: Wegen (I ∖ I ′ ) ∩ N = ∅ ist f stetig auf I ∖ I ′ . Außerdem ist I ∖ I ′ kompakt, weshalb f sogar gleichmäßig stetig auf I ∖ I ′ ist. Daher gibt es ein δ = δ (ε) > 0, so dass
∣f (x′ ) − f (x′′ )∣ < ε für alle x′ , x′′ ∈ I ∖ I ′ , ∣x′ − x′′ ∣ < δ.
5.4 Jordansche Nullmengen
173
Wählt man π so, dass δ (π ) < δ (ε) gilt, dann ist auch δ (π ′ ) < δ (ε), also ω (Iα′ , f ) ≤ ε für alle α ∶ Iα′ ⊂ I ∖ I ′ . Folglich gilt
∑
α∶Iα′ ⊂I ∖I ′
ω (Iα′ , f )∣Iα′ ∣ ≤ ε
∑
α∶Iα′ ⊂I ∖I ′
∣Iα′ ∣ = ε ∣I ∖ I ′ ∣ ≤ ε ∣I ∣ .
Zusammenfassend ergibt sich also, dass ω (π ′ , f ) ≤ 2M ε + ε ∣I ∣ . Daher gibt es eine ausgezeichnete Partitionsfolge (πk )k∈N mit lim ω (πk , f ) = 0
k→∞
und deshalb ist f Riemann-integrierbar. 5.4.6 Satz. Sei f ∶ I → R eine beschränkte Funktion, die bis auf eine Jordansche Nullmenge N identisch gleich 0 ist. Dann ist f Riemann-integrierbar und es gilt
∫ f (x) dx = 0. I
Beweis. Die Integrierbarkeit von f folgt aus Satz 5.4.5. Um die zweite Behauptung zu zeigen, betrachtet man die im Beweis von Satz 5.4.5 konstruierte Partition π ′ und wählt Zwischenstellen ξ ′ = (ξα′ )α∈Nnp′ , ξα′ ∈ Iα′ . Für die Riemannsche Aproximationssumme σ (π ′ , f, ξ ′ ) ergibt sich dann σ (π ′ , f, ξ ′ ) = ∑ f (ξα′ ) ∣Iα′ ∣ α∈Nn p′
= ∑ f (ξα′ ) ∣Iα′ ∣ + α∶I ′
α
⊂I ′
= ∑
α∶Iα′ ⊂I ′
also
∑
α∶I ′
α
⊂I ∖ I ′
f (ξα′ ) ∣Iα′ ∣
f (ξα′ ) ∣Iα′ ∣ ,
∣σ (π ′ , f, ξ ′ )∣ ≤ M ∣I ′ ∣ ≤ M ε.
Daher gibt es eine ausgezeichnete Partitionsfolge (πk )k∈N mit lim σ (πk , f, ξk ) = k→∞
0, und nach der Riemannschen Definition des Integrals 5.2.6 ist deshalb
∫ f (x) dx = 0. I
174
5 Das Riemannsche Integral
5.5 Integration über Jordansche Bereiche 5.5.1 Definition. Eine kompakte Menge J ⊂ Rn heißt ein Jordanscher Bereich, wenn die Menge ∂J aller Randpunkte von J eine Jordansche Nullmenge ist. 5.5.2 Bemerkung. Endliche Vereinigungen und endliche Durchschnitte von Jordanbereichen sind wieder Jordanbereiche. 5.5.3 Beispiele. (i)
I = { x ∈ Rn ∣ ai ≤ xi ≤ bi , i = 1, . . . , n } (Intervall).
(ii)
K = { x ∈ Rn ∣ ∣x − a∣ ≤ r } (Kugel beziehungsweise Hyperkugel).
(iii)
K ′ = { x ∈ Rn ∣ r1 ≤ ∣x − a∣ ≤ r2 } (Kugelschale).
(iv)
K ′′ = { x ∈ Rn ∣ ∣x∣ ≤ r, xn ≥ 0 } (Halbkugel).
Wegen Satz 5.4.5 läßt sich das Riemann-Integral einer auf einem Jordanbereich J stetigen Funktion f erklären: 5.5.4 Definition. Es sei f eine in einem Jordanbereich J erklärte beschränkte Funktion. Ferner sei I ⊂ Rn ein n-dimensionales Intervall mit I ⊃ J, und sei fJ (x) ∶= {
f (x) falls x ∈ J 0 falls x ∈ I ∖ J.
Ist fJ über I Riemann-integrierbar, so heißt f über J integrierbar und
∫ f (x) dx ∶= ∫ fJ (x) dx J
I
das über J erstreckte Integral von f . 5.5.5 Lemma. Sei f ∶ J → R eine stetige Funktion. Dann ist fJ ∶ I → R über I Riemann-integrierbar. Beweis. Die Menge der Unstetigkeitspunkte von fJ ist in ∂J enthalten und daher eine Nullmenge. Ferner ist fJ beschränkt, da J kompakt und f stetig auf J ist. Aufgrund von Satz 5.4.5 ist fJ deshalb Riemann-integrierbar. 5.5.6 Additivität des Integrationsbereiches. Es seien J1 , . . . , Jp nicht-überp lappende Jordanbereiche, das heißt, es gilt J˚k ∩J˚` = ∅ für k ≠ `, und sei J ∶= ⋃ Jk . k=1
Dann ist eine beschränkte Funktion f ∶ J → R genau dann über J integrierbar, wenn sie über alle Jk integrierbar ist. In diesem Fall gilt p
∫ f (x) dx = ∑ ∫ J
k =1
Jk
f (x) dx.
5.5 Integration über Jordansche Bereiche
175
Beweis. Sei I ein Intervall mit I ⊃ J. Zu zeigen ist nur, dass p
∫ fJ (x) dx = ∑ ∫ fJk (x) dx. I
I
k =1
p
Für x ∈ I ∖ ⋃ ∂Jk gilt k =1
p
g (x) ∶= fJ (x) − ∑ fJk (x) = 0. k =1
p
Da ⋃ ∂Jk eine Nullmenge und g in I beschränkt ist, folgt aus Satz 5.4.6, dass k=1
∫ g (x) dx = 0, I
also
p
∫ fJ (x) dx = ∑ ∫ fJk (x) dx. I
I
k =1
5.5.7 Bemerkung. Die Sätze 5.3.2 (Linearität des Integrals), 5.3.5 (Dreiecksungleichung), 5.3.6 und 5.3.7 (Mittelwertsätze der Integralrechnung) bleiben für Jordanbereiche J gültig. 5.5.8 Definition. Ist J ein Jordanbereich, so heißt
∣J ∣ = ∫ dx ∶= ∫ χJ (x) dx J
J
der Inhalt von J, dabei ist χJ (x) ∶= {
1 falls x ∈ J 0 falls x ∈/ J
die zu J gehörige charakteristische Funktion. Aus Satz 5.5.6 folgt unmittelbar: 5.5.9 Additivität des Inhalts. Seien J1 , . . . , Jp nicht-überlappende Jordanbep reiche, das heißt, es gilt J˚k ∩ J˚` = ∅ für k ≠ `, und sei J ∶= ⋃ Jk . Dann gilt k =1
p
∣J ∣ = ∑ ∣Jk ∣ . k =1
176
5 Das Riemannsche Integral
5.6 Uneigentliche Integrale Unser nächstes Ziel besteht darin, Integrale der Form
∫ f (x) dx U
zu erklären, wobei U eine offene Menge im Rn ist. Die Idee ist, U durch eine Folge von Jordanbereichen (Jk )k∈N auszuschöpfen. 5.6.1 Definition. Es sei U ⊂ Rn eine offene Menge. Eine Folge (Jk )k∈N von Jordanbereichen mit Jk ⊂ U schöpft U aus, in Zeichen Jk → U für k → ∞, wenn es zu jeder kompakten Teilmenge K ⊂ U ein N = N (K ) ∈ N gibt mit Jk ⊃ K für alle k ∈ N, k ≥ N . Wir schreiben Jk ↑ U für k → ∞, falls die Folge (Jk )k∈N monoton wächst, das heißt, falls J1 ⊂ J2 ⊂ J3 ⊂ ⋯ gilt. 5.6.2 Lemma. Zu jeder offenen Menge U ⊂ Rn gibt es eine Folge (Jk )k∈N von Jordanbereichen Jk ⊂ U mit Jk ↑ U für k → ∞. Beweis. Für k ∈ N betrachten wir die Intervalle Ik ∶= { x ∈ Rn ∣ ∣xi ∣ ≤ k, i = 1, . . . , n } (k )
(k )
und konstruieren eine Partition πk von Ik in (2k 2 )n Teilintervalle Iα = Iα1 ⋯αn √ (k) n 1 mit den Kantenlängen k und Durchmesser δ (Iα ) = k , dabei ist α1 , . . . , αn ∈ { −k 2 , . . . , −1, 1, . . . , k 2 }. Die Folge (Jk )k∈N der Jordanbereiche Jk ∶=
⋃ (k )
Iα(k)
α∶Iα ⊂U
ist offensichtlich monoton wachsend. Wir zeigen, dass sie die in Definition 5.6.1 verlangte Konvergenzeigenschaft besitzt (vergleiche die Abbildungen 5.9 und 5.10): Sei K ⊂ U eine kompakte Teilmenge. Dann gibt es ein N ∈ N mit K ⊂ IN . Weil K kompakt und ∂U abgeschlossen ist, gilt nach Lemma 1.4.5, dass d√(K, ∂U ) > 0. Deswegen kann N ∈ N so groß gewählt werden, dass d(K, ∂U ) > n N gilt. Sei k ≥ N . Zu zeigen ist, dass K ⊂ Jk . Sei also x ∈ K. Wegen K ⊂ IN ⊂ Ik (k )
gibt es ein α, so dass x ∈ Iα . Wegen δ (πk ) =
√
n k
und d(K, ∂U ) > √ n (k ) n √ Iα ⊂ K n (x) = { y ∈ R ∣ ∣y − x∣ ≤ } ⊂ U. k k
Deshalb ist x ∈ Jk .
√ n N
haben wir
5.6 Uneigentliche Integrale
177 x2
(2)
(2)
I(−4,4)
(2)
I(1,4)
I(4,4)
1
(1)
I(−1,1) (2)
(2)
I(−3,1)
I(1,1) 1 (2) I(3,−1) (1)
x1
(2)
I(−1,−1)
I(1,−1)
(2)
(2)
I(−3,−4)
I(2,−4)
U Abbildung 5.9: Ausschöpfung einer offenen Menge durch Jordanbereiche, erste und (1) (1) (1) (2) (2) zweite Approximation: J1 = I(−1,−1) ∪ I(−1,1) ∪ I(1,−1) , J2 = J1 ∪ I(−3,−4) ∪ ⋯ ∪ I(−3,1) ∪ ⋯ ∪ (2)
(2)
(2)
I(1,1) ∪ ⋯ ∪ I(2,−4) ∪ I(3,−1)
Aus dem Beweis ergibt sich auch die folgende Aussage: 5.6.3 Lemma. Für jede offene Menge U ⊂ Rn gibt es eine Folge (Ik )k∈N von nicht-überlappenden, nicht-ausgearteten kompakten Intervallen Ik ⊂ U mit ∞
U = ⋃ Ik . k =1
178
5 Das Riemannsche Integral x2 (2)
(2)
I(−4,4)
(2)
I(1,4)
I(4,4)
1
(1)
I(−1,1) (2)
(2)
I(−3,1)
I(1,1)
1 (2) I(3,−1)
(1)
I(−1,−1)
x1
(2)
I(1,−1)
(2)
(2)
I(−3,−4)
I(2,−4)
U Abbildung 5.10: Dritte Approximation
5.6.4 Definition. Es sei U ⊂ Rn eine offene Menge und f eine auf U erklärte Funktion, welche über jedem Jordanbereich J ⊂ U beschränkt und integrierbar ist. Wenn die Folge (∫Jk f (x) dx)k∈N für jede beliebige Folge (Jk )k∈N von Jordanbereichen Jk ⊂ U mit Jk → U für k → ∞ konvergiert, so heißt f über U integrierbar und wir erklären das uneigentliche Integral von f über U durch
∫ f (x) dx ∶= klim ∫ →∞ U
Jk
f (x) dx.
5.6 Uneigentliche Integrale
179
Beweis der Wohldefiniertheit. Der Grenzwert ist unabhängig von der Wahl der Folge (Jk )k∈N , wie man für eine beliebige weitere U ausschöpfende Folge (Jk′ )k∈N durch Betrachten der gemischten Folge J1 , J1′ , J2 , J2′ , . . . erkennt. 5.6.5 Beispiel. Sei f (x) ∶= x1 für x ∈ U = { 0 < ∣x∣ < 1 }. Dann ist das unbestimmte Integral ∫U f (x) dx nicht definiert: Je nach Wahl von (Jk )k∈N ist lim ∫Jk f (x) dx ∈ R beliebig, denn ist Jk = [−1, −ck ] ∪ [c′k , 1], 0 < ck , c′k < 1, dann k→∞
ist
∫
Jk
1 1 1 1 1 ck dx = ∫ ′ dx − ∫ dx = log ′ . x ck ck x ck x
y
1
−1
0
y= 1
1 x
x
−1
Abbildung 5.11: Uneigentliches Integral
5.6.6 Satz. Es sei f ∶ U → R über jedem Jordanbereich J ⊂ U (beschränkt und) integrierbar. Ferner gelte für jeden Jordanbereich J ⊂ U die Ungleichung
∫ ∣f (x)∣ dx ≤ M < +∞ J
mit einer festen, von J unabhängigen Konstanten M . Dann ist f über U (beschränkt und) integrierbar.
180
5 Das Riemannsche Integral
Beweis. Aufgrund von Lemma 5.6.2 gibt es eine Folge von Jordanbereichen (Jk )k∈N mit Jk ⊂ U und Jk → U . Ersetzen wir Jk durch J1 ∪ ⋯ ∪ Jk , so können wir ohne Beschränkung der Allgemeinheit annehmen, dass J1 ⊂ J2 ⊂ ⋯ gilt. Die Folge (∫Jk ∣f (x)∣ dx)k∈N ist also monoton wachsend und beschränkt und deshalb konvergent. Daher existiert zu jedem ε > 0 ein N = N (ε), so dass 0≤∫
Jk
∣f (x)∣ dx − ∫
JN
∣f (x)∣ dx < ε für alle k ≥ N.
Sei (J`′ )`∈N eine beliebige Folge von Jordanbereichen mit J`′ ⊂ U , J`′ → U . Da JN ⊂ U kompakt ist, gibt es ein N ′ ∈ N, so dass JN ⊂ J`′ für alle ` ≥ N ′ . Da J`′ kompakt ist, gibt es zu jedem ` ≥ N ′ ein k = k (`) ≥ N mit JN ⊂ J`′ ⊂ Jk . Daraus ergibt sich die Ungleichung
∣fJ`′ (x) − fJN (x)∣ = ∣fJ`′ ∖JN (x)∣ ≤ ∣fJk ∖JN (x)∣ = ∣fJk (x)∣ − ∣fJN (x)∣ und, insbesondere für ` = N ′ ,
∣fJN′ ′ (x) − fJN (x)∣ ≤ ∣fJk (x)∣ − ∣fJN (x)∣ , also
∣fJ`′ (x) − fJN′ ′ (x)∣ ≤ 2(∣fJk (x)∣ − ∣fJN (x)∣) für alle ` ≥ N ′ . Durch Integration folgt
∣∫ ′ f (x) dx − ∫ J`
′ JN ′
f (x) dx∣ ≤ ∫
Rn
≤ 2 (∫
∣fJ`′ (x) − fJN′ ′ (x)∣ dx Jk
∣f (x)∣ dx − ∫
JN
∣f (x)∣ dx) < 2ε
für alle ` ≥ N ′ . Daher ist (∫J ′ f (x) dx) eine Cauchy-Folge, also konvergent. ` `∈N Somit ist f über U integrierbar und das uneigentliche Integral ∫U f (x) dx existiert.
5.7 Grenzwertsätze
181
5.7 Grenzwertsätze In diesem Abschnitt behandeln wir das Problem der Vertauschung von Integration und Grenzübergang: 5.7.1 Satz. Sei (fk )k∈N eine Folge beschränkter, Riemann-integrierbarer Funktionen auf einem (nicht-ausgearteten, kompakten, n-dimensionalen) Intervall I. Außerdem gelte die Relation f (x) ∶= lim fk (x) k→∞
gleichmäßig auf I, das heißt, für alle ε > 0 gibt es ein N ∈ N mit
∣f (x) − fk (x)∣ < ε für alle k ≥ N und alle x ∈ I. Dann ist f beschränkt und Riemann-integrierbar auf I und es gilt
∫ f (x) dx = klim ∫ fk (x) dx. →∞ I
I
Beweis. (I) f ist beschränkt, denn für ε = 1 ist
∣f (x) − fN (x)∣ < 1 für alle x ∈ I und N = N (1) ∈ N. (II) Sei ε > 0. Dann gibt es ein N ∈ N mit fk (x) − ε ≤ f (x) ≤ fk (x) + ε für alle x ∈ I, k ≥ N. Ist π = { Iα ∣ α ∈ Nnp } eine Partition von I, dann folgt m(αk) − ε ≤ mα ≤ m(αk) + ε, (k )
dabei ist mα = inf Iα f , mα = inf Iα fk , also auch s(π, fk ) − ε ≤ s(π, f ) ≤ s(π, fk ) + ε sowie Deshalb ist
s(fk ) − ε ≤ s(f ) ≤ s(fk ) + ε. s(f ) = lim s(fk ) = lim ∫ fk (x) dx. k→∞ k→∞ I
Genauso ist
S (f ) = lim S (fk ) = lim ∫ fk (x) dx. k→∞ k→∞ I
Also gilt s(f ) = S (f ), das heißt, f ist Riemann-integrierbar und es gilt
∫ f (x) dx = klim ∫ fk (x) dx. →∞ I
I
182
5 Das Riemannsche Integral
Als Korollar erhalten wir: ∞
5.7.2 Gliedweise Integration von Reihen. Es sei ∑ fk (x) eine gleichmäßig k =0
konvergente Reihe beschränkter, Riemann-integrierbarer Funktionen über I ⊂ Rn . ∞
Dann stellt die Reihe ∑ fk (x) eine über I beschränkte, Riemann-integrierbare k =0
Funktion dar und es gilt
∞
∞
∫ ∑ fk (x) dx = ∑ ∫ fk (x) dx. I k =0
I
k =0
5.7.3 Bemerkung. Es gilt der Satz von Arzelà. Ist (fk )k∈N eine Folge gleichmäßig beschränkter, Riemann-integrierbarer Funktionen über I, das heißt
∣fk (x)∣ ≤ M < +∞ für alle k ∈ N und alle x ∈ I, und gilt
f (x) ∶= lim fk (x) k→∞
punktweise für alle x ∈ I, und ist f Riemann-integrierbar in I, so gilt
∫ f (x) dx = klim ∫ fk (x) dx. →∞ I
I
Der Beweis ist elementar, das heißt ohne Zuhilfenahme des Lebesgue-Integrals durchführbar. Als weiteres Korollar ergibt sich: 5.7.4 Satz. Es sei (fk )k∈N eine Folge von Funktionen, die in einem Jordanbereich J (beschränkt und ) integrierbar sind und dort gleichmäßig gegen eine Grenzfunktion f konvergieren. Dann ist f (beschränkt und) integrierbar über J und es gilt ∫ f (x) dx = lim ∫ fk (x) dx. J
k→∞
J
5.7.5 Beispiel. Das folgende Beispiel zeigt, dass der Satz 5.7.1 über die Vertauschbarkeit von Integral und Grenzwert einer Funktionenfolge im Allgemeinen falsch ist, wenn nur die punktweise Konvergenz der Folge (fk )k∈N vorausgesetzt wird: Sei ⎧ 1 ⎪ k2 x für 0 ≤ x ≤ 2k ⎪ ⎪ ⎪ 2 1 1 fk (x) ∶= ⎨k ( k − x) für 2k ≤ x ≤ k1 . ⎪ ⎪ ⎪ ⎪ für k1 ≤ x ≤ 1 ⎩0 Dann gilt für festes x ∈ [0, 1] die punktweise Konvergenz lim fk (x) = 0 ∶= f (x), jedoch ist ∫I fk (x) dx =
1 4
k→∞
für alle k ∈ N, wogegen ∫I f (x) dx = 0.
5.7 Grenzwertsätze
183
y 2
1
1 2
0
1
1 2
x
Abbildung 5.12: Zur Vertauschung von Integral und Limes
5.7.6 Satz von der majorisierten Konvergenz. Es sei U ⊂ Rn eine offene Menge und (fk )k∈N eine Folge von Funktionen, die über U integrierbar sind und auf jedem kompakten Teilbereich K ⊂ U gleichmäßig gegen eine Funktion f konvergieren. Außerdem gelte für alle x ∈ U und alle k ∈ N
∣fk (x)∣ ≤ F (x), ∫ F (x) dx < +∞ U
mit einer in U integrierbaren Funktion F . Dann ist f über K integrierbar und es gilt die Limesrelation
∫ f (x) dx = klim ∫ fk (x) dx. →∞ U
U
Beweis. Offensichtlich ist f über jedem Jordanbereich J ⊂ U beschränkt und integrierbar. Wegen ∣fk (x)∣ ≤ F (x) gilt auch ∣f (x)∣ ≤ F (x) für x ∈ U . Somit existiert laut Satz 5.6.6 das uneigentliche Integral ∫U f (x) dx. Es sei (J` )`∈N eine Folge von Jordanbereichen mit J1 ⊂ J2 ⊂ ⋯ ⊂ J` ⊂ ⋯ ⊂ U , J` → U für ` → ∞. Für m ≥ ` gilt dann
∣(fk (x))Jm − (fk (x))J` ∣ = ∣(fk (x))Jm ∖J` ∣ ≤ ∣FJm ∖J` (x)∣ ≤ FJm (x) − FJ` (x)
184
5 Das Riemannsche Integral
für alle k ∈ N, x ∈ U , weshalb
∣∫
Jm
fk (x) dx − ∫ fk (x) dx∣ ≤ ∫ J`
Jm
F (x) dx − ∫ F (x) dx J`
≤ ∫ F (x) dx − ∫ F (x) dx. U
J`
Sei ε > 0 vorgegeben, dann wähle man N = N (ε), so dass
∫ F (x) dx − ∫ F (x) dx < ε U
J`
für alle ` ≥ N . Dann ist
∣∫
Jm
fk (x) dx − ∫ fk (x) dx∣ < ε J`
für alle m ≥ ` ≥ N und alle k ∈ N. Der Grenzübergang m → ∞ ergibt insbesondere, dass
∣∫ fk (x) dx − ∫
JN
∣∫ f (x) dx − ∫
JN
U
fk (x) dx∣ ≤ ε.
Genauso gilt U
f (x) dx∣ ≤ ε.
Wegen Satz 5.7.4 gibt es ein N ′ ∈ N mit
∣∫
JN
fk (x) dx − ∫
JN
f (x) dx∣ < ε
für alle k ≥ N ′ . Zusammengenommen haben wir
∣∫ fk (x) dx − ∫ f (x) dx∣ ≤ ∣∫ fk (x) dx − ∫ U
U
U
JN
+ ∣∫
JN
fk (x) dx − ∫
+ ∣∫
JN
f (x) dx − ∫ f (x) dx∣
< 3ε für alle k ≥ N ′ und somit lim ∫ fk (x) dx = ∫ f (x) dx.
k→∞
U
fk (x) dx∣
U
JN
U
f (x) dx∣
5.8 Parameterabhängige Integrale
185
5.7.7 Korollar. Es sei U ⊂ Rn eine offene Menge und (fk )k∈N eine Folge von Funktionen, die über U integrierbar sind und auf jedem kompakten Teilbereich K ⊂ U gleichmäßig gegen eine Funktion f konvergieren. Außerdem gelte für alle x ∈ U und alle k ∈ N 0 ≤ fk (x) ≤ f (x), ∫ fk (x) dx ≤ M < +∞. U
Dann ist f über U integrierbar und es gilt lim ∫ fk (x) dx = ∫ f (x) dx.
k→∞
U
U
Beweis. Es sei J ⊂ U ein Jordanbereich. Dann gilt wegen Satz 5.7.4, dass lim ∫ fk (x) dx = ∫ f (x) dx,
k→∞
J
J
und wegen
∫ fk (x) dx ≤ ∫ fk (x) dx ≤ M J
U
für alle k ∈ N haben wir
∫ f (x) dx ≤ M. J
Wegen 0 ≤ fk (x) ≤ f (x) folgt aus dem Satz von der majorisierten Konvergenz 5.7.6 auch, dass lim ∫ fk (x) dx = ∫ f (x) dx.
k→∞
U
U
5.8 Parameterabhängige Integrale 5.8.1 Satz und Definition. Es sei D ⊂ Rm eine beliebige Menge und J ⊂ Rn ein Jordanbereich. Die Funktion f ∶ D × J → R sei für jedes feste x ∈ D beschränkt und integrierbar über J, weshalb das Parameterintegral F (x) ∶= ∫ f (x, y ) dy für x ∈ D J
exitiert. f sei gleichgradig stetig in D, das heißt, für alle a ∈ D und alle ε > 0 gibt es ein δ = δ (ε, a) > 0, so dass
∣f (x, y ) − f (a, y )∣ < ε für alle x ∈ D, ∣x − a∣ < δ und alle y ∈ J. Dann ist F ∶ D → R eine stetige Funktion.
186
5 Das Riemannsche Integral
Beweis. Sei a ∈ D und ε > 0. Sei δ > 0 wie oben gewählt. Dann ist
∣F (x) − F (a)∣ ≤ ∫ ∣f (x, y ) − f (a, y )∣ dy < ε ∣J ∣ J
für alle x ∈ D, ∣x − a∣ < δ, weshalb F stetig im Punkt a ist. 5.8.2 Satz. Es sei U ⊂ Rm eine offene Menge und J ⊂ Rn ein Jordanbereich. Die Funktion f ∶ U × J → R sei für jedes feste x ∈ U (beschränkt und) integrierbar über J und für jedes feste y ∈ J sei f partiell differenzierbar in U . Sind die partiellen ∂f Ableitungen ∂x (x, y ) gleichgradig stetig in U für i = 1, . . . , m, dann sind sie für i jedes feste x ∈ U (beschränkt und) integrierbar über J, die Funktion F ∶ U → R ist stetig partiell differenzierbar und es gilt ∂F ∂f ( x) = ∫ (x, y ) dy ∂xi J ∂xi für alle x ∈ U , i = 1, . . . , m. Beweis. Es genügt, den Fall U = I zu betrachten, wobei I ⊂ R ein offenes Intervall ist. Sei ε > 0 vorgegeben und sei a ∈ I. (I) Sei x ∈ I, x ≠ a. Dann ist F (x) − F (a) f (x, y ) − f (a, y ) =∫ dy x−a x−a J und für alle y ∈ J gibt es nach dem Mittelwertsatz der Differentialrechnung einer Variablen ein x ˜=x ˜(x, a, y ) ∈ I, welches zwischen x und a liegt, so dass f (x, y ) − f (a, y ) ∂f = (x ˜, y ). x−a ∂x Außerdem gibt es aufgrund der gleichgradigen Stetigkeit der partiellen Ableitung ∂f ∂x (x, y ) in U ein δ = δ (ε, a) > 0, so dass
∣
∂f ∂f ε (x, y ) − (a, y )∣ < min (ε, ) für alle x ∈ U, ∣x − a∣ < δ, y ∈ J. ∂x ∂x ∣J ∣
(5.2)
(II) Wir zeigen die Beschränktheit und Integrierbarkeit der partiellen Ableitung ∂f ∂x (a, y ) über J: Ist (xk )k∈N eine Folge in I mit xk ≠ a und xk → a für k → ∞, so gibt es ein N = N (ε, a) ∈ N, so dass ∣xk − a∣ < δ für alle k ∈ N, k ≥ N, und nach Teil (I) gibt es eine Folge (x ˜k )k∈N in I mit x ˜k zwischen xk und a, so dass f (xk , y ) − f (a, y ) ∂f = (x ˜k , y ). xk − a ∂x
5.9 Sukzessive Integration
187
Wegen ∣x ˜k − a∣ < δ für alle k ∈ N, k ≥ N, folgt aus (5.2), dass
∣
∂f ∂f (x ˜k , y ) − (a, y )∣ < ε für alle k ∈ N, k ≥ N, und alle y ∈ J. ∂x ∂x
Zusammengenommen haben wir also gezeigt, dass ( ∂f ˜k , y )) eine Folge von ∂x (x k∈N in J beschränkten und integrierbaren Funktionen ist, welche gleichmäßig in J gegen ∂f ∂x (a, y ) konvergiert. Deshalb ist diese Grenzfunktion nach Satz 5.7.4 auch in J beschränkt und integrierbar. (III) Weil (5.2) auch für x = x ˜ gilt, ergibt sich aus Teil (I):
∣
F (x) − F (a) ∂f ∂f ∂f −∫ (a, y ) dy ∣ ≤ ∫ ∣ (x ˜, y ) − (a, y )∣ dy < ε x−a ∂x J ∂x J ∂x
für alle x ∈ U , ∣x − a∣ < δ. Also existiert die Ableitung F ′ (a) und es gilt F ′ (a) = ∫
J
∂f (a, y ) dy. ∂x
(IV) Die Stetigkeit von F ′ (x) für x ∈ U folgt aus Satz 5.8.1, weil der Integrand des Parameterintegrals ∫J ∂f ∂x (x, y )dy für jedes feste x ∈ U beschränkt und integrierbar über J und gleichgradig stetig in U ist.
5.9 Sukzessive Integration Wir wollen jetzt höherdimensionale Integrale auflösen, das heißt auf niederdimensionale Integrale zurückführen. Den folgenden Satz nennen wir den „Satz von Fubini“, eigentlich wird der entsprechende Satz im Rahmen der Lebesgueschen Theorie so genannt. 5.9.1 „Satz von Fubini“. Sei f eine stetige Funktion in einem (kompakten, nicht-ausgearteten n-dimensionalen) Intervall I = [a1 , b1 ] × ⋯ × [an , bn ] ⊂ Rn , ai < bi für i = 1, . . . , n. Dann gilt die Auflösungsformel
∫ f (x) dx = ∫ I
bn an
(⋯ (∫
b1 a1
f (x1 , . . . , xn ) dx1 ) ⋯ ) dxn .
Dieser Satz ergibt sich unmittelbar aus der folgenden Iterationsformel, wo wir Funktionen f = f (x, y ) betrachten, die in einem n + m-dimensionalen Intervall I × J erklärt sind, dabei ist x = (x1 , . . . , xn ) ∈ I ⊂ Rn , y = (y1 , . . . , ym ) ∈ J ⊂ Rm . Sind πI = { Iα ∣ α ∈ Nnp } und πJ = { Jβ ∣ β ∈ Nm q } Partitionen von I und J, so entspricht diesen die Partition π = πI × πJ = { Iα × Jβ ∣ α ∈ Nnp , β ∈ Nm q } von I × J.
188
5 Das Riemannsche Integral
5.9.2 Iterationsformel. Die Funktion f ∶ I × J → R sei beschränkt und Riemann-integrierbar. Dann sind die Funktionen s, S ∶ I → R, – s(x) ∶= ∫ f (x, y ) dy, S (x) ∶= ∫ f (x, y ) dy, J –J in I Riemann-integrierbar und es gilt
∫
I ×J
f (x, y ) dxdy = ∫ s(x) dx = ∫ S (x) dx. I
I
Beweis. (I) Wegen der Beschränktheit von f in I × J existieren die Integrale s(x) und S (x) für alle x ∈ I. Es seien πI = { Iα ∣ α ∈ Nnp } und πJ = { Jβ ∣ β ∈ Nnq } Partitionen von I und J, ferner seien ξ = (ξα )α∈Nnp , ξα ∈ Iα , Zwischenstellen und sei mαβ = inf f (x, y ), Mαβ = sup f (x, y ) x∈Iα y ∈Jβ
x∈Iα y ∈Jβ
für alle α ∈ Nnp , β ∈ Nm q . Dann ist mαβ ≤ inf f (ξα , y ) ≤ sup f (ξα , y ) ≤ Mαβ , y ∈ Jβ
y ∈Jβ
also
∑ mαβ ∣Jβ ∣ ≤ ∑ inf f (ξα , y ) ∣Jβ ∣ ≤ ∫ f (ξα , y )dy = s(ξα ), β β y ∈Jβ –J – ∣ ∣ ∣ ∣ M J ≥ sup f ( ξ , y ) J ≥ ∑ αβ β ∑ α β ∫ f (ξα , y )dy = S (ξα ). J
β y ∈Jβ
β
Wegen s(x) ≤ S (x) für alle x ∈ I gilt somit
∑ mαβ ∣Jβ ∣ ≤ s(ξα ) ≤ S (ξα ) ≤ ∑ Mαβ ∣Jβ ∣ β
für alle α ∈
β
Nnp .
Wir betrachten nun die Partition π ∶= πI × πJ = { Iα × Iβ ∣ α ∈ Nnp , β ∈ Nm q } von I × J. Nach Multiplikation mit ∣Iα ∣ und Summierung über α ergibt sich dann s(π, f ) = ∑ mαβ ∣Iα ∣ ∣Jβ ∣ α,β
≤ ∑ s(ξα ) ∣Iα ∣ α
≤ ∑ S (ξα ) ∣Iα ∣ α
≤ ∑ Mα,β ∣Iα ∣ ∣Jβ ∣ α,β
= S (π, f ),
5.9 Sukzessive Integration
189
das heißt, es gilt s(π, f ) ≤ σ (πI , s, ξ ) ≤ σ (πI , S, ξ ) ≤ S (π, f ). (k )
(5.3)
(k )
(II) Es seien (πI )k∈N und (πJ )k∈N ausgezeichnete Partitionsfolgen von I und (k ) (k) J. Dann ist (π (k) )k∈N , π (k) = πI × πJ , eine ausgezeichnete Partitionsfolge von I × J. Durch Grenzübergang erhält man wegen der Integrierbarkeit von f über I ×J s(π (k) , f ) → ∫ S (π (k) , f ) → ∫
I ×J I ×J
f (x, y ) dxdy, f (x, y ) dxdy
für k → ∞. Der Ungleichung (5.3) kann man entnehmen, dass (k )
σ (πI , s, ξ ) → ∫
I ×J
(k )
σ (πI , S, ξ ) → ∫
I ×J
f (x, y ) dxdy, f (x, y ) dxdy
für k → ∞. Also sind die Funktionen s, S ∶ I → R über I Riemann-integrierbar und es gilt f (x, y ) dxdy = ∫ s(x) dx = ∫ S (x) dx. ∫ I ×J
I
I
Weil der Graph einer stetigen Funktion wegen Satz 5.4.3 eine Jordansche Nullmenge ist, ergibt sich aus der Iterationsformel 5.9.2 sofort: 5.9.3 Cavalierisches Prinzip. Sei I ⊂ Rn ein (kompaktes, nicht-ausgeartetes n-dimensionales) Intervall und seien g, h stetige Funktionen in I. Sei J ∶= ⋃ Jx , x∈ I
Jx ∶= { (x, y ) ∣ y ∈ R, g (x) ≤ y ≤ h(x) } für x ∈ I. Dann ist J ein vertikal einfacher Jordanbereich und für jede stetige Funktion f ∈ C 0 (J ) gilt die Formel
∬ f (x, y ) dxdy = ∫ J
b a
(∫
h(x) g ( x)
f (x, y ) dy ) dx.
Eine ähnliche Formel gilt, wenn J horizontal einfach ist. Aus dem „Satz von Fubini“ ergibt sich der folgende Spezialfall des Gaußschen Integralsatzes:
190
5 Das Riemannsche Integral
5.9.4 Partielle Integration im Rn . Seien f ∈ C k (Rn ) und g ∈ Cck (Rn ), k ∈ N, das heißt, es gibt ein r > 0, so dass { x ∈ Rn ∣ g (x) ≠ 0 } ⊂ Ir (0) = { x ∈ Rn ∣ ∣xi ∣ ≤ r, i = 1, . . . , n }. Dann gilt die partielle Integrationsformel
∫
Rn
Dα f (x)g (x) dx = (−1)∣α∣ ∫
Rn
f (x)Dα g (x) dx.
Beweis. Durch sukzessive Integration und partielle Integration bezüglich x1 folgt, dass
∫
Rn
r r ∂f ∂f (x)g (x) dx = ∫ ⋯ ∫ (x1 , ⋯, xn )g (x1 , . . . , xn ) dx1 ⋯dxn ∂x1 −r −r ∂x1 r r ∂g = − ∫ ⋯ ∫ f (x1 , . . . , xn ) (x1 , . . . , xn ) dx1 ⋯dxn ∂x1 −r −r ∂g = − ∫ f (x) (x) dx, n ∂x1 R
weil g (−r, x2 , . . . , xn ) = 0 = g (r, x2 , . . . , xn ) gilt. Ähnlich werden alle anderen Ableitungen „herübergewälzt“.
Literaturverzeichnis Im Folgenden sind hauptsächlich Lehrbücher aufgelistet, welche den Lehrstoff der Analysis von Funktionen und Abbildungen mehrerer Variablen des zweiten Semesters behandeln. Hervorzuheben sind die Bände [7], [10] und [12]. Die Bände [8] und [14] sind hilfreich in den Übungen und bei der Prüfungsvorbereitung. Der Klassiker [4] ist auch heute noch empfehlenswert. [13] ist die deutsche Übersetzung des in Amerika als „Baby-Rudin“ bekannten Lehrbuchs, welches dort den Standard schlechthin definiert. [1] Amann, H. und Escher, J.: Analysis II. 2. Auflage, Basel: Birkhäuser 2006 [2] Appell, J.: Analysis in Beispielen und Gegenbeispielen. Dordrecht-Heidelberg-London-New York: Springer-Verlag 2009 [3] Barner, M. und Flohr, F.: Analysis II. 5. Auflage, Berlin-New York: Walter de Gruyter 2000 [4] Courant, R.: Vorlesungen über Differential- und Integralrechnung, Zweiter Band: Funktionen mehrerer Veränderlicher. 4. Auflage, Berlin-HeidelbergNew York: Springer-Verlag 1972 [5] Courant, R. und John, F.: Introduction to Calculus and Analysis. Volume II. Berlin-Heidelberg-New York: Springer Verlag 1989 [6] Erwe, F.: Differential- und Integralrechnung, Erster Band: Differentialrechnung, Zweiter Band: Integralrechnung. Mannheim: Bibliographisches Institut 1971 [7] Forster, O.: Analysis 2. Differentialrechnung im Rn , gewöhnliche Differentialgleichungen. 9. Auflage, Braunschweig/Wiesbaden: Vieweg + Teubner 2011 [8] Furlan, P.: Das gelbe Rechenbuch, Band 2. Dortmund: Verlag Martina Furlan 1996 [9] Heinz, E.: Differential- und Integralrechnung II. Vorlesungsausarbeitung. Mathematisches Institut der Universität Göttingen 1981
192
Literaturverzeichnis
[10] Heuser, H.: Lehrbuch der Analysis, Teil 2. 14. Auflage, Stuttgart: Vieweg + Teubner 2008 [11] Hildebrandt, S.: Analysis 2. Berlin-Heidelberg-New York: Springer-Verlag 2003 [12] Königsberger, K.: Analysis 2. 5. Auflage, Berlin-Heidelberg-New York: Springer-Verlag 2004 [13] Rudin, W.: Analysis. 4. Auflage, München-Wien: Oldenbourg Verlag 2009 [14] Timmann, S.: Repetitorium der Analysis, Teil 2. 2. Auflage, Springe: Binomi 2006 [15] Tutschke, W.: Grundlagen der reellen Analysis, Band I: Differentialrechnung, Band II: Integralrechnung. Braunschweig: Friedr. Vieweg + Sohn 1971/72 [16] Walter, W.: Analysis 2. 5. Auflage, Berlin-Heidelberg-New York: SpringerVerlag 2002
Abbildungsverzeichnis 1.1
Höhenwinkel und Sonnenstand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Der Rand der Einheitskugel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3
Offene Kugeln sind offene Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4
Abstand zweier abgeschlossener Mengen. . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.5
Konstruktion einer kompakten Schachtelung . . . . . . . . . . . . . . . . . . . . . . 25
2.1
Schnittmengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2
Niveaumengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3
Wetterkarte mit Isobaren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4
Generisches Koordinatennetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5
Eine Abbildung, veranschaulicht als Vektorfeld . . . . . . . . . . . . . . . . . . . . 33
2.6
Veranschaulichung einer affinen Abbildung . . . . . . . . . . . . . . . . . . . . . . . . 34
2.7
Polarkoordinatenabbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.8
Zylinderkoordinatenabbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.9
Sphärische Koordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.10 Sphärische Koordinatenabbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.11 Relativ offene Mengen I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.12 Relativ offene Mengen II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.13 Kontraktionssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 2.14 Mehrere Fixpunkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
194
Abbildungsverzeichnis
2.15 Extrema unter einer Nebenbedingung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 3.1
Partielle Ableitung nach x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.2 Partielle Ableitung nach y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.3
Beweis der Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.4
Bildung des 2. Differenzenquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.5
Tangentialebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.6
Geometrische Bedeutung des Gradienten . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3.7
Konvexe Funktion mit Sekante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
3.8
Sekanten einer konvexen Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.1
Lokale Surjektivität beim Satz über inverse Abbildungen . . . . . . . . . 123
4.2
Eine horizontal einfache Abbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.3
Der horizontal einfache Faktor g . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.4
Der vertikal einfache Faktor h . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
4.5
Faktorisierung von f = h ○ g . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
4.6
Extrema unter Nebenbedingungen I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
4.7
Extrema unter Nebenbedingungen II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
5.1
Integral als Flächeninhalt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
5.2
Flächeninhalt des Halbkreises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
5.3
Riemannsche Näherungssumme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
5.4
Partition eines Rechtecks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
5.5
Ober- und Untersummen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
5.6
Zwei Partitionen eines Rechtecks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
5.7
Mittelwertsatz für Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
Abbildungsverzeichnis
195
5.8
Jordansche Nullmenge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
5.9
Approximation durch Jordanbereiche I . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
5.10 Approximation durch Jordanbereiche II . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 5.11 Uneigentliches Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 5.12 Vertauschung von Integral und Limes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
Schlagwortverzeichnis Abbildung affine, 33 auflösende, 137, 139, 141, 142 Diffeomorphismus, 127 geradebiegende, 141 gleichmäßig stetige, 52 Homöomorphismus, 124 horizontal einfache, 130 identische, 33 Komponentenfunktion, 27 konstante, 33 kontrahierende, 49 lineare, 33 partiell differenzierbare, 71, 113 Polarkoordinaten-, 115 reelle, 27 Selbst-, 49 stetig differenzierbare, 71, 113 stetige, 47 topologische, 56 total differenzierbare, 87, 114 Umkehrformel, 124, 127 vertikal einfache, 133 Zylinderkoordinaten-, 116 Abbildungen inneres Produkt, 38 skalares Vielfaches, 38 Summe, 38 abgeschlossen folgen-, 10 Hülle, 10 Menge, 10 topologisch, 15
Ableitung partielle, 67 Richtungs-, 88 totale, 82, 114 Abschnitt, p-ter, 154 Absolutbetrag, 3, 30 Abstand zweier Mengen, 20 Abstandsfunktion, 7 Additivität des Inhalts, 175 des Integrationsbereiches, 174 ausschöpfend, 176 Auswahlprinzip, Weierstraßsches, 9 Axiome Metrik, 7 Norm, 3, 5 Skalarprodukt, 2 Topologie, 18 Banach -raum, 14 Fixpunktsatz, 50 Basis, kanonische, 2 beschränkte Menge, 10 Binomische Formel, 80 Bolzano, Zwischenwertsatz, 61 Cantorscher Durchschnittssatz, 21 Cauchy-Folge, 8 Cauchy-Schwarzsche Ungleichung, 4 Cauchysches Konvergenzprinzip, 9 Cavalierisches Prinzip, 189 Definitheit Metrik, 7 Norm, 3 Skalarprodukt, 3
198 Definitionsbereich, 27 dichte Teilmenge, 11 Diffeomorphismus, 127 Differential k-ter Ordnung, 94 Differential, totales, 92 Differentiation, implizite, 141 Differenzierbarkeit partielle, 67, 71, 75 stetige, 77, 87 totale, 82, 87, 114 Dirichletsche Sprungfunktion, 161 diskrete Metrik, 15 Distanzfunktion, 7 Dreiecksungleichung für Integrale, 167 Norm, 3 Durchmesser einer Menge, 20 Einheitssphäre, 171 Ellipse, 171 Euklidisch Norm, 3 Raum, 5 Skalarprodukt, 2 Exponentialfunktion, 32 Extremum einer Funktion, 99 Faktorisierungslemma, 134 Fixpunkt, 50 Flächeninhalt, 151 Folge beschränkte, 8 Cauchy-, 8 Grenzwert, 9 Häufungswert, 9, 19 konvergente, 8 Limes, 9 Minimal-, 53 Folgenkriterium, 39, 46 Funktion in Achsenrichtung stetige, 70 Abstands-, 7 affine, 30
Schlagwortverzeichnis bestimmte Divergenz, 41 charakteristische, 175 Dirichletsche Sprung-, 161 Distanz-, 7 Grenzwert, 38 konkave, 106 konstante, 29 Konvergenz, 38 gleichmäßige, 43 uneigentliche, 41 konvexe, 105 Koordinaten-, 29 Limes, 38 uneigentlicher, 41 lineare, 30 partiell differenzierbare, 67, 77 reelle, 27 Schnitt-, 130 stetig differenzierbare, 67, 77, 87 stetige, 45 total differenzierbare, 82, 94 Funktionaldeterminante, 113 matrix, 113 Funktionen Produkt, 38 Quotient, 38 Summe, 38 Funktionenfolge gleichmäßig konvergente, 61 punktweise konvergente, 61 Funktionenreihe, 64 Gaußscher Integralsatz, 189 Gebiet, 60 geometrische Reihe, 31 Gerade, 59 orientierte, 59 parametrisierte, 59 gleichgradig stetig, 185 Gradient, 67 Richtung, 90
Schlagwortverzeichnis Graph, 27 Grenzwert Folge, 9 Funktion, 38 Funktionenfolge, 61 -sätze, 40 uneigentlicher, 41 Heine-Borelsche Überdeckungseigenschaft, 24 Hessesche Form, 98 indefinite, 101 Matrix, 98 Homogenität, 3, 5 Homöomorphismus, 56, 124 Häufungspunkt, 10 Höhenlinie, 29 Identität, 33 implizite Differentiation, 141 Inneres einer Menge, 15 inneres Produkt auf dem Rn , 2 von Abbildungen, 38 Integral, 161, 174 -mittel, 167 Parameter-, 185 Reihe, 182 uneigentliches, 178 integrierbar, 174, 178 Intervall n-dimensionales, 7, 152, 174 Durchmesser, 23, 153 Inhalt, 153 nicht überlappend, 155 Normalunterteilung, 22 Partition, 22 inverse Abbildung, 127 isolierter Punkt, 10 Isolinien, 29 Iterationsformel, 188
199 JacobiDeterminante, 113 Matrix, 113 Jordan -Nullmenge, 169 -bereich, 174 Additivität, 174, 175 Inhalt, 175 Kettenregel Grenzwerte, 41 partiell differenzierbare Funktionen, 72 stetige Abbildungen, 46 total differenzierbare Funktionen, 87, 115 Kompaktheit Folgen-, 19 Schachtelung, 21 topologische, siehe HeineBorelsche Überdeckungseigenschaft Komponenten, 2 konkave Funktion, 106 Kontraktionssatz, 50 Konvergenz gleichmäßige, 43, 61, 64 majorisierte, 183 Punktfolge, 8 punktweise, 61, 64 uneigentliche, 41 Konvergenzkriterium, Cauchy, 61 konvex Funktion, 105 Teilmenge, 105 Koordinaten, 2 -funktion, 29, 92 -netz, krummliniges, 32 Polar-, 35 sphärische, 36, 117 Zylinder-, 35 Kroneckersches δ-Symbol, XI, 92, 105
200 Kugel, 174 -schale, 174 Halb-, 174 Hyper-, 174 Kurve parametrisierte, 57 Lagrange -Multiplikatoren, 143 Restglied, 96 Landausches Symbol, XII, 83, 97 Lemma 2. Differenzenquotient, 78 Faktorisierungs-, 134 Limes, 9, 38 iterierter, 42 uneigentlicher, 41 Linearität, 3 Linearitätsrelation, 165 Lipschitz -Halbnorm, 50 -Konstante, 49 -Seminorm, 50 -stetig, 49 Matrix Funktional-, 113 Jacobi-, 113 Maximum einer Funktion, 99 Menge abgeschlossene Hülle, 10 Abschluss, 10 Abstand, 20 beschränkte, 10 dichte, 11 Distanz, 20 Durchmesser, 20 folgenabgeschlossene, 10 folgenkompakte, 19 Häufungspunkt, 10 horizontal einfache, 130, 189 innerer Punkt, 15 Inneres, 15
Schlagwortverzeichnis isolierter Punkt, 10 offene, 15 Kern, 15 Überdeckung, 23 Rand, 11 relativ offene, 47 topologisch abgeschlossene, 15 topologisch kompakte, 24 vertikal einfache, 189 zusammenhängende, 57 wegweise, 57 Methode der kleinsten Quadrate, 103, 119, 129 Metrik, 7 diskrete, 15 induzierte, 14 metrischer Raum, 14 Minimalfolge, 53 Minimum einer Funktion, 99 Minkowskische Ungleichung, 6 Mittelwertsatz, 75, 87 der Integralrechnung, 167 erweiterter, 168 in Integralform, 76 Monotoniekriterium, 108 Multiindex, 30 Multinomialformel, 81 Multiplikation mit Skalaren, 2 Niveaumenge, 28 Norm, 3, 5 p-, 6 Abbildungs-, 6 Euklidische, 3 induzierte, 6 Matrix-, 6 Maximums-, 6 Nullvektor, 2 Obersumme, 155 orthogonal, 3 Oszillation, 162
Schlagwortverzeichnis partielle Ableitung, 67 der Ordnung k, 77 partielle Differenzierbarkeit, 67, 71, 75 partielle Integration, 190 Partition, 154 ausgezeichnete Folge, 160 Durchmesser, 155 Feinheit, 155 Oszillation, 162 Schwankung, 162 Verfeinerung, 172 Polarkoordinaten, 3 -abbildung, 115 Polygonzug, 59 Polynom, 30 elementarsymmetrisches, 31 Potenzreihe, 31 Produkt Euklidisches Skalar-, 2 inneres, 2 Punkt im Rn , 2 innerer, 15 kritischer, 99 stationärer, 99 Quader, 152 Rand, 11 Raum n-dimensionaler, 2 Banach-, 14 Euklidischer, 5 linearer, 2 metrischer, 14 normierter, 5 Skalarprodukt-, 5 topologischer, 18 Vektor-, 2 vollständiger, 14 Rechteck, 152
201 Reihe Funktionen-, 64 geometrische, 31 gliedweise Integration, 182 Richtung des stärksten Anstiegs, 90 Richtungsableitung, 88 Riemann -Integral, 160, 161 -integrierbar, 161, 164 Approximationssumme, 163 Definition des Integrals, 163 Integrabilitätskriterium, 162 Obersumme, 155 Untersumme, 155 Zwischensumme, 163 Sattelpunkt, 101 Satz Arzelà, 182 Bolzano-Weierstraß, 12 Cantorscher Durchschnitts-, 21 Dini, 63 Fermat, 99 Fubini, 187 Heine-Borel, 24 implizite Funktionen, 139 inverse Abbildungen, 127 über den iterierten Limes, 42 majorisierte Konvergenz, 183 Mittelwert-, 75, 87 Schwarz, 79 Taylor, 96 Weierstraß, 53 Zwischenwertsatz von Bolzano, 61 Schnittmenge, 28 Schwankung, 162 Separation der Variablen, 31 Skalarprodukt, 2, 38 Euklidisches, 2 Skalarproduktraum, 5 sphärische Koordinaten, 117 Startpunkt, 50
202 Stetigkeit, 45 gleichgradige, 185 gleichmäßige, 52 Strecke, 59 Streckenzug, 59 Symbol Kronecker, XI, 92, 105 Landau, XII, 83, 97 Symmetrie, 3, 7 Tangentenkriterium, 110 Taylorsche Formel, 96 Topologie, 17 Abbildung, 56 diskrete, 19 feinste, 19 gröbste, 19 offene Menge, 19 Raum, 18 relative, 47 totale Ableitung, 82, 94, 114 totale Differenzierbarkeit, 82, 87, 94, 114 totales Differential, 92 Tupel, geordnete, 2 Überdeckung, offene, 23 Überdeckungseigenschaft Heine-Borel, 24 Umgebung, 15 ε-Umgebung, 7 offene Kugel-, 7 umkehrbar global, 131 lokal, 131 Umkehrformel, 124, 127 Ungleichung Minkowskische, 6 Youngsche, 147 Untersumme, 155
Schlagwortverzeichnis Vektor, 2 -addition, 2 -analysis, 33 -feld, 33 -raum, n-dimensionaler, 2 Einheits-, 2 Null-, 2 Verbindungsgerade, 59 Volumen, 151 Weg, 57 Weierstraß Auswahlprinzip, 9 M-Test, 64 Satz, 53 Youngsche Ungleichung, 147 Zerlegung, 154 Zweite-Ableitungskriterium, 112 hinreichendes, 100 notwendiges, 100 Zwischenwertsatz von Bolzano, 61 Zylinderkoordinatenabbildung, 116