239 15 3MB
German Pages 375 [376] Year 2018
Joachim Erven, Jiří Horák Mathematik für angewandte Wissenschaften De Gruyter Studium
Weitere empfehlenswerte Titel Mathematik für angewandte Wissenschaften. Ein Vorkurs für Ingenieure, Natur- und Wirtschaftswissenschaftler Joachim Erven, Matthias Erven, Josef Hörwick, 6. Auflage, 2017 ISBN 978-3-11-052684-4, e-ISBN (PDF) 978-3-11-052686-8, e-ISBN (EPUB) 978-3-11-052697-4
Mathematik für angewandte Wissenschaften. Ein Lehrbuch für Ingenieure und Naturwissenschaftler Joachim Erven, Dietrich Schwägerl, 5. Auflage, 2018 ISBN 978-3-11-053694-2, e-ISBN (PDF) 978-3-11-053711-6, e-ISBN (EPUB) 978-3-11-053723-9
Mathematik für angewandte Wissenschaften. Ein Übungsbuch für Ingenieure und Naturwissenschaftler Joachim Erven, Dietrich Schwägerl, Jiří Horák, 3. Auflage, 2019 ISBN 978-3-11-054889-1, e-ISBN (PDF) 978-3-11-055350-5, e-ISBN (EPUB) 978-3-11-055365-9
Martingale und Prozesse René L. Schilling, 2018 ISBN 978-3-11-035067-8, e-ISBN (PDF) 978-3-11-035068-5, e-ISBN (EPUB) 978-3-11-038751-3
Numerik gewöhnlicher Differentialgleichungen. Anfangswertprobleme und lineare Randwertprobleme Martin Hermann, 2. Auflage, 2017 ISBN 978-3-11-050036-3, e-ISBN (PDF) 978-3-11-049888-2, e-ISBN (EPUB) 978-3-11-049773-1
Joachim Erven, Jiří Horák
Mathematik für angewandte Wissenschaften Ein Taschenbuch für Ingenieure und Naturwissenschaftler 2. Auflage
Autoren Prof. Dr. Joachim Erven [email protected] Prof. Dr. Jiří Horák [email protected]
ISBN 978-3-11-053712-3 e-ISBN (PDF) 978-3-11-053716-1 e-ISBN (EPUB) 978-3-11-053724-6 Library of Congress Control Number: 2018954117 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2018 Walter de Gruyter GmbH, Berlin/Boston Coverabbildung: Thomas Albrecht/EyeEm/getty images Druck und Bindung: CPI books GmbH, Leck www.degruyter.com
Ein paar Worte voraus… Vor fast acht Jahren erschien unter dem Titel „Taschenbuch der Ingenieurmathematik“ die erste Auflage dieses Buches, damals noch im Oldenbourg Verlag. Als dieser vor einigen Jahren vom De Gruyter Verlag übernommen wurde, entstand im Zusammenhang mit der Neuordnung des Verlagsprogramms die Idee, vier Werke, an denen der erstgenannte Autor beteiligt ist, unter dem einheitlichen Rahmen „Mathematik für angewandte Wissenschaften“ mit differenzierenden Untertiteln zusammenzufassen. Mit dieser Namensgebung sollte noch stärker unterstrichen werden, dass die Mathematik hier vornehmlich unter dem Aspekt der Anwendung behandelt wird, was inzwischen weit über die klassische Ingenieurmathematik hinausgeht. Das Vorkursbuch und das Lehrbuch aus dieser Reihe sind in den letzten Monaten erschienen, das Übungsbuch erscheint bald nach diesem Taschenbuch. Außerdem ist Jiří Horák als zweiter Autor hinzugekommen. Er hat die Entstehung der Erstauflage bereits im Hintergrund begleitet und beim Korrekturlesen einige wertvolle Hinweise gegeben. Inzwischen ist er selbst Professor an der TH Ingolstadt und hat an der Erstellung dieser zweiten Auflage wesentlichen Anteil genommen. Als aktiver Hochschullehrer hat er durch den ständigen Kontakt mit den Studierenden eher die Möglichkeit, neuere Entwicklungen aufzunehmen als der erstgenannte Autor, der inzwischen emeritiert ist. Nichtsdestoweniger wurde das bewährte Konzept der Erstauflage beibehalten: Das vorliegende Werk soll Studierende an Universitäten und Hochschulen, die als Anwender Mathematik studieren, während ihres gesamten Studiums und im Berufsleben danach als nützliches Nachschlagewerk für möglichst alle für sie relevanten mathematischen Sachverhalte zur Verfügung stehen. Deshalb haben wir uns um eine möglichst anschauliche Darstellung, unterstützt durch viele Abbildungen, bemüht, ohne jedoch die notwendige mathematische Strenge und Exaktheit zu vernachlässigen. Ein detailliertes Stichwortverzeichnis unterstützt unser Anliegen. Der Aufbau des ersten Teils (Kapitel 1-9) entspricht etwa dem des von J. Erven und D. Schwägerl verfassten Lehrbuchs, das in der gleichen Reihe erschienenen ist. Es werden die Grundlagen dargestellt, wie sie in jedem Bachelor-Studiengang einer ingenieur- oder naturwissenschaftlichen Disziplin benötigt werden. Dabei nehmen Teile der diskreten Mathematik (Lineare Algebra und Algebra) aufgrund ihrer für die Anwendung gestiegenen Bedeutung einen größeren Raum ein als in früheren vergleichbaren Werken. In den Kapiteln 9-16 werden weitergehende Themen behandelt, die insbesondere in den universitären Studiengängen der Elektro- und Informationstechnik sowie in allen Master-Studiengängen der Ingenieurund Naturwissenschaften eine zunehmend wichtige Rolle spielen. Hervorzuheben sind hier die Kapitel über Numerik und Funktionentheorie, die wir in keinem uns bekannten Taschen-
https://doi.org/10.1515/9783110537161-005
VI
Ein paar Worte voraus…
buch in dieser Weise behandelt finden. Im Kapitel 17 sind – des schnelleren Auffindens wegen – häufig benutzte Integrale, Reihenentwicklungen und statistische Tabellen zusammengefasst. Wir halten so etwas auch in Zeiten des überall verfügbaren Internets nach wie vor für hilfreich und meist bequemer in der Handhabung. Teile des Anhangs basieren übrigens auf einem älteren Buch, an dem einer der Autoren mitgearbeitet hat und das unter dem Titel „H. Wörle, H.-J. Rumpf und J. Erven: Taschenbuch der Mathematik“ 2015 als Reprint vom De Gruyter Verlag neu herausgegeben wurde. Obwohl das vorliegende Buch aus unseren an verschiedenen Fakultäten und Hochschulen gehaltenen Vorlesungen entstanden ist, kann es kein Lehrbuch – und erst recht nicht den Vorlesungsbesuch – ersetzen. Das wird schon daran deutlich, dass bis auf wenige Ausnahmen auf Beispiele verzichtet wurde – einerseits deshalb, um es bei der Fülle des Stoffs noch einigermaßen kompakt und übersichtlich zu halten, andererseits aber auch, um es als Formelsammlung in Prüfungen zulassen zu können. In der vorliegenden zweiten Auflage wurden etliche leider immer wieder vorkommende Schreibfehler beseitigt, an einigen Stellen die Darstellungsweise geglättet und mathematische Unsauberkeiten bereinigt. Außerdem wurden Inhalte ergänzt. Es gibt viele Personen, die bei der Erstellung dieses Buches mitgewirkt haben und denen wir herzlich danken möchten: Da sind zunächst einmal Dietrich Schwägerl und Matthias Erven, Mitautoren bei anderen Werken dieser Reihe, zu nennen – dem einen für die Überlassung etlicher Grafiken, dem anderen für kritisches Korrekturlesen und viele fachliche Hinweise. Christine Erven hat das Abtippen der Integraltafeln übernommen und darüber hinaus den gesamten Text hinsichtlich Schreibfehler und Layoutgestaltung überprüft. Zudem sind hier die MINT-Lektorate der beiden Verlage zu nennen – namentlich Anton Schmid, Oldenbourg Verlag, für viele wertvolle Hinweise zur Konzeption und technischen Herstellung sowie Nadja Schedensack, De Gruyter Verlag, für die gute Zusammenarbeit. Unser besonderer Dank gilt jedoch unseren Familien für die große Nachsicht, die sie bei der Erstellung der Texte mit uns hatten. München und Ingolstadt, im Juli 2018
J. Erven, J. Horák
Inhalt Ein paar Worte voraus…
V
1
Grundlagen
1
1.1
Aussagenlogik und Mengenlehre ...............................................................................1
1.2
Relationen und Funktionen.........................................................................................7
1.3
Algebraische Strukturen .............................................................................................9
1.4
Zahlbereiche .............................................................................................................12
1.5
Die Arithmetik der reellen Zahlen............................................................................17
1.6
Elementare Geometrie ..............................................................................................22
1.7
Ebene Trigonometrie................................................................................................26
1.8
Koordinatensysteme .................................................................................................30
1.9
Kegelschnitte ............................................................................................................32
1.10
Räumliche Körper ....................................................................................................39
2
Grundzüge der Linearen Algebra
2.1
Vektorraum, Unterraum, Basis.................................................................................45
2.2
Matrizen und Determinanten....................................................................................46
2.3
Lineare Abbildungen und lineare Gleichungssysteme .............................................53
2.4
EUKLIDische Räume und Orthogonalität ..................................................................56
2.5
Eigenwerte................................................................................................................58
2.6
Anwendung: Analytische Geometrie im R3 .............................................................60
3
Elementare Funktionen
3.1
Funktionen einer reellen Veränderlichen .................................................................65
3.2
Rationale Funktionen ...............................................................................................67
3.3
Potenz- und Wurzelfunktionen.................................................................................72
3.4
Exponential- und Logarithmus-, Hyperbel- und Areafunktionen.............................74
45
65
VIII
Inhalt
3.5
Trigonometrische und Arcus-Funktionen ................................................................ 78
3.6
Komplexe Funktionen.............................................................................................. 82
4
Differentialrechnung einer reellen Veränderlichen
4.1
Konvergenz von Folgen ........................................................................................... 85
4.2
Grenzwert von Funktionen und Stetigkeit................................................................ 88
4.3
Ableitung, Tangente, Differential ............................................................................ 91
4.4
Elementare Ableitungen und Ableitungsregeln........................................................ 94
4.5
Anwendungen der Differentialrechnung .................................................................. 97
4.6
Differentiation vektorwertiger Funktionen ............................................................ 101
5
Integralrechnung einer reellen Veränderlichen
5.1
Stammfunktion und unbestimmtes Integral ........................................................... 103
5.2
Hauptsatz der Differential- und Integralrechnung und bestimmtes Integral .......... 104
5.3
Integrationstechniken ............................................................................................. 110
5.4
Anwendungen der Integralrechnung ...................................................................... 113
6
Ebene und räumliche Kurven
6.1
Als Graphen darstellbare ebene Kurven................................................................. 119
6.2
Ebene Kurven in Polarkoordinaten ........................................................................ 121
6.3
Ebene Kurven in Parameterdarstellung.................................................................. 124
6.4
Räumliche Kurven ................................................................................................. 128
7
Reihen
7.1
Grundbegriffe und Konvergenz ............................................................................. 131
7.2
Potenzreihen........................................................................................................... 136
7.3
FOURIER-Reihen ..................................................................................................... 139
8
Mehrdimensionale Analysis
85
103
119
131
145
n
8.1
Der metrische Raum R ......................................................................................... 145
8.2
Funktionen mehrerer Veränderlicher ..................................................................... 147
8.3
Partielle und vollständige Differenzierbarkeit........................................................ 148
8.4
Gradient, Richtungsableitung, Kettenregel ............................................................ 152
8.5
Anwendungen der Differentialrechnung ................................................................ 155
8.6
Doppel- und Dreifachintegrale............................................................................... 160
Inhalt
IX
9
Gewöhnliche Differentialgleichungen
167
9.1
Grundlagen .............................................................................................................167
9.2
Differentialgleichungen erster Ordnung .................................................................170
9.3
Lineare Differentialgleichungen mit konstanten Koeffizienten .............................173
9.4
Lineare Differentialgleichungen mit variablen Koeffizienten................................176
9.5
Differentialgleichungen zweiter Ordnung ..............................................................181
9.6
Lineare Rand- und Eigenwertaufgaben ..................................................................183
9.7
Differentialgleichungssysteme erster Ordnung ......................................................185
10
Partielle Differentialgleichungen
10.1
Grundlegende Begriffe ...........................................................................................189
10.2
Partielle Differentialgleichungen erster Ordnung...................................................190
10.3
Lineare und quasilineare partielle Differentialgleichungen zweiter Ordnung........194
11
Vektoranalysis
11.1
Kurven und Flächen im Raum................................................................................197
11.2
Vektorfelder ...........................................................................................................199
11.3
Divergenz und Rotation..........................................................................................202
11.4
Kurvenintegrale ......................................................................................................203
11.5
Oberflächenintegrale ..............................................................................................206
11.6
Integralsätze von GAUSS, GREEN und STOKES .......................................................207
12
Integraltransformationen
12.1
FOURIER-Transformation........................................................................................209
12.2
LAPLACE-Transformation .......................................................................................213
13
Funktionentheorie
13.1
Komplexe Differentiation.......................................................................................217
13.2
Komplexe Integration.............................................................................................218
13.3
Die klassischen Sätze der Funktionentheorie .........................................................220
13.4
Isolierte Singularitäten und LAURENT-Reihen........................................................221
13.5
Der Residuenkalkül ................................................................................................224
13.6
Konforme Abbildungen und MÖBIUS-Transformationen .......................................227
14
Grundzüge der Numerik
14.1
Grundlagen .............................................................................................................233
189
197
209
217
233
X
Inhalt
14.2
Nichtlineare Gleichungen....................................................................................... 236
14.3
Numerische Lösung linearer Gleichungssysteme .................................................. 240
14.4
Interpolation ........................................................................................................... 245
14.5
Ausgleichsrechnung ............................................................................................... 251
14.6
Approximation durch orthogonale Funktionen ...................................................... 253
14.7
Numerische Integration .......................................................................................... 256
14.8
Numerische Differentiation.................................................................................... 263
14.9
Numerische Lösung gewöhnlicher Differentialgleichungen .................................. 265
15
Wahrscheinlichkeitsrechnung
15.1
Kombinatorische Grundlagen ................................................................................ 273
15.2
Ereignisse und Wahrscheinlichkeit ........................................................................ 275
15.3
Zufallsvariable und Verteilung............................................................................... 278
15.4
Maßzahlen einer Verteilung ................................................................................... 281
15.5
Spezielle diskrete Verteilungen.............................................................................. 284
15.6
Spezielle stetige Verteilungen................................................................................ 287
15.7
Mehrdimensionale Verteilungen ............................................................................ 291
15.8
Testverteilungen..................................................................................................... 295
16
Statistik
16.1
Grundlagen............................................................................................................. 299
16.2
Schätzen von Parametern ....................................................................................... 300
16.3
Testen von Hypothesen .......................................................................................... 304
17
Anhang: Tafeln und Tabellen
17.1
Unbestimmte Integrale ........................................................................................... 309
17.2
Bestimmte Integrale ............................................................................................... 321
17.3
Potenzreihen........................................................................................................... 325
17.4
FOURIER-Reihen ..................................................................................................... 328
17.5
FOURIER-Transformierte ........................................................................................ 334
17.6
LAPLACE-Transformierte........................................................................................ 336
17.7
Statistische Tabellen............................................................................................... 340
18
Literaturhinweise
Stichwortverzeichnis
273
299
309
351 353
1
Grundlagen
1.1
Aussagenlogik und Mengenlehre
Definition: Eine Aussage ist ein sprachliches Gebilde (meist ein grammatikalisch korrekter Satz!), von dem eindeutig bestimmt werden kann, ob es wahr (w, true, 1) oder falsch (f, false, 0) ist. Wesentlich für die sogenannte Aussagenlogik ist also die Tatsache, dass stets eindeutig feststellbar ist, welchen Wahrheitswert – wahr oder falsch – eine Aussage A hat; man spricht von der Zweiwertigkeit („tertium non datur“1)) der Logik. Auf Grund dessen können zusammengesetzte Aussagen durch die Festlegung ihrer Wahrheitswerte – in Abhängigkeit von denen der Einzelaussagen – definiert werden. Häufig entsprechen diese dem umgangssprachlichen Gebrauch (zum Beispiel bei Verneinung oder Und-Verknüpfung), bei einigen, wie etwa Oder-Verknüpfung und Folgerung, ist allerdings Vorsicht geboten. Negation (Verneinung) Umgangssprachlich verneint man eine Aussage meist durch Hinzusetzen des Wortes „nicht“. Die so aus A erhaltene Aussage A (auch mit ¬A bezeichnet, gelesen „nicht A“, „non A“ oder einfach „A quer“) hat – wie im alltäglichen Sprachgebrauch – genau die umgekehrten Wahrheitswerte wie A. Präzise wird dies durch sogenannte Wahrheitstafeln dargestellt, die man also in dieser Form auch zur Definition der Negation hernehmen kann:
1)
A
A
w
f
f
w
lat.: Es gibt kein Drittes.
https://doi.org/10.1515/9783110537161-011
2
1 Grundlagen
Konjunktion (Und-Verknüpfung, AND) Umgangssprachlich wird „A und B“ nur dann als zutreffend angesehen, wenn beide beteiligten Einzelaussagen wahr sind, in den drei anderen Fällen (eine der beiden falsch und die andere wahr sowie beide falsch) ist „A und B“ falsch. Der Gebrauch in der mathematischen Logik ist der gleiche, die Konjunktion der beiden Aussagen A und B, geschrieben als A ∧ B (gelesen „A und B“ oder „A et B“) wird über die folgende Wahrheitstafel definiert:
A w w f f
B w f w f
A∧ B w f f f
Auf diese Weise können insgesamt 16 verschiedene Wahrheitstafeln erzeugt werden (in der dritten Spalte kann an jeder der 4 Stellen w oder f stehen), es gibt also – anders ausgedrückt – 16 verschiedene 2-stellige Aussageverknüpfungen. Von diesen sind außer der Konjunktion noch die Disjunktion (Oder-Verknüpfung, OR; geschrieben A ∨ B , gelesen „A oder B“), die Implikation (Folgerung; geschrieben A ⇒ B , gelesen „aus A folgt B“ oder „wenn A dann B“) und die Äquivalenz (Gleichwertigkeit; geschrieben A ⇔ B , gelesen „A äquivalent B“) von Bedeutung. Sie werden durch folgende Wahrheitstafel definiert:
A
B
A∧ B
A∨ B
A⇒ B
A⇔ B
w
w
w
w
w
w
w
f
f
w
f
f
f
w
f
w
w
f
f
f
f
f
w
w
Zu beachten ist, dass die Disjunktion stets nichtausschließend gemeint ist, sie also nur falsch ist, wenn beide Teilaussagen falsch sind, während in der Umgangssprache oft „entweder – oder“ gemeint ist. Auch bei der Folgerung wird in der Umgangssprache häufig „wenn A dann B“ mit „wenn nicht A dann nicht B“ gleichgesetzt, was der Äquivalenz, aber nicht der Implikation entspricht. Eine Implikation A ⇒ B ist (siehe oben) nur dann falsch, wenn die Prämisse A wahr und gleichzeitig die Konklusion B falsch ist. In den beiden ersten Spalten sind alle denkbaren Kombinationen der Wahrheitswerteverteilungen der Einzelaussagen (insgesamt 4) aufgeführt, aus der dritten Spalte entnimmt man, dass nur im Falle, wo A und B wahr sind, auch A ∧ B wahr ist. Das bedeutet aber auch, dass B ∧ A die gleiche Wahrheitswerteverteilung hat wie A ∧ B , A ∧ B und B ∧ A sind logisch gleichbedeutend, „ A ∧ B entspricht B ∧ A “ ist ein aussagenlogisches Gesetz.
1.1 Aussagenlogik und Mengenlehre
3
Aussagenlogische Gesetze (Tautologien)
Offensichtlich ergeben sich die gleichen Verteilungen der Wahrheitswerte, wenn man bei A ∧ B , A ∨ B oder A ⇔ B A und B die Rollen tauschen lässt, A ∧ B und B ∧ A sind also logisch gleichbedeutend, „ A ∧ B entspricht B ∧ A “ ist ein aussagenlogisches Gesetz. Weitere wichtige Tautologien sind: A∧ B
B∧ A
Kommutativgesetz
A∨ B
B∨ A
Kommutativgesetz
A⇔ B
B⇔A
Kommutativgesetz
A⇒ B
B⇒A
Kontrapositionsregel
A⇒ B
(A ∧ B)
A⇔ B
A⇒ B ∧ B ⇒ A
Ringschluss-Regel
A∧ B
A∨B
de MORGAN - Regel
A∨ B
A∧B
de MORGAN - Regel
A ∧ (B ∨ C )
( A ∧ B) ∨ ( A ∧ C )
Distributivgesetz
A ∨ (B ∧ C)
( A ∨ B) ∧ ( A ∨ C )
Distributivgesetz
Aussageformen
Der Ausdruck „x > 2“ stellt ohne weitere Information über x keine Aussage im oben definierten Sinn dar. Steht die Variable x nämlich für irgendein Tier, so ergibt sich Unsinn, setzt man jedoch für x eine Zahl ein, so ergibt sich eine – wahre oder falsche – Aussage. Es liegt hier eine sogenannte Aussageform vor, die erst durch Angabe eines Einsetzungsbereichs für x zu einer Aussage wird. Definition:
Eine Aussageform ist ein sprachliches Gebilde mit mindestens einer Variablen (Leerstelle). Durch Einsetzen von entsprechend vielen Elementen aus angegebenen Einsetzungsbereichen wird daraus eine Aussage. Man schreibt A(x) bzw. A( x1 , L , x n ) , wobei x bzw. x1 , L , x n für Objekte aus den Einsetzungsbereichen E bzw. E1 , L , E n stehen. Interessant werden Aussageformen vor allem durch die häufig benutzte Möglichkeit der Quantisierung. Will man ausdrücken, dass eine Aussageform A(x) für jedes Objekt x aus dem Einsetzungsbereich E gilt, so benutzt man den sogenannten All-Quantor (geschrieben: ∀x : A( x) , gelesen: „Für alle x (aus E) gilt A(x) .“); die Tatsache, dass eine Aussageform A(x) für mindestens ein Objekt x aus dem Einsetzungsbereich E wahr ist, wird durch den
4
1 Grundlagen
Existenz-Quantor ∃ x : A( x) („Es gibt (mindestens) ein x aus E, für das A(x) gilt) beschrieben. Durch Benutzung der Mengenschreibweise (siehe nächster Abschnitt) wird die Benutzung der Quantoren noch präziser: All-Quantor: ∀x ∈ E : A( x)
Existenz-Quantor: ∃x ∈ E : A( x)
Insbesondere bei Verneinungen quantisierter Aussageformen ist die Benutzung der Quantoren-Schreibweise im Vergleich zur Umgangssprache kürzer und vor allem exakter: Es ist nicht ganz klar, ob mit „Für alle x gilt A(x) nicht.“ gemeint ist, dass A(x) nicht allgemeingültig ist (formal: ∀x : A( x) ) oder dass A(x) nie gilt (formal: ∀x : A( x) ). Es gelten folgende Entsprechungen für Negationen quantisierter Aussageformen:
∀x : A( x)
∃x : A( x)
∃x : A( x)
∀x : A( x)
∀x : ( A( x) ∧ B ( x) )
( ) ∀x : (A( x) ∨ B( x) ) ∃x : (A( x) ∧ B( x) ) ∀x : (A( x) ∧ B( x) ) ∃x : (A( x) ∧ B( x) ) ∀x : (A( x) ∧ B( x) )
∃x : ( A( x) ∧ B( x) ) ∀x : ( A( x) ∨ B ( x) ) ∃x : ( A( x) ∨ B( x) ) ∀x : ( A( x) ⇒ B( x) ) ∃x : ( A( x) ⇒ B( x) )
∃x : A( x) ∨ B( x)
Eine widerspruchsfreie exakte Definition des Begriffs „Menge“ ist schwierig, hier aber auch nicht erforderlich. Der Begriff soll bei den abstrakten Objekten der Mathematik analog zum alltäglichen Sprachgebrauch verwendet werden, also eine Zusammenfassung von bestimmten unterscheidbaren Objekten, Elemente genannt, zu einem Ganzen bezeichnen. Um Widersprüche zu vermeiden, geht man von der Existenz einer Grundmenge Ω aus, die sich sehr häufig aus dem Zusammenhang ergibt (Menge aller reellen Zahlen, Menge aller Punkte in der Ebene, Menge aller Matrizen o.Ä.). Bezeichnungen: Mengen werden meist mit Großbuchstaben (A, M, Ω , M o.Ä.) bezeichnet, ihre Elemente häufig mit kleinen lateinischen oder griechischen Buchstaben.
a ∈ M – gelesen: „a (ist ein) Element von M“ – bedeutet, dass das Element a zur Menge M gehört.
1.1 Aussagenlogik und Mengenlehre
5
Die Menge, die kein Element enthält, heißt leere Menge und wird mit ∅ oder { } bezeichnet. Sie ist dadurch gekennzeichnet, dass die Aussage x ∈ ∅ stets falsch ist. Eine Menge M kann durch Aufzählen ihrer Elemente oder durch Angabe einer kennzeichnenden Eigenschaft beschrieben werden. M = {x ∈ Ω | A( x)} ist also die Menge aller derjenigen Elemente aus der Grundmenge Ω , für die A(x) eine wahre Aussage ist. Definition:
Eine Menge A heißt Teilmenge einer Menge B (bzw. B Obermenge von A), wenn jedes Element von A auch Element von B ist. Man schreibt dafür A ⊆ B. (bzw. B ⊇ A), anders formuliert: A ⊆ B ⇔ ∀ x:(x ∈ A ⇒ x ∈ B). Die Menge aller Teilmengen einer gegebenen Menge B heißt die Potenzmenge von B und wird mit P(B) bezeichnet. Eine gegebene Menge B besitzt also stets mindestens die beiden Teilmengen ∅ und B selbst, die sogenannten trivialen Teilmengen. Weitere Teilmengen A von B heißen echte Teilmengen, wofür häufig die Schreibweise A ⊂ B benutzt wird. Allgemein besitzt die Potenzmenge einer n-elementigen Menge 2n Elemente. Definition:
(i) Zwei Mengen A und B heißen gleich (geschrieben: A = B) genau dann, wenn sowohl A ⊆ B als auch B ⊆ A ist, kurz: A=B ⇔
(∀ x : x ∈ A ⇔ x ∈ B ) .
(ii) Der Durchschnitt (die Schnittmenge) von A und B (geschrieben A ∩ B) ist die Menge aller derjenigen Elemente x aus Ω , die sowohl in A als auch in B liegen. Es gilt also: A ∩ B = {x | x ∈ A ∧ x ∈ B}. (iii) Die Vereinigung(smenge) von A und B (geschrieben A ∪ B) ist die Menge aller derjenigen Elemente x aus Ω , die in A oder B liegen. Es gilt also: A ∪ B = { x | x ∈ A ∨ x ∈ B} . (iv) Die Differenz- oder Restmenge A ohne B (geschrieben A \ B) ist die Menge aller derjenigen Elemente x aus Ω , die zu A, aber nicht zu B gehören. Es gilt also: A \ B = { x | x ∈ A ∧ x ∉ B} . (v) Die Differenzmenge aus Grundmenge Ω und A heißt das Komplement von A und wird mit CΏ (A) oder A bezeichnet. Mengenbeziehungen und -verknüpfungen werden häufig mit sogenannten VENNDiagrammen veranschaulicht. In den Bildern 1.1.1 – 1.1.4 sind die oben definierten Begriffe jeweils schattiert dargestellt.
6
1 Grundlagen
Bild 1.1.1: Der Durchschnitt A ∩ B
Bild 1.1.2: Die Vereinigung A ∪ B
Hieraus ist unmittelbar zu ersehen, dass A ∩ B Teilmenge von sowohl A als auch B ist; andererseits sind A und B Teilmengen von A ∪ B.
Bild 1.1.3: Die Differenzmenge A \ B
Bild 1.1.4: Das Komplement CG(A) von A
Für die Verknüpfungen von Mengen gelten folgende Regeln:
(i)
A∩B=B∩A
A∪B=B∪A (Kommutativgesetze)
(ii)
A ∩ (B ∩ C) = (A ∩ B) ∩ C (Assoziativgesetze)
A ∪ (B ∪ C) = (A ∪ B) ∪ C
(iii)
A ∩ (B∪C) = (A∩B) ∪ (A∩C) (Distributivgesetze)
A ∪ (B∩C) = (A∪B) ∩ (A∪C)
(iv)
A \ (B∪C) = (A\B) ∩ (A\C) A \ (B∩C) = (A\B) ∪ (A\C) (DE MORGANsche Gesetze)
(v)
A∩A=A
A∪A=A (Idempotenzgesetze)
(vi)
A∩G=A
A∪G=G
A∩∅=∅
A∪∅=A (Neutralitätsgesetze)
(vii)
Für A ⊆ B gilt:
A∩ B = A
und
A∪ B = B
1.2 Relationen und Funktionen
7
Für n gegebene Mengen A1, A2, ..., A n erhält man die folgende Definition:
(i) Die Menge aller geordneten n-Tupel (x1, x2, ..., xn) mit xi ∈ Ai (für jedes i = 1, ..., n) heißt kartesisches Produkt der Mengen A1, A2, ..., An und wird mit A1 × ... × A n bezeichnet. Für n = 2, also für die Menge aller geordneten Paare (x, y) mit x ∈ A1 und y ∈ A2, heißt das kartesische Produkt auch Paarmenge der Mengen A1 und A2. (ii) Ist jedes Ai = A, so schreibt man auch An statt A × ... × A.
1.2
Relationen und Funktionen
Definition:
(i) Eine Teilmenge R von M × N heißt (binäre) Relation auf M × N oder Relation von M nach N. Statt ( x, y ) ∈ R schreibt man meist x R y. (ii) Ist R eine Relation auf M × N, so nennt man D = {x ∈ M | ∃ y ∈ N : x R y} den Definitionsbereich und W = {y ∈ N | ∃ x ∈ M : x R y} den Werte- oder Bildbereich der Relation. Im Definitions- bzw. Wertebereich werden also alle diejenigen Elemente von M bzw. N zusammengefasst, die in R als erste bzw. zweite Komponente (mindestens einmal) vorkommen. Die Umkehrrelation R-1 ist eine Relation auf N × M, sie ist gegeben durch: ( y, x) ∈ R −1 ⇔ ( x, y ) ∈ R . Für den Spezialfall M = N (also R ⊆ M × M , man spricht dann einfach von Relationen auf M) können Relationen folgende Eigenschaften haben: reflexiv:
∀x ∈ M : x R x
symmetrisch:
∀x, y ∈ M : x R y ⇒ y R x
antisymmetrisch:
∀x, y ∈ M : ( x R y ∧ y R x ) ⇒ x = y
asymmetrisch:
∀x, y ∈ M : ( x R y ) ⇒ ¬( y R x)
transitiv:
∀x, y, z ∈ M : (x R y ∧ y R z ) ⇒ x R z
Ist eine Relation reflexiv, symmetrisch und transitiv, so heißt sie Äquivalenzrelation; liegt statt der Symmetrie Antisymmetrie vor, so spricht man von einer Halbordnung. Eine Halbordnung, bei der zusätzlich für alle x, y ∈ M noch x R y oder y R x gilt, heißt lineare Ordnung.
8
1 Grundlagen
Ist R eine Äquivalenzrelation auf M und x ∈ M fest gewählt, so heißt {y ∈ M | x R y} die Äquivalenzklasse von x bezüglich R, sie wird mit [ x ]R bezeichnet. Definition:
Eine Relation f auf M × N heißt Funktion (Abbildung), wenn 1. ∀x ∈ M ∃y ∈ N : x f y und 2. ∀x ∈ M ∀y1 , y2 ∈ N : x f y1 ∧ x f y2 ⇒ y1 = y 2 ist. Eine Funktion ist also eine Relation, bei der jedem Element aus M eindeutig ein Element aus N zugeordnet wird. Dies wird auch durch die Schreibweise f : M → N , x a f (x ) , ausgedrückt. Der Definitionsbereich Df ist also ganz M, während der Wertebereich Wf , für den man auch f (M) schreibt, im Allgemeinen eine echte Teilmenge von N, dem sogenannten Zielbereich, ist. Die Menge Gf = {( x, y ) ∈ M × N | y = f ( x)} heißt Graph von f. Besondere Eigenschaften einer Funktion f : M → N : surjektiv:
∀y ∈ N ∃x ∈ M : f ( x) = y , also f (M) = N.
injektiv:
∀x1 , x2 ∈ M : ( f ( x1 ) = f ( x2 ) ⇒ x1 = x2 ) , also haben verschiedene Argumente verschiedene Werte.
bijektiv:
surjektiv und injektiv
Ist f : M → N injektiv, so ist die auf dem Wertebereich Wf definierte Umkehrrelation auch eine Funktion, die sogenannte Umkehrfunktion f -1. Durch diese wird also jedem y ∈ Wf dasjenige eindeutig bestimmte x ∈ M zugeordnet, für das f ( x) = y gilt. f −1 : f ( M ) → M ist somit bijektiv und besitzt deshalb auch eine Umkehrfunktion, diese ist offensichtlich f. Definition:
Seien f : M → N und g : N → O Funktionen. Die Funktion g o f : M → O , die durch die Zuordnungsvorschrift ( g o f )( x) := g ( f ( x)) definiert ist, wird Komposition, Verknüpfung oder Hintereinanderausführung von g und f genannt.
M
N
Bild 1.2.1: surjektive Funktion
M
N
Bild 1.2.2: injektive Funktion
M
N
Bild 1.2.3: bijektive Funktion
1.3 Algebraische Strukturen
9
Offensichtlich gilt für beliebige Funktionen f : M → N und g : N → M : f und g sind Umkehrfunktionen zueinander ⇔ (∀x ∈ M : ( g o f )( x) = x ) ∧ (∀y ∈ N : ( f o g )( y) = y ) Man beachte, dass zur Äquivalenz beide All-Aussagen auf der rechten Seite gelten müssen!
1.3
Algebraische Strukturen
Definition:
Gegeben sei eine Menge M. Eine Funktion o : M × M → M heißt eine (innere) Verknüpfung auf M, ( M ,o) nennt man ein algebraisches System. Eine Verknüpfung heißt assoziativ kommutativ Sie besitzt ein neutrales Element
⇔
∀a, b, c ∈ M : a o (b o c) = (a o b) o c ,
⇔
∀a, b ∈ M : a o b = b o a .
⇔
∃e ∈ M ∀x ∈ M : x o e = e o x = x .
Ist die Verknüpfung assoziativ, so heißt ( M ,o) Halbgruppe; existiert zusätzlich ein neutrales Element, so liegt ein Monoid vor. Ein Monoid heißt Gruppe, wenn zusätzlich für jedes a ∈ M ein inverses Element b ∈ M existiert, sodass a o b = b o a = e gilt. Man kann zeigen, dass b eindeutig bestimmt ist, es wird meist mit a −1 bezeichnet. Ist die Gruppe zusätzlich kommutativ, so heißt sie abelsch. Die Menge aller natürlichen Zahlen ohne 0 bilden bezüglich der Addition eine Halbgruppe; nimmt man die 0 hinzu, so erhält man ein Monoid (genauso bezüglich der Multiplikation mit 1 als neutralem Element). Die Menge aller ganzen Zahlen bilden bezüglich der Addition eine abelsche Gruppe. Demgegenüber ist die Menge aller regulären (n, n) -Matrizen bezüglich der Matrizenmultiplikation (siehe 2.2) eine nicht-abelsche Gruppe. Eine nichtleere Teilmenge U einer Gruppe (G ,o) heißt Untergruppe von G, wenn (U ,o) (bezüglich der gleichen Verknüpfung) eine Gruppe ist. Äquivalent dazu ist, dass für alle a, b ∈ U auch a o b −1 ∈ U ist. Gibt es auf M eine zweite Verknüpfung, etwa ∗ , so erfüllen o und ∗ das Distributivgesetz, wenn für alle a, b, c ∈ M die Beziehung a ∗ (b o c) = (a ∗ b) o (a ∗ c) gilt (ggf. auch o und ∗ vertauscht). Ein Beispiel stellen ∪ und ∩ dar, die beide Distributivgesetze erfüllen. Häufig ersetzt man o durch + und ∗ durch ⋅.
10
1 Grundlagen
( R,+, ⋅ ) heißt Ring, wenn ( R,+) eine abelsche Gruppe, ( R, ⋅ ) eine Halbgruppe ist und die Distributivgesetze a ⋅ (b + c) = a ⋅ b + a ⋅ c und (a + b) ⋅ c = a ⋅ c + b ⋅ c gelten; er heißt kommutativ, wenn auch a ⋅ b = b ⋅ a auf R gilt. Üblicherweise wird das neutrale Element bezüglich + mit 0 bezeichnet, auch Nullelement genannt. Ist ( R, ⋅ ) ein Monoid, so heißt ( R,+, ⋅ ) Ring mit Eins(element), das neutrale Element bezüglich ⋅ wird meist mit 1 bezeichnet. Von 0 verschiedene Elemente x und y eines Rings heißen Nullteiler, wenn x ⋅ y = 0 ist. Umgekehrt heißt ein Ring nullteilerfrei, wenn aus x ⋅ y = 0 stets x = 0 oder y = 0 folgt. Einen nullteilerfreien, kommutativen Ring mit Eins nennt man Integritätsbereich. Die Menge aller quadratischen Matrizen der Größe n bildet bezüglich Addition und Multiplikation (siehe 2.2) einen Ring mit Einselement, der aber im Allgemeinen weder kommutativ noch nullteilerfrei ist, die Menge aller ganzen Zahlen (siehe 1.4) bildet hingegen einen Integritätsbereich. ( K ,+, ⋅ ) heißt Körper, wenn ( K ,+) und ( K \ {0}, ⋅ ) abelsche Gruppen sind und das Distributivgesetz a ⋅ (b + c) = a ⋅ b + a ⋅ c gilt. Da es außer den rationalen, reellen und komplexen Zahlen weitere wichtige Beispiele von Körpern gibt, sollen hier noch einmal die sogenannten Körperaxiome explizit aufgeführt werden: bezüglich der Addition: ∀a, b, c ∈ K : a + (b + c) = (a + b) + c ∀a, b ∈ K : a + b = b + a ∃ 0 ∈ K ∀a ∈ K : a + 0 = a ∀a ∈ K ∃(−a) ∈ K : a + (− a) = 0
(Assoziativgesetz) (Kommutativgesetz) (Existenz eines Nullelements) (Existenz eines Negativen)
bezüglich der Multiplikation (mit K* = K \ {0}): ∀a, b, c ∈ K : a ⋅ (b ⋅ c ) = (a ⋅ b) ⋅ c ∀a, b ∈ K : a ⋅ b = b ⋅ a ∃1 ∈ K ∀a ∈ K : a ⋅ 1 = a ∀a ∈ K * ∃ 1a ∈ K * : a ⋅ a1 = 1
(Assoziativgesetz) (Kommutativgesetz) (Existenz eines Einselements) (Existenz eines Reziproken)
bezüglich Addition und Multiplikation: ∀a, b, c ∈ K : a ⋅ (b + c) = a ⋅ b + a ⋅ c
(Distributivgesetz)
Definiert man für beliebige a ∈ K und b ∈ K (bzw. b ∈ K * ) die Umkehroperationen Suba 1 traktion bzw. Division in Körpern durch a − b := a + (−b) bzw. := a ⋅ , so lassen sich b b aus obigem minimalen Axiomensystem weitere Rechenregeln folgern, die in beliebigen Körpern gelten:
1.3 Algebraische Strukturen
11
Rechenregeln in Körpern:
(i)
−( − a ) = a
und
(ii)
a ⋅0 = 0⋅a = 0
und
(iii)
a+b = a+c ⇒ b = c
und
(iv) (v)
(−1) ⋅ a = −a a − (−b) = a + b a b a⋅e +b⋅d + = d e d ⋅e a b a ⋅b ⋅ = d e d ⋅e
und und
(vi) (vii)
1 1 d
=d
a ⋅ b = 0 ⇒ (a = 0 ∨ b = 0) Nullteilerfreiheit (a ⋅ b = a ⋅ c ) ⇒ (a = 0 ∨ b = c ) Kürzungsregeln (− a ) ⋅ b = − ab −( a + b) = − a − b
Während die bisher behandelten algebraischen Strukturen für das Rechnen im landläufigen Sinne benötigt werden, sollen nun auf einer Menge M solche algebraischen Systeme mit zwei Verknüpfungen ∪ und ∩ betrachtet werden, die sowohl in der Schaltungstechnik als auch in der Wahrscheinlichkeitstheorie angewandt werden. Definition:
Ein algebraisches System ( M ,∪,∩) heißt Verband, wenn bezüglich beider Verknüpfungen Assoziativ-, Kommutativ- und die sogenannten Absorptionsgesetze a ∪ (a ∩ b) = a und a ∩ (a ∪ b) = a gelten. Ein Element 1 ∈ M heißt Einselement des Verbands, wenn 1 ∩ a = a und 1 ∪ a = 1 für alle a ∈ M gilt. Analog heißt 0 ∈ M Nullelement, wenn 0 ∩ a = 0 und 0 ∪ a = a ist.
Ein Verband mit Null- und Einselement heißt komplementär, wenn es zu jedem a ∈ M ein a gibt, sodass a ∪ a = 1 und a ∩ a = 0 ist. Ein komplementärer Verband mit Eins- und Nullelement, in dem beide Distributivgesetze gelten, heißt BOOLEscher Verband oder BOOLEsche Algebra. In jedem Verband gelten die Idempotenzgesetze a ∪ a = a und a ∩ a = a . Die Notation der Verknüpfungen legt ein erstes Beispiel nahe: Für eine beliebige Menge Ω sei M deren Potenzmenge, ∪ und ∩ bezeichnen Vereinigung und Durchschnitt. Mit Ω als Eins- und der leeren Menge als Nullelement sowie der Differenzmengenbildung als Komplement ist M eine BOOLEsche Algebra.
12
1 Grundlagen
1.4
Zahlbereiche
Natürliche und ganze Zahlen, Teilbarkeit N = { 0, 1, 2, L} bezeichnet die Menge aller natürlichen Zahlen, N+ = N \ {0}. Die natürlichen Zahlen sind die kleinstmögliche Teilmenge der reellen Zahlen, die 0 und mit jedem n auch ihren Nachfolger n + 1 enthalten. Damit hat N zwar ein kleinstes 1), aber kein größtes Element. Es gilt vielmehr das Axiom von ARCHIMEDES: ∀x ∈ R ∃n ∈ n : n > x . N ist sowohl bezüglich Addition als auch Multiplikation ein Monoid. Z = {0,±1,±2, L} bildet die Menge der ganzen Zahlen. Diese bilden einen Integritätsbereich, aber keinen Körper, da es außer zu 1 und −1 kein Reziprokes in Z gibt. Definition:
a ∈ Z \ {0} heißt Teiler von b ∈ Z (anders ausgedrückt: a teilt b oder b ist durch a teilbar; geschrieben: a | b ) ⇔ ∃q ∈ Z : q ⋅ a = b p ∈ N, n ≥ 2, heißt Primzahl
⇔
∀ a, b ∈ Z : ( p | ( a ⋅ b) ⇒ p | a ∨ p | b )
⇔
p hat nur 1 oder sich selbst als positive Teiler
Für zwei gegebene ganze Zahlen a und b bezeichnet ggT (a, b) den größten gemeinsamen Teiler und kgV (a, b) das kleinste gemeinsame Vielfache von a und b. Zur Bestimmung von ggT (a, b) mit a, b > 0 und a ≥ b benutzt man den Divisionsalgorithmus von EUKLID:
Man dividiere a durch b ganzzahlig. Geht die Division auf, so ist b = ggT (a, b) . Ansonsten bleibt ein ganzzahliger Rest r1 < b , das heißt: a = q1 ⋅ b + r1 Nun dividiere man b durch r1, also b = q2 ⋅ r1 + r2 mit r2 < r1 , und fahre fort mit r1 durch r2, also r1 = q3 ⋅ r2 + r3 mit r3 < r2 , bis die Division aufgeht: rn−1 = qn+1 ⋅ rn . Der letzte von 0 verschiedene Rest rn = ggT (a, b) . Es gilt: c = ggT (a, b) ⇔ ∃ p, q ∈ Z : c = p ⋅ a + q ⋅ b . Insbesondere gilt, wenn a und b teilerfremd sind: ∃ p, q ∈ Z : 1 = p ⋅ a + q ⋅ b . Für festes n ∈ N, n ≥ 2 , und beliebiges a ∈ Z definiert man die Restklasse von a modulo n durch [a]n = {x ∈ z | a und x haben bei Teilung durch n den gleichen Rest} , anders formuliert: [a]n ist die Äquivalenzklasse von a bezüglich der durch a = b mod n ⇔ ∃ q ∈ z : a − b = q ⋅ n
1)
Manchmal wird 0 nicht zu den natürlichen Zahlen gezählt, dann gilt diese Beschreibung sinngemäß mit 1 statt 0.
1.4 Zahlbereiche
13
auf Z definierten Äquivalenzrelation. Da als Reste bei der Teilung durch n nur 0, 1, K , n − 1 infrage kommen, gibt es n verschiedene Restklassen modulo n. Die Menge aller dieser Restklassen wird mit Zn bezeichnet. Für obige Äquivalenzrelation gilt darüber hinaus:
(a = a′ mod n und b = b′ mod n )
⇒
(a + b = a′ + b′ mod n und a ⋅ b = a′ ⋅ b′ mod n )
Eine Äquivalenzrelation mit dieser Eigenschaft heißt Kongruenzrelation. Deshalb lassen sich auf Zn Addition und Multiplikation eindeutig definieren durch: [a]n + [b]n := [a + b]n
und [a]n ⋅ [b]n := [a ⋅ b]n
Mit diesen Verknüpfungen ist Zn – wie Z – ein kommutativer Ring mit Eins (mit n Elementen), aber im Allgemeinen kein Integritätsbereich. Es gilt jedoch: Zn ist ein Körper ⇔ n ist eine Primzahl Rationale und reelle Zahlen Die Menge aller Brüche { qp | p ∈ z ∧ q ∈ n + } heißt auch die Menge aller rationalen Zahlen
und wird mit Q bezeichnet. Die Darstellung einer rationalen Zahl durch Zähler und Nenner ist nicht eindeutig; erst durch die Forderung, Zähler und Nenner durch ggT ( p, q) zu dividieren, erhält man mit der vollständig gekürzten Darstellung Eindeutigkeit. Aus der vollständig gekürzten Bruchdarstellung erhält man durch Ausführen der Division die Darstellung einer rationalen Zahl als Dezimalbruch, die endlich oder periodisch sein kann, und zwar ist diese • • •
endlich, wenn der Nenner nur die Primzahlen 2 oder 5 enthält (etwa 1,23); rein-periodisch, wenn der Nenner nicht die Primzahlen 2 oder 5 enthält (etwa 1, 23 ); gemischt-periodisch, wenn neben 2 oder 5 noch mindestens eine andere Primzahl im Nenner vorkommt (etwa 1,2 3 ).
Alle anderen unendlichen Dezimalbrüche stellen irrationale Zahlen dar. Man unterscheidet dabei zwischen algebraischen Zahlen (das sind Nullstellen von Polynomen mit ganzzahligen Koeffizienten, siehe 3.2) und transzendenten Zahlen (alle übrigen irrationalen Zahlen, zum Beispiel π oder e). Rationale und irrationale Zahlen zusammen bilden die reellen Zahlen, mit R bezeichnet. Auf R stellt die übliche „ y oder x = y. Deshalb lassen sich die reellen Zahlen als Zahlengerade darstellen. Definition:
Eine Teilmenge I von r heißt Intervall ⇔ ∀s, t ∈ I ∀x ∈ R : s < x < t ⇒ x ∈ I Die Intervalle stellen die zusammenhängenden Teilmengen von R dar. Schreibweisen: [a, b] = {x ∈ r | a ≤ x ≤ b} abgeschlossen, ] a, b [= {x ∈ r | a < x < b} offen, [a, b [= {x ∈ r | a ≤ x < b} , ] a, b] = {x ∈ r | a < x ≤ b} halboffen.
14
1 Grundlagen
Es ist zu beachten, dass sich ohne die Voraussetzung a < b leere oder einelementige Intervalle ergeben können. Um diese degenerierten Fälle zu vermeiden, wird meist, wie auch hier, stillschweigend a < b vorausgesetzt. Definiert man ∞ als ein Element, das nicht zu R gehört, für das aber die Aussagen „x < ∞“ und „x > −∞“ für jedes x ∈ r wahr sein sollen, so lassen sich damit bequem unbeschränkte Intervalle schreiben, insbesondere: ] 0, ∞ [= {x ∈ r | 0 < x} = r + bzw. ] − ∞,0 [= {x ∈ r | x < 0} = r − bezeichnen die Menge aller positiven bzw. negativen reellen Zahlen, ] − ∞, ∞ [ ist eine andere Schreibweise für R.
a für a ≥ 0 Der (Absolut-) Betrag einer reellen Zahl, definiert als | a | = , stellt anschau− a für a < 0 lich den Abstand zwischen a und dem Nullpunkt auf der Zahlengeraden dar. Rechenregeln für den Absolutbetrag:
1.
| a | ≥ 0 und | a | = 0 ⇔ a = 0
2.
| a |≤ b ⇔ − b ≤ a ≤ b
3.
| a ⋅ b | = | a | ⋅ | b | und
4.
| a + b | ≤ | a | + | b | und | a − b | ≥ | a | − | b | (Dreiecksungleichungen)
a |a| = b |b|
Rationale und reelle Zahlen sind Körper; die rationalen Zahlen bilden den kleinsten Körper, der die natürlichen Zahlen enthält. Zum numerischen Rechnen und zum Messen reichen die rationalen Zahlen (genauer gesagt: eine Teilmenge davon 1)) stets aus. Dass man trotzdem in der Ingenieurmathematik die reellen und nicht die rationalen Zahlen als Zahlbereich zugrunde legt, liegt an der Q fehlenden Vollständigkeit. Ein Zahlbereich M (allgemein: ein metrischer Raum M) heißt vollständig, wenn in ihm jede CAUCHY-Folge (siehe Abschnitt 4.1) einen Grenzwert besitzt. R ist die Vervollständigung von Q, das heißt die hinzugefügten irrationalen Zahlen erhält man als Grenzwerte solcher rationaler CAUCHYFolgen, die in Q nicht konvergieren. Man sagt, dass Q dicht in R liegt. Für das praktische Rechnen heißt das, dass sich jede irrationale Zahl beliebig genau durch eine rationale Zahl annähern lässt. Dies geschieht zum Beispiel bei der Intervallschachtelung. Komplexe Zahlen
Für manche Anwendungen ist es sinnvoll, den Zahlbereich R zu den komplexen Zahlen C zu erweitern. Die zugrundeliegende Menge ist R × R, also die Menge aller geordneten Paare ( x, y ) reeller Zahlen. Auf R × R definiert man zwei Verknüpfungen durch: Addition: Multiplikation: 1)
( x1 , y1 ) + ( x2 , y2 ) = ( x1 + x2 , y1 + y 2 ) ( x1 , y1 ) ⋅ ( x2 , y2 ) = ( x1 ⋅ x2 − y1 ⋅ y2 , x1 ⋅ y2 + x2 ⋅ y1 )
Diese ist gemeint, wenn in der Informatik von reals (= reelle Zahlen!) die Rede ist.
1.4 Zahlbereiche
15
Mit den so definierten Verknüpfungen ist C ein Körper. Streng genommen ist R keine Teilmenge von C; identifiziert man jedoch jede reelle Zahl x mit dem Zahlenpaar (x,0) , so ist C eine Zahlbereichserweiterung von R. Mit i := (0,1) und obiger Identifikation gilt: i 2 = −1 und ( x, y ) = x + iy für alle x, y ∈ R. Die Zahl i heißt imaginäre Einheit 1) für z = x + iy ∈ c heißt x der Real- und y der Imaginärteil der komplexen Zahl z ( x = Re z und y = Im z ). Damit erhält man für das Rechnen mit komplexen Zahlen:
Man rechne mit Ausdrücken der Gestalt x + iy wie man es mit reellen Zahlen gewohnt ist, für i 2 setze man jeweils −1 ein. Da eine komplexe Zahl z durch ein Zahlenpaar (a, b) dargestellt wird, kann man sich z auch als Punkt in der Ebene (bzw. Vektor in der Ebene vom Nullpunkt aus) bezüglich eines kartesischen Koordinatensystems vorstellen. Man spricht in diesem Zusammenhang von der GAUSSschen Zahlenebene.
Bild 1.4.1: Komplexe Zahl z in der GAUSSschen Zahlenebene
Die waagerechte Achse stellt dann gerade die reellen Zahlen dar; auf der senkrechten Achse liegen die komplexen Zahlen, die keinen Realteil haben, die sogenannten (rein-)imaginären Zahlen. Beschreibt man den eine komplexe Zahl z in der GAUSSschen Zahlenebene darstellenden Punkt statt mit kartesischen Koordinaten (a, b) mit seinen Polarkoordinaten (r , ϕ ) , so erhält man die sogenannte trigonometrische (auch: EULERsche) Darstellung von z (siehe Bild 1.4.1). Die Polarkoordinate r wird Betrag von z genannt und mit | z | bezeichnet; φ heißt Argument von z – geschrieben arg z. Nach den Umrechnungsformeln zwischen kartesischen und Polarkoordinaten (siehe auch Abschnitt 1.8) gilt demnach:
| z | = (Re z ) 2 + (Im z ) 2 sowie arg z = arctan
1)
Im z + Korrekturterm 2) Re z
Manchmal, insbesondere bei Anwendungen in der Elektrotechnik, wird j statt i benutzt. Zu beachten ist außerdem, dass die häufig zu findende „Definition“ i = − 1 zu diversen Inkonsistenzen führt, sie ist deshalb Unsinn!
2)
Auf diesen wird in 1.8 genauer eingegangen.
16
1 Grundlagen
Bei gegebenen Polarkoordinaten ist Re z = | z | ⋅ cos(arg z ) und Im z = | z | ⋅ sin(arg z ) , insgesamt also z = | z | ⋅e i arg z , wobei für beliebiges α ∈ R e iα = cosα + i sin α definiert 1) ist. Mit der trigonometrischen Darstellung komplexer Zahlen lässt sich die Multiplikation in C anschaulich als Drehstreckung interpretieren: Bei der Multiplikation z1 ⋅ z 2 wird der z1 darstellende Vektor um den Faktor | z 2 | gestreckt und um den Winkel arg z 2 gedreht. Zudem ist diese Darstellung hilfreich beim ganzzahligen Potenzieren: Satz von DE MOIVRE:
∀n ∈ z ∀z ∈ c : z n = | z |n ⋅e in arg z
Damit ist das sogenannte „komplexe Wurzelziehen“ möglich. Da es im Gegensatz zu R in C keine lineare Ordnung gibt, kann es für q ∈ C auch nicht die eindeutig bestimmte Wurzel n
q geben; man kann lediglich die Menge aller z ∈ C bestimmen, die Lösungen der Glei-
chung z n = q (mit gegebenen n ∈ N, n ≥ 2, und q ∈ C) sind: Aus der EULERschen Darstellung q = | q | ⋅e i arg q erhält man die n verschiedenen Lösungen arg q 2π 2) z k = | z k | ⋅e iϕk ( k = 0, 1, K, n − 1 ) mit | z k | = n | q | und ϕ k = +k⋅ . n n Definition:
Für eine gegebene komplexe Zahl z = x + iy ist die zu z konjugiert komplexe Zahl z (manchmal auch mit z* bezeichnet) definiert durch z = x − iy . In der GAUSSschen Zahlenebene entspricht also der Übergang zur konjugiert komplexen Zahl einer Spiegelung an der reellen Achse. Es ist damit Re z = Re z und Im z = − Im z , aber auch | z | = | z | und arg z = − arg z . Rechenregeln:
1.
z=z
2.
z + z ∈r
und
Re z = 12 ( z + z )
3.
z − z ∈i ⋅r
und
Im z = 2i ( z − z )
4.
z ⋅ z ∈r
und
| z |= z ⋅ z
5.
z1 + z 2 = z1 + z 2 und
6.
z1 ⋅ z 2 = z1 ⋅ z 2
1) 2)
⇔
z∈R
und
z1 − z 2 = z1 − z 2 z1 z1 = z2 z 2
zur Definition der komplexen e-Funktion siehe auch Abschnitt 3.6 Liegen die Winkel in Grad statt im Bogenmaß vor, so ist 2π durch 360° zu ersetzen.
1.5 Die Arithmetik der reellen Zahlen
1.5
17
Die Arithmetik der reellen Zahlen
Potenz, Wurzel, Logarithmus
Der Potenzbegriff a b wird sukzessive – dem Aufbau des Zahlbereichs R folgend – definiert: 1. b ∈ N, a ∈ R: Für b ≥ 2 ist a b := a1 ⋅2 K4 ⋅ a ; zusätzlich a1 := a und, für a ≠ 0 , a 0 := 1 . 4 3 b − mal
1 2. b ∈ Z \ N, a ∈ R : a := −b (gemäß 1.) a 1 1 3. b = mit n ∈ N, n ≥ 2 (Stammbruch), a ∈ [ 0, +∞ [: a n := n a , wobei mit n *
b
n
a die ein-
deutig bestimmte nicht-negative Lösung der Gleichung x n = a bezeichnet wird. m
1 m m mit m, n ∈ N, n ≥ 2, a ∈ [ 0, +∞ [: a n := a n (gemäß 3. und 1.) n b 5. b irrational und positiv, a ∈ [ 0, +∞ [: a := lim a bk , wobei bk eine beliebige Folge positiver
4. b =
k →∞
rationaler Zahlen mit lim bk = b ist (vgl. 1.4) und a bk gemäß 4. berechnet wird. k →∞
6. b ∈ R −, a ∈ R+: a b =
1 a
b
=
1 (gemäß 3.-5.) a −b
Unter Beachtung der unterschiedlichen Definitionsbereiche für die Basis in Abhängigkeit vom Exponenten gelten die folgenden Potenz- und Wurzelgesetze: b
(i)
( x ⋅ y)b = x b ⋅ y b
(ii)
xb x = b y y
(iii)
(x )
(iv)
x b +c = x b ⋅ x c
(v)
n
(vi)
mn
b c
= x b⋅c
x⋅ y = n x ⋅n y
x = m⋅n x
Definition:
Für a > 0, b > 1 ist der Logarithmus zur Basis b definiert durch: x = log b a Schreibweisen: lg x = log10 x (Zehner-Logarithmus) ln x = log e x (natürlicher Logarithmus) ld x = log 2 x (dualer Logarithmus)
Durch Umkehrung der entsprechenden Potenzgesetze ergeben sich die
⇔ bx = a
18
1 Grundlagen
Logarithmengesetze:
Für beliebige b, c > 1, x, y > 0 und t ∈ R gilt: (i)
log b ( x ⋅ y ) = log b x + logb y
(ii)
log b
(iii)
log b x t = t ⋅ log b x
(iv)
log c x =
x = logb x − logb y y
log b x ln x = log b c ln c
(Basiswechselformel)
Summen- und Produktzeichen:
Es seien m, n ∈ N, a k ∈ R oder C. Dann bezeichnet n
n
∑a
k
∏a
:= am + am+1 + K + an bzw.
k =m
k
:= am
bzw.
k =m
∏a
k
:= am ,
falls m = n,
k
:= 1 ,
falls m > n ist 2).
k =m n
n
∑
:= am ⋅ am+1 ⋅ K ⋅ an , falls m < n 1),
n
n
∑a und
k
k =m
ak := 0
bzw.
k =m
∏a k =m
Rechenregeln für das Summenzeichen:
Mit m, n ∈ N, ak , bk , c ∈ R bzw. C gilt: n
(i)
∑
n
(ak + bk ) =
k =m
∑
n
ak +
k =m
∑
n
∑
(ii)
bk
k =m
k =m n
(iii)
Für jedes i ∈ N mit m ≤ i ≤ n gilt: n
∑a
i
k
k =m
= am +
∑a = ∑a k
k = m+1
Für beliebiges r ∈ Z ist
∑ k =m
1) 2)
k
,
k =i +1
k
+ an
(Abspalten eines Summanden)
k =m n
(iv)
n
k
k =m
k
k =m
n −1
n
k
∑a
∑a = ∑a + ∑a k =m
insbesondere:
n
c ⋅ ak = c
n+r
∑a
ak =
k −r
(Indexverschiebung)
k =m+ r
Man beachte, dass diese Summe n – m +1 (!) Summanden hat. Diese – mathematisch sinnvolle – Zusatzdefinition der „leeren Summe“ ist in manchen Programmiersprachen, die ein allgemeines Summensymbol haben, nicht vorhanden; beim Programmieren ist also Vorsicht geboten!
1.5 Die Arithmetik der reellen Zahlen
19
Häufig benutzte Summenformeln: n
∑k = 1+ 2 +K+ n =
(i)
k =1
n(n + 1) 2
(Summe der ersten natürlichen Zahlen)
n
∑ (2k − 1) = 1 + 3 + K + (2n − 1) = n
(ii)
2
(Summe der ersten n ungeraden Zahlen)
k =1 n
(iii)
∑ 2k = 2 + 4 + K + 2n = n(n + 1)
(Summe der ersten n geraden Zahlen)
k =1 n
(iv)
∑k
2
n(n + 1)(2n + 1) 6
= 1 + 4 + K + n2 =
k =1 n
∑
(v)
(2k − 1) 2 = 1 + 9 + K + (2n − 1) 2 =
k =1
n
(vi)
∑
k 3 = 1 + 8 + K + n3 =
k =1
(Summe der ersten n Quadratzahlen)
n(4n 2 − 1) 3
n 2 (n + 1) 2 n = k 4 k =1
2
∑
n
(vii)
∑ (2k − 1)
3
= 1 + 27 + K + (2n − 1)3 = n 2 (2n 2 − 1)
k =1 n
(viii)
∑
k 4 = 1 + 16 + K + n 4 =
k =1 n
(ix)
Für q ≠ 1 :
∑
qk =
k =0
q n+1 − 1 q −1
n
(x)
Für q ≠ 1 :
∑k ⋅q k =1
(xi)
n(n + 1)(2n + 1)(3n 2 + 3n − 1) 30
k −1
=
(endliche geometrische Reihe)
n q n+1 − (n + 1) q n + 1 (q − 1) 2
Für beliebige a, b ∈ R bzw. C, n ∈ N+: a n − b n = (a − b)
n−1
∑a k =0
1)
Für n = 2 ist dies gerade die bekannte dritte binomische Formel.
n−1− k
bk
1)
20
1 Grundlagen
Binomialkoeffizient und binomischer Satz: Definition:
n Für k, n ∈ N mit n ≥ k ist der Binomialkoeffizient (gelesen: „n über k“) definiert k n n n ⋅ (n − 1) ⋅ K ⋅ (n − (k − 1)) = 1 und = durch 1): 1⋅ 2 ⋅K ⋅ k 0 k
Unter Benutzung der Fakultät n!, definiert auf n + durch n !:= 1 ⋅ 2 ⋅K ⋅ n und zusätzlich 0! := 1, erhält man für den Binomialkoeffizienten bei n ≥ k : n n n n! = und damit = k k ! ⋅ ( n − k )! k n − k Der binomische Satz, eine Verallgemeinerung der bekannten binomischen Formel, lautet:
Für beliebige a, b ∈ R oder C, n ∈ N+, ist (a + b) n =
n
n
∑ k ⋅ a
n−k
bk .
k =0
Während der Teil über Summen- und Produktzeichen für reelle und komplexe Zahlen gilt, benutzen die folgenden Teile die Tatsache, dass R im Gegensatz zu C ein linear geordneter Körper ist. Infimum und Supremum von Teilmengen von R Definition:
Für M ⊆ R und a, b ∈ R ∪{+∞, −∞} heißt a untere Schranke von M, wenn
∀x ∈ M : a ≤ x ist;
b obere Schranke von M, wenn
∀x ∈ M : b ≥ x ist;
a Minimum von M ( a = min M ), wenn a untere Schranke und Element von M ist; b Maximum von M ( b = max M ), wenn b obere Schranke und Element von M ist; a Infimum von M ( a = inf M ), wenn a die größte untere Schranke von M ist; b Supremum von M ( b = sup M ), wenn b die kleinste obere Schranke von M ist. Jede Teilmenge M von R besitzt also sowohl untere und obere Schranken als auch Infimum und Supremum, aber nicht unbedingt Minimum oder Maximum. Ist M jedoch endlich, so gibt es stets min M und max M. Minimum bzw. Maximum sind – falls existent – auch Infimum bzw. Supremum von M. Ist M = ∅, so ist +∞ = inf M und −∞ = sup M .
1)
Später wird der Binomialkoeffizient noch allgemeiner (mit n ∈ R) definiert.
1.5 Die Arithmetik der reellen Zahlen
21
Spezielle Ungleichungen Definition verschiedener Mittelwerte: n
n
Für gegebene x1 , L , xn ∈ R heißen A =
1 n
∑x
k
arithmetisches und Q =
1 n
∑x
k =1
2 k
k =1 n
quadratisches Mittel. Sind zusätzlich alle xk positiv, so bezeichnen G = n
∏x
k
bzw.
k =1
H=
n n
∑ k =1
1 xk
geometrisches bzw. harmonisches Mittel.
n ≤ n x1 ⋅K ⋅ xn ≤ 1n ( x1 + K + xn ) 3 1 1 14 243 144244 +K+ A G x1 xn 142 4 43 4
Es gilt für beliebige positive xk:
H
Die letzte Beziehung ist nur dann eine Gleichheit, wenn alle xk gleich sind. Das quadratische Mittel ist stets größer oder gleich dem Betrag des arithmetischen Mittels, 2
also
| 1n ( x1 + K + xn ) | ≤
x1 + K + xn n
2
. n
CAUCHY-SCHWARZsche Ungleichung :
∑a b
k k
n
≤
k =1
∑a
2 k
n
⋅
∑b
2
k
, wobei Gleichheit
k =1
k =1
nur dann gilt, wenn es ein c ∈ R gibt, sodass ak = c ⋅ bk für alle k gilt. TSCHEBYSCHEFFsche Ungleichung :
Sind alle ak und bk positiv und beide Folgen n n n ak ⋅ bk ; es gilt die aufsteigend oder beide abfallend geordnet, so ist ak ⋅ bk ≤ n ⋅ k =1 k =1 k =1 umgekehrte Ungleichheit, wenn eine der beiden Folgen aufsteigend und die andere abfallend geordnet ist.
∑
∑
∑
BERNOULLIsche Ungleichung: (1 + a ) n ≥ 1 + n a , wobei a ∈ [−1, ∞ [ und n ∈ N+ ist. Dabei gilt Gleichheit nur für n = 1 oder a = 0.
22
1 Grundlagen
1.6
Elementare Geometrie
Strahlensätze
Bild 1.6.1: Zwei in S sich schneidende Geraden g1 und g2 werden von zwei Parallelen p1 und p2 geschnitten.
Es gelten folgende Proportionen sowie
r r+s s = = u u+v v x u r = = y u+v r+s
auf den Strahlen auf den Parallelen.
Dreiecke
Die üblichen Bezeichnungen für ein allgemeines Dreieck finden sich in Bild 1.6.2:
α + β + γ = 180° Bild 1.6.2: Allgemeines Dreieck ABC
Dabei bezeichnet hc die Höhe und mc die Mittelsenkrechte auf der Seite c sowie sc deren Seitenhalbierende (entsprechend für die anderen Seiten a und b). Mit wγ wird die in Bild 1.6.2 nicht eingezeichnete Winkelhalbierende des Winkels γ bezeichnet (entsprechend für die anderen Winkel α und β ). In jeweils einem Punkt schneiden sich a)
die Seitenhalbierenden, und zwar im Schwerpunkt S der Dreiecksfläche, S teilt jede Seitenhalbierende im Verhältnis 2:1;
b) die Winkelhalbierenden, und zwar ist dieser von allen Seiten gleich weit entfernt (Mittelpunkt des Inkreises);
1.6 Elementare Geometrie c)
23
die Höhen, die Schnittpunkte aus a), b) und c) liegen auf einer Geraden;
d) die Mittelsenkrechten, und zwar ist dieser von allen Eckpunkten gleich weit entfernt (Mittelpunkt des Umkreises – er kann außerhalb des Dreiecks liegen). Der Flächeninhalt F eines Dreiecks wird nach der Formel „halbe Grundseite × Höhe“ berechnet, also: F = 12 aha = 12 bhb = 12 chc = 12 ab sin γ = 12 bc sin α = 12 ac sin β . Mit dem halben Umfang s = 12 (a + b + c) erhält man a)
für den Flächeninhalt
F = s ( s − a)( s − b)( s − c) (HERONsche Formel),
b) für den Radius des Inkreises
r=
c)
R=
für den Radius des Umkreises
( s − a)( s − b)( s − c) , s abc 4 s ( s − a)( s − b)( s − c)
.
Zwei Dreiecke ABC und A'B'C' heißen kongruent, wenn sie deckungsgleich sind, das heißt, wenn sie durch eine Bewegung in der Ebene (Verschiebung, Drehung und/oder Spiegelung an einer Achse) ineinander übergeführt werden können. Kongruenz liegt vor, wenn einer der vier Fälle erfüllt ist: a)
Entsprechende Seiten in beiden Dreiecken sind gleich.
b) Zwei entsprechende Seiten und der eingeschlossene Winkel sind jeweils gleich. c)
Eine Seite sowie die anliegenden Winkel sind jeweils gleich.
d) Jeweils zwei Seiten und der der längeren Seite gegenüberliegende Winkel sind gleich. Zwei Dreiecke ABC und A'B'C' heißen ähnlich, wenn entsprechende Seiten im gleichen Verhältnis zueinander stehen, also wenn a : a′ = b : b′ = c : c′ ist. Äquivalent dazu ist, dass entsprechende Winkel übereinstimmen, also α = α ′ , β = β ′ und γ = γ ′ .
Bild 1.6.3: Ähnliche Dreiecke (Seitenverhältnis 3 : 2)
Die Flächen ähnlicher Dreiecke verhalten sich wie die Quadrate entsprechender Seiten (in Bild 1.6.3 also wie 9 : 4).
24
1 Grundlagen
Rechtwinklige Dreiecke
Bild 1.6.4: Rechtwinkliges Dreieck mit rechtem Winkel bei C
c2 = a2 + b2
Satz des PYTHAGORAS:
h2 = p ⋅ q c ⋅h a ⋅b = Flächeninhalt: F = 2 2 Höhensatz:
(Katheten-)Satz des EUKLID: b 2 = c ⋅ q und a 2 = c ⋅ p Gleichschenklige Dreiecke
Bild 1.6.5: Gleichschenkliges Dreieck mit Spitze C
Schenkel AC = BC = a , Basiswinkel rBAC = rCBA = α, h = mc = sc = wγ ; 4a 2 − c 2 = a cos γ2 = a sin α = 2c tan α = 2c cot γ2 ;
Höhe
h=
Flächeninhalt
F = 14 c 4a 2 − c 2 = 14 c 2 tan α = 12 a 2 tan γ .
1 2
Im gleichseitigen Dreieck, bei dem zusätzlich c = a und damit α = γ = 60° ist, vereinfachen sich diese Formeln zu Höhe
h = a⋅
3 , 2
Flächeninhalt
F = a2 ⋅
3 . 4
1.6 Elementare Geometrie
25
Allgemeines Viereck
Es gilt stets: α + β + γ + δ = 360° sowie
θ = 90° ⇔ a 2 + c 2 = b 2 + d 2 F = 12 ef sin θ =
4 e 2 f 2 − (b 2 + d 2 − a 2 − c 2 ) 2
1 4
Bild 1.6.6: Allgemeines Viereck
Parallelogramm, Raute (Rhombus), Rechteck
Es ist α = γ und β = δ , also α + β = 180° . Außerdem: h = b sin α , also F = ab sin α e 2 + f 2 = 2( a 2 + b 2 ) e = a 2 + b 2 + 2ab cosα f = a 2 + b 2 − 2ab cos α Bild 1.6.7: Parallelogramm
Bei einer Raute ist zusätzlich a = b, also θ = 90° ; obige Formeln vereinfachen sich zu F = a 2 sin α = 12 ef , e 2 + f 2 = 4a 2 , e = 2a cos
α 2
,
f = 2a sin
α
.
2 Ein Rechteck ist ein Parallelogramm, bei dem zusätzlich α = β = 90° ist. Deshalb ist
e = f = a 2 + b 2 , h = b und F = ab . Trapez
Es ist a c , h = d sin α = b sin β und F =
(a + c) ⋅ h 2
sowie e = a 2 + b 2 − 2ab cos β und
Bild 1.6.8: Trapez
e = a 2 + d 2 − 2ad cos α .
26
1 Grundlagen
Regelmäßiges n-Eck
a 2π π und und sin = n n 2r
Es ist φ =
a
somit r =
2 sin
Insgesamt:
a
sowie ρ =
π
2 tan
n F=
.
π n
n a2 4 tan
π n
Bild 1.6.9: Regelmäßiges n-Eck
Kreise und Kreisteile
Kreisumfang
U = 2π r
Kreisfläche
F = π r2
Bogenlänge
b=r
Kreissektorfläche
FA = r 2
Sehnenlänge
s = 2 r sin
α 180°
π
α 360°
π
α 2
Kreissegmentfläche FS =
r2 α π − sin α 2 180°
Bild 1.6.10: Kreis um M mit Radius r
1.7
Ebene Trigonometrie
Die Winkelmessung erfolgt in Grad (Vollkreis ≅ 360°) oder im Bogenmaß (Vollkreis ≅ 2π). b (Bezeichnungen wie in Bild 1.6.10), wegen der Proportionalität Dieses wird definiert als r
1.7 Ebene Trigonometrie
27
von Bogenlänge und Kreissektorwinkel α (gemessen in Grad) folgt aus
b
α
=
2π r : 360°
b α = ⋅π r 180° woraus man die zur Umrechnung von Grad in Bogenmaß gebräuchliche Merkregel erhält: °≅
π
Beispiel: 60° ≅ 60 ⋅
180
π 180
=
π 3
Gerichtete Winkel werden gegen den Uhrzeigersinn („links herum“) als positiv gezählt, die Richtung im Uhrzeigersinn ist negativ (bei der nautischen Navigation ist es genau umgekehrt!). Die Lage eines Punktes auf dem Einheitskreis (das ist der Kreis um den Ursprung des Koordinatensystems mit Radius 1) ist einerseits durch die Angabe seiner kartesischen Koordinaten eindeutig bestimmt. Andererseits ist er durch den gerichteten Winkel, den der Radiusvektor dieses Punktes Px mit der positiven x-Achse bildet, genauso eindeutig festgelegt (siehe Bild 1.7.1). Es besteht also eine eineindeutige Beziehung zwischen dem in Bild 1.7.1 mit x
Bild 1.7.1: Die trigonometrischen Funktionswerte am Einheitskreis
bezeichneten Winkel und den Koordinaten des Punktes auf der Kreisperipherie, die zur Definition der trigonometrischen Funktionswerte führt: Mit cos x wird die Abszisse und mit sin x die Ordinate des durch den gerichteten Winkel x eindeutig bestimmten Punktes Px auf dem Einheitskreis bezeichnet. Daraus ergeben sich sofort folgende elementaren Eigenschaften von Kosinus und Sinus (Entsprechendes gilt im Bogenmaß – dann ist jedoch „90°“ durch „ π2 “ etc. zu ersetzen): 1.
−1 ≤ cos x ≤ 1
2.
sin 2 x + cos 2 x = 1
3.
sin 0° = sin 360° = 0 , cos 0° = cos 360° = 1 ; sin 90° = 1 , cos 90° = 0 ; sin 180° = 0 und cos180° = −1 ; sin 270° = −1 und cos 270° = 0
und
−1 ≤ sin x ≤ 1 (folgt aus dem Satz des PYTHAGORAS)
28
1 Grundlagen 4.
sin( − x ) = − sin x ,
cos(− x) = cos x
5.
sin(360° + x) = sin x ,
cos(360° + x) = cos x
6.
sin(180° + x) = − sin x ,
cos(180° + x) = − cos x
7.
sin(90° + x) = cos x ,
cos(90° + x) = − sin x
Mittels Sinus und Kosinus werden definiert:
tan x =
sin x cos x und cot x = cos x sin x
Im Gegensatz zu Sinus und Kosinus, die für jeden Winkel definiert sind, lassen sich Tangens und Kotangens für bestimmte Winkel nicht berechnen, und zwar sind tan 90° und tan 270° undefiniert, genauso wie cot 0° und cot 180° . Zufolge der Definition und aufgrund der Ähnlichkeit entsprechender Dreiecke (eine Dreiecksseite hat jeweils die Länge 1) lassen sich tan x und cot x wie in Bild 1.7.1 anschaulich darstellen. Im Gegensatz zu Sinus- und Kosinusfunktion wiederholen sich die Werte von Tangens und Kotangens bereits nach einem Halbkreis (180°): tan(180° + x) = tan x ,
cot(180° + x) = cot x ,
nach einem Viertelkreis (90°) gilt: tan(90° + x) = − cot x ,
cot(90° + x) = − tan x .
Wichtige Werte der trigonometrischen Funktionen im ersten Quadranten (die anderen lassen sich mittels obiger Formeln daraus berechnen) sind in folgender Tabelle zusammengestellt:
sin x
Winkel (in °)
Bogenmaß
0
0
1 2
0 =0
30
π
1 2
1=
45
π
60
π
90
π
6
4
3
2
1 2
1 2
cos x
tan x
cot x
1
0
nicht def.
1 2
3
1 2
2
1 2
2
1 2
3
1 2
4 =1
0
3
1 3
3
1 3 nicht def.
1 3
1 3
0
1.7 Ebene Trigonometrie
29
Trigonometrische Funktionen am rechtwinkligen Dreieck
Bild 1.7.2 zeigt ein rechtwinkliges Dreieck mit dem rechten Winkel bei B. Darin eingezeichnet ist das dazu ähnliche Dreieck aus Bild 1.7.1.
Bild 1.7.2: Trigonometrie am rechtwinkligen Dreieck
Aus Strahlensätzen:
cos α =
cos α c a a c = , sin α = , tan α = , cot α = . 1 b b c a
Als Merkregel: Kosinus = Ankathete / Hypotenuse
Sinus = Gegenkathete / Hypotenuse
Tangens = Gegenkathete / Ankathete
Kotangens = Ankathete / Gegenkathete
Bild 1.7.4: Zu Sinus- und Kosinussatz
Sinussatz:
a b c = = sin α sin β sin γ
Kosinussatz:
a 2 = b 2 + c 2 − 2bc cos α c 2 = a 2 + b 2 − 2ab cos γ
b 2 = a 2 + c 2 − 2ac cos β
30
1 Grundlagen
Ist insbesondere γ ein rechter Winkel, so ist die letzte Gleichung der Satz des PYTHAGORAS; der Kosinussatz heißt deshalb manchmal auch der verallgemeinerte Satz des PYTHAGORAS. Weitere wichtige trigonometrische Formeln finden sich in Abschnitt 3.5.
1.8
Koordinatensysteme
In der Ebene ist ein Punkt P (siehe dazu Bild 1.8.1) durch seine kartesischen Koordinaten ( x, y ) , also durch ein Paar (beliebiger) reeller Zahlen gegeben. Genauso kann die Lage von P eindeutig durch die im selben Bild mit r und φ bezeichneten Polarkoordinaten beschrieben werden:
r ist der Abstand zwischen 0 und P, also gilt stets:
r ≥ 0.
φ ist der gerichtete Winkel zwischen der positiven x-Achse und der Verbindungsstrecke 0P auf dem kürzeren Weg; liegt P auf der negativen x-Achse, so wird die mathematisch positive Richtung gewählt, ist P = 0, so ist φ unbestimmt, die Lage von P ist dann bereits durch die r-Koordinate eindeutig bestimmt. Es ist also ϕ ∈] − π , π ] (bzw. ] − 180°,180°] ).
Es sei darauf hingewiesen, dass manchmal auch die Winkelmessung nur in mathematisch positiver Richtung vorgenommen wird – dann ist ϕ ∈ [ 0,2π [ (bzw. [0°,360°[) .
Bild 1.8.1: Kartesische und Polarkoordinaten in der Ebene
Berechnung der Polarkoordinaten aus den kartesischen Koordinaten von P: r = x2 + y2
für beliebige Lagen von P
1.8 Koordinatensysteme
ϕ = arctan
y + k ⋅π x
31 1)
mit k ∈ { 0, 1,−1} vom Quadranten abhängig, und zwar:
0 falls P im 1. oder 4. Quadranten liegt (also x > 0), k = 1 falls P im 2. Quadranten liegt (also x < 0 und y > 0), − 1 falls P im 3. Quadranten liegt (also x < 0 und y < 0). Bei Winkelmessung nur mit positiven Werten ist 0 falls P im 1. Quadranten liegt, k = 1 falls P im 2. oder 3. Quadranten liegt, 2 falls P im 4. Quadranten liegt. Berechnung der kartesischen Koordinaten aus den Polarkoordinaten von P: x = r cos ϕ , y = r sin ϕ
für beliebige Lagen von P
Polarkoordinaten werden nicht nur bei der trigonometrischen Darstellung komplexer Zahlen (siehe 1.4) oder bei der Klassifikation von Kegelschnitten (siehe 1.9), sondern auch bei der Doppelintegration oder der Lösung von Differentialgleichungen benutzt. Koordinatensysteme im dreidimensionalen Raum Die Lage eines Punktes P im dreidimensionalen Raum, der bezüglich eines kartesischen Koordinatensystems durch das Tripel ( x, y, z ) gegeben ist, kann unter Benutzung der oben eingeführten Polarkoordinaten auch folgendermaßen beschrieben werden:
Bild 1.8.2: Zylinder- und Kugelkoordinaten
1)
Bei Winkelmessung in Grad ist π durch 180° zu ersetzen.
32
1 Grundlagen
Bei den sogenannten Zylinderkoordinaten wird der Punkt P0, den man als senkrechte Projektion von P in die ( x, y ) -Ebene erhält (siehe Bild 1.8.2), mit seinen Polarkoordinaten (r0 , ϕ ) beschrieben, als dritte Zylinderkoordinate wird z übernommen. Der Zusammenhang zwischen den kartesischen Koordinaten ( x, y, z ) und den Zylinderkoordinaten (r0 , ϕ , z ) ist also gegeben durch: y + k ⋅ π , wobei k genauso wie oben von der Lage von P0 im x jeweiligen Quadranten der ( x, y ) -Ebene abhängt,
r0 = x 2 + y 2 und ϕ = arctan
x = r0 cos ϕ , y = r0 sin ϕ für beliebige Lagen von P. Bei der Beschreibung mittels Kugelkoordinaten wird die Höhe z durch die Entfernung von P vom Koordinatenursprung sowie die Größe des gerichteten Winkels zwischen 0P0 und 0P (in Bild 1.8.2 mit r bzw. ψ bezeichnet) dargestellt, ψ ∈ [−
π π
, ] bzw. ψ ∈ [−90°,90°] . Mit 2 2 r und ψ ist r0 = r cosψ , womit man für den Zusammenhang zwischen den kartesischen Koordinaten ( x, y, z ) und den Kugelkoordinaten (r , ϕ ,ψ ) erhält: r = x 2 + y 2 + z 2 , ϕ = arctan
y z + k ⋅ π 1), ψ = arcsin 2 x x + y2 + z2
sowie x = r cos ϕ cosψ , y = r sin ϕ cosψ , z = r sin ψ
Übergänge zu anderen kartesischen Koordinatensystemen in der Ebene bzw. im Raum, die anschaulich der Verschiebung des Koordinatenursprungs oder der Drehung um Nullpunkt bzw. eine Koordinatenachse entsprechen, können mit Methoden der Linearen Algebra (siehe hierzu Abschnitt 2.6) beschrieben werden.
1.9
Kegelschnitte
Kegelschnitte sind ebene Kurven, die sich beim Schnitt eines geraden Kreiskegels mit einer Ebene ergeben. Aus der Anschauung ist klar, dass danach auch die leere Menge, ein einzelner Punkt oder eine Gerade im Raum Kegelschnitte sind. Als nichttriviale Beispiele ergeben sich Ellipsen (insbesondere Kreise), Hyperbeln und Parabeln, die in diesem Abschnitt näher behandelt werden sollen. Die allgemeine Gleichung eines Kegelschnitts lautet:
1)
Für den Korrekturfaktor k gilt das bei Polar- und Zylinderkoordinaten Gesagte.
1.9 Kegelschnitte
33
Ax 2 + By 2 + Fxy + Cx + Dy + E = 0
mit festen A, … , F ∈ R
Durch Drehung des Koordinatensystems in der Schnittebene kann man stets erreichen, dass der gemischte Term Fxy wegfällt; in diesem Koordinatensystem sind die Symmetrieachsen des Kegelschnitts parallel zu den Koordinatenachsen, man erhält als Gleichung eines Kegelschnitts in achsenparalleler Lage: Ax 2 + By 2 + Cx + Dy + E = 0
mit festen A, … , E ∈ R
(1.9.1)
Ferner sollen A und B nicht gleichzeitig verschwinden, da sich sonst Geraden ergeben. Ohne Beschränkung der Allgemeingültigkeit sei A ≠ 0 , sodass sich die letzte Gleichung auf die Form x2 + α y2 + β x + γ y + δ = 0
(1.9.2)
bringen lässt. Ist δ = 0, so geht die Kurve durch den Ursprung, sonst nicht.
Ellipse
β2
γ2
> 0 , so lässt sich für α > 0 (!) diese Gleichung mit quadratischer Ergän4 4 zung umformen auf
Ist − δ +
+
( x − x0 ) 2 ( y − y0 ) 2 + = 1, a2 b2
(1.9.3)
man erhält die Gleichung einer Ellipse mit dem Mittelpunkt M = ( x0 , y0 ) und den Halbachsen a und b.
Bild 1.9.1: Achsenparallele Ellipse in allgemeiner Lage
Häufig liegt der Mittelpunkt der Ellipse im Ursprung; (1.9.3) vereinfacht sich dann zur sogenannten Mittelpunkts- oder Ursprungsgleichung x2 y2 + = 1. a2 b2
(1.9.4)
34
1 Grundlagen
Ist a = b = R, so ergibt sich als Spezialfall der Ellipse ein Kreis; (1.9.3) wird dann zu ( x − x0 ) 2 + ( y − y0 ) 2 = R 2 ,
(1.9.5)
der allgemeinen Kreisgleichung, die für den Fall, dass Mittelpunkt und Ursprung zusammenfallen, die besonders einfache Form x 2 + y 2 = R 2 annimmt. Auf der Verlängerung der größeren Halbachse (in Bild 1.9.1 ist das a) liegen die beiden Brennpunkte F1 und F2, und zwar jeweils in Entfernung e = a 2 − b 2 vom Mittelpunkt M. Die Brennpunkte sind geometrisch durch folgende Eigenschaft gekennzeichnet:
PF1 + PF2 = 2a = const. für jeden Punkt P auf der Ellipse Der Ausdruck ε =
a2 − b2 heißt numerische Exzentrizität. Offensichtlich ist ε < 1 . a
Beim Spezialfall Kreis fallen Brennpunkte und Mittelpunkt zusammen, die numerische Exzentrizität ist dann 0. Ellipsen lassen sich auch mittels Polarkoordinaten (r , ϕ ) beschreiben. Fallen Mittelpunkt und Ursprung zusammen, so ergibt sich aus (1.9.4): r=
b 2
1 − ε cos 2 ϕ
mit ε < 1
(1.9.6)
Für den Kreis in Ursprungslage, also für a = b = R und ε = 0 , ist damit einfach r = R die gesuchte Gleichung. Für eine Ellipse mit M = ( a 2 − b 2 ,0) – der linke Brennpunkt liegt also im Ursprung – wird beim Übergang zu Polarkoordinaten aus (1.9.3): r=
b2 p . mit ε < 1 und p = a 1− ε cos ϕ
(1.9.7)
Liegt der rechte Brennpunkt im Ursprung, ist also M = (− a 2 − b 2 ,0) , so ergibt sich r=
b2 p . mit ε < 1 und p = a 1+ ε cos ϕ
(1.9.8)
Die Parameterdarstellung einer Ellipse mit Mittelpunkt M = ( x0 , y0 ) , wie sie in Bild 1.9.1 dargestellt ist, lautet (mit t ∈ [ 0, 2π [ ): x = x0 + a cos t y = y0 + b sin t
1.9 Kegelschnitte
35
Hyperbel
Bild 1.9.2: Achsenparallele Hyperbel in allgemeiner Lage
Ist in (1.9.2) − δ +
β2 4
+
γ2 4
> 0 und α < 0 (!), so lässt sich die Gleichung umformen auf
( x − x0 ) 2 ( y − y 0 ) 2 − = 1, a2 b2
(1.9.9)
man erhält die Gleichung einer Hyperbel mit dem Mittelpunkt M = ( x0 , y0 ) und den Halbachsen a und b (siehe Bild 1.9.2). Liegt der Mittelpunkt der Hyperbel im Ursprung, vereinfacht sich (1.9.9) zur Mittelpunktsoder Ursprungsgleichung x2 y2 − =1. a2 b2
(1.9.10)
b ( x − x0 ) sind die Asymptoten der Hyperbel; sie a schneiden sich in M und sind die Diagonalen des in Bild 1.9.2 gestrichelt gezeichneten Rechtecks mit den Kantenlängen 2a und 2b.
Die Funktionsgraphen von y = y0 ±
Auf der Verlängerung der größeren Halbachse (in Bild 1.9.2 ist das a) liegen die beiden Brennpunkte F1 und F2, und zwar jeweils in Entfernung e = a 2 + b 2 vom Mittelpunkt M, also im Innern der Hyperbeläste. Die Brennpunkte sind geometrisch durch folgende Eigenschaft gekennzeichnet: | PF1 − PF2 |= 2a = const. für jeden Punkt P auf der Hyperbel Der Ausdruck ε =
ε >1.
a2 + b2 bezeichnet hier die numerische Exzentrizität. Offensichtlich ist a
36
1 Grundlagen
Beim Übergang zu Polarkoordinaten (r , ϕ ) ergeben sich für Hyperbeln sehr ähnliche Formeln wie bei Ellipsen, nämlich b
für Mittelpunkt im Ursprung:
r=
für linker Brennpunkt im Ursprung:
r=
p , ε cos ϕ ± 1
(1.9.12)
für rechter Brennpunkt im Ursprung:
r=
−p . ε cos ϕ ± 1
(1.9.13)
2
ε cos 2 ϕ − 1
,
(1.9.11)
Das obere Vorzeichen beschreibt den linken, das untere Vorzeichen den rechten Hyperbelast. Auch hier ist, wie bei Ellipsen, p =
b2 ; man beachte jedoch, dass wegen der abweichenden a
Definition der numerischen Exzentrizität als ε =
a2 + b2 hier stets ε > 1 ist. a
Die Parameterdarstellung einer Hyperbel mit Mittelpunkt M = ( x0 , y0 ) , wie sie in Bild 1.9.2 dargestellt ist, lautet (mit t ∈ R): x = x0 m a cosh t y = y0 + b sinh t Wieder bezeichnet das obere Vorzeichen den linken und das untere den rechten Hyperbelast. Parabel
Ist in (1.9.2) α = 0 und γ ≠ 0 (sonst entsteht kein nichttrivialer Kegelschnitt), so lässt sich (1.9.2) schreiben als ( x − x0 ) 2 = 2 p ( y − y0 )
mit p ≠ 0
(1.9.14)
Die Parabel ist für positive p nach oben und für negative p nach unten geöffnet. ( x0 , y0 ) sind p die Koordinaten des Scheitelpunkts S, ( x0 , y0 + ) die des Brennpunkts F. Dieser liegt also 2 | p| stets im Innern der Parabel und ist um von S entfernt (siehe Bild 1.9.3). 2
1.9 Kegelschnitte
37
Bild 1.9.3: Parabel in allgemeiner Lage
Liegt der Scheitel im Ursprung, so vereinfacht sich (1.9.14) zur Scheitelgleichung y=
1 2 x . 2p
(1.9.15)
Für diese Lage – Scheitelpunkt im Ursprung des Koordinatensystems – lässt sich leicht aus (1.9.15) der Übergang zu Polarkoordinaten (r , ϕ ) vollziehen: r = 2 p sin ϕ (1 + tan 2 ϕ )
(1.9.16)
Liegt der Brennpunkt F im Ursprung des Koordinatensystems, also S = (0,−
p ) , so ergibt 2
sich aus (1.9.14) r=
p für p > 0 1 − sin ϕ
insgesamt
r=
und
| p| 1 − sign ( p) ⋅ sin ϕ
r=
| p| 1 + sin ϕ
für p < 0 ,
für beliebige p ≠ 0.
(1.9.17)
Eine Parameterdarstellung der in Bild 1.9.3 skizzierten Parabel ist mit t ∈ R gegeben durch x = x0 + t ,
y = y0 +
t2 2p
(1.9.18)
Allgemeine Bemerkung:
Damit (1.9.1) die Gleichung eines nichttrivialen Kegelschnitts ist, dürfen nicht beide quadratischen Terme gleichzeitig verschwinden. Hier wurde vorausgesetzt, dass dies stets x 2 ist. Fordert man nun, dass y 2 stets vorkommen soll, so ändert sich bei der Ellipse nichts, da
38
1 Grundlagen
wegen des „+“ in (1.9.3) x- und y-Terme miteinander vertauschbar sind. Ergibt sich statt (1.9.9) die Gleichung ( y − y0 ) 2 ( x − x0 ) 2 − = 1, b2 a2 in der x 2 und y 2 ihre Rollen getauscht haben, so stellt dies eine Hyperbel dar, bei der die Hyperbeläste statt nach links bzw. rechts nach oben bzw. unten geöffnet sind. a2 + b2 und den Parameter p als b
Definiert man nun die numerische Exzentrizität als ε =
a2 , so ergeben sich für die Darstellung in Polarkoordinaten (r , ϕ ) ganz ähnliche Ausb drücke wie in (1.9.11) – (1.9.13), im Einzelnen p=
für Mittelpunkt im Ursprung:
r=
für oberer Brennpunkt im Ursprung:
r=
für unterer Brennpunkt im Ursprung:
r=
a 2
ε sin 2 ϕ − 1
,
−p , ε sin ϕ m 1
p
ε sin ϕ m 1
.
Das obere Vorzeichen beschreibt den oberen, das untere Vorzeichen den unteren Ast. Etwas anders verhält es sich bei Parabeln, da hier nur ein quadratischer Term vorkommt: In (1.9.1) ist nun A = 0 und B ≠ 0. Die Gleichungen (1.9.14) – (1.9.17) werden zu ( y − y0 ) 2 = 2 p ( x − x0 ) ,
r = 2 p cosϕ (1 + cot 2 ϕ )
und
x=
1 2 y , 2p
r=
| p| . 1 − sign ( p) ⋅ cos ϕ
Vergleicht man nun die letzte Gleichung mit (1.9.8), (1.9.12) und (1.9.13), so erhält man als Zusammenfassung folgendes Resultat: | p| Die Polarkoordinatengleichung r= stellt stets einen Kegelschnitt dar, des1 + ε ⋅ cos ϕ sen einer Brennpunkt im Ursprung des Koordinatensystems liegt, und zwar
1.10 Räumliche Körper
39
für ε > 1 eine Hyperbel, für ε = 1 eine Parabel, für ε ∈]0,1[ eine Ellipse, für ε = 0 einen Kreis;
ε und p bestimmen wie oben beschrieben die Halbachsen.
1.10
Räumliche Körper
In diesem Abschnitt sollen Körper im eigentlichen (umgangssprachlichen) Sinne, also nicht die im Abschnitt 1.3 vorgestellten algebraischen Strukturen gleichen Namens, betrachtet werden. Die Thematik ist Teil der sogenannten Stereometrie. Ein Körper in diesem Sinne ist also eine allseitig von einer Fläche oder zusammenhängenden Flächenstücken begrenzte Teilmenge des dreidimensionalen Raumes. Die Art der begrenzenden Flächen, eben oder gekrümmt, führt zu einer natürlichen Einteilung der entsprechenden Körper. Es sollen hier vor allem die Volumina und Oberflächen der verschiedenen Körper behandelt werden. Wichtig für die Berechnung des Volumens „verschobener“ oder „verdrehter“ Körper ist das Prinzip von CAVALIERI:
Zwei Körper besitzen dasselbe Volumen, wenn all ihre Schnittflächen mit zu einer Grundebene parallelen Ebenen in entsprechenden Höhen den gleichen Flächeninhalt haben. Anschaulich lässt sich dies etwa folgendermaßen interpretieren: Verdreht man einen quadratischen Abreißblock schraubenförmig, so ändert sich sein Volumen nicht, es lässt sich anhand der quaderförmigen Grundform leicht bestimmen. Obiger Sachverhalt, in der Literatur auch als Satz von CAVALIERI bekannt, wurde bereits Mitte des 17. Jahrhunderts formuliert. In der Integralrechnung, mit deren Hilfe die meisten der hier vorgestellten Ergebnisse erhalten werden1), gilt der Satz als Spezialfall des allgemeineren Satzes von FUBINI. A. Körper mit ebenen Begrenzungsflächen (Polyeder)
Als Polyeder (Vielflach) bezeichnet man einen Körper, der nur von ebenen Vielecken begrenzt wird. Den Zusammenhang zwischen den Anzahlen von Ecken (E), Kanten (K) und Flächen (F) beschreibt der
1)
siehe dazu auch Abschnitt 5.4
40
1 Grundlagen
EULERsche Polyedersatz:
E−K+F =2 Definition:
(i) Ein Polyeder, bei dem die beiden Grundflächen G1 und G2 kongruente Vielecke sind und in zueinander parallelen Ebenen liegen und bei dem die Seitenflächen Parallelogramme sind, heißt Prisma. (ii) Sind die Grundflächen Parallelogramme, so heißt es Spat oder Parallelepiped. (iii) Ein Prisma heißt gerade, wenn die Seitenkanten senkrecht auf den Grundflächen stehen. (iv) Ein Prisma heißt regulär, wenn es gerade ist und die Grundflächen reguläre n-Ecke sind. Bezeichnet G den Flächeninhalt von G1 bzw. G2 und h den Abstand der beiden parallelen Ebenen, so ist das Volumen eines Prismas stets V = G⋅h . Wird ein Parallelepiped von den drei linear unabhängigen Vektoren a, b und c aufgespannt, so gilt für dessen Volumen mit den Bezeichnungen aus Kapitel 2 V = | (a × b ) ⋅ c | . Deshalb heißt der Ausdruck (a × b) ⋅ c auch Spatprodukt von a, b und c. Ist bei einem geraden Prisma die Grundfläche ein Rechteck, so ergibt sich ein Quader (Kanten seien a,b und c), dann gilt für Volumen V und Oberfläche O: V = abc und O = 2(ab + ac + bc) Die vier Raumdiagonalen schneiden sich in einem Punkt, sie haben die Länge d = a2 + b2 + c2 . Liegt der Spezialfall eines Würfels vor (also a = b = c ), so vereinfachen sich obige Formeln: V = a3
O = 6a 2
d =a 3
Bei einem regulären Prisma mit Höhe h und einem regelmäßigen n-Eck mit Kantenlänge a als Grundfläche besteht die Mantelfläche aus n Rechtecken, jeweils mit Flächeninhalt a ⋅ h . Nach Abschnitt 1.6 ergibt sich für die Grundfläche (regelmäßiges n-Eck) G =
na 2 4 tan
Damit ist V =
nha 2 4 tan
π n
a + nah = na + h . und O = 2G + n ⋅ ah = π π 2 tan 2 tan n n na 2
π n
.
1.10 Räumliche Körper
41
Definition:
Ein Polyeder, dessen Grundfläche G ein beliebiges n-Eck ist und dessen Seitenflächen Dreiecke sind, die sich in einem Punkt S, der sogenannten Spitze, treffen, heißt Pyramide. Ist die Grundfläche ein regelmäßiges n-Eck derart, dass das Lot von S auf G diese in ihrem Mittelpunkt trifft, so heißt die Pyramide regulär. Die Seitenflächen sind kongruente Dreiecke. Schneidet man von einer Pyramide durch eine zur Grundfläche parallele Ebene den oberen Teil ab, so entsteht ein Pyramidenstumpf; die beiden parallelen Polyederflächen sind ähnlich zueinander, die Seitenflächen sind Trapeze. Bezeichnet h den Abstand der Spitze von der Grundfläche (die Höhe der Pyramide), so erhält man das Volumen einer Pyramide als V =
1 G⋅h. 3
Eine Pyramide mit einem Dreieck als Grundfläche heißt Tetraeder. Da auch die Seitenflächen Dreiecke sind, ist ein Tetraeder ein durch vier Dreiecke begrenztes Polyeder. Man kann jede der Dreiecksflächen als Grundfläche auffassen. Für den Sonderfall, dass alle vier Dreiecke kongruent und gleichseitig (mit Seitenlänge a) sind, lassen sich Volumen, Oberfläche und Körperhöhe angeben: V =
a3 2 12
O = a2 3
h=
a 6 3
Bezeichnet bei einem Pyramidenstumpf G die Grund-, g die Deckfläche und h deren Abstand, so gilt für das Volumen: V =
1 (G + G ⋅ g + g ) 3
B. Körper mit gekrümmten Begrenzungsflächen
Körper mit gekrümmter Begrenzungsfläche entstehen häufig durch die Rotation einer ebenen Fläche um eine Drehachse, die in der gleichen Ebene liegt, die erzeugende Fläche aber nicht schneidet. Zur Bestimmung von Mantelfläche und Volumen ist der folgende Satz oft sehr hilfreich: GULDINsche Regeln: 1. Die Mantelfläche M eines wie oben beschriebenen Rotationskörpers ist das Produkt aus der Länge des die rotierende Fläche begrenzenden Bogenstücks l und der von seinem Schwerpunkt SB beschriebenen Kreiswegs. Bezeichnet R den Abstand des Schwerpunkts von der Drehachse, so ist also
M = 2π R ⋅ l .
42
1 Grundlagen
2. Das Volumen V eines solchen Rotationskörpers ist das Produkt aus dem Inhalt A der rotierenden Fläche und der Länge des von ihrem Schwerpunkt SA beschriebenen Kreiswegs. Bezeichnet R den Abstand des Schwerpunkts von der Drehachse, so ist also V = 2π R ⋅ A .
Sowohl Bogenlängen als auch Schwerpunktlagen lassen sich meist nur mittels Integralrechnung bestimmen; deshalb sei an dieser Stelle auf die Abschnitte 5.4 und 6.1 verwiesen. Ein Beispiel für die Anwendung der GULDINschen Regeln mit elementaren Mitteln stellt der Torus dar. Dabei rotiert ein Kreis mit Radius r und Mittelpunkt (R, 0) (mit r < R) um die yAchse. Es entsteht ein Torus, auch Kreisring genannt (siehe Bild 1.10.1).
Bild 1.10.1: Rotierender Kreis und Torus
Der Schwerpunkt sowohl der rotierenden Kreislinie als auch der Kreisfläche ist der Mittelpunkt des Kreises, er legt also bei der Rotation einen Weg der Länge 2π R zurück. Die Länge des rotierenden Bogenstücks ist der Umfang des Kreises, also 2π r , die Fläche hat den Inhalt π r 2 . Damit ergibt sich für Volumen und Oberfläche des Torus: V = 2π 2 R r 2 und O = 4π 2 R r Definition:
Ein Körper heißt Kreiszylinder, wenn Deck- und Grundfläche kongruente Kreise mit Radius r sind, die in parallelen Ebenen mit Abstand h liegen. Ein Kreiszylinder heißt gerade, wenn die Verbindungsstrecke der beiden Kreismittelpunkte senkrecht auf der Grundfläche steht. Ein gerader Kreiszylinder kann als Rotationskörper – mit der Körperachse als Drehachse – aufgefasst werden, das Volumen ergibt sich somit zu V = π r 2h . Nach dem Prinzip von CAVALIERI ergibt sich für einen beliebigen Kreiszylinder der gleiche Wert.
1.10 Räumliche Körper
43
Bei der Berechnung der Oberfläche O eines geraden Kreiszylinders ist zu beachten, dass man zu der etwa durch Abwicklung leicht zu bestimmenden Mantelfläche M noch Grund- und Deckfläche addieren muss: M = 2π rh und O = 2π rh + 2π r 2 = 2π r (h + r ) Definition:
In der Ebene G sei ein Kreis mit Mittelpunkt M und Radius r gegeben. Verbindet man alle Punkte der Kreislinie mit einem Punkt S, Spitze genannt, der von der Ebene G den Abstand h > 0 hat, so entsteht ein Kreiskegel. Dieser heißt gerade, wenn die Verbindungsstrecke zwischen Spitze und Kreismittelpunkt auf G senkrecht steht. Wie oben kann ein gerader Kreiskegel als Rotationskörper − mit der Körperachse als Drehachse – aufgefasst werden, das Volumen ergibt sich somit zu 1 V = π r 2h . 3 Nach dem Prinzip von CAVALIERI ergibt sich für einen beliebigen Kreiskegel der gleiche Wert. Bezeichnet bei einem geraden Kreiskegel s die Mantellinie (das ist gerade die Hypotenuse des rotierenden Dreiecks), so ist M = π r s = π r r 2 + h 2 und O = π r ( s + r ) = π r r + r 2 + h 2 . Definition:
Ist ein Körper symmetrisch bezüglich drei aufeinander senkrecht stehender, sich im Körpermittelpunkt M schneidender Ebenen und sind die dabei entstehenden Schnittfiguren Ellipsen mit den Halbachsen a und b, a und c bzw. b und c, so heißt er Ellipsoid (siehe Bild 1.10.2). Sein Volumen ist
V =
4π abc . 3
Die Oberfläche eines Ellipsoids lässt sich nicht mithilfe elementarer Funktionsausdrücke bestimmen, es werden elliptische Integrale benutzt. Von Knud Thomsen1) stammt eine integralfreie sehr brauchbare Näherungsformel: 5 8 8 8 8 1 O ≈ 4π (ab) 5 + (ac) 5 + (bc) 5 3
1)
siehe wikipedia.org/wiki/Ellipsoid
44
1 Grundlagen
Bild 1.10.2: Ellipsoid
Ist b = c, so kann das Ellipsoid durch Rotation um die durch a gegebene Achse erzeugt wer4π 2 den, das Volumen ist demnach V = ab . 3 Mit der GULDINschen Regel erhält man nun für a > b:
O = 2π a a +
für a < b:
b2 b2 − a2 O = 2π a a + ⋅ arc sin b b2 − a2
b2 a2 − b2
⋅ ar sinh
a 2 − b 2 b
Haben alle drei Halbachsen die gleiche Länge r, so ergibt sich der Spezialfall einer Kugel mit V =
4 π r 3 und O = 4π r 2 . 3
2
Grundzüge der Linearen Algebra
2.1
Vektorraum, Unterraum, Basis
Eine der wichtigsten und am häufigsten vorkommenden mathematischen Strukturen ist der Vektorraum über einem Körper K. Definition:
Gegeben sei eine nichtleere Menge V mit einer inneren Verknüpfung + : V × V → V , Addition genannt, ein Körper ( K ,+, ⋅) sowie eine äußere Verknüpfung K × V → V , (λ , v) a λv , skalare Multiplikation genannt. V heißt Vektorraum über K (kurz: K-Vektorraum), wenn folgende Bedingungen gelten: (i)
(V ,+ ) ist eine abelsche Gruppe;
(ii)
für alle λ , µ ∈ K , v, w ∈ V gilt:
c)
λ ( µ v ) = (λ ⋅ µ ) v , (λ + µ ) v = λv + µ v , λ ( v + w ) = λv + λw ,
d)
1v = v (1 bezeichnet das Einselement von K).
a) b)
Die Elemente von V heißen Vektoren, das Nullelement 0 von (V ,+) heißt Nullvektor, die Körperelemente werden Skalare genannt. Jeder Körper ist offensichtlich ein Vektorraum über sich selbst. Definiert man auf Kn Addition und skalare Multiplikation komponentenweise, also über (v1 , L , vn ) + ( w1 , L , wn ) := (v1 + w1 , L , vn + wn ) und λ (v1 , L , vn ) := (λv1 , L , λvn ) , so erhält man weitere wichtige Vektorräume. Für K = R und n = 3 erhält man so den Anschauungsraum als Vektorraum. Eher abstrakt sind die Beispiele „Menge aller reellwertigen Funktionen mit demselben Definitionsbereich“, „Menge aller reellen Polynome“, „Menge aller konvergenten Folgen“ oder vieles mehr. Rechenregeln in Vektorräumen:
Aus obigen Vektorraum-Axiomen lassen sich folgende weitere Rechenregeln ableiten:
https://doi.org/10.1515/9783110537161-055
46
2 Grundzüge der Linearen Algebra
1. λ 0 = 0 und 0 v = 0
2. λv = 0 ⇔ λ = 0 ∨ v = 0
3. (−1) v = − v
Definition:
Eine nichtleere Teilmenge U eines Vektorraums V heißt Unterraum von V, wenn U bezüglich der in V definierten Verknüpfungen selbst ein Vektorraum ist, insbesondere ist 0 ∈ V auch Nullelement von U. Anders formuliert: U ⊆ V, U ≠ ∅, ist Unterraum von V ⇔ ∀λ ∈ K ∀v, w ∈ U : v + w ∈ U ∧ λv ∈ U Die Menge
{ 0 } , der sogenannte Nullraum, sowie V selbst sind Unterräume von V. Außer-
dem ist für v1 , v 2 ,L , v m ∈ V die Menge {λ1 v1 + λ2 v 2 + K + λm v m | λk ∈ K } , die Menge aller Linearkombinationen der v1 , v 2 ,L , v m , geschrieben [ v1 , v 2 ,L , v m ] , ein Unterraum von V. Definition:
(i) Eine Teilmenge {v1 , v 2 , L , v m } von V heißt linear unabhängig, wenn eine Linearkombination der v1 , v 2 ,L , v m nur dann den Nullvektor ergibt, wenn alle λk = 0 sind, also wenn
λ1 v1 + λ2 v 2 + K + λm v m = 0
⇒ λ1 = λ2 = K = λm = 0
gilt.
Anderenfalls heißt sie linear abhängig. (ii) {v1 , v 2 , L , v m } heißt Basis des Unterraums U, wenn U = [ v1 , v 2 , L , v m ] und {v1 , v 2 , L , v m } linear unabhängig ist. (iii) Die Anzahl m der Basiselemente eines Unterraums1) heißt Dimension von U, kurz dim U = m . Gleichbedeutend mit (i) ist {v1 , v 2 , L , v m } linear abhängig, wenn sich mindestens ein Vektor aus {v1 , v 2 , L , v m } als Linearkombination der anderen darstellen lässt. Für Kn hat man die kanonische Basis {e1 , e 2 , L , e n } , wobei bei e k = (0, L ,1,L , 0) alle Komponenten bis auf die k-te 0 sind, e k heißt k-ter kanonischer Einheitsvektor. Deshalb ist dim K n = n .
2.2
Matrizen und Determinanten
In diesem Abschnitt sei K ein beliebiger Körper, bei der Einführung der Determinanten muss vorausgesetzt werden, dass die Charakteristik von K ungleich 2 ist. Dabei ist die Charakteristik eines Körpers die kleinstmögliche Anzahl von Einselementen, die aufaddiert das Nullelement ergibt. Ist dies nie der Fall (wie in R oder C), so wird die Charakteristik als 0 definiert. In den meisten hier interessierenden Anwendungen ist K = R, manchmal auch K = C.
1)
Es ist durchaus nicht trivial, dass diese Zahl wohlbestimmt ist.
2.2 Matrizen und Determinanten
47
Definition:
Eine rechteckige Anordnung von m ⋅ n doppelt indizierten Elementen aij ∈ K in der Form a11 a21 M a m1
L a1n L a2 n L M L amn
a12 a22 M
am 2
heißt (m, n) -Matrix über K. Die Menge aller (m, n) -Matrizen wird mit Mm,n(K) bezeichnet. Die waagerechten Reihen heißen Zeilen, die senkrechten Spalten der Matrix. Dementsprechend gibt m die Zeilen- und n die Spaltenzahl der Matrix an. Bei aij heißen i der Zeilen- und j der Spaltenindex des Elements. Matrizen als Ganzes werden meist mit Großbuchstaben A, B, E o.Ä. bezeichnet. Die durch die Vorschrift aij′ : = a ji gebildete (n, m) -Matrix heißt die zu A transponierte Matrix und wird mit A T bezeichnet. Ist m = 1, so heißt die Matrix Zeilenvektor, für n = 1 Spaltenvektor. Für m = n heißt die Matrix quadratisch. In offensichtlicher Weise lässt sich Mm,n(K) mit Kmn identifizieren. Durch komponentenweise Definition von Addtion und skalarer Multiplikation, also durch a11 a21 M a m1
a12 a22 M
am 2
L a1n b11 b12 L a2 n b21 b22 + L M M M L amn bm1 bm 2
L b1n a11 + b11 L b2 n a21 + b21 := L M M L bmn am1 + bm1
a11 a λ 21 M a m1
L a1n λa11 λa12 L a2 n λa21 λa22 := L M M M L amn λam1 λam 2
und
a12 a22 M
am 2
a12 + b12 a22 + b22 M
am 2 + bm 2
L λa1n L λa 2 n , L M L λamn
wird Mm,n(K) ein K-Vektorraum der Dimension m · n.
Spezielle Eigenschaften quadratischer Matrizen: 1. A heißt symmetrisch 2. A heißt schiefsymmetrisch
⇔ A = AT ⇔ A = −A
⇔ ∀i, j : aij = a ji T
a1n + b1n L a2 n + b2 n L M L amn + bmn L
⇔ ∀i, j : aij = −a ji
48
2 Grundzüge der Linearen Algebra
a11 0 3. A heißt obere Dreiecksmatrix ⇔ ∀i, j : i > j ⇒ aij = 0 , also A = M 0 a11 a 4. A heißt untere Dreiecksmatrix ⇔ ∀i, j : j > i ⇒ aij = 0 , also A = 21 M a n1 a11 0 ⇔ ∀i, j : j ≠ i ⇒ aij = 0 , also A = M 0
5. A heißt Diagonalmatrix
a12 L a1n a22 L a2 n M L M 0 L ann
an 2
0 L 0 L M L ann
0
L
0 a22 M
a22 M
0
L
0 L 0 L M L ann
6. Die Elemente der Form aii bilden die Hauptdiagonale von A . 7. Die Diagonalmatrix mit lauter Einsen auf der Hauptdiagonalen heißt Einheitsmatrix und 1 falls i = j wird mit E bezeichnet. Für die Einträge eij von E gilt also: eij = . 0 falls i ≠ j
Matrizenmultiplikation:
( )
( ) C = (c )
Für eine (m, n) -Matrix A = aij und eine (n, l ) -Matrix B = bij (Größen beachten!) ist das Matrizenprodukt A ⋅ B (oder AB ) eine (m, l ) -Matrix
ij
n
mit cij =
∑a
b ,
ik kj
k =1
anders ausgedrückt: Das (i, j ) -te Element der Matrix A ⋅ B erhält man, indem man die i-te Zeile von A und die j-te Spalte von B (beide haben die gleiche Länge n) in Form des Standardskalarprodukts (siehe 2.4) miteinander multipliziert. Gleichartige Matrizen lassen sich also nur dann miteinander multiplizieren, wenn sie quadratisch sind. Aber auch dann gelten einige von der Zahlenmultiplikation her bekannte Rechenregeln, insbesondere das Kommutativgesetz und die Kürzungsregel, im Allgemeinen nicht. Die n-reihigen quadratischen Matrizen bilden einen Ring mit der Einheitsmatrix als Einselement, der weder kommutativ noch nullteilerfrei ist. Rechenregeln für die Matrizenmultiplikation:
Es seien A, B, C Matrizen, es bezeichne E die Einheitsmatrix (entsprechender Größe), es sei λ ∈ R. Wenn die entsprechenden Ausdrücke (von den Matrizengrößen her) definiert sind, gelten folgende Regeln:
2.2 Matrizen und Determinanten
49
(i)
A ⋅ (B ⋅ C) = ( A ⋅ B ) ⋅ C
(Assoziativgesetz)
(ii)
A ⋅ E = A und E ⋅ A = A
(neutrales Element)
(iii)
A ⋅ (B + C ) = A ⋅ B + A ⋅ C
(Distributivgesetz)
(iv)
(Distributivgesetz)
(v)
(B + C) ⋅ A = B ⋅ A + C ⋅ A (λA ) ⋅ B = λ(A ⋅ B ) = A ⋅ (λB )
(vi)
(A ⋅ B )T = B T ⋅ A T
(vii)
Falls zusätzlich A ⋅ B = B ⋅ A ist:
(A ⋅ B )k = A k ⋅ B k
Rang einer Matrix
( )
Jede der m Zeilen einer (m, n) -Matrix A = aij kann als Element von Kn aufgefasst werden, zi = (ai1 , L , ain ) . Damit ist [ z1 , z 2 , L , z m ] ein Unterraum von Kn, der sogenannte Zeilenraum von A , seine Dimension heißt Zeilenrang. Analog bilden die Spalten [ s1 , s2 , L , sn ] den Spaltenraum von A , einen Unterraum von Km, dessen Dimension der Spaltenrang ist. Da stets Zeilenrang und Spaltenrang einer Matrix gleich sind, spricht man einfach vom Rang einer Matrix, rg A geschrieben. Dieser ist also höchstens gleich Zeilenzahl bzw. Spaltenzahl. Matrizenumformungen
( )
Eine gegebene (m, n) -Matrix A = aij kann durch folgende elementare Zeilenoperationen verändert werden: (Z1)
Die i-te wird mit der j-ten Zeile vertauscht.
(Z2)
Die i-te Zeile wird mit λ ≠ 0 multipliziert.
(Z3)
Das λ-Fache der i-ten Zeile wird zur j-ten addiert und ergibt die neue j-te Zeile.
Diese elementaren Zeilenoperationen lassen sich auch durch Multiplikation mit sogenannten – quadratischen – Elementarmatrizen von links ausdrücken, und zwar: 1. Für i ≠ j bezeichne Vij diejenige Matrix, die aus der Einheitsmatrix durch Vertauschen von i-ter und j-ter Zeile hervorgeht. Vij ⋅ A entspricht dann (Z1). 2. Für λ ∈ R* bezeichne M iλ diejenige Diagonalmatrix, die an der i-ten Stelle mit λ und sonst mit lauter Einsen besetzt ist. M λi ⋅ A entspricht dann (Z2). 3. Für i ≠ j bezeichne Sji diejenige Matrix, die aus der Einheitsmatrix durch Hinzufügen −1
einer 1 an der Stelle (j,i) entsteht. (Z3) entspricht dann M iλ ⋅ S ji ⋅ M iλ ⋅ A . Analog lassen sich elementare Spaltenoperationen definieren; ihr Ergebnis erhält man als Matrizenprodukt mit den entsprechenden Elementarmatrizen von rechts multipliziert.
50
2 Grundzüge der Linearen Algebra
Bei diesen elementaren Matrizenumformungen bleibt der Rang der Matrix unverändert. Zur Rangbestimmung bringt man also durch elementare Zeilenumformungen die Matrix auf die sogenannte Staffelform (auch: Zeilenstufenform), die wie folgt gekennzeichnet ist: In jeder Zeile stehen links und unterhalb von dem Pivotelement • ≠ 0 nur Nullen; geht man die Zeilen von oben nach unten durch, so rückt • pro Zeile um mindestens eine Stelle nach rechts, wie im folgenden Beispiel einer (5,7) -Matrix dargestellt:
• 0 0 0 0
∗ • 0 0 0
∗ ∗ 0 0 0
∗ ∗ • 0 0
∗ ∗ ∗ • 0
∗ ∗ ∗ ∗ 0
∗ ∗ ∗ ∗ 0
• ≠ 0 Pivotelement ∗ ∈ K beliebig
Der Rang lässt sich leicht als Anzahl der Nicht-Nullzeilen in der Staffelform bestimmen (im Beispiel rg A = 4). Zur Erstellung der Staffelform geht man wie folgt vor: 1.
Man sucht in der ersten Spalte ein passendes Pivotelement ≠ 0 aus und bringt diese Operationszeile durch Zeilenvertauschung an die erste Stelle. Ist die erste Spalte eine Nullspalte, so suche man ein Pivotelement in der zweiten Spalte usw.
2.
Durch Addition eines passenden Vielfachen der Operationszeile auf die darunter stehenden erreicht man, dass alle Elemente unterhalb des Pivotelements 0 werden. Die Operationszeile bleibt dabei unverändert.
3.
Danach geht man eine Zeile nach unten und sucht in der nächsten Spalte (nur nach unten!) ein neues Pivotelement. Damit verfahre man wie in 1. und 2. beschrieben.
4.
Man wiederhole dieses Vorgehen solange, bis man mit dem Pivotelement rechts oder unten „anstößt“ oder bis unterhalb des Pivotelements nur noch reine Nullzeilen stehen.
Reguläre Matrizen
Eine quadratische Matrix A heißt regulär (oder invertierbar), wenn es eine Matrix A −1 gibt, sodass A ⋅ A −1 = A −1 ⋅ A = E ist. A −1 ist eindeutig bestimmt und heißt zu A inverse Matrix. A ist genau dann regulär, wenn ihr Rang maximal, also gleich Zeilen- und Spaltenzahl ist.
Zur Bestimmung der Inversen einer regulären Matrix A kann man das durch A ⋅ A −1 = E für die Einträge von A −1 gegebene lineare Gleichungssystem der Größe (n 2 , n 2 ) lösen. Eine weitere Möglichkeit ist die Benutzung der adjungierten Matrix (siehe am Ende dieses Abschnitts). Am einfachsten ist häufig die folgende Methode:
2.2 Matrizen und Determinanten
51
1. Man schreibt A und die Einheitsmatrix E nebeneinander in eine (n,2n) -Matrix:
a 11 M a n1
L O
a1n M
1 M
L O
L
a nn
0
L
0 M. 1
2. An der gesamten Matrix führe man nun elementare Zeilenoperationen aus mit dem Ziel, eine Staffelform zu erreichen. Der vordere aus A stammende Teil ist eine obere Dreiecksmatrix. Kommt auf der Hauptdiagonalen eine 0 vor, besitzt A keine Inverse, das Verfahren wird abgebrochen, ansonsten: 3. Die Hauptdiagonalelemente werden – von unten nach oben – als Pivotelemente benutzt mit dem Ziel, durch (Z2) und (Z3) den vorderen Teil auf die Einheitsmatrix E umzuformen; der hintere Teil stellt dann A −1 dar. ′ L a1′n 1 L 0 a11 M O M M O M 0 L 1 an′ 1 L a′nn 14 4244 3 = A −1 Die regulären Matrizen bilden bezüglich der Matrizenmultiplikation eine nichtkommutative Gruppe GL( n,K). Rechenregeln für reguläre Matrizen A, B, λ ∈ R*:
( )
1. A −1
−1
=A
4. (A ⋅ B ) = B −1 ⋅ A −1 −1
( ) = (A )
2. A T
−1
5. (λA ) = −1
−1 T
1
λ
( ) = (A )
3. A n
−1
−1 n
A −1
Determinanten Definition von LEIBNIZ: a11 L a1n det A = M O M = (−1) I (σ ) ⋅ aσ (1),1 ⋅ K ⋅ aσ ( n ),n an1 L ann σ ∈Sn
∑
( )
für A = aij
Dabei bezeichnet Sn die sogenannte symmetrische Gruppe, das ist die Menge aller Permutationen von {1, L , n} , die Summe besteht also aus n! Summanden (siehe 15.1). I(σ) ist die Anzahl aller Inversionen in σ, das ist die Anzahl aller Paare (i, j ) , für die i < j und σ(i) > σ(j) ist. Die Determinante ist eine Zahl aus K, det : M n ,n ( K ) → K .
52
2 Grundzüge der Linearen Algebra
Unmittelbar aus dieser Definition erhält man die Spezialfälle n = 2:
a11 a21
a11 n = 3 : a21 a31
a12 = a11a22 − a12 a21 a22 a12 a22 a32
und
a13 a23 = a11a22 a33 + a12 a23 a31 + a13 a21a32 − a13 a22 a31 − a23 a32 a11 − a33 a12 a21 a33 (Regel von SARRUS)
Definition von WEIERSTRASS:
( )
Mit M n ,n ( K ) = K n
n
(zeilenweise Betrachtung der Matrizeneinträge) ist die Determi-
( )
nante eine multilineare antisymmetrische Abbildung1) von K n
n
nach K mit det E = 1 .
Durch diese Forderung ist eindeutig eine Abbildung definiert; die gemäß LEIBNIZ-Definition berechnete Determinante erfüllt diese Bedingungen.
Rechenregeln für Determinanten: 1. Bezeichnet U ik (A ) diejenige (n − 1, n − 1) -Untermatrix von A, die durch Streichen der iten Zeile und k-ten Spalte von A entsteht, so gilt nach dem LAPLACEschen Entwicklungssatz n
für jedes feste i: det A =
∑ (− 1)
i+k
aik ⋅ det U ik (A )
(Entwicklung nach der i-ten Zeile)
k =1
2. det A = det AT; deshalb gilt 1. analog auch für die Entwicklung nach einer festen Spalte j. 3. det (A⋅B) = (det A) ⋅ (det B) 4. Anwendung elementarer Zeilenoperationen: (Z1) – Zeilenvertauschung: (Z2) – Zeilenvervielfachung (Z3) – Zeilenaddition
⇒ ⇒ ⇒
Vorzeichenwechsel Vervielfachung um gleichen Faktor keine Änderung
Wegen 2. gilt dies analog auch für Spaltenoperationen. Spezielle Determinanten
1. A ist obere/untere Dreiecksmatrix, insbesondere Diagonalmatrix: det A = a11 ⋅ a22 ⋅ K ⋅ ann
1)
siehe hierzu Abschnitt 2.3
(Produkt der Hauptdiagonalelemente)
2.3 Lineare Abbildungen und lineare Gleichungssysteme 2. A ist reguläre Matrix: det A ≠ 0 und det A −1 =
53
1 det A
Es gilt sogar: A regulär ⇔ det A ≠ 0 ⇔ rg A = n (maximal) 3. λ-Faches einer Matrix: det(λA ) = λn ⋅ det A Adjungierte Matrix
Für eine (n, n) -Matrix A ist die Adjunkte zu aik definiert als Aik = (− 1) ⋅ det U ik (A ) . Die Transponierte der aus allen Adjunkten gebildeten (n, n) -Matrix heißt zu A adjungierte Matrix Aadj, also Aadj = (Aik)T. 1 Es ist A ⋅ A adj = A adj ⋅ A = (det A )E , woraus für reguläre Matrizen A −1 = A adj folgt. det A i+k
2.3
Lineare Abbildungen und lineare Gleichungssysteme
Definition:
Es seien V und W K-Vektorräume. (i)
f : V → W heißt lineare Abbildung ⇔
∀v, w ∈ V : f ( v + w ) = f ( v ) + f (w )
und ∀v ∈ V ∀λ ∈ K : f (λv) = λf ( v)
1)
(ii)
Eine bijektive lineare Abbildung f : V → W heißt Isomorphismus; V und W heißen dann isomorph.
(iii)
Ist V = W, so heißt f Endomorphismus; ist f zusätzlich bijektiv, so heißt f Automorphismus.
(iv)
F : V n → W heißt multilinear (n-linear), wenn die Abbildung in Abhängigkeit von jedem der n Argumente einzeln (bei Festhalten der anderen) linear im Sinne von (i) ist.
(v)
Eine multilineare Abbildung heißt antisymmetrisch, wenn die Vertauschung beliebiger Argumente vi und vj lediglich zum Vorzeichenwechsel bei F ( v1 , L , v n ) führt. F heißt alternierend, wenn F ( v1 , L , v n ) = 0 ist, falls vi und vj gleich sind.1)
Ist die Charakteristik von K ungleich 2, so sind die Begriffe „antisymmetrisch“ und „alternierend“ äquivalent.
54
2 Grundzüge der Linearen Algebra
Das Bild von V unter f, also der Wertebereich f (V), ist ein Unterraum von W; der Kern von f, das ist {v ∈ V | f ( v) = 0} , ist ein Unterraum von V. Ihre Dimensionen heißen Rang bzw. Defekt von f (rg f bzw. def f). Sind V und W endlich-dimensional, so gilt der Rang-Defekt-Satz:
dim V = rg f + def f .
Ist {v1 , v 2 , L , v n } eine Basis von V, so ist f wegen der Linearität vollständig bekannt, wenn die Bilder der Basiselemente {v1 , v 2 , L , v n } bekannt sind. Entwickelt man jedes f ( v j ) m
nach einer Basis {w1 , w 2 , L , w m } von W, so ergibt sich f ( v j ) =
∑a w ij
i
mit aij ∈ K. Die
i =1
lineare Abbildung f : V → W ist also bezüglich gegebener Basen in V und W eindeutig durch die (m, n) -Matrix A = aij gegeben. Dabei sind die Koordinaten der Bilder der Basis
( )
von V, entwickelt nach der Basis von W, die Spalten von A. Für unterschiedliche Basenpaare ergeben sich natürlich auch unterschiedliche Matrizen, es ist jedoch stets rg f = rg A. Lineare Gleichungssysteme (LGS)
m lineare Gleichungen für die n Unbekannten x1 , L , xn ∈ K in der Form a11 x1 a21 x1 M am1 x1
a12 x2 a22 x2 M + a m 2 x2 + +
a1n xn a2 n x n M + L + amn xn + L + + L +
= b1 = b2 = M mit gegebenen aij, bi ∈ K = bm
bilden ein lineares Gleichungssystem der Größe (m, n) , kurz: ein (m, n) -LGS. Mit der Matrizenmultiplikation aus 2.2 kann dies auch als A ⋅ x = b geschrieben werden; die (m, n) -Matrix A = aij heißt Koeffizientenmatrix, der Spaltenvektor b rechte Seite oder
( )
Störvektor, der Spaltenvektor x Lösung(svektor) des LGS. Die (m, n + 1) -Matrix, die durch Anhängen der rechten Seite – als (n + 1) -te Spalte – an die Koeffizientenmatrix entsteht, heißt erweiterte Koeffizientenmatrix oder Systemmatrix Aerw. Ist b = 0, so heißt das LGS homogen, anderenfalls inhomogen. Ist m = n, so heißt das LGS quadratisch. Lösbarkeit linearer Gleichungssysteme
Für eine gegebene (m, n) -Matrix A wird durch die Zuordnung x a A ⋅ x eine lineare Abbildung fA von K n nach K m definiert. Diese wird bezüglich der kanonischen Basen von K n und K m durch A dargestellt. Deshalb: 1. Das LGS A ⋅ x = b ist genau dann lösbar, wenn rg A = rg Aerw ist. 2. Ist A ⋅ x = b lösbar, so sind in der Lösung (n – rg A) Parameter frei wählbar.
2.3 Lineare Abbildungen und lineare Gleichungssysteme
55
3. Ein homogenes LGS A ⋅ x = 0 ist stets lösbar (zumindest durch die triviale Lösung x = 0); die Lösungsmenge H = Kern von fA ist ein Unterraum von K n , gefundene Lösungen eines homogenen Systems lassen sich also zu weiteren Lösungen beliebig linear kombinieren. 4. Mit einer speziellen Lösung xs eines inhomogenen Systems A ⋅ x = b erhält man seine
Lösungsgesamtheit als x s + H = {x ∈ K n | ∃x h ∈ H : x = x s + x h } . 5. Ist A ⋅ x = b quadratisch, so gilt: A ⋅ x = b ist (mit jedem b) eindeutig lösbar A ist regulär (damit ist x = A −1 ⋅ b ) det A ≠ 0 rg A = n (maximal)
⇔ ⇔ ⇔
6. Die j-te Komponente xj des Lösungsvektors x lässt sich mit der CRAMERschen Regel didet ∆ j rekt berechnen: xj = , det A
wobei ∆ j aus A gebildet wird, indem die j-te Spalte durch die rechte Seite b ersetzt wird. GAUSSsches Eliminationsverfahren
Mit diesem konstruktiven Verfahren wird zunächst festgestellt, ob ein gegebenes (m, n) -LGS A ⋅ x = b lösbar ist und wie viele Parameter in der allgemeinen Lösung frei wählbar sind. Durch Rückwärtselimination wird anschließend die allgemeine Lösung ermittelt. 1.
Man bringe die erweiterte Koeffizientenmatrix Aerw nur durch Zeilenoperationen (!) auf Staffelform.
2.
Ist rg A ≠ rg Aerw, so ist das LGS unlösbar, das Verfahren wird abgebrochen; ist rg A = rg Aerw, so ist das LGS lösbar. Die allgemeine Lösung erhält man wie folgt:
3.
n − rg A ist die Anzahl der in der allgemeinen Lösung frei wählbaren Parameter (gegebenenfalls 0 – dann ist das LGS eindeutig lösbar).
4.
Nach Streichen von Nullzeilen ergibt die dann letzte eine Gleichung mit k ≥ 1 Unbekannten. k − 1 davon werden mit frei wählbaren Parametern vorbesetzt, nach der übrigen wird aufgelöst.
5.
Die vorletzte Zeile der Staffelform stellt eine Gleichung dar, in der mindestens eine Unbekannte mehr vorkommt. Die Ergebnisse aus dem 4. Schritt werden eingesetzt. In der entstandenen Gleichung werden alle bis auf eine Unbekannte durch weitere freie Parameter vorbesetzt, nach der übrigen wird aufgelöst.
6.
Analog verfahre man mit allen weiteren Zeilen bis in die erste. Der resultierende Lösungsvektor ist dann von l = n − rg A frei wählbaren Parametern λi abhängig, er l
lässt sich in der Form x = x s +
∑λ v i
i =1
i
schreiben.
56
2 Grundzüge der Linearen Algebra
2.4
EUKLIDische Räume und Orthogonalität
Im Gegensatz zu den Abschnitten 2.1 bis 2.3 werden in diesem Abschnitt nur reelle Vektorräume betrachtet, also ist hier stets K = R . Einige der Begriffe und Sätze sind zwar auch für K = C sinnvoll, spielen aber bei den hier betrachteten Anwendungen keine Rolle. Definition:
Eine auf einem R-Vektorraum V gegebene Verknüpfung < ⋅ , ⋅ >: V × V → r heißt (i)
bilinear, wenn für alle u, v, w ∈ V und λ ∈ r < u + v, w > = < u, w > + < v, w > und < λu, w > = λ < u, w > sowie < u, v + w > = < u, v > + < u, w > und < u, λw > = λ < u, w > ist;
(ii)
symmetrisch, wenn für alle v, w ∈ V < v, w > =< w , v > ist;
(iii)
positiv definit, wenn für alle v ∈ V < v, v > ≥ 0 und < v, v > = 0 ⇔ v = 0 ist.
(iv)
Eine bilineare, symmetrische, positiv definite Verknüpfung heißt Skalarprodukt oder inneres Produkt für V.
(v)
Ein R-Vektorraum mit Skalarprodukt heißt EUKLIDischer (Vektor-)Raum.
Häufig wird das Skalarprodukt auch als v ⋅ w oder ( v, w ) statt < v, w > notiert. Bekanntestes Beispiel eines Skalarprodukts ist das Standardskalarprodukt für V = r n , defin
niert als
< (v1 , L , vn ), ( w1 , L , wn ) > =
∑v w . i
i
i =1
Dieses liegt – wenn nicht ausdrücklich etwas anderes vermerkt ist – immer zugrunde, wenn der r n als EUKLIDischer Raum betrachtet wird. Ein ganz anderes, etwa bei der FOURIER-Entwicklung (siehe Abschnitt 7.3) wichtiges Skalarprodukt, ist auf dem Vektorraum V = { f : r → r | f ist stetig und 2π − periodisch} gegeben durch 2π
< f,g > =
∫ f ( x) g ( x) dx , 0
worauf später noch genauer eingegangen wird.
2.4 Euklidische Räume und Orthogonalität Mittels eines Skalarprodukts wird durch
57 v := < v, v > auf V eine Norm definiert, jeder
EUKLIDische Raum ist also ein normierter Vektorraum1). n
Für das Standardskalarprodukt ist (v1 , L , vn ) =
∑v
i
2
, was im anschaulichen Fall n = 2
i =1
oder n = 3 dem Satz von PYTHAGORAS, für n = 1 dem Absolutbetrag einer reellen Zahl entspricht. In einem EUKLIDischen Raum gilt die CAUCHY-SCHWARZsche Ungleichung 2): | < v, w > |≤ v ⋅ w , wobei Gleichheit nur dann gilt, wenn v und w linear abhängig sind. Definition:
(i)
v und w heißen orthogonal
⇔
< v, w > = 0
(ii)
{v1,…,vm} bilden ein Orthogonalsystem
⇔
< vi, vj > = 0 für i ≠ j
(iii)
{v1,…,vm} bilden ein Orthonormalsystem
⇔
0 für i ≠ j < vi, vj > = 1 für i = j
Orthogonale vom Nullvektor verschiedene Vektoren sind stets linear unabhängig. Eine Basis eines Unterraums, die gleichzeitig ein Orthonormalsystem ist, heißt Orthonormalbasis. m
Darstellung von v ∈ V mittels Orthonormalbasis {v1,…,vm}: v =
∑ < v, v
i
> vi
i =1
Die kanonische Basis bildet bezüglich des Standardskalarprodukts eine Orthonormalbasis des r n . Orthogonalisierungsverfahren von GRAM-SCHMIDT:
Für eine gegebene Basis {v1,…,vm} eines EUKLIDischen Raums V soll eine Orthonormalbasis {e1,…,em} derart bestimmt werden, dass [ v1 , K , v l ] = [e1 , K , e l ] für jedes l ∈ {1, L , m} gilt:
1) 2)
v1 v1
1.
e1 =
2.
f 2 = v 2 − < v 2 , e1 > e1 , e 2 =
f2 f2
siehe dazu Abschnitt 8.1 Die in Abschnitt 1.4 beschriebene Formel gleichen Namens ergibt sich als Spezialfall für das Standardskalarprodukt.
58
2 Grundzüge der Linearen Algebra
3.
f 3 = v 3 − < v 3 , e1 > e1 − < v 3 , e 2 > e 2 , e 3 =
f3 f3
usw. bis l = m
Orthogonale Abbildungen und orthogonale Matrizen
Eine lineare Abbildung f : V → V heißt orthogonal, wenn < f ( v), f (w ) > = < v, w > für alle v, w ∈ V ist. Orthogonale Abbildungen sind stets bijektiv, also Automorphismen. Bezüglich einer Orthonormalbasis wird eine orthogonale Abbildung durch eine Matrix A dargestellt, deren Spalten und Zeilen ein Orthonormalsystem bilden, es gilt also: A ⋅ AT = AT ⋅ A = E
bzw. A−1 = AT
Solche Matrizen, für die also A−1 = AT ist, heißen orthogonale Matrizen. Für eine orthogonale Matrix A ist det A = ±1 ; die Menge aller orthogonalen Matrizen bilden bezüglich der Matrizenmultiplikation eine Untergruppe von GL(n, R), die sogenannte orthogonale Gruppe O(n).
2.5
Eigenwerte
In diesem Abschnitt werden stets R oder C als Körper K zugrundegelegt. Definition:
Für einen Endomorphismus f : V → V heißt λ ∈ K Eigenwert von f, wenn es ein v ≠ 0 gibt, sodass f ( v) = λv ist. v heißt dann ein zum Eigenwert λ gehöriger Eigenvektor. Die Menge aller Eigenvektoren zu einem festen Eigenwert λ, vereinigt mit dem Nullvektor (der ja für jedes λ die Eigenwertgleichung erfüllt!), bilden einen Unterraum von V, den sogenannten Eigenraum Eλ; seine Dimension heißt geometrische Vielfachheit des Eigenwerts λ. Für eine gegebene (n, n) -Matrix A heißen λ ∈ K bzw. v ∈ K n Eigenwert bzw. Eigenvektor von A, wenn sie dies für die lineare Abbildung v a A ⋅ v sind, wenn also gilt: v1 v1 A ⋅ M = λ M v v n n Eigenvektoren zu verschiedenen Eigenwerten einer linearen Abbildung bzw. einer Matrix sind stets linear unabhängig.
2.5 Eigenwerte
59
Zur praktischen Bestimmung von Eigenwerten und Eigenvektoren einer Matrix geht man wie folgt vor:
1.
Mit
a11 − λ L a1n festem λ ∈ K berechne man pA (λ ) = det ( A − λE) = M O M . an1 L ann − λ
Dies ist ein Polynom vom Grade n, das charakteristische Polynom von A. 2.
Die Eigenwerte von A sind die Nullstellen von p A (λ ) ; die algebraische Vielfachheit eines Eigenwerts λ gibt an, wievielfache Nullstelle λ ist.
3.
Der zu einem Eigenwert λ gehörige Eigenraum Eλ ist der Lösungsraum des durch v1 v1 A ⋅ M = λ M gegebenen homogenen (!) linearen Gleichungssystems. v v n n
Ordnet man das charakteristische Polynom nach fallenden Potenzen, so ist der führende Koeffizient (−1) n , der nächste (−1) n−1 Sp A . Dabei ist die Spur einer quadratischen Matrix n
A, mit Sp A bezeichnet, die Summe aller Hauptdiagonalelemente, also Sp A =
∑a
ii
. Das
i =1
absolute Glied von p A (λ ) ist det A. Für jeden Eigenwert λ ist die geometrische Vielfachheit mindestens 1 und höchstens gleich seiner algebraischen. Für einen gegebenen Endomorphismus f eines endlich-dimensionalen Vektorraums V kann man – wie in 2.3 beschrieben – die f bezüglich einer gewählten Basis darstellende Matrix A bestimmen und wie in 1. deren charakteristisches Polynom pA (λ ) berechnen. Dieses ist unabhängig von der gewählten Basis von V. Deshalb lassen sich damit die Eigenwerte von f und die zugehörigen Eigenvektoren wie oben bestimmen; bei letzteren ergeben sich genau genommen die Koordinaten-n-Tupel der Eigenvektoren bezüglich der gewählten Basis. Um einen gegebenen Endomorphismus f durch eine Diagonalmatrix darstellen zu können, muss die dazu gewählte Basis ausschließlich aus Eigenvektoren bestehen. Die Frage nach der Existenz einer solchen Eigenbasis ist äquivalent zu der Frage, ob die Darstellungsmatrix A diagonalisierbar ist. Eine quadratische Matrix heißt genau dann diagonalisierbar (oder: zu einer Diagonalmatrix ähnlich), wenn es eine reguläre Matrix P derart gibt, dass P −1AP eine Diagonalmatrix ist.
60
2 Grundzüge der Linearen Algebra
Diagonalisierung einer Matrix A: 1.
Man prüfe, ob das charakteristische Polynom pA (λ ) vollständig in Linearfaktoren zerfällt (über C ist dies stets der Fall, siehe 3.6).
2.
Ist für jeden Eigenwert λ die geometrische Vielfachheit gleich der algebraischen, so ist A diagonalisierbar (ggf. über C ), sonst nicht.
3.
Die Transformationsmatrix P erhält man, in dem man n linear unabhängige Eigenvektoren (wegen 2. vorhanden!) spaltenweise aufschreibt. P −1AP ist eine Diagonalmatrix aus den Eigenwerten in der Reihenfolge der Eigenvektoren in P.
Hat eine (n, n) -Matrix n verschiedene Eigenwerte, so ist sie also diagonalisierbar. Spektralsatz für symmetrische Matrizen:
Symmetrische reelle Matrizen haben nur reelle Eigenwerte (keine komplexen!), bei jedem sind geometrische und algebraische Vielfachheit gleich, sie sind also stets über R diagonalisierbar. Da hier außerdem Eigenvektoren zu verschiedenen Eigenwerten orthogonal sind, erhält man eine Orthonormalbasis aus Eigenvektoren, indem man in jedem Eigenraum das GRAM-SCHMIDTsche Orthonormalisierungsverfahren anwendet. Die Transformationsmatrix P ist dann eine orthogonale Matrix, mit P −1 = P T lässt sich die Transformation auf Diagonalmatrix leicht durchführen. Die Eigenwerte einer orthogonalen Matrix haben alle den Betrag 1 (auch die komplexen!); orthogonale Matrizen sind im Allgemeinen nur über C diagonalisierbar.
2.6
Anwendung: Analytische Geometrie im R3
Ein Vektor v = (v1 , v2 , v3 ) ∈ r 3 ist genau genommen die Äquivalenzklasse aller derjenigen Pfeile, die durch Parallelverschiebung in den Pfeil vom Nullpunkt zum Punkt P(v1 , v2 , v3 ) , genannt Ortsvektor von P, überführt werden können. Mit der Schreibweise v sollen sowohl der Vektor als auch der Punkt P bezeichnet werden, aus dem Zusammenhang wird klar, was jeweils gemeint ist. Alle Begriffe und Bezeichnungsweisen sollen – sofern sinnvoll – analog auf die Ebene R2 übertragen werden. Als Skalarprodukt des EUKLIDischen Raums dient das Standardskalarprodukt, als Orthonormalbasis die kanonische Basis {e1 , e 2 , e 3 } . Die Koordinaten von v bezüglich dieser Basis sind gerade die Komponenten (v1 , v 2 , v 3 ) von v. Für das Skalarprodukt gilt:
< v, w > = v w cos r( v, w )
2.6 Anwendung: Analytische Geometrie im R3
61
Nebenbemerkung: Deshalb wird in nicht-anschaulichen EUKLIDischen Räumen der ungerich< v, w > . tete Winkel zwischen zwei Vektoren v und w gerade so definiert: r( v, w ) = arccos v w Dass der letzte Ausdruck wohldefiniert ist, liegt an der CAUCHY-SCHWARZschen Ungleichung. Zwei Vektoren v und w im R3 sind also orthogonal, wenn einer von ihnen der Nullvektor ist oder wenn sie senkrecht aufeinander stehen. Definition:
Das Kreuzprodukt zweier Vektoren (auch: äußeres Produkt oder Vektorprodukt) ist eine Funktion von r 3 × r 3 nach r 3 , die folgendermaßen definiert ist: (v1 , v2 , v3 ) × ( w1 , w2 , w3 ) = (v2 w3 − v3 w2 , v3 w1 − v1w3 , v1w2 − v2 w1 ) Man beachte, dass in der ersten Komponente gerade die Indizes 2 und 3 vorkommen und dann zyklisch getauscht wird. Man kann v × w auch berechnen, indem man mittels LAPLAe1 e 2 e 3 CE-Entwicklung oder Regel von SARRUS die formale Determinante v1 v2 v3 auswertet. w1 w2 w3 Rechenregeln für das Kreuzprodukt:
1. Antisymmetrie: 2. Distributivgesetze: 3. Für beliebiges λ ∈ R:
v × w = −w × v , insbesondere:
v×v = 0
(u + v) × w = u × w + v × w und u × ( v + w ) = u × v + u × w ( λ v ) × w = λ ( v × w ) = v × (λ w )
⇔ v und w sind linear abhängig 4. v × w = 0 5. < v, v × w > = 0 und < w, v × w > = 0 Damit lässt sich das Kreuzprodukt anschaulich interpretieren: v × w ist ein Vektor, der senkrecht auf der von v und w aufgespannten Ebene steht, seine Richtung ist durch die Rechtsschraubenregel gegeben, das heißt: In diese Richtung bewegt sich eine Schraube mit Rechtsgewinde, wenn man v nach w dreht. Die Länge von v × w lässt sich berechnen als v × w = v w | sin r( v, w ) | .
Ebenen im Raum
Die Parameterdarstellung einer Ebene E (siehe Bild 2.6.1) durch P0 mit den Richtungsvektoren a und b ist gegeben durch r (λ , µ ) = r0 + λa + µb mit λ , µ ∈ r .
62
2 Grundzüge der Linearen Algebra
Bild 2.6.1: Ebene durch einen Punkt mit zwei Richtungsvektoren
Durch drei Punkte, gegeben durch ihre Ortsvektoren r0, r1, r2, ist genau dann eindeutig eine Ebene gegeben, wenn die Punkte nicht auf einer Geraden liegen, wenn also r1 − r0 und r2 − r0 linear unabhängig sind, das heißt, wenn (r1 − r0 ) × (r2 − r0 ) ≠ 0 ist. Die Parameterdarstellung von E ist dann r (λ , µ ) = r0 + λ (r1 − r0 ) + µ (r2 − r0 ) mit λ , µ ∈ r . Da das Kreuzprodukt senkrecht auf jedem der beiden Vektoren steht, ist a × b ein Normalenvektor von E. Umgekehrt ist eine Ebene eindeutig gegeben durch Angabe eines Punktes P0 sowie eines Normalenvektors n, auf dem jeder in E verlaufende Verbindungsvektor r − r0 senkrecht steht; man erhält die Beschreibung einer Ebene mittels Normalenvektor: n ⋅ (r − r0 ) = 0
⇔
n ⋅ r = n ⋅ r0
mit gegebenen n, r0 ∈ R3
Führt man das Standardskalarprodukt mit unbekanntem r = ( x, y, z ) explizit aus, so erhält man mit Ax + By + Cz = D (mit gegebenen A, B, C, D ∈ R) die allgemeine Form einer Ebenengleichung, einer linearen Gleichung mit drei Unbekannten. Ist diese homogen, so enthält E den Nullpunkt, sonst nicht. Ist eine Ebene E durch einen Punkt P0 und einen Normalenvektor n gegeben, so lassen sich damit verschiedene Abstände berechnen: a) Abstand von einem Punkt Q:
d=
| n ⋅ (rQ − r0 ) | n
b) Abstand von einer zu E parallelen Geraden r (λ ) = r1 + λa :
d=
| n ⋅ (r1 − r0 ) | n
d=
| n ⋅ (r1 − r0 ) | n
Wegen der Parallelität muss n ⋅ a = 0 sein. c) Abstand von einer zu E parallelen Ebene n ⋅ (r − r1 ) = 0 :
Wegen der Parallelität ist n Normalenvektor zu beiden Ebenen.
2.6 Anwendung: Analytische Geometrie im R3
63
Ohne Schwierigkeiten lassen sich obige Formeln – wo sinnvoll – auf eine Dimension niedriger, also in die Ebene R2, übertragen: Parameterdarstellung einer Geraden mit Richtungsvektor a:
r (λ ) = r0 + λa mit λ ∈ r
Gerade durch zwei Punkte, Ortsvektoren r0 und r1:
r (λ ) = r0 + λ (r1 − r0 ) , λ ∈ r
Normalenvektor zu einer Geraden mit Richtungsvektor a:
a = (a1 , a2 ) ⇒ n = (−a2 , a1 )
Abstand einer Geraden von einem Punkt Q (wie oben):
d=
| n ⋅ (rQ − r0 ) | n
Drehungen im R3
Bei einer Drehung D um eine feste Achse, gegeben durch den Richtungsvektor a, um einen Winkel α bleiben alle Längen und Winkel erhalten, die lineare Abbildung D : r 3 → r 3 erhält also das Skalarprodukt, ist also eine orthogonale Abbildung. Die Elemente der Drehachse bleiben unverändert, das heißt D (a) = a . Dies bedeutet, dass 1 Eigenwert von D und a zugehöriger Eigenvektor ist. Da alle Eigenwerte einer orthogonalen Abbildung den Betrag 1 haben, kommt als weiterer reeller Eigenwert nur −1 infrage. Die Eigenwertgleichung lautet dann D( v) = − v , was bei einer Drehung nur für Vektoren aus dem zweidimensionalen Unterraum a ⊥ der zu a senkrechten Vektoren möglich ist. −1 ist also doppelter Eigenwert. Die Drehung ist dann auf a ⊥ eine Spiegelung am Nullpunkt, also ist der Drehwinkel α = 180° . Ist andererseits 1 mehrfacher reeller Eigenwert, so kann er nicht doppelter Eigenwert sein, da echt komplexe Nullstellen eines reellen Polynoms in gerader Anzahl auftreten (siehe 3.6) und auch −1 nur doppelt auftreten kann. Ist aber 1 dreifacher Eigenwert, so gilt D( v) = v für alle v ∈ R3, D ist also die identische Abbildung, als Drehung also eine solche mit Drehwinkel α = 0° . Bei einer nichttrivialen Drehung ist also 1 einfacher Eigenwert, der zugehörige Eigenvektor ist die Drehachse, der Drehwinkel α ist das Argument eines weiteren – komplexen – Eigenwerts von D. Will man bei einer gegebenen (3,3)-Matrix A prüfen, ob sie eine Drehung beschreibt und ggf. die Drehgrößen bestimmen, so geht man wie folgt vor:
64
2 Grundzüge der Linearen Algebra 1.
Man prüft, ob A orthogonal, also ob A ⋅ AT = E ist.
2.
Wenn det A = 1 ist, stellt A eine Drehung dar.
3.
Man bestimme einen Eigenvektor zum Eigenwert 1; dieser ist die Drehachse a.
4.
Für den Drehwinkel α gilt: cos α = 12 (Sp A − 1) .
5.
Normiert man a auf 1 und ergänzt diesen Vektor zu einer Orthonormalbasis von R3, so hat die Abbildungsmatrix bezüglich dieser Basis die Gestalt 0 1 0 cos α 0 sin α
0 − sin α . cos α
3
Elementare Funktionen
3.1
Funktionen einer reellen Veränderlichen
Für Funktionen einer reellen Veränderlichen f : M → N ist üblicherweise verabredet: Zielbereich:
N=R
Definitionsbereich:
M ist eine Teilmenge von R, die, wenn nicht explizit angeben, alle diejenigen x enthalten soll, für die die Rechenvorschrift f (x) ausführbar ist.
Aufgrund der in R gegebenen Ordnung lassen sich speziell für reelle Funktionen einer Veränderlichen f : Df → R die folgenden Begriffe definieren: Definition:
(i)
f ist monoton wachsend (bzw. fallend) ⇔
(ii)
∀ a, b ∈ Df : a < b ⇒ f (a) < f (b)
(bzw. f (a) > f (b))
f ist nach oben beschränkt (bzw. nach unten beschränkt) ⇔
(iv)
(bzw. f (a) ≥ f (b))
f ist streng monoton wachsend (bzw. fallend) ⇔
(iii)
∀ a, b ∈ Df : a < b ⇒ f (a) ≤ f (b)
f ist beschränkt ⇔
∃ C ∈ R: ∀ a ∈ Df : f (a) ≤ C
(bzw. f (a) ≥ C))
∃ C ∈ R+: ∀ a ∈ Df : | f (a)| ≤ C
Gemäß obiger Definition ist unmittelbar einsichtig, dass f genau dann beschränkt ist, wenn es nach oben und unten beschränkt ist. Außerdem sind konstante Funktionen (also solche mit f(x) = c ∀x ∈ D f) sowohl monoton wachsend als auch fallend, was auf den ersten Blick etwas irritiert. Für streng monotone Funktionen, die offenbar injektiv sind und somit eine Umkehrfunktion besitzen, gilt:
https://doi.org/10.1515/9783110537161-075
66
3 Elementare Funktionen
Satz:
Ist f streng monoton wachsend (fallend), dann existiert die Umkehrfunktion f −1 und ist ebenfalls streng monoton wachsend (fallend). Es ist D f −1 = Wf und W f −1 = d f. Durch b = f (a) und a = f − 1 (b) sind dieselben Werte a und b miteinander verknüpft. Weitere wichtige Eigenschaften reeller Funktionen einer Veränderlichen enthält die Definition:
(i)
Eine Funktion f : Df → R heißt gerade
⇔∀ x ∈ Df : f (x) = f (−x)
(ii)
Eine Funktion f : Df → R heißt ungerade
⇔∀ x ∈ Df : f (x) = −f (−x)
(iii)
Eine Funktion f : Df → R heißt P-periodisch
⇔∀ x ∈ Df : f (x) = f (x+P) +
P heißt Periode von f. Die kleinste Periode P ∈ R heißt primitive Periode. Zur anschaulichen Darstellung einer Funktion einer Veränderlichen wird häufig ihr Graph in der Zeichenebene benutzt. Diese Punktmenge G f des R2 ist folgendermaßen für eine Funktion f : Df → R definiert (vgl. 1.2):
G f = {(x, y) ∈ R2 | x ∈ Df und y = f (x)} Die oben definierten Eigenschaften von Funktionen lassen sich leicht am Verlauf der Graphen ablesen.
Bild 3.1.1: Graph einer geraden Funktion
Bild 3.1.3: Graph einer P-periodischen Funktion
Bild 3.1.2: Graph einer ungeraden Funktion
3.2 Rationale Funktionen
67
Bild 3.1.4: Graphen einer streng monoton wachsenden Funktion und ihrer Umkehrfunktion
In den folgenden Abschnitten werden die wichtigsten Funktionen einer reellen Veränderlichen dargestellt.
3.2
Rationale Funktionen
In diesem Abschnitt werden ganzrationale Funktionen, insbesondere die algebraischen Eigenschaften von Polynomen, und – darauf aufbauend – gebrochen rationale Funktionen, insbesondere deren Partialbruchzerlegung, behandelt.
Definition:
(i)
Eine Funktion p : R → R heißt ganzrational (Polynom)
1)
, wenn für alle x ∈ R
n
p( x) =
∑a x i
i
ist. Dabei ist n eine natürliche Zahl, und a0 , a1 , ..., an sind feste
i =0
reelle Zahlen, die Koeffizienten von p . (ii)
1)
Die größte natürliche Zahl k, für die ak ≠ 0 ist, heißt der Grad des Polynoms, mit grad p (x) bezeichnet.
Es gibt Körper, bei denen die beiden Begriffe nicht dasselbe bedeuten; für die hier verwendeten Zahlbereiche R und C sind sie jedoch inhaltsgleich, sie werden deshalb synonym verwandt.
68
3 Elementare Funktionen
Zusatz: Das Polynom, dessen Koeffizienten alle 0 sind, heißt das Nullpolynom; es gibt also (vgl. (ii) in obiger Definition) keine natürliche Zahl, die als Grad des Nullpolynoms infrage kommt.1) n
Üblicherweise wird mit der Schreibweise p( x ) =
∑a x i
i
unterstellt, dass an ≠ 0 , also
i =0
grad p(x) = n ist. Polynome vom Grade 0 sind die konstanten Funktionen vom Werte ≠ 0. Es ist unmittelbar einsichtig, dass für zwei Polynome p(x) und q(x) gilt: grad (p(x) + q(x)) ≤ max {grad p(x), grad q(x)} und grad (p(x) ⋅ q(x)) = grad p(x) + grad q(x). Algebraische Eigenschaften von Polynomen
Statt über R kann man genauso Polynome über einem beliebigen Körper K betrachten; die Menge aller solchen Polynome wird mit K [x] bezeichnet. 1. Bezüglich der üblichen Addition von Funktionen und der Multiplikation mit einem Skalar ist K [x] ein (unendlich-dimensionaler) K-Vektorraum mit dem Nullpolynom als Nullvektor; die Menge aller Polynome p mit grad p ≤ n bildet einen (n + 1)-dimensionalen Unterraum von K [x]. 2. Bezüglich der üblichen Addition und Multiplikation von Funktionen ist K [x] ein Integritätsbereich mit der konstanten Funktion vom Werte 1 als Einselement. 3. Wie im Integritätsbereich Z gilt auch in K [x] der Satz über die Teilung mit Rest:
Für zwei Polynome p1 ( x) und p2 ( x) mit grad p1 ( x) ≥ grad p2 ( x) ≥ 1 gibt es eindeutig bestimmte Polynome q (x) und r (x) derart, dass p1 ( x) = q( x) ⋅ p2 ( x) + r ( x)
(mit grad r (x) < grad p2 ( x) )
ist. 4. Hieraus folgt unmittelbar: Ist b eine Nullstelle von p(x), so lässt sich der Linearfaktor (Polynom 1. Grades) ( x − b) aus p(x) ausklammern, das heißt, es gibt ein Polynom q(x), dessen Grad um 1 kleiner ist als der von p(x), mit dem gilt:
p(x) = (x − b) ⋅ q(x). Allgemein: b ∈ K heißt r-fache Nullstelle von p (x) (mit r ∈ N+) ⇔
1)
p (b) = 0 und p (x) = (x − b)r ⋅ q(x) mit einem Polynom q(x), für das q(b) ≠ 0 ist.
Meist wird aus Gründen der Systematik sein Grad auf −∞ festgesetzt.
3.2 Rationale Funktionen
69
Mittels Differentialrechnung lässt sich dies für K = R oder K = C äquivalent ausdrücken: b ∈ K ist r - fache Nullstelle von p (x) ⇔ ∀k ∈ {0, L , r − 1} : p ( k ) (b) = 0 und p ( r ) (b) ≠ 0 . 5. Identitätssatz für Polynome: m
n
Für die Polynome p( x) =
∑a x i
i
und q( x) =
∑b x i
i =0
i
gelte p(x) = q(x) für alle x ∈ K.
i =0
Dann müssen alle ai = bi sein, „überzählige“ ai oder bi (für n ≠ m) sind 0. Anders formuliert: Zwei Polynome sind nur dann gleich, wenn sie in allen Koeffizienten übereinstimmen. Dieser Satz beinhaltet, dass die Polynome {1, x, x 2 , L, x n } linear unabhängig in K [x] sind, und ist die Grundlage des sogenannten Koeffizientenvergleichs. 6. Zerlegungssatz für reelle Polynome:
Jedes Polynom p(x) über R mit grad p(x) ≥ 1 lässt sich darstellen als p( x) = C ⋅ ( x − b1 ) r1 ⋅ ... ⋅ ( x − bk ) rk ⋅ ( x 2 + c1 x + d1 ) s1 ⋅ ... ⋅ ( x 2 + cm x + d m ) sm . Diese Darstellung ist bis auf die Reihenfolge der Faktoren eindeutig. Dabei ist C der Koeffizient bei der höchsten Potenz in p(x); b1, ..., bk sind die verschiedenen Nullstellen von p(x) mit ihren Vielfachheiten r1, ..., rk; die Polynome zweiten Grades x 2 + ci x + d i (i = 1, ..., m) sind alle irreduzibel, haben also keine reelle Nullstelle, die si geben die jeweiligen Vielfachheiten an. Man findet obige Zerlegung, indem man zunächst den Koeffizienten der höchsten Potenz ausklammert, dann für jede gefundene Nullstelle bi durch den Linearfaktor x − bi entsprechend oft dividiert; das Herausfinden der verbleibenden quadratischen unzerlegbaren Terme kann sich (ohne einen Umweg über das Komplexe, s. Abschnitt 3.6) im Einzelfall recht schwierig gestalten, es gibt hierfür keinen Algorithmus. Außerdem bedeutet der Satz, dass sich reelle Polynome mit Grad 3 oder größer auf jeden Fall zerlegen lassen müssen (sie sind reduzibel); die Zerlegung von Polynomen ungeraden Grades muss mindestens einen Linearfaktor aufweisen, das heißt, dass solche Polynome mindestens eine reelle Nullstelle haben. Darüber hinaus kann ein Polynom vom Grade n höchstens n verschiedene Nullstellen haben. Analytische Eigenschaften reeller Polynome (ganzrationaler Funktionen)
Aufgrund der Rechenvorschrift können Polynome stets auf dem ganzen Körper definiert n
werden. Für ein reelles Polynom p( x) =
∑a x i
i =0
Definitionsbereichs:
i
vom Grade n ≥ 0 gilt an den Grenzen des
70
3 Elementare Funktionen
Für an > 0 :
lim p ( x) = +∞
und
für an < 0 :
lim p ( x) = −∞
und
x →∞
x →∞
+ ∞ falls n gerade lim p( x) = − ∞ falls n ungerade
x →−∞
− ∞ falls n gerade lim p( x) = + ∞ falls n ungerade
x →−∞
Mit der auch sonst sehr nützlichen Signumfunktion sign: R → R, definiert durch 1 für x > 0 sign x = 0 für x = 0 , − 1 für x < 0 lässt sich dies kürzer ausdrücken: lim p( x) = (sign an )∞ und lim p( x) = (−1) n (sign an )∞ x →∞
x →−∞
Definition:
(i)
Eine Funktion f (x) heißt gebrochen rational, wenn sie sich als Quotient zweier p ( x) Polynome p(x) und q(x) darstellen lässt, also als f ( x) = . Der größtmögliche q( x) Definitionsbereich ist dann Df = R \ {b | q(b) = 0}.
(ii)
Eine gebrochen rationale Funktion f (x) heißt echt gebrochen rational, wenn der Grad des Zählerpolynoms kleiner als derjenige des Nennerpolynoms ist.
Durch die oben behandelte Polynomdivision mit Rest lässt sich jede gebrochen rationale Funktion eindeutig als Summe eines Polynoms und einer echt gebrochen rationalen Funktion darstellen. Echt gebrochen rationale Funktionen lassen sich vereinfachen durch eine Partialbruchzerlegung:
p( x) , außerdem sei q ( x) die Zerlegung des Nennerpolynoms in Linearfaktoren und irreduzible quadratische Polynome bekannt, etwa Gegeben sei eine beliebige echt gebrochen rationale Funktion f ( x) =
q ( x) = C ⋅ ( x − b1 ) r1 ⋅ ... ⋅ ( x − bk ) rk ⋅ ( x 2 + c1 x + d1 ) s1 ⋅ ... ⋅ ( x 2 + cm x + d m ) sm . Dann lässt sich f (x) darstellen als Summe von Termen folgender Art: Aij Jede Nullstelle bi führt zu Summanden der Form , wobei die Potenzen j alle natür( x − bi ) j lichen Zahlen von 1 bis zur Vielfachheit der Nullstelle bi durchlaufen, die Konstanten Aij sind zu bestimmende reelle Zahlen; jedes irreduzible quadratische Polynom x 2 + ci x + d i
3.2 Rationale Funktionen
führt zu Summanden der Form
71 Eij x + Fij 2
( x + ci x + d i ) j
, wobei die Potenzen j alle natürlichen Zahlen
von 1 bis zur Vielfachheit des Polynoms x 2 + ci x + d i in der Darstellung von q(x) durchlaufen, die Konstanten Eij und Fij sind zu bestimmende reelle Zahlen. Diese Darstellung ist bis auf die Reihenfolge der Summanden eindeutig. Praktische Durchführung der Partialbruchzerlegung: 1.
p( x) echt gebrochen rational ist – wenn nicht, q( x) p ( x) p ( x) dar; für 2 wird stelle man durch Polynomdivision f ( x) = p1 ( x) + 2 q( x) q( x) dann die Partialbruchzerlegung durchgeführt. Zunächst prüfe man, ob f ( x) =
2.
Nun zerlege man das Nennerpolynom wie oben beschrieben in Linearfaktoren und irreduzible quadratische Polynome, zum Beispiel q ( x ) = ( x + 2) 2 ( x − 1)( x 2 + 1) 2 .
3.
Der Partialbruchansatz in obigem Beispiel lautet nun p2 ( x ) A A12 A E x + F11 E12 x + F12 = 11 + + 21 + 11 2 + . 2 q( x) x + 2 ( x + 2) x −1 ( x 2 + 1) 2 x +1
4.
Durch Multiplikation mit dem Hauptnenner q (x) ergibt sich links das Zählerpolynom und rechts nach Ausmultiplizieren ein Polynom, dessen Grad um 1 kleiner ist als der des Nennerpolynoms q (x) . Dessen Koeffizienten sind Ausdrücke mit den gesuchten Konstanten.
5.
Zur Bestimmung der Konstanten muss ein quadratisches LGS gelöst werden (in unserem Beispiel von der Größe (6, 6)), das man auf verschiedene Weisen erhalten kann: a) Man führt für die Polynome aus 4. einen Koeffizientenvergleich durch. b) Man setzt in 4. (am besten vor dem Ausmultiplizieren) nacheinander beliebige x-Werte ein; wenn man mit den Nullstellen von q (x) beginnt, entstehen zunächst Gleichungen, die jeweils nur eine Unbekannte enthalten (in unserem Beispiel A12 und A21).
Verhalten an den Grenzen des Definitionsbereichs
p( x) ist für die Nullstellen bi von q (x) nicht definiert, der Ausdruck geht hier q( x) gegen ±∞ . Welches Vorzeichen bei einem konkreten bi zu wählen ist, kann man sehr leicht sehen, wenn man das Grenzverhalten der Terme mit bi in der Partialbruchzerlegung untersucht. Die anderen spielen keine Rolle, da sie einen endlichen Grenzwert haben. 1. f ( x) =
72
2. Ist f ( x) =
3 Elementare Funktionen p( x) mit p( x) = q( x)
m
n
∑a x i
i
und q( x) =
i =0
∑b x i
i
, so gilt für lim f ( x) : x → ±∞
i =0
a) bei n < m: lim f ( x) = 0 ; und zwar geht für x → +∞ der Ausdruck von oben gegen 0, x → ±∞
a a wenn n > 0 ist, sonst von unten. Für x → −∞ muss n (−1) n−m > 0 sein, damit die Anbm bm näherung von oben erfolgt. b) bei n = m: lim f ( x) = x → ±∞
an bm
c) bei n > m: Hier bestimmt das Polynom p1 ( x) in dem durch Polynomdivision erhaltenen p ( x) das Grenzverhalten: Es ist (siehe oben) Ausdruck f ( x) = p1 ( x) + 2 q( x) a a lim f ( x) = lim p1 ( x) = (sign n )∞ und lim f ( x) = lim p1 ( x) = (−1) n− m (sign n )∞ . x →∞ x →∞ x x → −∞ → −∞ bm bm
3.3
Potenz- und Wurzelfunktionen
Definition:
Eine Funktion der Gestalt pb ( x) = x b (mit b ∈ R) heißt Potenzfunktion; ist speziell b = 1 mit n n ∈ N, n ≥ 2, so heißt pb (x) Wurzelfunktion. Eigenschaften: 1. Nach der Definition der Potenz ist eine Potenzfunktion pb ( x) = x b stets mindestens auf R+
definierbar; in Abhängigkeit von b kann D pb auch größer sein, und zwar: a) Für b ≥ 0 kann pb auch auf R0+ definiert werden. b) Für b ∈ Z kann pb auf R*, für b ∈ N sogar auf ganz R definiert werden. 2. Für b > 0 (bzw. b < 0) ist pb | R0+ streng monoton wachsend (bzw. fallend), besitzt also 1
eine auf W pb = R0+ definierte Umkehrfunktion. Diese ist x b . 3. Für alle Potenzfunktionen ist pb (1) = 1.
3.3 Potenz- und Wurzelfunktionen
73
In den folgenden Bildern (3.3.1) bis (3.3.10) sind einige charakteristische Graphen für Potenzfunktionen pb ( x) = x b mit unterschiedlichen Werten für b dargestellt.
Bild 3.3.1: b = ungerade natürliche Zahl
Bild 3.3.2: zugehörige Umkehrfunktionen
Bild 3.3.3: b = gerade natürliche Zahl
Bild 3.3.4: zugehörige Umkehrfunktionen
Bild 3.3.5: b = ungerade negative Zahl
Bild 3.3.6: zugehörige Umkehrfunktionen
74
3 Elementare Funktionen
Bild 3.3.7: b = gerade negative Zahl
Bild 3.3.8: zugehörige Umkehrfunktionen
Bild 3.3.9: b = reelle positive Zahl ∉ Z (samt b für Umkehrfunktionen)
Bild 3.3.10: b = reelle negative Zahl ∉ Z (samt b für Umkehrfunktionen)
3.4
Exponential- und Logarithmus-, Hyperbel- und Areafunktionen
Definition:
Die für festes a ∈ R+ durch exp a x = a x auf ganz R definierte Funktion heißt (allgemeine) Exponentialfunktion. Nach Definition der Potenz ist bei jeder positiven Basis a der Ausdruck ax für jedes reelle x definiert. Für a = 1 ergibt sich dabei die konstante Funktion vom Werte 1, die man ja auch als Polynom vom Grade 0 auffassen kann; für a ∈ ] 0, 1[ ergibt sich wegen a = 1 (mit b > 1): b x x 1 1 a x = 1 = x = x , das heißt, jede Exponentialfunktion mit einer Basis < 1 lässt sich b b b
3.4 Exponential- und Logarithmus-, Hyperbel- und Areafunktionen
75
mittels Kehrwert auf eine solche mit einer Basis > 1 zurückführen. Deshalb werden hier – wie sonst auch üblich – nur Exponentialfunktionen mit Basen > 1 betrachtet. Eine Exponentialfunktion exp a x = a x mit a > 1 hat folgende Eigenschaften: 1. expa (0) = 1 (das heißt, die Graphen aller Exponentialfunktionen haben diesen Punkt gemeinsam). 2. Wexp a = R+ (das heißt, Exponentialfunktionen nehmen genau alle positiven Werte an). 3. a x ist streng monoton wachsend, besitzt also eine auf R+ definierte Umkehrfunktion, die sogenannte Logarithmusfunktion zur Basis a, mit log a x bezeichnet. 4. log a x ist auf R+ definiert, hat den Wertebereich R und ist − wie a x − streng monoton wachsend. 5. Aus der Basiswechselformel
log b x =
log a x log a b
erhält man mit a = e (EULERsche Zahl) für beliebiges b > 1 log b x =
ln x ln b
Die graphische Darstellung von log b x erhält man also aus der von ln x durch einfaches 1 Umskalieren der y-Achse um den Faktor . ln b Analog lassen sich alle Exponentialfunktionen auf die zur Basis e, die sogenannte spezielle Exponentialfunktion (kurz: die e-Funktion) zurückführen; der Basiswechsel entspricht nun einer Umskalierung der x-Achse um den Faktor ln a : a x = e x ln a
76
3 Elementare Funktionen
Bild 3.4.1: Exponentialfunktionen
Bild 3.4.2: Logarithmusfunktionen zu verschiedenen Basiswerten a
Definition:
(e (e
− e− x
x
+ e− x
sinh x =
1 2
(ii)
cosh x =
1 2
(iii)
tanh x = sinh x cosh x coth x = cosh x sinh x
(iv)
) )
x
(i)
(„sinus hyperbolicus“) („cosinus hyperbolicus“) („tangens hyperbolicus“) („cotangens hyperbolicus“)
Eigenschaften: 1. Definitionsbereiche: sinh, cosh und tanh können auf ganz R definiert werden; da sinh nur in 0 eine Nullstelle hat, ist dcoth = R*. 2. Wertebereiche: Wsinh = R, Wcosh = [1, ∞ [, Wtanh = ]−1, 1 [, Wcoth = R \ [−1, 1 ]. 3. Für alle x ∈ R gilt die wichtige Formel:
cosh 2 x − sinh 2 x = 1
4. cosh und coth haben keine Nullstellen, sinh und tanh jeweils nur in 0. 5. cosh ist gerade, sinh, tanh und coth sind ungerade. 6. sinh und tanh sind auf ganz R, cosh ist auf [0, ∞ [ streng monoton wachsend und auf ]−∞, 0 ] streng monoton fallend; coth ist auf ]−∞, 0 [ und auf ]0, ∞ [ jeweils streng monoton fallend (Definitionslücke in 0 beachten!).
3.4 Exponential- und Logarithmus-, Hyperbel- und Areafunktionen
77
7. Deshalb sind sinh, tanh und coth auf ihrem jeweiligen Definitionsbereich, cosh beschränkt auf [0, ∞ [ umkehrbar. Die jeweiligen Umkehrfunktionen werden mit arsinh, artanh, arcoth und arcosh bezeichnet und heißen Area-Sinus-Hyperbolicus-Funktion und entsprechend für die anderen. Diese lassen sich in ihrem jeweiligen Definitionsbereich ausdrücken als ar sinh x = ln x + x 2 + 1 , arcosh x = ln x + x 2 − 1 , x + 1 1 ar tanh x = ar coth x = 2 ln (unterschiedliche Definitionsbereiche!) x −1
Die angesprochenen Verlaufseigenschaften der hyperbolischen Funktionen und ihrer Umkehrfunktionen sind auch an den in Bild 3.4.3 bis 3.4.6 dargestellten Graphen erkennbar.
Bild 3.4.3: sinh x und cosh x
Bild 3.4.4: tanh x und coth x
Bild 3.4.5: arsinh x und arcosh x
Bild 3.4.6: artanh x und arcoth x
78
3 Elementare Funktionen
3.5
Trigonometrische und Arcus-Funktionen
Definitionen und grundlegende Eigenschaften der trigonometrischen Funktionen wurden bereits in 1.6 behandelt; alle weiteren Formeln werden wie üblich im Bogenmaß notiert. Eigenschaften der trigonometrischen Funktionen 1. sin x und cos x sind auf ganz R definiert und 2π-periodisch, das heißt
sin( x + 2π ) = sin x und cos( x + 2π ) = cos x ∀x ∈ R . 2. Es ist tan x = sin x und cot x = cos x , sin 2 x + cos 2 x = 1 . cos x sin x
Deshalb ist
Dtan = R\{b ∈ R | cos b = 0}
und
Dcot = R\{b ∈ R | sin b = 0}.
tan x und cot x sind π-periodisch. 3. Nullstellen:
sin b = 0
⇔
b = k⋅π
cos b = 0
⇔
b = π + k⋅π 2
tan b = 0
⇔
b = k⋅π
cot b = 0
⇔
b = π + k⋅π 2
Dabei ist stets k ∈ Z. Die Nullstellen einer trigonometrischen Funktion haben also jeweils den Abstand π voneinander; sin x und cos x haben somit in jeder Periode zwei, tan x und cot x nur eine Nullstelle. 4. Wertebereiche: Wsin = Wcos = [−1, 1] , Wtan = Wcot = R .
Insbesondere gilt für die Minimal- bzw. Maximalwerte von sin x und cos x: sin b = 1 ⇔ b = π + 2k⋅π 2
bzw.
sin b = −1 ⇔ b = 3π + 2k⋅π ; 2
cos b = 1 ⇔ b = 2k⋅π
bzw.
cos b = −1 ⇔ b = (2k + 1)⋅π
5. Symmetrieeigenschaften: sin x, tan x und cot x sind ungerade, cos x ist eine gerade Funktion, also: sin( − x ) = − sin x , tan(− x) = − tan x , cot(− x) = − cot x und cos(− x) = cos x . 6. Verschiebungen um eine halbe bzw. Viertelperiode im Argument von Sinus- und Kosinusfunktion ergeben: sin( x + π ) = − sin x
und
cos( x + π ) = − cos x
sin( x + π ) =cos x 2
und
cos( x + π ) = − sin x . 2
Die letzte Gleichung bedeutet anschaulich, dass der Kosinus dem Sinus um eine Viertelperiode voraus läuft, was auch an den in Bild 3.5.1 dargestellten Graphen zu sehen ist.
3.5 Trigonometrische und Arcus-Funktionen
79
Bild 3.5.1: Die Graphen von Sinus- und Kosinusfunktion
7. Additionstheoreme: Für alle x, y ∈ R gilt:
sin( x ± y ) = sin x cos y ± sin y cos x
cos( x ± y ) = cos x cos y m sin x sin y
8. Hieraus lassen sich viele weitere nützliche Formeln1) ableiten, etwa:
tan( x ± y ) =
tan x ± tan y 1 m tan x tan y
cot( x ± y ) =
cot x cot y m 1 cot x ± cot y
sin 3x = 3 sin x − 4 sin 3 x
sin 2 x = 2 sin x cos x
n n sin nx = n sin x cos n−1 x − sin 3 x cos n−3 x + sin 5 x cos n−5 x − K 3 5 cos 2 x = cos 2 x − sin 2 x
cos 3x = 4 cos 3 x − 3 cos x
n n cos nx = cos n x − sin 2 x cos n−2 x + sin 4 x cos n− 4 x − K 2 4
tan 2 x =
2 tan x 1 − tan 2 x
tan 3x =
3 tan x − tan 3 x 1 − 3 tan 2 x
cot 2 x =
cot 2 x − 1 2 cot x
cot 3x =
cot 3 x − 3 cot x 3 cot 2 x − 1
9. Summen und Differenzen von trigonometrischen Ausdrücken:
sin x + sin y = 2 sin
x+ y x− y cos 2 2
cos x + cos y = 2 cos
1)
x+ y x− y cos 2 2
sin x − sin y = 2 sin
x− y x+ y cos 2 2
cos x − cos y = −2 sin
x und y sind jeweils so zu wählen, dass alle vorkommenden Ausdrücke definiert sind!
x+ y x− y sin 2 2
80
3 Elementare Funktionen
Bild 3.5.2: Die Graphen von Tangens- und Kotangensfunktion
10. Produkte von trigonometrischen Ausdrücken:
1 sin x sin y = [cos( x − y ) − cos( x + y )] 2 1 sin x cos y = [sin( x − y ) + sin( x + y )] 2 1 cos x cos y = [cos( x − y ) + cos( x + y )] 2 11. Ausdrücke mit dem halben Winkel:
sin 2 tan
α 2
α 2
= =
1 − cos α 2
cos 2
sin α 1 + cos α
cot
α
α 2
2
=
=
1 + cos α 2
sin α 1 − cos α
12. Wechsel zwischen verschiedenen trigonometrischen Funktionen:
sin x = l ⋅ 1 − cos 2 x = k ⋅ cos x = k ⋅ 1 − sin 2 x = k ⋅
tan x = k ⋅
sin x 2
1 − sin x
=l⋅
tan x 1 + tan 2 x 1 1 + tan 2 x cos x 1 − cos 2 x
3.5 Trigonometrische und Arcus-Funktionen
Dabei ist
π π 1 für x ∈[− 2 , 2 ] k = und − 1 für x ∈ ] π , 3π [ 2 2 (bzw. 2π-periodisch fortgesetzt).
81
1 für x ∈[ 0,π ] l= − 1 für x ∈ ]π ,2π [
Arcusfunktionen
Die trigonometrischen Funktionen sind auf ihrem gesamten möglichen Definitionsbereich nicht injektiv, besitzen also dort keine Umkehrfunktion. Deshalb beschränkt man sich bei der Umkehrung jeweils auf Teilmengen des Definitionsbereichs. Üblich ist dabei Folgendes: 1. f = sin | [ − π ,π ] besitzt die Umkehrfunktion f −1 ( x) = arcsin x , deshalb: 2 2
darcsin = [−1, 1], warcsin = [ − π ,π ], arcsin ist streng monoton wachsend. 2 2 2. f = cos | [0, π ] besitzt die Umkehrfunktion f −1 ( x) = arccos x , deshalb:
darccos = [−1, 1], warccos = [0, π ], arccos ist streng monoton fallend. 3. f = tan | ] − π ,π [ besitzt die Umkehrfunktion f −1 ( x) = arctan x , deshalb: 2 2
darctan = R, warctan = ] − π ,π [, arctan ist streng monoton wachsend. 2 2 4. f = cot | ]0, π [ besitzt die Umkehrfunktion f −1 ( x) = arc cot x , deshalb:
darccot = R, warccot = ]0, π [, arccot ist streng monoton fallend.
Bild 3.5.3: arcsin x und arccos x
Bild 3.5.4: arctan x und arccot x
Nach Definition der Umkehrfunktion ist sin(arcsin x) = x für alle x ∈ D arcsin ; Entsprechendes gilt für cos, tan und cot.
82
3 Elementare Funktionen
Mittels 12. erhält man darüber hinaus: sin(arccos x) = 1 − x 2 ,
sin(arctan x) =
cos(arcsin x ) = 1 − x 2 ,
cos(arctan x) =
tan(arcsin x) =
3.6
x 1 − x2
,
tan(arccos x) =
x
,
1 + x2 1 1 + x2
,
1 − x2 . x
Komplexe Funktionen
In diesem Abschnitt soll kurz auf komplexe Funktionen einer Veränderlichen eingegangen werden. Diese Veränderliche wird, wie in C üblich, mit z = x + iy bezeichnet. Es sei darauf hingewiesen, dass man wie in Abschnitt 1.2 einen Graphen definieren kann, dieser sich aber im Allgemeinen nicht skizzieren lässt, da man dafür ja einen vierdimensionalen Darstellungsraum benötigte. Alle hier behandelten Funktionen sind Fortsetzungen der entsprechenden reellen Funktionen, die in den vorherigen Abschnitten behandelt wurden. Dabei heißt die (komplexe) Funktion f : d → C eine Fortsetzung der (reellen) Funktion f , wenn f (x) = f (x) für alle x ∈ R ∩ d ist. Ist dies der Fall, so wird auf den entsprechenden Index verzichtet. C
R
C
R
Definition: n
Eine Funktion p: c → c , gegeben durch z a p( z ) =
∑a z k
k
mit ak ∈ c, an ≠ 0, heißt
k =0
komplexes Polynom vom Grade n. Für eine Nullstelle b von p(z ) lässt sich, wie bei jedem Körper, ein Linearfaktor z − b ausklammern; über C gilt jedoch darüber hinaus der wichtige Fundamentalsatz der Algebra:
Jedes komplexe Polynom mit grad p ≥ 1 hat eine Nullstelle. Anders formuliert: Jedes komplexe Polynom vom Grade n (n ≥ 1) zerfällt vollständig in Linearfaktoren, das heißt, es hat genau n (nicht unbedingt voneinander verschiedene!) Nullstellen.
Dies gilt, da R ⊆ c ist, natürlich auch für reelle Polynome und scheint auf den ersten Blick dem Zerlegungssatz aus Abschnitt 3.2 zu widersprechen – man muss jedoch beachten, dass bei dieser Aussage die komplexen Nullstellen mitzuzählen sind!
3.6 Komplexe Funktionen
83
Ist q eine (echt) komplexe Nullstelle eines reellen Polynoms p (x) , so gilt dies auch für q ; komplexe Nullstellen eines reellen Polynoms liegen also stets in gerader Anzahl vor. Wegen des Fundamentalsatzes der Algebra ist die Partialbruchzerlegung über C einfacher Ai als die über R, da dort nur Partialbrüche der Gestalt auftreten (wegen der fehlen(z − b j )k den irreduziblen quadratischen Terme bei der komplexen Zerlegung des Nennerpolynoms). Komplexe Exponentialfunktion
Diese wird für beliebiges z ∈ c, z = x + iy, definiert als e z = e x+iy = e x (cos y + i sin y )
1)
Offensichtlich ist diese Funktion eine Fortsetzung der reellen e-Funktion. Wie im Reellen: e z hat keine Nullstelle und e z1+ z2 = e z1 ⋅ e z2 gilt für alle z1, z2 ∈ c. Anders als in R: e z ist nicht injektiv, besitzt also keine Umkehrfunktion auf d. Mit der komplexen Exponentialfunktion erhält man (mit beliebigem z ∈ c) Komplexe hyperbolische und trigonometrische Funktionen
cosh z = 12 (e z + e − z )
sinh z = 12 (e z −e − z )
cos z = 12 (e iz + e − iz )
sin z =
1 2i
( e iz − e − iz )
Auch diese Funktionen sind Fortsetzungen der entsprechenden elementaren reellen Funktionen. Eigenschaften: 1. Für alle z ∈ c:
cosh 2 z − sinh 2 z = 1
und
cos 2 z + sin 2 z = 1 .
2. Für alle z ∈ c:
cosh(iz ) = cos z
und
sinh(iz ) = i sin z .
3. In C gelten – wie in R – die Additionstheoreme für trigonometrische Funktionen
sin( z1 ± z 2 ) = sin z1 cos z 2 ± cos z1 sin z 2 und cos( z1 ± z 2 ) = cos z1 cos z 2 m sin z1 sin z 2 4. Mit 2. und 3. lassen sich die komplexen trigonometrischen Funktionen nur durch reelle Funktionen ausdrücken; es gilt für alle a, b ∈ R: 1)
Dabei sind auf der rechten Seite der Gleichung die vom Reellen her bekannten elementaren Funktionen gemeint.
84
3 Elementare Funktionen sin( a + ib) = sin a cosh b + i cos a sinh b und cos(a + ib) = cos a cosh b − isina sinh b
5. Nullstellen:
π
cosh z = 0
⇔
sinh z = 0
⇔
+ kπ ) 2 z = i ⋅ kπ
cos z = 0
⇔
z=
sin z = 0
⇔
z = i(
π
2 z = kπ
+ kπ (jeweils k ∈ Z)
Bemerkenswert ist, dass die trigonometrischen Funktionen auch im Komplexen nur die aus R bekannten Nullstellen haben, während die hyperbolischen Funktionen zusätzlich noch rein-imaginäre Nullstellen besitzen. 6. Anders als in R sind die trigonometrischen Funktionen im Komplexen unbeschränkt, für die hyperbolischen gilt dies ja schon im Reellen. Sowohl komplexe hyperbolische als auch trigonometrische Funktionen sind nicht injektiv, sie besitzen also keine Umkehrfunktion.
Wie oben bereits erwähnt, ist die komplexe Exponentialfunktion nicht umkehrbar. Deshalb formuliert man folgende Definition:
Für alle z ∈ c \ ]–∞, 0] definiert man die komplexe Logarithmusfunktion log durch: log z = ln |z| + j⋅arg z Man beachte, dass wegen der Wahl des Definitionsbereichs stets arg z ∈ ] −π, π [ und |z| > 0 ist. Wie der natürliche Logarithmus ln ist auch der komplexe Logarithmus log für negative reelle Zahlen nicht definiert, auf R+ jedoch stimmen log und ln überein. Achtung: Einige für die reelle ln-Funktion bekannte Regeln gelten für die komplexe logFunktion im Allgemeinen nicht, etwa: 1. Es gilt zwar e log z = z für alle z ∈ c \ ]–∞, 0], die Umkehrung log e z = z gilt jedoch zum Beispiel nicht für z mit Im z ∈ ] π, 2π [. 2. Auch log( z1 ⋅ z 2 ) = log z1 + log z 2 gilt nur für solche zi , deren Argument-Summe nicht über π oder unter – π hinausgeht.
Mit komplexer Exponential- und Logarithmusfunktion kann man − analog zum Reellen − auch Potenzen mit komplexen Exponenten erklären: Definition:
Für w ∈ c \ ]–∞, 0] und z ∈ c ist w z = e z⋅log w
4
Differentialrechnung einer reellen Veränderlichen
In diesem Kapitel sollen nicht nur der Ableitungsbegriff in R und seine Anwendungen behandelt werden, sondern es soll auch auf den dabei zugrundeliegenden Konvergenzbegriff bei Folgen und Funktionen eingegangen werden. Im letzten Abschnitt werden die Ergebnisse auf komplex- und vektorwertige Funktionen verallgemeinert.
4.1
Konvergenz von Folgen
Definition:
Eine Folge reeller Zahlen ist eine Funktion a : N → R . Statt a(k) wird üblicherweise ak für den Funktionswert geschrieben. Bezeichnungsweisen für Folgen: {ak }k∈n oder (ak ) ∞0 oder – weniger exakt – einfach ak . Verallgemeinerungen: 1. Statt der Menge aller natürlichen Zahlen kommen als Definitionsbereich von Folgen auch solche Teilmengen von N infrage, die aus allen k bestehen, die größer oder gleich einem festen n sind, zum Beispiel N+. Charakteristisch für Folgen ist, dass der Definitionsbereich ein kleinstes Element hat, unendlich und diskret ist. 2. Statt Folgen reeller Zahlen kann man analog Folgen von komplexen Zahlen, Vektoren, Matrizen, Funktionen o.Ä. definieren. Charakteristisch für den Folgenbegriff ist der Definitionsbereich (vgl. 1.).
Folgen werden als Funktionen genau wie diese oft durch eine Rechenvorschrift gegeben; aufgrund des besonderen Definitionsbereichs können sie aber auch rekursiv gegeben werden: Eine Folge {ak }k∈n ist eindeutig durch die Angabe eines Anfangsglieds a0 sowie eine Rekursionsvorschrift Rk+1 gegeben, mit der sich ak+1 eindeutig aus ak bestimmen lässt. Ein Beispiel hierfür ist die Folge der Binomialkoeffizienten (siehe auch Abschnitt 1.5):
https://doi.org/10.1515/9783110537161-095
86
4 Differentialrechnung einer reellen Veränderlichen
α α − k α α := . := 1 und k + 1 k + 1 k 0
α Für festes α ∈ R ist definiert durch k
Durch sukzessive Anwendung der Rekursionsvorschrift ergibt sich
α = α 1
α α (α − 1) , = , 2 2
α α (α − 1)(α − 2) = usw. 6 3
sowie für α = n ∈ N bei n ≥ k :
n n! = und damit k k !⋅ (n − k )!
bei n < k :
n = 0 . k
n n = , k n − k
Bei der verallgemeinerten Rekursion kann die Rekursionsvorschrift zur Berechnung von ak+1 nicht nur ak , sondern auch weitere Vorgängerglieder benutzen; es müssen dann entsprechend viele Anfangsglieder vorgeschrieben werden. Ein Beispiel hierfür sind die sogenannten FIBONACCI-Zahlen 0, 1, 1, 2, 3, 5, 8, 13,…, die durch a0 = 0, a1 = 1 (Anfangsglieder) sowie ak +1 = ak + ak −1 (Rekursionsvorschrift) gegeben sind. Viel komplizierter ist die explizite Formel von BINET-DE MOIVRE: k
1 1 + 5 1 1 − 5 ak = − 5 2 5 2
k
Definition:
(i) {ak }k∈n konvergiert gegen a ∈ R (geschrieben: lim ak = a ) k →∞
⇔
∀ε ∈ r ∃k 0 ∈ n ∀k ∈ n : k ≥ k 0 ⇒ | ak − a | < ε . +
Ist a = 0, so heißt {ak }k∈n Nullfolge. (ii) {ak }k∈n konvergiert gegen +∞ ( lim ak = +∞ ) bzw. gegen −∞ ( lim ak = −∞ ) k →∞
⇔
k →∞
∀M ∈ r ∃k 0 ∈ n ∀k ∈ n : k ≥ k 0 ⇒ ak > M bzw. ak < − M +
(iii) Eine Folge heißt konvergent, wenn es eine reelle Zahl a mit lim ak = a gibt, sonst k →∞
heißt sie divergent.1) (iv) {ak }k∈n heißt CAUCHY-Folge ⇔
1)
∀ε ∈ r + ∃k 0 ∈ n ∀k , m ∈ n : k , m ≥ k 0 ⇒ | ak − am | < ε .
Manchmal wird eine Folge auch nur dann als divergent bezeichnet, wenn (i) und (ii) nicht zutreffen.
4.1 Konvergenz von Folgen
87
Konvergenz gegen einen Grenzwert a bedeutet also anschaulich ausgedrückt, dass von einem bestimmbaren Index k0 an alle Folgenglieder um weniger als ε von a entfernt sind (siehe (i) in obiger Definition); CAUCHY-Konvergenz (siehe (iv)) bedeutet lediglich, dass von k0 an alle Folgenglieder um weniger als ε voneinander entfernt sind. Dass jede Folge mit Grenzwert auch CAUCHY-konvergent ist, folgt unmittelbar aus der Dreiecksungleichung; dass auch jede CAUCHY-Folge einen Grenzwert besitzt, gilt nicht allgemein, jedoch für reelle Zahlenfolgen: Dies ist gerade der Inhalt des Vollständigkeitsbegriffs von R. So lässt sich leicht zeigen, dass die durch 3 a 1 , ak +1 = k + 2 2 ak
a0 =
rekursiv definierte Folge rationaler Zahlen zwar eine CAUCHY-Folge ist, ihr Grenzwert 2 ist jedoch bekanntlich irrational, liegt also außerhalb des Zahlenbereichs der Folgenglieder. Elementare Grenzwertsätze:
Für konvergente (!) Folgen {ak }k∈n und {bk }k∈n gilt: (i) (ii) (iii)
lim (ak ± bk ) = lim ak ± lim bk
k →∞
(
k →∞
)(
k →∞
lim (ak ⋅ bk ) = lim ak ⋅ lim bk
k →∞
k →∞
k →∞
)
ak ak lim = k →∞ , falls alle bk ≠ 0 sind und lim bk ≠ 0 ist. k →∞ b k →∞ lim bk k lim
k →∞
α
α
(
)
α
(iv)
Falls ak
(v)
lim | ak | = lim ak
(vi)
ak ≤ lim bk (∀k ∈ n : ak ≤ bk ) ⇒ lim k →∞ k →∞
(vii)
Ist lim bk = 0 und {ck }k∈n eine beschränkte – nicht unbedingt konvergente –
k →∞
für alle k ∈ N definiert ist:
lim ak = lim ak k →∞
k →∞
k →∞
k →∞
Folge, so ist auch lim bk ⋅ ck = 0 . k →∞
(viii)
Ist {ck }k∈n eine Folge derart, dass ak ≤ ck ≤ bk für alle k ∈ N gilt und ist außerdem lim ak = lim bk , so ist auch ck konvergent mit lim ck = lim ak . k →∞
k →∞
k →∞
k →∞
Offensichtlich ist jede konvergente Folge nach oben und unten beschränkt; die Umkehrung gilt aber im Allgemeinen nicht, es gilt jedoch der Grenzwertsatz für monotone Folgen:
Ist {ak }k∈n monoton wachsend (bzw. monoton fallend) und nach oben beschränkt (bzw. nach unten beschränkt), so existiert lim ak in R. k →∞
88
4 Differentialrechnung einer reellen Veränderlichen
Einige wichtige Grenzwerte:
(i)
lim
k →∞
1 =0 k +1
(ii)
lim k c = 1
für alle c > 0
(iii)
lim k k α = 1
für alle α > 0
(iv)
lim k p(k ) = 1
für jedes Polynom p(x) ≠ Nullpolynom
(v)
falls | c | < 1 0 lim c = ∞ falls c > 1 k →∞ ex. nicht falls c < −1
(vi)
1 lim 1 + = e k k →∞
k →∞
k →∞
k →∞
k
k
Gleichung (vi) wird häufig als Definitionsgleichung für die EULERsche Zahl e genommen: k
1 Die Folge 1 + ist – wie man zeigen kann – streng monoton wachsend und durch S = 3 k nach oben beschränkt, nach dem Grenzwertsatz für monotone Folgen existiert also der Grenzwert in R – er wird e genannt.
4.2
Grenzwert von Funktionen und Stetigkeit
Definition: Für f : d → r , x0 , a ∈ r definiert man: (i) (ii)
lim f ( x) = a
x → x0
lim f ( x ) = a
x → x0 +
⇔
∀ε ∈ r + ∃δ ∈ r + ∀x ∈ d :| x − x0 | < δ ⇒ | f ( x) − a | < ε
⇔
∀ε ∈ r + ∃δ ∈ r + ∀x ∈ d : (| x − x0 | < δ ∧ x > x0 ) ⇒ | f ( x) − a | < ε
(iii)
lim f ( x) = a
x → x0 −
⇔
∀ε ∈ r + ∃δ ∈ r + ∀x ∈ d : (| x − x0 | < δ ∧ x < x0 ) ⇒ | f ( x) − a | < ε
4.2 Grenzwert von Funktionen und Stetigkeit (iv) (v)
89
lim f ( x) = a
⇔
∀ε ∈ r + ∃M ∈ r +∀x ∈ d : x > M ⇒ | f ( x) − a | < ε
lim f ( x) = a
⇔
∀ε ∈ r + ∃M ∈ r + ∀x ∈ d : x < − M ⇒ | f ( x) − a | < ε
x →∞
x →−∞
Bei (i) spricht man vom beidseitigen, bei (ii) bzw. (iii) vom rechtseitigen bzw. linksseitigen Grenzwert von f in x0. Analog ist lim f ( x) = ±∞ definiert: In (i) bis (v) ist jeweils lediglich der Ausdruck | f ( x) − a | < ε zu ersetzen, und zwar bei lim f ( x) = ∞ durch f (x) > ε , bei lim f ( x) = −∞ durch f (x) < −ε . Offenbar gilt:
lim f ( x) = a
x → x0
lim f ( x) = a und lim f ( x) = a
⇔
x → x0 +
x → x0 −
Praktischer zur konkreten Berechnung von lim f ( x) ist jedoch folgende äquivalente x → x0
Definition: Für f : d → r , x0 , a ∈ r definiert man: (i)
lim f ( x) = a
x → x0
⇔
Für alle Folgen xk mit Werten aus d und lim xk = x0 ist k →∞
lim f ( xk ) = a .
k →∞
(ii)
lim f ( x) = a
x → x0 +
⇔
Für alle Folgen xk mit Werten aus d, xk > x0 und lim xk = x0 ist lim f ( xk ) = a . k →∞
(iii)
lim f ( x) = a
x → x0 −
⇔
k →∞
Für alle Folgen xk mit Werten aus d, xk < x0 und lim xk = x0 ist lim f ( xk ) = a . k →∞
(iv)
lim f ( x) = a x →∞
⇔
k →∞
Für alle Folgen xk mit Werten aus d und lim xk = ∞ ist k →∞
lim f ( xk ) = a .
k →∞
(v)
lim f ( x) = a
x → −∞
⇔
Für alle Folgen xk mit Werten aus d und lim xk = −∞ k →∞
ist lim f ( xk ) = a . k →∞
Bei unendlichem Funktionsgrenzwert ist analog zu oben a durch ±∞ zu ersetzen.
90
4 Differentialrechnung einer reellen Veränderlichen
Es sei ausdrücklich auf die Bedeutung von „alle“ in der letzten Formulierung hingewiesen: 1 1 Will man prüfen, ob z.B. lim sin existiert, so würde das Einsetzen der Nullfolge xk = x →0 πk x 1 den Grenzwert 0 nahe legen; nimmt man jedoch das ebenfalls mögliche xk = π , so ist + 2π k 2 lim f ( xk ) = 1 ≠ 0 , lim sin x →0
k →∞
1 existiert also nicht. x
Die Definition des Grenzwerts von Funktionen mittels Folgenkonvergenz hat auch den Vorteil, dass sich die elementaren Grenzwertsätze aus Abschnitt 4.1 ohne weiteres übertragen lassen, etwa: Der Grenzwert einer Summe von Funktionen ist die Summe der Einzelgrenzwerte usw. Ein zentraler Begriff für Funktionen findet sich in folgender
Definition: Es sei f : d → r , x0 ∈ d . (i)
f heißt stetig in x0
(ii)
f heißt rechtsseitig stetig in x0
(iii)
f heißt linksseitig stetig in x0
⇔
f ( x0 ) = lim f ( x)
⇔
f ( x0 ) = lim f ( x)
⇔
f ( x0 ) = lim f ( x)
x→ x0
x→ x0 +
x → x0 −
Gemäß der Definition ist klar, dass die Stetigkeit einer Funktion an einer Stelle x0 beinhaltet, dass x0 zum Definitionsbereich gehört. Liegt in x0 eine Definitionslücke einer sonst stetigen Funktion vor, so kann, wenn lim f ( x) = a in R existiert, f zu einer auch in x0 stetigen Funkx → x0
tion dadurch fortgesetzt werden, dass a als Funktionswert der Definitionslücke definiert wird. Aus den elementaren Grenzwertsätzen folgt unmittelbar, dass Summe, Differenz, Produkt und – wenn möglich – Quotient zweier an der Stelle x0 stetiger Funktionen in x0 ebenfalls stetig sind. Darüber hinaus kann man damit sowie mit weitergehenden Grenzwertuntersuchungen zeigen, dass alle im Kapitel 3 besprochenen elementaren Funktionen auf ihren jeweiligen Definitionsbereichen stetig sind, es gilt also der wichtige
Satz: Ganzrationale und gebrochen rationale Funktionen, Potenz- und Exponentialfunktionen, hyperbolische und trigonometrische Funktionen sind auf ihrem jeweiligen Definitionsbereich stetig. Dasselbe gilt für deren ggf. existierende Umkehrfunktionen. Eine der wichtigsten Eigenschaften stetiger Funktionen enthält der sogenannte
4.3 Ableitung, Tangente, Differential
91
Zwischenwertsatz: Die Funktion f sei auf einem Intervall (!) I stetig, es seien a und b beliebige Stellen dieses Intervalls mit a < b. Dann gibt es für jeden Wert η zwischen f (a) und f (b) (mindestens) ein ξ ∈ ]a, b[ mit f (ξ) = η . Anschaulich besagt der Zwischenwertsatz, dass bei auf einem Intervall stetigen Funktionen der Übergang zwischen den Funktionswerten „kontinuierlich“, also „stetig“ vonstattengeht, es gibt keine Sprünge – noch einfacher ausgedrückt: Man kann den Graphen einer auf einem Intervall stetigen Funktion zeichnen, ohne den Stift abzusetzen.
4.3
Ableitung, Tangente, Differential
Nur für ein Polynom ersten Grades, das bekanntlich durch eine Gerade dargestellt wird, lässt sich „Steigung“ leicht definieren: In jedem Punkt P ist der relative Zuwachs des Funktions∆f konstant und lässt sich als Tangens des Schnittwinkels α der Geraden mit der werts ∆x positiven x-Achse leicht berechnen. Wie aus Bild 4.3.1 ersichtlich, ist für eine beliebige in einer Umgebung von x0 definierte Funktion dieser Ausdruck von ∆x abhängig.
Bild 4.3.1: Steigung, Tangente und Differential einer in x0 differenzierbaren Funktion
f ( x0 + ∆x) − f ( x0 ) ∆f = , definiert für solche ∆x ≠ 0 (auch negative!), dass ∆x ∆x x0 + ∆x ∈ d f ist, heißt Differenzenquotient von f an der Stelle x0 .
Der Ausdruck
Differenzierbarkeit und Ableitung Da der Differenzenquotient im Allgemeinen von ∆x abhängt und nur für betraglich kleine ∆f Werte annähernd den lokalen Anstieg in x0 widerspiegelt, bildet man lim und hat die ∆x →0 ∆x
92
4 Differentialrechnung einer reellen Veränderlichen
Definition: f heißt differenzierbar in x0
⇔
lim
∆x →0
f ( x 0 + ∆x ) − f ( x 0 ) existiert in R. ∆x
Der Grenzwert heißt Differentialquotient oder (erste) Ableitung von f an der Stelle x0. Er df wird mit oder mit f ′( x0 ) bezeichnet. dx x = x 0
Existiert der Grenzwert nicht nur an einer Stelle x0 ∈ Df, sondern auf einer Teilmenge I ⊆ Df, so ist durch x a f ′(x ) auf I die Ableitungsfunktion f ′(x) definiert. Manchmal wird auch der (schwächere) Begriff der rechtsseitigen (bzw. linksseitigen) Differenzierbarkeit benutzt: In obiger Definition wird dann der beidseitige Grenzwert durch den entsprechenden einseitigen ersetzt. Häufig wird aus praktischen Gründen x = x0 + ∆x gesetzt, sodass dann f ′( x0 ) = lim
x→ x0
f ( x ) − f ( x0 ) x − x0
definiert ist. Wie die Stetigkeit ist auch die Differenzierbarkeit eine lokale Eigenschaft einer Funktion. Die Aussage „ f ist stetig/differenzierbar“ (ohne Angabe der Stelle x0) wird meist als „ f ist stetig/differenzierbar auf dem betrachteten Definitionsbereich“ verstanden.
Höhere Ableitungen Ist f auf I ⊆ Df differenzierbar, existiert also die Ableitungsfunktion f ′ : I → r , so gilt die
Definition: f heißt zweimal differenzierbar in x0 ⇔ lim
∆x →0
f ′( x0 + ∆x) − f ′( x0 ) existiert in R. ∆x
Der Grenzwert heißt zweite Ableitung von f und wird mit
d2 f oder mit f ′′( x0 ) dx 2 x = x 0
bezeichnet. Analog wird definiert: f ′′′( x) = ( f ′′)′ ( x) , allgemein: f ( n+1) ( x) = ( f ( n ) )′( x) . Die 0-te Ableitung f (0 ) ( x) bezeichnet die Funktion f (x) selbst. Man bezeichnet mit C n ( I ) die Menge aller derjenigen Funktionen, die auf I n-mal stetig differenzierbar sind, das heißt, dass die n-te Ableitung auf I existiert und stetig ist. C 0 ( I ) ist also die Menge aller auf I stetigen Funktionen, C ∞ ( I ) die Menge aller beliebig oft differenzierbaren Funktionen.
4.3 Ableitung, Tangente, Differential
93
Tangente Die Tangente („Berührende“) in P an den Graphen einer differenzierbaren Funktion f (x) ist diejenige (eindeutig bestimmte) Gerade t (x) mit Steigung f ′( x0 ) , die mit dem Graphen von f (x) den Berührpunkt P = ( x0 , f ( x0 )) gemeinsam hat (siehe Bild 4.3.1). Deshalb lautet die Tangentengleichung:
t ( x) = f ( x0 ) + f ′( x0 ) ⋅ ( x − x0 )
Die Existenz der Tangente in P folgt somit aus der Differenzierbarkeit von f (x) in x0. Eine rein geometrische Definition einer Tangenten ist für beliebige Graphen nicht möglich. Man kann jedoch eine Tangente als eine solche Gerade bezeichnen, die durch P geht und in einer Umgebung von x0 die Funktion f (x) „am besten“ approximiert. Unter allen Geraden s(x) durch P, also denjenigen von der Form s ( x) = f ( x0 ) + c ⋅ ( x − x0 ) mit beliebigem c ∈ R, ist t(x) diejenige, für die | f ( x) − t ( x) | für kleiner werdende ∆x schneller gegen 0 geht als | f ( x) − t ( x) | = 0 ist. Die letzte Forderung hat aber unmittelbar ∆x selbst, für die also lim ∆x →0 ∆x die Differenzierbarkeit von f in x0, wie sie oben definiert ist, zur Folge. Differenzierbarkeit und Existenz einer Tangenten sind also äquivalent.
Differential Das Differential df einer differenzierbaren Funktion f gibt den Zuwachs der Tangenten t(x) von x0 bis x0 + ∆x an (vgl. Bild 4.3.1), es ist also df = t ( x0 + ∆x) − t ( x0 ) . Da t(x) eine Gerade ist, erhält man df = tan α ⋅ ∆x = f ′( x0 ) ⋅ ∆x .
(4.3.1)
Setzt man speziell f ( x) = x und beachtet, dass dann f ′( x) = 1 ist, so ergibt sich dx = ∆x , womit man aus (4.3.1) die leicht zu merkende Formel df = f ′( x0 ) ⋅ dx
(4.3.2)
für das Differential erhält1). Wegen der oben beschriebenen Grenzwerteigenschaft der Tangenten ist – für betraglich kleine ∆x – das Differential df eine gute Approximation für die Änderung der Funktionswerte ∆f , eine Tatsache, die zum Beispiel bei der Fehlerrechnung angewendet wird.
1)
Daran wird deutlich, wie geschickt die Schreibweise der Ableitung als Differentialquotient ist.
94
4 Differentialrechnung einer reellen Veränderlichen
4.4
Elementare Ableitungen und Ableitungsregeln
Unmittelbar aus der Definition erhält man durch Grenzwertbildung
Ableitungen einiger elementarer Funktionen:1) ⇒
1. f ( x) = c n
+
2. f ( x) = x (n ∈ N ) ⇒
f ′( x) = 0 f ′( x) = nx n−1
3. f ( x ) = | x |
⇒
f ′( x) = sign x
4. f ( x) = sin x
⇒
f ′( x) = cos x
5. f ( x) = cos x
⇒
6. f ( x) = ln x
⇒
f ′( x) = − sin x 1 f ′( x) = x
(für x ∈ R*, in x = 0 nicht diffb.)
Zur Berechnung weiterer Ableitungen benutzt man diese „Bausteine“ sowie
Elementare Ableitungsregeln:2) 1. Gliedweises Differenzieren von Summen:
( f ± g )′( x) = f ′( x) ± g ′( x)
2. Wegfall eines konstanten Summanden:
( f ( x) ± c)′ = f ′( x)
3. „Durchziehen“ eines konstanten Faktors:
(c ⋅ f ( x))′ = c ⋅ f ′( x)
4. Produktregel (LEIBNIZ-Regel):
( f ⋅ g )′( x) = f ′( x ) ⋅ g ( x) + f ( x) ⋅ g ′( x)
5. Quotientenregel:
′ f f ′( x) ⋅ g ( x) − f ( x) ⋅ g ′( x) ( x) = g ( g ( x)) 2
Die wohl wichtigste Ableitungsregel ist die sogenannte
Kettenregel: Soll die zusammengesetzte Funktion h = f o g differenziert werden und sind die Einzelableitungen f ′ und g ′ bekannt, so ist h′( x ) = ( f o g )′( x) = f ′( g ( x)) ⋅ g ′( x) d f (u ) d f (u ) d u oder anders geschrieben mit u = g (x) : = ⋅ . dx du dx Damit erhält man die Ableitung der Umkehrfunktion:
1) 2)
( f −1 )′( x) =
1 f ′( f −1 ( x))
Wenn nicht anders vermerkt, gelten die Ableitungsformeln auf dem gesamten Definitionsbereich der Funktion. Diese gelten überall dort, wo alle vorkommenden Ausdrücke definiert sind.
4.4 Elementare Ableitungen und Ableitungsregeln
95
Die durch elementare Grenzwertrechnung sowie die daraus durch Anwendung obiger Regeln erhaltenen Ableitungsfunktionen sind in der folgenden Tabelle wichtiger Ableitungen zusammengestellt. Ableitungen sind dabei auf dem jeweils größtmöglichen Definitionsbereich zu betrachten, der durchaus kleiner als der Definitionsbereich der Funktion sein kann (zum Beispiel bei arcsin x).
f (x )
x t für t ∈ R x n
x
f ’(x )
f (x )
t ⋅ x t −1
sinh x
cosh x
1
cosh x
sinh x
tanh x
1 = 1 − tanh 2 x cosh 2 x 1 = −1 + coth 2 x sinh 2 x 1
2 x 1 n ⋅ n x n−1
sin x
cos x
coth x
cos x
− sin x
arcsin x
tan x cot x ln | x | ln sin x ln cos x
f ’(x )
1 = 1 + tan 2 x cos 2 x 1 = 1 + cot 2 x sin 2 x 1 x cot x − tan x
arccos x
−
1 − x2 1
ar sinh x
1 − x2 1 1 + x2 1 − 1 + x2 1
ar cosh x
1 + x2 1
arctan x arc cot x
ex
ex
ar tanh x
a x für a ∈ R+
a x ⋅ ln a
ar coth x
xx
x x (1 + ln x)
x2 − 1 1 1 − x2 1 1 − x2
96
4 Differentialrechnung einer reellen Veränderlichen
Durch mehrfache Anwendung obiger Differentiationsregeln erhält man die höheren Ableitungen einer gegebenen Funktion f (x), von denen einige besonders häufig vorkommende Beispiele hier dargestellt sind:
1. f ( x) = e x
⇒
f ( m ) ( x) = e x
2. f ( x) = sinh x
⇒
sinh x für gerade m f ( m ) ( x) = cosh x für ungerade m
3. f ( x) = cosh x
⇒
cosh x für gerade m f ( m ) ( x) = sinh x für ungerade m
⇒
4. f ( x) = sin x
⇒
5. f ( x) = cos x
f
(m)
f
( m)
m (−1) 2 sin x für gerade m ( x) = m −1 (−1) 2 cos x für ungerade m m (−1) 2 cos x für gerade m ( x) = m +1 (−1) 2 sin x für ungerade m
π
6. f ( x) = sin( ax + b) ⇒
f ( m ) ( x) = a m sin( ax + b + m ) 2
7. f ( x) = cos(ax + b) ⇒
f ( m ) ( x) = a m cos(ax + b + m ) 2
π
8. f ( x) = ln x
⇒
f ( m ) ( x) =
(−1) m−1 (m − 1)! xm
9. f ( x) = x n
⇒
f ( m ) ( x) =
n! x n− m für m ≤ n , sonst f ( m ) ( x) = 0 (n − m)!
⇒
f ( m ) ( x) =
∑a
n
n
10. f ( x) =
∑a x
k
k
k =0
k =m
k
k! x k −m (k − m)!
11. f ( x) = (a + bx)t
⇒
t f ( m ) ( x) = m!(a + bx) t −m für t ∈ R m
12. f ( x) = a bx
⇒
f ( m ) ( x) = (b ln a) m a bx
4.5 Anwendungen der Differentialrechnung
4.5
97
Anwendungen der Differentialrechnung
In diesem Abschnitt sollen wichtige Anwendungen der Differentialrechnung dargestellt werden, nämlich einerseits für die Untersuchung des Wachstumsverhaltens von Funktionen (Kurvendiskussion) und andererseits bei der Bestimmung von Grenzwerten (Regeln von BERNOULLI - de l’HOSPITAL). Grundlage aller Anwendungen sind Mittelwertsatz bzw. Satz von ROLLE, die am Anfang dieses Abschnitts stehen.
Definition: Es sei D ⊆ R, f : D → R eine Funktion, x0 ∈ D. (i)
f besitzt in x0 ein globales Maximum ⇔
(ii) f besitzt in x0 ein globales Minimum
⇔
∀x ∈ D : f ( x) ≤ f ( x0 ) ∀x ∈ D : f ( x) ≥ f ( x0 )
(iii) f besitzt in x0 ein lokales Maximum ⇔ ∃ε ∈ R + : ∀x ∈] x0 − ε , x0 + ε [∩ D : f ( x) ≤ f ( x0 ) (iv) f besitzt in x0 ein lokales Minimum ⇔ ∃ε ∈ R + : ∀x ∈] x0 − ε , x0 + ε [∩ D : f ( x) ≥ f ( x0 ) Statt „global“ ist auch die Bezeichnung „absolut“, statt „lokal“ auch „relativ“ gebräuchlich. Besitzt f in x0 ein Maximum oder Minimum, dann sagt man, dass f in x0 ein Extremum besitzt. Es ist möglich, dass eine Funktion überhaupt keine Extrema besitzt, da Extremwerte – im Gegensatz zu Schranken – stets angenommen werden müssen. Es sei noch darauf hingewiesen, dass der Begriff „lokales Extremum“ häufig auch beinhaltet, dass x0 ein sogenannter innerer Punkt ist, das heißt, dass er nicht auf dem Rande des Definitionsbereichs liegt. Die oben definierten Begriffe lassen sich ohne Schwierigkeiten auf Funktionen mehrerer Veränderlicher oder auf im Komplexen definierte reellwertige Funktionen verallgemeinern. Für den Rest dieses Abschnitts werde zusätzlich vorausgesetzt: Alle betrachteten Funktionen seien auf einem Intervall I, also einem zusammenhängenden Bereich der reellen Achse, definiert und dort differenzierbar.
Satz von ROLLE: Für a, b ∈ I, a < b, sei f (a) = f (b) 1). Dann existiert (mindestens) ein ξ ∈ ] a, b [ mit f ′(ξ ) = 0 . Anschaulich bedeutet dies (siehe Bild 4.5.1), dass der Graph von f mindestens einmal zwischen a und b eine waagerechte Tangente besitzt. Auf den ersten Blick sieht der Satz von ROLLE wie ein Spezialfall des anschließenden Mittelwertsatzes aus; die beiden Sätze sind jedoch äquivalent. 1)
In der ursprünglichen Version ist der Funktionswert 0, was aber als Voraussetzung entbehrlich ist.
98
4 Differentialrechnung einer reellen Veränderlichen
Mittelwertsatz: Es seien a, b ∈ I mit a < b. Dann existiert (mindestens) ein ξ ∈ ] a, b [ mit f ′(ξ ) =
f (b) − f (a ) . b−a
Anschaulich bedeutet dies (siehe Bild 4.5.2), dass der Graph von f mindestens einmal zwischen a und b eine zur Sekanten durch (a, f (a)) und (b, f (b)) parallele Tangente besitzt.
Bild 4.5.1: zum Satz von ROLLE
Bild 4.5.2: zum Mittelwertsatz
Damit können nun Zusammenhänge zwischen dem Wachstumsverhalten und Extrema von f einerseits und Werten der Ableitungsfunktion andererseits formuliert werden.
Wachstumsverhalten von auf Intervallen definierten Funktionen 1.
f ist konstant auf I
⇔
∀x ∈ I : f ′( x) = 0
2.
f ist monoton wachsend auf I
⇔
∀x ∈ I : f ′( x) ≥ 0
3.
f ist monoton fallend auf I
⇔
∀x ∈ I : f ′( x) ≤ 0
Bei 2. bzw. 3. ist zu beachten, dass aus der strengen Monotonie keinesfalls f ′( x) > 0 bzw. f ′( x) < 0 folgt, es gilt jedoch umgekehrt: Ist f ′( x0 ) > 0 (bzw. f ′( x0 ) < 0 ) für ein x0 ∈ I , so ist f auf einer Umgebung von x0 streng monoton wachsend (fallend).
4.5 Anwendungen der Differentialrechnung
99
Lokale Extrema Notwendiges Kriterium:
Damit in x0 ein lokales Extremum vorliegt, muss x0 ein kritischer (stationärer) Punkt sein, das heißt, es muss f ′( x0 ) = 0 sein.
Hinreichendes Kriterium:
Ist f ′( x0 ) = 0 und f ′′( x0 ) < 0 (bzw. f ′′( x0 ) > 0 ), so liegt in x0 ein Maximum (bzw. Minimum) vor.
Notwendig und hinreichend
für ein lokales Maximum (bzw. Minimum) in x0 ist1): f ′( x0 ) = 0 , und in x0 wechselt f ′(x) sein Vorzeichen von + nach – (bzw. von – nach +).
Mittels Differentialrechnung können nur lokale Extrema bestimmt werden. Ob diese auch global sind, muss stets gesondert untersucht werden. Man beachte, dass stetige Funktionen auf einem abgeschlossenen Intervall stets ihr globales Maximum und Minimum annehmen, gegebenenfalls am Rand.
Krümmung und Wendepunkte Die Krümmungsrichtung eines Graphen wird durch das Vorzeichen der zweiten Ableitung bestimmt: Der Graph ist nach links gekrümmt (beim Durchlaufen in positiver x-Richtung) – auch konvex genannt, wenn f ′′( x) ≥ 0 ist; er ist rechts gekrümmt (auch: konkav), wenn f ′′( x ) ≤ 0 ist. Ist f ′′( x0 ) = 0 und findet in x0 ein Vorzeichenwechsel der zweiten Ableitung statt, so liegt ein Wendepunkt vor, die Tangente „schneidet“ dann den Graphen von f im Berührpunkt.
Asymptoten Der Graph einer Funktion f (x) hat an einer Definitionslücke x0 eine senkrechte Asymptote, wenn dort die Funktion den Grenzwert +∞ oder −∞ hat. Gibt es eine Gerade g ( x) = mx + b derart, dass sich der Graph von f für x → ∞ (bzw. x → −∞ ) immer mehr an diese Gerade annähert, so spricht man ebenfalls von einer Asymptoten von f. Die Parameter der Geraden werden wie folgt ermittelt: m = lim
x →∞
f ( x) x
und
b = lim( f ( x) − mx) x →∞
Existiert einer der beiden Grenzwerte nicht in R, so besitzt f (x) keine Asymptote für x → ∞ . Analog verfährt man für x → −∞ . Es kann vorkommen, dass f (x) nur eine oder überhaupt keine Asymptote besitzt.
1)
„⇒“ gilt nur, wenn f´ in einer Umgebung von x0 keine weitere Nullstelle besitzt.
100
4 Differentialrechnung einer reellen Veränderlichen
Regeln von BERNOULLI - de l’HOSPITAL: 1.
Ist lim f ( x) = 0 und lim g ( x) = 0 und existiert lim x → x0
lim
x → x0
2.
x → x0
x → x0
f ( x) f ′( x) in R und ist gleich lim x → x0 g ′( x ) g ( x)
f ′( x) in R, so existiert auch g ′( x)
(Fall: " 00 " ).
Ist lim f ( x) = ±∞ und lim g ( x) = ±∞ und existiert lim x → x0
auch lim
x → x0
x → x0
x → x0
f ( x) f ′( x) in R und ist gleich lim x → x0 g ′( x ) g ( x)
f ′( x) in R, so existiert g ′( x)
(Fall: " ∞∞ " ).
Entsprechendes gilt für x → x0 + , x → x0 − , x → ∞ und x → −∞ .
Achtung: Bei der Anwendung der Regeln von BERNOULLI - de l’HOSPITAL ist stets darauf zu f ′( x) achten, dass alle Voraussetzungen erfüllt sind. Sind diese für erneut erfüllt, so lässt g ′( x) f ( x) sich der Grenzwert von ggf. durch mehrfache Anwendung dieser Regel bestimmen. g ( x) f ′( x) f ( x) Existiert lim aussagen. nicht in R, so lässt sich nichts über lim x → x g ′( x ) x→ x g ( x) 0
0
Weitere unbestimmte Grenzwerte Durch elementare Umformungen lassen sich weitere Ausdrücke auf eine Form bringen, auf die die Regeln von BERNOULLI - de l’HOSPITAL ggf. anwendbar sind:
1. Fall "0 ⋅ ∞" : Ist lim f ( x) = 0 und lim g ( x) = ±∞ , so erfüllt f ( x) g ( x) = x → x0
x → x0
f ( x) g ( x) = 1 1 g ( x) f ( x)
die Voraussetzungen der ersten bzw. zweiten Regel von BERNOULLI - de l’HOSPITAL. 1 1 − g ( x) f ( x) 2. Fall " ∞ − ∞" : Ist lim f ( x) = lim g ( x) = ∞ , so erhält man in f ( x) − g ( x) = x→ x x→ x 1 f ( x) g ( x) einen für die erste Regel von BERNOULLI - de l’HOSPITAL passenden Ausdruck. 0
0
3. Fall "0 0 " , " ∞ 0 " : Für die Bestimmung von lim f ( x) g ( x ) benutzt man f ( x) g ( x ) = e g ( x ) ln f ( x ) x → x0
und untersucht lim g ( x) ln f ( x) . Hat dieser den Wert a, so ist lim f ( x) g ( x ) = e a . x → x0
x → x0
4.6 Differentiation vektorwertiger Funktionen
101
Spezielle Grenzwerte ∞ für a > 1 1. lim a = 1 für a = 1 x →∞ 0 für 0 < a < 1 x
2. lim x x = 1 x →0 +
x
a 3. lim1 + = e a x →∞ x
5. lim x →0
4. lim x →0
0 für b > 0 6. lim x b ln x = x →0+ − ∞ für b ≤ 0
tan ax =a x
xα = 0 für b > 1, α ∈ R x →∞ b x
8. lim xα ⋅ e − bx = 0 für b > 0, α ∈ R
7. lim
4.6
sin ax =a x
x →∞
Differentiation vektorwertiger Funktionen
In diesem Abschnitt sollen die Begriffe und Regeln der Differentialrechnung, wie sie bisher für Funktionen f : d → r , D ⊆ R, entwickelt wurden, auf solche ausgedehnt werden, deren Werte in r n liegen. Funktionen f : d → r n sind also für t ∈ D durch ihre sogenannten auf D definierten Komponentenfunktionen fi gegeben: f (t ) = ( f1 (t ),L , f n (t )) . Definition:
f : d → r n ist differenzierbar (in x0 ∈ D bzw. auf I ⊆ D) ⇔
∀i ∈ {1, L , n} : f i ist differenzierbar (in x0 ∈ D bzw. auf I ⊆ D)
Wegen der komponentenweisen Definition der Ableitung lassen sich die elementaren Ableitungsregeln (vgl. Abschnitt 4.4) ohne weiteres auf Funktionen f , g : d → r n übertragen: ⇒
(i)
f (t ) = const.
(ii)
( f ± g )′(t ) = f ′(t ) ± g ′(t )
(iii)
(cf )′(t ) = cf ′(t ) für jedes c ∈ R
(iv)
( f o h)′(t ) = h′(t ) ⋅ f ′(h(t )) für jede beliebige Umparametrisierung h : I → d
∀t ∈ d : f ′(t ) = (0, L ,0)
Die Produktregel lässt sich auf verschiedene Weise übertragen; man beachte dabei die Reihenfolge der Faktoren, da die Produkte im Allgemeinen nicht kommutativ sind:
102 a)
4 Differentialrechnung einer reellen Veränderlichen für das Skalarprodukt im R n : 3
( v ⋅ w )′(t ) = v′(t ) ⋅ w (t ) + v(t ) ⋅ w ′(t )
b)
für das Kreuzprodukt im R :
( v × w )′(t ) = v′(t ) × w (t ) + v (t ) × w ′(t )
c)
für das Produkt von Matrizen:
( A ⋅ B)′(t ) = A′(t ) ⋅ B(t ) + A (t ) ⋅ B′(t )
Ist A(t) auf I regulär und differenzierbar, so gilt:
( A −1 )′(t ) = − A −1 (t ) ⋅ A′(t ) ⋅ A −1 (t )
Obige Überlegungen gelten natürlich insbesondere für sogenannte komplexwertige Funktionen f : d → C . Man kann dann obige Definition unter Benutzung von u (t ) : = Re f (t ) und v(t ) : = Im f (t ) in folgender leicht zu merkenden Form schreiben: f ′(t ) : = (u + iv)′(t ) : = u ′(t ) + iv′(t ) Da obige Regel (iii) auch für alle c ∈ C gilt und sich außerdem die in Abschnitt 3.6 definierten komplexen Funktionen beim Ableiten wie die entsprechenden reellen verhalten, hat man folgende einfache Merkregel für das Differenzieren komplexwertiger Funktionen: Man betrachte die komplexe Einheit i wie eine reelle Konstante und differenziere komplexe Funktionen wie von R her gewohnt.
5
Integralrechnung einer reellen Veränderlichen
Allgemeine Voraussetzung: Im gesamten Kapitel seien alle betrachteten Funktionen stets auf Intervallen, also zusammenhängenden Bereichen der reellen Achse, definiert.
5.1
Stammfunktion und unbestimmtes Integral
Definition:
F (x) heißt (eine) Stammfunktion von f : I → r ⇔
∀x ∈ I : F ′( x) = f ( x)
Aufgrund dessen ist eine Stammfunktion F(x) mindestens auf dem Definitionsbereich von f(x) definiert und differenzierbar. Zudem ist nach den Ableitungsregeln mit F(x) auch F ( x) + C mit beliebigem C ∈ R eine Stammfunktion von f(x). Eine Stammfunktion ist also nie eindeutig bestimmt. Da andererseits f(x) auf einem Intervall definiert ist, können sich zwei Stammfunktionen F1(x) und F2(x) der gleichen Funktion f(x) nur um eine Konstante C unterscheiden. Daraus ergibt sich die Definition:
Die Menge aller Stammfunktionen F ( x) + C (mit C ∈ R) einer gegebenen Funktion f(x) heißt das unbestimmte Integral von f(x) und wird mit
∫ f ( x) dx bezeichnet.
Durch Umkehrung entsprechender elementarer Ableitungen erhält man die sogenannten
https://doi.org/10.1515/9783110537161-113
104
5 Integralrechnung einer reellen Veränderlichen
Grundintegrale:
1
(i)
∫ x dx = b + 1 x
(ii)
∫ e dx = e + C ∫ sin xdx = − cos x + C
(iii)
b
x
b +1
+ C für b ∈ R\{−1}
1
∫ x dx = ln | x | +C
x
1
(iv)
∫ sin
(v)
∫ sinh
(vi)
∫1− x
(vii)
∫
2
dx = − cot x + C
x
1 2
1
2
x
dx = − coth x + C
ar tanh x + C für | x |< 1 dx = ar coth x + C für | x |> 1
1 1− x
2
dx = arcsin x + C = − arccos x + C
∫ cos xdx = sin x + C 1
∫ cos
2
x
dx = tan x + C
1
∫ cosh
2
1
∫1+ x ∫
2
x
dx = tanh x +C
dx = arctan x + C
1 1 + x2
dx = ar sinh x +C
Aus diesen Grundintegralen erhält man durch Anwendung der im Folgenden behandelten Integrationsregeln und -techniken viele weitere Integrale, die in den Integraltafeln im Anhang aufgeführt sind. Unmittelbar durch Umkehrung entsprechender Ableitungsregeln ergibt sich die Linearität des Integrals: (i) (ii)
5.2
∫ ( f ( x) ± g ( x))dx = ∫ f ( x)dx ±∫ g ( x)dx ∫ (α f ( x))dx = α ∫ f ( x)dx für beliebige α ∈ R Hauptsatz der Differential- und Integralrechnung und bestimmtes Integral
Gemäß dem vorherigen Abschnitt gibt es für eine gegebene Funktion f(x) stets unendlich viele verschiedene Stammfunktionen – falls überhaupt eine existiert. Für welche Funktionen dies der Fall ist und wie man sie ggf. bestimmen kann, soll in diesem Abschnitt untersucht werden. Dafür sei f : I → r auf I stetig und habe nur positive Werte. Für festes a ∈ I bezeichne Aa(x) die Maßzahl der Fläche zwischen Graph und x-Achse, wenn x > a ist; Aa(x) sei das Negative dieser Maßzahl, wenn x < a ist; Aa(x) = 0, wenn x = a ist (siehe Bild 5.2.1).
5.2 Hauptsatz der Differential- und Integralrechnung und bestimmtes Integral
105
Bild 5.2.1: Flächenfunktion Aa(x) für x > a
Für die so auf I definierte Flächenfunktion Aa(x) gilt Aa′ ( x) = f ( x) ; Aa(x) ist also eine Stammfunktion von f (x), und zwar diejenige, die an der Stelle a verschwindet (Hauptsatz der Differential- und Integralrechnung). Für feste b, c ∈ I mit a < b < c gilt für die Fläche A zwischen dem Graphen von f (x) und der x-Achse im Bereich von b bis c offensichtlich A = Aa (c) − Aa (b) = F (b) − F (c) , wobei F(x) eine beliebige Stammfunktion von f (x) ist, die sich von Aa(x) ja nur um eine additive reelle Konstante unterscheiden kann. Definition:
Besitzt f (x) eine Stammfunktion, so heißt der Ausdruck b
∫ f ( x ) dx = F ( x )
b a
= [ F ( x)]ba = F (b) − F (a )
a
das bestimmte Integral von f (x). Dabei ist F(x) eine beliebige Stammfunktion von f (x), a und b beliebig gewählte Elemente aus I, für die nicht unbedingt a < b gelten muss. Unmittelbar aus der Definition ergeben sich folgende Rechenregeln für bestimmte Integrale: (i)
a
b
b
a
∫ f ( x ) dx = − ∫ f ( x ) dx a
(ii)
∫ f ( x ) dx = 0 a b
(iii)
∫ a
c
f ( x ) dx +
∫ b
c
f ( x ) dx =
∫ f ( x ) dx a
(auch dann, wenn b ∉ [a, c] ist!)
106
5 Integralrechnung einer reellen Veränderlichen
Obige Konstruktion der Flächenfunktion Aa(x) lässt sich auch auf stetige Funktionen verallgemeinern, die nicht nur positive Werte auf I haben. Damit besitzen (zumindest) alle stetigen Funktionen Stammfunktionen. Unter Benutzung von bestimmten Integralen erhält man Stammfunktionen durch: x
F ( x) = b +
∫ f (t ) d t
ist diejenige Stammfunktion von f, für die F (a) = b ist.
a
Weitere Eigenschaften bestimmter Integrale: b
∫
1. f ( x) ≤ g ( x) auf [a, b] ⇒
b
∫
f ( x ) d x ≤ g ( x )d x
a b
2.
∫
a
b
∫
f ( x)d x ≤ | f ( x) | d x ≤ (b − a) max | f ( x) |
a
(für a ≤ b und stetige Funktionen f)
x∈[ a ,b ]
a
3. Mittelwertsatz: Sind f (x) und g (x) stetig auf [a, b] und wechselt g (x) dort sein Vor-
zeichen nicht, so gibt es ein ξ ∈] a, b [ mit b
∫
b
∫
f ( x) g ( x)d x = f (ξ ) ⋅ g ( x)d x , insbesondere mit g ( x) ≡ 1 :
a
a
b
∫ f ( x)d x = f (ξ ) ⋅ (b − a) . a
4. HÖLDERsche Ungleichung : 1
b p | f ( x) g ( x) | d x ≤ | f ( x) | p d x a a b
∫
∫
1
b q ⋅ | g ( x ) |q d x , a
∫
1 1 + = 1 ; für p = q =2 ist dies die CAUCHY-SCHWARZsche Unp q gleichung (vgl. auch Abschnitt 2.4).
mit p, q > 1 und
5. MINKOWSKIsche Ungleichung : 1
1
1
b p b p b p | f ( x) + g ( x) | p d x ≤ | f ( x) | p d x + | g ( x) | p d x a a a
∫
mit p > 1.
∫
∫
5.2 Hauptsatz der Differential- und Integralrechnung und bestimmtes Integral
107
Andere Definition des bestimmten Integrals: Grenzwert einer unendlichen Summe
Um die Fläche A zwischen dem Graphen einer positiven stetigen Funktion f und der x-Achse im Bereich zwischen a und b zu bestimmen, zerlegt man das Intervall [a, b] in n (nicht unbedingt gleich große) abgeschlossene Teilintervalle I1,…, In, die nur die jeweiligen Eckpunk(n ) te gemeinsam haben, also [a, b] = I1 ∪ L ∪ I n . Es bezeichne d i die Intervallbreite von Ii bei Zerlegung in n Teilintervalle. Wegen der Stetigkeit von f existieren in jedem Ii Stellen x i und xi , in denen f | I i sein Minimum bzw. Maximum annimmt. Wenn f – anders als in Bild 5.2.2 dargestellt – nicht streng monoton ist, liegen diese Werte nicht notwendig auf dem Rand des Teilintervalls Ii. Es gilt damit für jedes n ∈ N: n
∑
( n)
n
∑
( n)
f ( xi ) ⋅ di ≤ A ≤ f ( xi ) ⋅ d i i =14 i =14 1 4244 3 1 4244 3 Untersumme Obersumme
Bild 5.2.2: Untersumme und Obersumme ( n)
Für immer feiner werdende Zerlegungen von [a, b] , also für n → ∞ und max d i → 0 , konvergiert die Untersumme von unten und die Obersumme von oben gegen die gesuchte Fläche A, die nach dem Hauptsatz der Differential- und Integralrechnung ja auch durch das b
bestimmte Integral
∫ f ( x)d x berechnet werden kann. Man hat damit die a
Definition:
Eine Funktion f (x) heißt RIEMANN-integrierbar auf [a, b] , wenn für jede immer feiner n
werdende Zerlegung von [a, b] die Untersumme
∑ f (x ) ⋅ d i
(n) i
und die Obersumme
i =1 n
∑ f (x ) ⋅ d i
( n) i
für n → ∞ den gleichen Grenzwert haben. Dieser heißt bestimmtes In-
i =1
b
tegral und wird mit
∫ f ( x)d x bezeichnet. a
108
5 Integralrechnung einer reellen Veränderlichen
Diese – klassische – Definition des bestimmten Integrals, die ohne Differentialrechnung auskommt, ist zwar für das praktische Rechnen ungeeignet, sie erschließt aber viele Anwendungen, auf die unter anderem in Abschnitt 5.4 eingegangen wird. Dies insbesondere deshalb, da für eine auf [a, b] RIEMANN-integrierbare Funktion f (x) b
∫
n
f ( x)d x = lim n→∞
a
∑ f (x ) ⋅ d i
( n) i
i =1
ist, und zwar für beliebige xi aus Ii. Alle auf einem abgeschlossenen Intervall stetigen Funktionen sind dort auch RIEMANNintegrierbar. Häufig ist diese Funktionsklasse jedoch für ingenieurmäßige Anwendungen zu klein. Ausreichend groß ist im Allgemeinen die Klasse der auf einem Intervall stückweise stetigen Funktionen, die ebenfalls RIEMANN-integrierbar sind. Definition:
f (x) heißt stückweise stetig auf [a, b] , wenn 1. f (x) auf [a, b] höchstens endlich viele Unstetigkeitsstellen xi besitzt und 2. für jede Unstetigkeitsstelle xi lim f ( x) und lim f ( x) in R existieren. x → xi +
x → xi −
Uneigentliche Integrale
Uneigentliche Integrale sind eine Verallgemeinerung der bestimmten Integrale. Die Existenz b
von
∫ f ( x)d x hängt nicht nur von der Integration selbst, sondern auch von der anschließena
den Ermittlung eines Grenzwerts ab. Man unterscheidet zwei Typen uneigentlicher Integrale: 1. Typ: Die Integrandenfunktion f (x) besitzt in [a, b] eine Definitionslücke oder Unstetigkeitsstelle c und ist ansonsten stetig. b
a) Ist etwa c = a, so existiert für kleine positive ε
∫ f ( x )d x
und ist von ε abhängig. Exis-
a +∈ b
tiert lim
ε →0+
∫
b
f ( x)d x in R, so wird dieser Grenzwert mit
a +∈
a 1
So ist zum Beispiel
∫ 0
1 x
1
1
∫ x dx
d x = 2 , während
nicht existiert.
0
b
b) Analog für c = b:
∫ f ( x)d x bezeichnet.
∫ a
b −ε
f ( x)d x = lim
ε →0 +
∫ f ( x)d x (falls der Grenzwert existiert) a
5.2 Hauptsatz der Differential- und Integralrechnung und bestimmtes Integral
109
c) Liegt die Definitionslücke/Unstetigkeitsstelle c im Innern des Integrationsbereichs [a, b] , c
∫
so prüft man wie oben, ob die beiden uneigentlichen Integrale
b
f ( x)d x und
a b
c
b
a
a
c
∫ f ( x)d x exisc
∫ f ( x)d x := ∫ f ( x)d x + ∫ f ( x)d x .
tieren und erhält dann
Auf diese Weise berechnet man das Integral einer stückweise stetigen Funktion als Summe der Teilintegrale zwischen den Unstetigkeitsstellen. 2. Typ: Der Integrationsbereich ist unendlich lang, das heißt, a = −∞ oder b = ∞ .
Man berechnet wie oben ein bestimmtes Integral für endliche Grenzen und lässt dann die entsprechende Grenze gegen −∞ bzw. +∞ gehen, also hat man (im Falle der Existenz): b
b
∫ f ( x)d x = lim ∫ f ( x)d x a → −∞
−∞
b
∞
∫ f ( x)d x = lim ∫ f ( x)d x
bzw.
a
b→∞
a b
∞
Für die Berechnung von
∫
a
∫
f ( x)d x muss die Existenz von
−∞
∞
f ( x)d x und
∫ f ( x)d x (für ein b
−∞
festes b ∈ R, oft: b = 0) überprüft und anschließend die Summe gebildet werden. 0
∞
So ist zum Beispiel
∞
π 1 1 1 dx = dx + d x = π (wegen lim arctan x = ). 2 2 2 x → ∞ 2 1+ x 1+ x 1+ x −∞ −∞ 0
∫
∫
∫
a
∞
∫
Achtung: Es ist im Allgemeinen falsch,
f ( x)d x = lim a →∞
−∞
∫ f ( x )d x
zu setzen, wie das Bei-
−a
∞
spiel
∫ x d x zeigt. −∞
Integration komplexwertiger Funktionen
Analog zur Differentiation wird i wie eine reelle Konstante behandelt; für f (t ) = u (t ) + iv(t ) ist also b
∫ a
b
b
∫
∫
a
a
f (t ) d t : = u (t ) d t + i ⋅ v(t ) d t .
110
5.3
5 Integralrechnung einer reellen Veränderlichen
Integrationstechniken
Integration durch Substitution
Hierbei wird die Kettenregel der Differentialrechnung „umgekehrt“: Für unbestimmte Integrale:
∫ f ( x)d x = ∫ f (ϕ (t )) ⋅ ϕ ′(t ) dt
b
für bestimmte Integrale:
∫
bei der Substitution x = ϕ (t ) ,
d
f ( x )d x =
a
∫ f (ϕ (t )) ⋅ ϕ ′(t ) dt
mit ϕ (c) = a und ϕ (d ) = b .
c
Die die Substitutionsregel ausdrückende Gleichung kann in beide Richtungen sehr nützlich interpretiert werden: a) von links nach rechts:
∫ f ( x)d x die Variable x als x = ϕ (t ) auszudrücken mit dem Ziel, den t −1 der Integrand Integranden zu vereinfachen, etwa wird in ∫ 2 x + 1 d x über x = ϕ (t ) := 2 Man versucht dabei, in
zu 12 t , was sich ohne weiteres mittels der Grundintegrale integrieren lässt. Beim so erhaltenen Ergebnis muss die Variable t schließlich wieder durch x resubstituiert werden, um die gesuchte Stammfunktion (als Funktion von x) zu erhalten; in obigem Beispiel wird aus 1 3
t 3 mit t = 2 x + 1 schließlich
1 3
(2 x + 1)3 + C =
∫
2x + 1 d x .
Bei der Berechnung bestimmter Integrale mit der Substitutionsregel ist eine Resubstitution nicht erforderlich, wenn man die Integrationsgrenzen wie oben beschrieben beim Übergang vom x- auf das t-Integral verändert. Zusammenfassung: 1. In
∫ f ( x)d x wird ein Ausdruck von x gleich einer neuen Variablen t gesetzt: t = A(x).
2. Dieser Ausdruck wird nach der alten Variablen x aufgelöst: x = ϕ (t ) . 3. Man differenziere nun nach der neuen Variablen t: 4. Man ersetze nun in
∫ f ( x)d x x und dx gemäß 2.
dx = ϕ ′(t ) ⇒ d x = ϕ ′(t ) ⋅ dt . dt bzw. 3. und erhält das t-Integral, für
das man beim bestimmten Integral die Integrationsgrenzen mittels 1. berechnet. 5. Nach Lösung des t-Integrals muss das Ergebnis – im Fall des unbestimmten Integrals – mittels 1. resubstituiert werden.
5.3 Integrationstechniken
111
Meist ist klar, welcher Ausdruck A(x) als neue Variable t zu wählen ist (etwa in obigem Beispiel t = 2 x + 1 ), da sich damit der Integrand sofort vereinfacht. Bei anderen Formen von f (x) ist eine sinnvolle Substitution nicht immer sofort erkennbar, deshalb hier eine Zusammenstellung einiger gebräuchlicher Substitutionen:
f ( x) = R x, a 2 − x 2
⇒
x = a sin t
f ( x) = R x, a 2 + x 2
⇒
x = a tan t
f ( x) = R x, x 2 − a 2
⇒
x = a cosh t
f ( x) = R(cos x, sin x)
⇒
x = 2 arctan t
R ist dabei eine beliebige rationale Funktion, die von einem oder beiden der genannten Argumente abhängt. b) von rechts nach links:
Liegt der Integrand als Produkt zweier Funktionen vor, so kann man manchmal den einen Faktor als f (ϕ (t )) und den anderen als ϕ ′(t ) interpretieren, manchmal erst, nachdem der Integrand durch eine geeignete Konstantenmultiplikation „passend“ wurde, etwa in
∫t ⋅e
t2
dt =
1 2
t2
d t mit ϕ (t ) = t ∫ ϕ2{′(tt ) ⋅ f (e{ ϕ (t ))
2
. Nach Durchführung der x-Integration muss das
Ergebnis mittels x = ϕ (t ) resubstituiert werden, im Beispiel:
∫t ⋅e
t2
dt =
1 2
∫ e dx = x
1 2
2
et + C .
Besonders häufig wird dieses Vorgehen bei Ausdrücken der folgenden Art angewendet:
∫ g (t ) ⋅ g ′(t )dt =
∫
1 2
g (t ) ⋅ g ′(t )d t =
( g (t )) 2 + C 2 3
(
)
3
g (t ) + C
g ′(t )
∫ g (t ) dt = ln | g (t ) | +C
„logarithmische Ableitung“
Mit der Substitutionsregel erhält man auch einen sehr nützlichen Satz zur Integration über symmetrische Intervalle: a
f (x) gerade
⇒
∫
a
−a a
f (x) ungerade
⇒
∫ f ( x )d x = 0 −a
∫
f ( x )d x = 2 f ( x )d x 0
112
5 Integralrechnung einer reellen Veränderlichen
Partielle Integration
Dieses Verfahren stellt die „Umkehrung“ der Produktregel der Differentialrechnung dar:
∫ f ′( x) g ( x) d x = f ( x) g ( x) − ∫ f ( x) g ′( x) d x b
bzw.
b
∫ f ′( x ) g ( x ) d x = [ f ( x ) g ( x )] − ∫ f ( x ) g ′( x ) d x b a
a
a
Bei der partiellen Integration wird also die Integration eines Produkts auf die eines anderen verlagert. Es ist also wichtig, die richtige Zuordnung der gegebenen Faktoren (was entspricht f ′(x) , was g (x) ?) vorzunehmen, um eine Vereinfachung zu erreichen. Es ist deshalb sinnvoll, folgende Hinweise zu beachten: 1. Ist einer der Faktoren ein Polynom, so sollte dieses als g(x) genommen werden, da sich beim Ableiten der Grad um eins erniedrigt; führt man die partielle Integration auf diese Weise genügend oft durch, kann der Produktanteil aus dem Polynom auf eine Konstante reduziert werden. 2. Hat eine der beteiligten Funktionen die Eigenschaft, dass sich – bis auf konstante Faktoren – die Ableitungen nach wenigen Schritten wiederholen (zum Beispiel bei trigonometrischen, hyperbolischen oder Exponentialfunktionen), so ergibt die mehrfache Durchführung der partiellen Integration unter anderem wieder das gesuchte Integral (mit einem anderen Faktor) auf der rechten Seite. Man kann also durch einfaches Auflösen das Integral bestimmen. 3. Manchmal lässt sich
∫ g ( x) d x
durch Einführen des konstanten Faktors f ′( x) = 1 im
Integranden der partiellen Integration zugänglich machen. Das ist z.B. bei
∫ ln x d x möglich.
Integration mittels Partialbruchzerlegung
Jede rationale Funktion f (x) lässt sich durch Polynomdivision eindeutig als Summe eines Polynoms, dessen Integration unproblematisch ist, und einer echt gebrochen rationalen Funk~ ~ tion f ( x) zerlegen. Bei der Integration von f ( x) benutzt man die in Abschnitt 3.2 behandelte Partialbruchzerlegung. Dabei entstehen verschiedene Arten von Partialbrüchen: 1. Aus den Linearfaktoren der Nennerzerlegung ergeben sich Ausdrücke der Gestalt A mit A, b ∈ R, k ∈ N+. Diese lassen sich durch die Substitution x = t + b auf ( x − b) k Grundintegrale aus Abschnitt 5.1 zurückführen, und zwar:
A
a) für k = 1:
∫ x − b d x = A ln | x − b | +C
b) für k ≥ 2:
∫ ( x − b)
A
k
dx =
−A +C (k − 1)( x − b) k −1
5.4 Anwendungen der Integralrechnung
113
2. Aus den irreduziblen quadratischen Termen der Nennerzerlegung ergeben sich Ausdrücke Ex + F der Gestalt mit E, F, c, d ∈ R, k ∈ N+. Da x 2 + cx + d unzerlegbar ist, lässt ( x 2 + cx + d ) k
es sich (durch quadratische Ergänzung) umformen in ( x + e) 2 + f 2 . Damit wird der Ex + F Ex + F E ( x + e) + ( F − Ee) Et + ( F − Ee) = = = mit Integrand zu 2 k 2 2 k ( x + cx + d ) (( x + e) + f ) (( x + e) 2 + f 2 ) k (t 2 + f 2 ) k der Substitution x = t − e . Für die Integration der durch Bruchstrichtrennung des letzten Terms entstehenden Brüche muss für k wieder eine Fallunterscheidung durchgeführt werden: a) für k = 1:
∫t
2
Et E d t = ln (t 2 + f 2 ) + C (logarithmische Ableitung) und 2 2 +f
F − Ee F − Ee t dt = arctan + C 2 2 f f +f
∫t b) für k ≥ 2:
Et F − Ee −E dt = + C . Den Ausdruck dt 2 k 2 2 k −1 +f ) 2(k − 1)(t + f ) (t 2 + f 2 ) k 1 berechnet man mithilfe des Integrals I k = d t , das der Rekursi2 (t + f 2 ) k t 2k − 1 + I k genügt. onsformel I k +1 = 2kf 2 (t 2 + f 2 ) k 2kf 2
∫ (t
∫
2
∫
Die in diesem Abschnitt dargestellten Integrationstechniken werden oft auch in einer Kombination benutzt, um ein gegebenes Integral zu berechnen. Es sei ausdrücklich darauf hingewiesen, dass oft schon eine geschickte Umformung des Integranden sehr hilfreich ist, bevor man aufwendige Integrationstechniken anwendet. So ist es zum Beispiel einfacher, statt ln x 2 oder 2 sin x cos x die äquivalenten Ausdrücke 2 ln | x | bzw. sin 2 x zu integrieren. Letztendlich lassen sich alle im Anhang dargestellten Integrale durch Integrandenumformungen und die beschriebenen Integrationstechniken auf die in 5.1 aufgeführten Grundintegrale zurückführen.
5.4
Anwendungen der Integralrechnung
Fläche zwischen zwei Graphen
Unmittelbar aus dem Hauptsatz der Differential- und Integralrechnung ergibt sich diese Anwendung: Die Fläche F zwischen den Graphen von f (x) und g (x) auf dem Intervall [a, b] (siehe Bild 5.4.1) ist
114
5 Integralrechnung einer reellen Veränderlichen b
∫
F = ( f ( x ) − g ( x)) d x , a
wobei nur f ( x) ≥ g ( x) – aber nicht unbedingt positiv – sein muss. Damit lassen sich nun die Koordinaten des Schwerpunkts der Fläche zwischen den Graphen von f (x) und g (x) berechnen: b
∫ xS =
b
∫ (( f ( x))
x( f ( x) − g ( x)) d x
a b
und
yS =
2
)
− ( g ( x)) 2 d x
a b
(SF)
∫
∫ ( f ( x) − g ( x)) d x
2 ( f ( x) − g ( x)) d x
a
a
Man beachte, dass das Integral im Nenner den Flächeninhalt darstellt; darüber hinaus sei auf den Faktor 2 im Nenner der y-Koordinate hingewiesen.
Bild 5.4.1: Fläche zwischen zwei Graphen
Der Mittelwert einer Funktion
Der Wert f ′(ξ ) im Mittelwertsatz der Integralrechnung (vgl. Abschnitt 5.2) wird als Mittelwert M der Funktion f (x) auf dem Intervall [a, b] bezeichnet, also M =
1 b−a
b
∫ f ( x )d x . a
Anschaulich ist M diejenige Höhe, auf der der Streifen zwischen a und b „abgeschnitten“ werden muss, damit das entstandene Rechteck die gleiche Fläche hat wie die, die von xAchse und Funktionsgraph eingeschlossen wird (siehe Bild 5.4.2).
5.4 Anwendungen der Integralrechnung
115
Bild 5.4.2: Der Mittelwert einer Funktion
Dieser Begriff wird zum Beispiel angewandt bei der Ermittlung der Durchschnittsgeschwindigkeit oder des arithmetischen Mittelwerts der Stromstärke, wenn diese als Funktionen von der Zeit gegeben sind. Volumenberechnung
Ein Körper besitze eine Achse A (diese muss nicht unbedingt Symmetrieachse sein!) derart, dass die Flächen, die beim Schnitt mit zu dieser Achse senkrechten Ebenen entstehen, sich als Funktion von der Schnitthöhe ausdrücken lassen, etwa A(x) mit a ≤ x ≤ b (siehe Bild 5.4.3). Beispiele hierfür sind beliebige Zylinder, Pyramiden mit beliebigen Grundflächen, Rotationsflächen etc.
Bild 5.4.3: Körper mit x-Achse als Achse A b
Für das Volumen V gilt:
∫
V = A( x)d x a
Damit erhält man unter anderem die Volumenformeln für folgende Körper: Pyramide mit Grundfläche G und Höhe h:
V = 13 G ⋅ h
Pyramidenstumpf mit Grundflächen G und g, Höhe h:
V = 13 h(G + Gg + g )
Kreiskegel mit Grundkreisradius r und Höhe h:
V = 13 π r 2 ⋅ h
116
5 Integralrechnung einer reellen Veränderlichen
Rotationskörper
Der Graph der auf dem Intervall [a, b] nicht-negativen Funktion f (x) , der in diesem Zusammenhang auch Median genannt wird, rotiere um die x-Achse (siehe Bild 5.4.4).
Bild 5.4.4: Rotation um die x-Achse
Das Volumen Vrot des dabei entstehenden Rotationskörpers ergibt sich als Spezialfall aus obiger Formel zu b
∫
Vrot = π ( f ( x)) 2 d x . a
Multipliziert man den Inhalt der rotierenden Fläche (siehe Bild 5.4.4) mit ihrer Schwerpunktkoordinaten yS (siehe (SF)) sowie 2π, so erhält man dasselbe Ergebnis – die 2. GULDINsche Regel ist an diesem Spezialfall bestätigt. Wie für ebene Flächen lassen sich auch für Stücke eines Graphen die Schwerpunktkoordinaten berechnen: b
b
∫ xS =
∫ f ( x)
x 1 + ( f ′( x)) 2 d x
a b
∫
und 2
1 + ( f ′( x)) d x
a
yS =
1 + ( f ′( x)) 2 d x
a
(SB)
b
∫
2
1 + ( f ′( x)) d x
a
Im Nenner beider Ausdrücke steht die Bogenlänge s, auf die im Kapitel 6 noch näher eingegangen wird. Mit der 1. GULDINsche Regel (siehe Abschnitt 1.10) erhält man daraus für die Mantelfläche des Rotationskörpers: b
∫
M rot = 2π f ( x) 1 + ( f ′( x)) 2 d x a
5.4 Anwendungen der Integralrechnung
117
Findet die Rotation um die y-Achse statt, so ist in obigen Formeln x sinngemäß durch y zu ersetzen; insbesondere ist der Median als Funktion von y darzustellen (ggf. mit der Umkehrfunktion). Gammafunktion
Durch ein uneigentliches Integral ist die vor allem in der Wahrscheinlichkeitstheorie wichtige Gammafunktion Γ : r + → r definiert: ∞
∫
Γ( x) = e −t t x−1 d t für alle x > 0 0
Für diese erhält man die Rekursionsformel Γ( x + 1) = x ⋅ Γ( x) , woraus unmittelbar mit Γ(1) = 1 für n ∈ N folgt: Γ(n + 1) = n! Die Gammafunktion heißt deshalb auch verallgemeinerte Fakultät. Aus Γ( 12 ) = π und obiger Rekursionsformel erhält man die ebenfalls in der Statistik wichtigen Werte für die „halben“ Argumente 12 , 32 , L als 2k + 1 1 ⋅ 3 ⋅ K ⋅ (2k − 1) Γ ⋅ π . = 2k 2
6
Ebene und räumliche Kurven
Kurven sind grob gesprochen „eindimensionale“ Teilmengen eines höherdimensionalen Raums. Beispiele hierfür kamen in diesem Buch bereits als Kegelschnitte (siehe Abschnitt 1.9) oder als Graphen von Funktionen einer reellen Veränderlichen (siehe Abschnitt 3.1) vor. Kegelschnitte sind Lösungsmengen gewisser Gleichungen 2. Grades mit zwei Variablen x und y (vgl. Gleichung (1.9.1)); der Graph einer auf D ⊆ R definierten Funktion f ist definiert als {( x, y ) ∈ r 2 | x ∈ D ∧ y = f ( x)} . Wenn man diese als Punktmengen in einem kartesischen Koordinatensystem darstellt, ergeben sich ebene Kurven. Es ist unmittelbar einsichtig, dass die Beschreibung einer Kurve als Lösungsmenge einer Gleichung, wie bei Kegelschnitten praktiziert, für viele mit der geometrischen Darstellung zusammenhängende Zwecke ungeeignet ist. Die Darstellung als Graph einer Funktion ist hier wesentlich hilfreicher, nur lassen sich viele wichtige Kurven in der Ebene (zum Beispiel Ellipsen, Hyperbeln, etc.) nicht als Graph einer Funktion darstellen; im Raum ist dies sowieso nicht möglich. In diesem Kapitel werden zunächst ebene Kurven in verschiedenen Darstellungsweisen (als Graph, in Polarkoordinaten und in Parameterdarstellung) untersucht; danach folgt ein Abschnitt über räumliche Kurven. Für die Betrachtung von Kurven in höherdimensionalen Räumen, die sich der geometrischen Anschauung entziehen, sei auf Kapitel 11 verwiesen.
6.1
Als Graphen darstellbare ebene Kurven
Die betrachtete Kurve K sei als Graph einer Funktion f : I → r gegeben. Da nur zusammenhängende Kurven betrachtet werden sollen, ist der Definitionsbereich ein Intervall, welches abgeschlossen, halboffen oder offen sein kann – je nachdem, ob die Kurve Anfangsund/oder Endpunkt besitzt oder nicht. Außerdem soll f genügend oft nach x differenzierbar sein. Ein fester Kurvenpunkt P ∈ K habe die Koordinaten ( x P , y P ) , es ist also y P = f ( xP ) . Einige der in diesem Abschnitt behandelten Begriffe und Eigenschaften wurden bereits in Abschnitt 4.5 in anderem Zusammenhang dargestellt, sollen hier aber noch einmal kurz erwähnt werden.
https://doi.org/10.1515/9783110537161-129
120
6 Ebene und räumliche Kurven
Tangente in (xP , yP)
Steigung: m = f ′( x P )
Gleichung: t ( x) = f ( xP ) + f ′( x P )( x − xP )
Ist die Steigung „unendlich“ (zum Beispiel bei f ( x) = sign ( x) ⋅ | x | in (0,0)), so ist die Tangente eine senkrechte Gerade mit der Gleichung x = x P . Asymptoten K kann nur am offenen Rand des Definitionsbereichs eine senkrechte Asymptote besitzen. Dann muss dort lim f ( x) = ±∞ sein. x → x0
Gibt es eine Gerade g ( x) = mx + b derart, dass sich der Graph von f für x → ∞ (bzw. x → −∞ ) immer mehr an diese Gerade annähert, so spricht man ebenfalls von einer Asymptoten von f. Die Parameter der Geraden werden wie folgt ermittelt: m = lim
x →∞
f ( x) x
und
b = lim( f ( x) − mx) x →∞
Existiert einer der beiden Grenzwerte nicht in R, so besitzt f (x) keine Asymptote für x → ∞ . Analog verfährt man für x → −∞ . Kurven mit Anfangs- und Endpunkt (also mit abgeschlossenem Intervall I als Definitionsbereich) besitzen keine Asymptoten. Bogenlänge s
Die Länge einer Kurve, die natürlich nur sinnvoll für Kurven mit Anfangs- und Endpunkt, also mit I = [a, b] , zu definieren ist, wird Bogenlänge s genannt; für sie gilt: b
s=
∫
1 + ( f ′( x)) 2 d x
a
Es sei darauf hingewiesen, dass selbst für viele „einfache“ Beispiele dieses Integral nicht elementar lösbar ist. Krümmung
Unter Krümmung in einem Kurvenpunkt P versteht man die Änderung des Tangentenwinkels dα in Abhängigkeit von der Bogenlänge, also . Sie lässt sich berechnen als ds
κP =
f ′′( x P ) 1 + ( f ′( x )) 2 P
3
.
6.2 Ebene Kurven in Polarkoordinaten
121
Häufig interessiert man sich nur für das Vorzeichen von κ − da der Nenner immer positiv ist, ist es das gleiche wie bei f ′′ (vgl. auch Abschnitt 4.5). Die Kurve ist nach links gekrümmt, wenn κ > 0 ist, und nach rechts, wenn κ < 0 ist (natürlich jeweils dann, wenn sie von links nach rechts, also mit wachsenden x-Werten, durchlaufen wird, siehe Bild 6.1.1).
Bild 6.1.1: Vorzeichen von κ
Bild 6.1.2: Krümmungskreis und Kurve
|κ | gibt die Stärke der Krümmung an; für κ ≠ 0 heißt ρ =
1
κ
Krümmungsradius. Die Be-
zeichnung rührt daher, dass ein Kreis mit Radius R offenbar überall die gleiche Krümmung, 1 nämlich κ = hat, umgekehrt also der Kehrwert der Krümmung in einem Kurvenpunkt P R als Radius eines Kreises, des sogenannten Krümmungskreises, aufgefasst werden kann. Dieser Krümmungskreis berührt die Kurve K in P und hat dort die gleiche Steigung und Krümmung wie K (siehe Bild 6.1.2). Sein Mittelpunkt M liegt also auf der Senkrechten zur Tangenten in P und hat die Koordinaten xM = x P −
6.2
(1 + [ f ′( x P )]2 ) ⋅ f ′( x P ) f ′′( xP )
und
yM = y P +
1 + [ f ′( x P )]2 . f ′′( xP )
Ebene Kurven in Polarkoordinaten
Jeder Punkt P einer Kurve K lässt sich nicht nur durch seine kartesischen Koordinaten ( x P , y P ) , sondern auch durch seine Polarkoordinaten rP und φP ausdrücken. Besteht für die Polarkoordinaten der Punkte von K ein funktionaler Zusammenhang der Gestalt r = f (ϕ ) mit φ ∈ Df, so ist K = {( f (ϕ ) ⋅ cosϕ , f (ϕ ) ⋅ sin ϕ ) ∈ r 2 | ϕ ∈ D f } . Ein Beispiel ist die Darstellung eines Kegelschnitts durch r =
| p| (vgl. Abschnitt 1.9). 1 + ε ⋅ cos ϕ
122
6 Ebene und räumliche Kurven
Weitere Beispiele hierfür sind (Bilder 6.2.1 bis 6.2.4): a) Archimedische Spirale:
r = aϕ
mit a > 0 und Df = [ 0, ∞ [
b) Logarithmische Spirale:
r = ae bϕ
mit a, b > 0 und Df = R
c) Hyperbolische Spirale:
r=
π
1
ϕ−π
mit Df = [ 4 , ∞ [
4
r = a cos(2ϕ )
d) Lemniskate:
mit a > 0, Df = [−
3π 5π , ]∪[ , ] 4 4 4 4
π π
Bild 6.2.1: Archimedische Spirale
Bild 6.2.2: Logarithmische Spirale
Bild 6.2.3: Hyperbolische Spirale
Bild 6.2.4: Lemniskate
Wie üblich wird die Ableitung von r = f (ϕ ) nach ϕ mit f ′(ϕ ) bezeichnet. In einem Kurvenpunkt P einer auf diese Weise beschriebenen Kurve mit Polarkoordinaten rP = f (ϕ P ) gilt dann für die Steigung
tan α P =
f ′(ϕ P ) sin ϕ + rP cos ϕ f ′(ϕ P ) cos ϕ − rP sin ϕ
und für die
6.2 Ebene Kurven in Polarkoordinaten
123
Krümmung
κP =
rP2 + 2( f ′(ϕ P )) 2 − rP f ′′(ϕ P ) r 2 + ( f ′(ϕ )) 2 P P
3
.
Asymptoten
Die durch r = f (ϕ ) gegebene Kurve hat eine Asymptote a in Richtung ϕ*, wenn lim* f (ϕ ) = ∞ ist. Mit q * = lim* ϕ →ϕ
ϕ →ϕ
a ( x ) = x ⋅ tan ϕ * −
( f (ϕ )) 2 lautet die Asymptotengleichung f ′(ϕ )
q* . cos ϕ *
Bogenlänge
Für die Länge s des Bogens von P1 nach P2 (siehe Bild 6.2.5) gilt ϕ2
s=
∫
( f (ϕ )) 2 + f ′(ϕ )) 2 dϕ .
ϕ1
Sektorflächeninhalt
Für die Fläche A des in Bild 6.2.5 schraffierten Sektors gilt ϕ2
∫
A = ( f (ϕ )) 2 dϕ . ϕ1
Bild 6.2.5: Bogenlänge und Sektorflächeninhalt
124
6.3
6 Ebene und räumliche Kurven
Ebene Kurven in Parameterdarstellung
Die allgemeinste und für das praktische Rechnen am besten geeignete Beschreibung einer Kurve ist die Parameterdarstellung. Dabei werden x- und y-Koordinate eines Kurvenpunkts jeweils als Funktion von einem Parameter t ∈ I (I Intervall) beschrieben. Häufig ist es hilf x (t ) beschreibt dann den Vorgang reich, sich t als Zeit vorzustellen – die Funktion c(t ) = y (t ) des Zeichnens der Kurve oder das Durchlaufen der Kurve im Zeitintervall I. Ableitungen nach dem Parameter t sollen auch dann, wenn t nicht die Zeit darstellt, mit x& bzw. y& bezeichnet werden. Die durch c(t) dargestellte Kurve ist also der Wertebereich der Funktion c(t), nicht etwa deren Graph (der wäre ja eine Teilmenge des R3!). Ist eine ebene Kurve als Graph einer Funktion f : I → r gegeben, so lässt sich daraus leicht x(t ) t := mit t ∈ I; liegt sie in eine Parameterdarstellung gewinnen, nämlich c(t ) = y (t ) f (t ) Polardarstellung r = f (ϕ ) mit ϕ ∈ I vor, so erhält man daraus auf I die Parameterdarstellung x (t ) f (t ) cos t := . c(t ) = y (t ) f (t ) sin t
Umgekehrt lässt sich nicht jede in Parameterdarstellung gegebene Kurve als Graph einer Funktion auffassen (zum Beispiel lässt sich von einem Kreis nur der obere oder der untere Halbkreis als Graph einer Funktion beschreiben). Dasselbe gilt für die Polardarstellung. Insofern ist die Parameterdarstellung die allgemeinste Form einer Kurvenbeschreibung. Die sogenannte parameterfreie Darstellung einer Kurve K (also als Graph einer Funktion), die im Allgemeinen nur lokal möglich ist, erhält man dadurch, dass man x(t) nach t auflöst und dies dann in y(t) einsetzt oder umgekehrt. Offensichtlich ist die Parameterdarstellung nicht eindeutig – so beschreiben zum Beispiel sin 2π t cos 2π t (jeweils t ∈ [ 0, 1]) die gleiche und c 2 (t ) = die Funktionen c1 (t ) = cos 2π t sin 2π t Kurve, nämlich einen Kreis um den Nullpunkt mit Radius 1, bei dem allerdings Anfangspunkt, Durchlaufungsrichtung und -geschwindigkeit verschieden sind. Für die im Folgenden beschriebenen geometrischen Eigenschaften spielen die unterschiedlichen Parametrisierungen der gleichen Kurve allerdings keine Rolle.
Steigung und Tangentenvektor x (t ) gegebene Kurve K hat im Kurvenpunkt P = c(t P ) die Steigung Die durch c(t ) = y (t ) y& (t P ) tan α = ; x& (t P )
6.3 Ebene Kurven in Parameterdarstellung
125
ist x& (t P ) = 0 und y& (t P ) ≠ 0 , so besitzt die Kurve in P eine senkrechte Tangente. y& (t ) Für x& (t P ) = 0 und y& (t P ) = 0 lässt sich die Steigung in P durch lim bestimmen, falls t → tP x & (t ) dieser existiert. x& (t ) Sind x& (t P ) und y& (t P ) nicht gleichzeitig 0, so ist c& (t P ) = P der Tangentenvektor (auch: y& (t P ) Geschwindigkeitsvektor) an K in P; sein Betrag c& (t P ) = ( x& (t P )) 2 + ( y& (t P )) 2 heißt (Bahn-) Geschwindigkeit an der Stelle P.
Asymptoten Gibt es t* mit lim* x (t ) = ±∞ und lim* y (t ) = ya , so besitzt K eine Asymptote parallel zur xt →t
t →t
Achse durch ya; umgekehrt besitzt die Kurve bei lim* y (t ) = ±∞ und lim* x(t ) = xa eine solche t →t
t →t
parallel zur y-Achse durch xa. Gibt es t* mit lim* x (t ) = ±∞ , t →t
lim* y (t ) = ±∞ und existieren außerdem lim* t →t
t →t
y (t ) = m und x(t )
lim* ( y (t ) − mx(t )) = b in R, so ist a ( x) = mx + b eine Asymptote für K. t →t
Krümmung Die Krümmung κP im Kurvenpunkt P = c(t P ) errechnet man aus x&&y& − &x&y& (t ) . 3 P x& 2 + y& 2
κP = LEIBNIZsche Sektorformel
Die von einer geschlossenen Kurve (d.h. c(t1) = c(t2)) eingeschlossene Fläche A (siehe Bild 6.3.1) erhält man durch t2
A=
1 2
∫ ( xy& −x&y)dt . t1
Bild 6.3.1: zur LEIBNIZschen Sektorformel
126
6 Ebene und räumliche Kurven
Dabei ist zu beachten, dass die Parametrisierung der Kurve so zu wählen ist, dass beim Durchlaufen die Fläche stets links liegt (ansonsten ergibt sich −A).
Bogenlänge Die Länge s der Kurve K von c(t1) nach c(t2) (mit t1 < t2) ist gegeben durch t2
s=
∫
x& 2 + y& 2 d t .
t1
Die Parameterdarstellungen der Kegelschnitte wurden bereits in Abschnitt 1.9 beschrieben. Im Folgenden sollen nun als weitere Beispiele sogenannte Rollkurven behandelt werden, bei denen die Bewegung eines Punktes, der fest mit einem Kreis K verbunden ist, beim Abrollen auf einem anderen geometrischen Objekt untersucht wird.
Zykloiden Auf einer festen Geraden g rolle ein Kreis K vom Radius r ab, ohne zu gleiten. Ein fest mit K verbundener Punkt P im Abstand a vom Kreismittelpunkt M beschreibt eine Zykloide. Dabei sind drei Fälle zu unterscheiden (Bild 6.3.2): a < r : gestreckte Zykloide
a = r : gespitzte Zykloide
a > r : geschlungene Zykloide Bild 6.3.2: Verschiedene Arten von Zykloiden
x (t ) (mit t ∈ R) einer Zykloiden ist gegeben durch Eine Parameterdarstellung c(t ) = y (t )
x(t ) = rt − a sin t y (t ) = r − a cos t Die Spitzpunkte bei a = r entstehen dadurch, dass hier x& (t P ) und y& (t P ) gleichzeitig 0 sind, was bei a ≠ r nicht möglich ist. Bei a > r gibt es sogenannte Doppelpunkte, das sind Schnittpunkte einer Kurve mit sich selbst.
Trochoiden Ein Rollkreis K (Mittelpunkt M, Radius r) rolle auf einem Festkreis F (Mittelpunkt O , Radius R) ab, ohne zu gleiten. OM geht stets durch den Berührpunkt B beider Kreise. Ein fest mit K verbundener Punkt P (Abstand a von M) beschreibt eine Trochoide. Rollt K
6.3 Ebene Kurven in Parameterdarstellung
127
außen an F ab, heißt sie Epitrochoide, rollt K innen an F ab, heißt sie Hypotrochoide; für letztere muss r < R sein. Beide sind in Bild 6.3.3 dargestellt.
Bild 6.3.3: Epitrochoide und Hypotrochoide
Parameterdarstellungen:
( (
) )
( (
) )
Epitrochoide:
x(t ) = ( R + r ) cos t − a cos R + r t r R rt + y (t ) = ( R + r ) sin t − a sin r
Hypotrochoide:
x(t ) = ( R − r ) cos t + a cos R − r t r R rt − y (t ) = ( R − r ) sin t − a sin r
Ist a = r, so hat die Trochoide Spitzpunkte. Eine Trochoide ist genau dann geschlossen, wenn das Verhältnis der Radien r : R rational ist. Eine Epitrochoide mit R = r = a heißt Kardioide (siehe Bild 6.3.4). Sie besitzt einen Spitzpunkt für t = 0 bzw. t = 2kπ (k ∈ Z) und schließt sich bereits nach einem Umlauf ( t ∈ [0,2π ] ).
Bild 6.3.4: Kardioide
Bild 6.3.5: Elliptische Bewegung
128
6 Ebene und räumliche Kurven
Die Hypotrochoide mit R = 2r ist eine Ellipse mit den Halbachsen r + a und r − a , dieser Sonderfall heißt deshalb elliptische Bewegung (siehe Bild 6.3.4). Ist zusätzlich r = a, so degeneriert die Ellipse zur Strecke zwischen (− R, 0) und (R, 0) ; die vollzogene Bewegung wird in der Technik Geradführung genannt.
6.4
Räumliche Kurven
Räumliche Kurven werden meist in Parameterform dargestellt, also ist K der Wertebereich x (t ) einer Funktion c(t ) = y (t ) mit t ∈ I. Wie im zweidimensionalen Fall werden auch hier z (t ) Ableitungen nach dem Parameter t als x& etc. dargestellt. Es ergeben sich viele Parallelen zu den im vorigen Abschnitt dargestellten Formeln.
Tangentenvektor und Geschwindigkeit x& (t P ) c& (t P ) = y& (t P ) z& (t ) P
c& (t P ) = ( x& (t P )) 2 + ( y& (t P )) 2 + ( z& (t P )) 2
Bogenlänge Die Länge s der Kurve K von c(t1) nach c(t2) (mit t1 < t2) ist gegeben durch t2
s=
∫
x& 2 + y& 2 + z& 2 d t .
t1
Manchmal wird auch die Bogenlänge s als Parameter für die Kurvendarstellung genommen. Die Formeln für Krümmung und Torsion sehen dann anders aus als im Folgenden dargestellt.
Krümmung Anders als in der Ebene spielt im Raum das Vorzeichen von κ keine Rolle, da man nicht zwischen Links- und Rechtskrümmung unterscheiden kann. Es ist ( x& 2 + y& 2 + z& 2 )( &x&2 + &y&2 + &z&2 ) − ( x&&x& + y&&y& + z&&z&) 2 (t P ) . ( x& 2 + y& 2 + z& 2 )3
κ P2 = ρP =
1
κP
ist wie in der Ebene der Krümmungsradius.
6.4 Räumliche Kurven
129
Torsion Die Torsion (auch: Windung) T einer Raumkurve in einem Punkt P gibt an, wie stark die Kurve bei P von einer ebenen Kurve abweicht. Das Vorzeichen von T gibt – in eine bestimmte Richtung gesehen – den Drehsinn an. Es ist x& y& 1 1 ⋅ det &x& &y& TP = 2 2 2 2 3 & & & ρP (x + y + z ) &x&& &y&&
z& &z& (t P ) . &z&&
Als wichtiges Beispiel einer Raumkurve sei hier die Schraubenlinie genannt, gegeben durch ρ cos t c(t ) = ρ sin t mit ρ, h ∈ R+. ht Die senkrechte Projektion dieser Kurve auf die (x, y)-Ebene ist ein Kreis mit Radius ρ; in zRichtung ändert ein Kurvenpunkt P seine Lage proportional zu t mit Proportionalitätsfaktor h; die Änderung nach einem Kreisumlauf beträgt H = 2π ⋅ h und heißt Ganghöhe. Krümmung und Torsion einer Schraubenlinie sind überall konstant, nämlich h
ρ 2 + h2
.
ρ bzw. ρ 2 + h2
7
Reihen
7.1
Grundbegriffe und Konvergenz
Definition: Gegeben sei eine beliebige Folge reeller Zahlen {ak }k∈n . (i)
Durch Summation erhält man daraus eine zweite Folge {S n }n∈n , die Folge der Teil- oder Partialsummen, nämlich: S0 = a0 , S1 = a0 + a1 , S2 = a0 + a1 + a2 , n
allgemein: S n =
∑a
k
.
k =0 ∞
Diese heißt Reihe oder unendliche Summe der ak und wird mit
∑a
k
bezeichnet.
k =0
(ii)
Ist die Folge der Partialsummen Sn konvergent in R (gemäß Abschnitt 4.1), so heißt die Reihe konvergent, anderenfalls divergent. Im Falle der Konvergenz der n
Reihe wird auch der Grenzwert S = lim S n = lim n→∞
n→∞
∑a
k
der Partialsummenfolge mit
k =0
∞
∑a
k
bezeichnet.
k =0
Beginnt die Folge der ak bei k = 1 oder k = 2 oder ähnlich, so schreibt man für die daraus ∞
gebildete Reihe entsprechend
∑
∞
ak oder
k =1
∑a
k
oder ähnlich. Für Fragen der Konvergenz
k =2
spielt das keine Rolle1), lediglich bei der Bestimmung des Grenzwerts S ist dies zu beachten.
1)
Deshalb werden hier Reihen in Definitionen und Sätzen stets mit k = 0 beginnend notiert.
https://doi.org/10.1515/9783110537161-141
132
7 Reihen
Lässt sich die Folge der Partialsummen Sn in geschlossener Form, das heißt ohne Summenzeichen, angeben, so fällt die Konvergenzuntersuchung und die Grenzwertbestimmung mit den Methoden aus Abschnitt 4.1 meist nicht schwer. Da dies nur selten der Fall ist, kommt der Untersuchung der Frage, ob eine Reihe konvergiert oder divergiert, viel größere Bedeutung zu als bei Zahlenfolgen; der Grenzwert selbst kann bei Reihen oft nur näherungsweise bestimmt werden.
Spezielle Reihen ∞
1.
∑ (a + dk )
mit festen a, d ∈ R heißt arithmetische Reihe. Sie ist dadurch gekennzeich-
k =0
net, dass ak +1 − ak = d = konst. ist; sie ist, außer im Trivialfall a = d = 0 , divergent. ∞
2.
∑ aq
k
mit festen a, q ∈ R* heißt geometrische Reihe mit Anfangsglied a und Quotient q.
k =0
Sie ist dadurch gekennzeichnet, dass n
Sn =
∑
aq k = a
k =0
ak +1 = q = konst. ist. Für festes n ∈ N und q ≠ 1 ist ak
q n+1 − 1 (Summenwert der endlichen geometrischen Reihe). q −1
Daraus folgt: ∞
Die geometrische Reihe
∑ aq
k
ist konvergent
⇔
| q |< 1
k =0 ∞
Im Falle der Konvergenz ist der Grenzwert
∑ aq k =0
k
=
a . 1− q
Bemerkung: Alle Formeln und Aussagen über geometrische Reihen gelten genauso in C. ∞
1
∑ k =1+
3. Die Reihe
1 2
+ 13 + L , also die Summe aller Stammbrüche, heißt harmonische
k =1
∞
Reihe. Sie ist divergent – im Gegensatz zu
∑ k =1
(−1) k +1 = 1 − 12 + 13 − L , der sogenannten k
alternierenden harmonischen Reihe, die nach dem LEIBNIZ-Kriterium (weiter unten) konvergiert; ihr Grenzwert ist ln 2 .
4. Allgemeiner gilt für festes α ∈ R: ∞
1
∑k k =1
α
= 1 + ( 12 )α + ( 13 )α + L ist konvergent
⇔
α >1
7.1 Grundbegriffe und Konvergenz ∞
5. Bei Reihen der Gestalt
133
a
∑ k ( k + m)
mit festen a ∈ R und m ∈ N+ lässt sich der Sum-
k =1
mand mittels Partialbruchzerlegung vereinfachen, sodass sich für n > m die Partialsumme Sn explizit angeben lässt: Sn =
a m 1 n+m 1 − m k =1 k k =n+1k
∑
∑
∞
⇒
S=
a
a
m
1
∑ k ( k + m) = m ∑ k k =1
k =1
Auch bei anderen ähnlichen Summanden kann eine elementare Umformung dazu führen, dass man Sn explizit angeben und damit den Grenzwert der Reihe berechnen kann.
Absolute Konvergenz Definition: ∞
Eine Reihe
∑a
∞
k
heißt absolut konvergent, wenn die Reihe
k =0
∑| a
k
| konvergent ist.
k =0
Aus den Vergleichskriterien (siehe unten) folgt unmittelbar, dass jede absolut konvergente Reihe auch konvergent ist – die Umkehrung ist jedoch im Allgemeinen falsch, wie das Beispiel der alternierenden harmonischen Reihe zeigt (siehe 3. auf der vorigen Seite). Ist eine Reihe absolut konvergent, so kann man den Grenzwert durch beliebige Umordnung (das heißt durch Vertauschen und Zusammenfassen) der Summanden berechnen. So ist zum 1 1 1 1 1 + K absolut konvergent (Majorantenkriterium, Beispiel die Reihe 1 − + + + − 2 9 8 81 32 siehe unten); ihr Grenzwert lässt sich leicht durch Umordnung der Summanden, womit man zwei geometrische Reihen erhält, berechnen. Im Gegensatz dazu würde die Umordnung der Summanden der alternierenden harmonischen Reihe, die ja nur konvergent, aber nicht absolut konvergent ist, zu mathematischen Widersprüchen (etwa 1 = 2) führen, wenn man auch hier davon ausginge, dass Umordnung am Ergebnis nichts ändere.
Notwendiges Konvergenzkriterium ∞
Damit die Reihe
∑a
k
konvergiert, muss die Folge der Summanden eine Nullfolge sein,
k =0
also lim ak = 0 . k →∞
Bei der Konvergenzuntersuchung einer gegebenen Reihe benutzt man dieses Kriterium also als „Einstieg“, um festzustellen, ob diese überhaupt konvergieren kann, ob also weiter gehende Untersuchungen angestellt werden müssen. Dass dieses Kriterium nicht hinreichend ist, zeigt zum Beispiel die harmonische Reihe.
134
7 Reihen
Die im Folgenden dargestellten Kriterien sind hinreichende Kriterien, und zwar sowohl für ∞
die (absolute) Konvergenz als auch für die Divergenz einer zu untersuchenden Reihe
∑a
k
.
k =0
Ist also im Einzelfall die jeweilige Voraussetzung nicht erfüllt, so ist keine Aussage über ∞
Konvergenz bzw. Divergenz von
∑a
möglich.
k
k =0
Vergleichskriterien ∞
(i)
Majorantenkriterium: Gibt es eine konvergente Reihe
∑c
k
mit |ak| ≤ ck für
k =0 ∞
jedes k ≥ k0, so ist die Reihe
∑a
k
absolut konvergent.
k =0 ∞
(ii)
Minorantenkriterium: Gibt es eine gegen +∞ divergente Reihe
∑d
k
mit
k =0 ∞
| dk | ≤ ak für jedes k ≥ k0, so ist die Reihe
∑a
k
divergent.
k =0
∞
Als Vergleichsreihe dient häufig eine Reihe der Gestalt
1
∑k
α
(siehe 4. weiter oben); ein
k =1
Vergleich mit der ebenfalls hinsichtlich ihres Konvergenzverhaltens bekannten geometrischen Reihe ergibt das
Quotientenkriterium (i)
Lässt sich ein δ < 1 finden, sodass für alle k von einem Index k0 an ak +1 ≤ δ < 1 ∀k ≥ k 0 ak ∞
gilt, so ist die Reihe
∑a
k
absolut konvergent.
k =0
(ii)
Lässt sich ein δ > 1 finden, sodass für alle k von einem Index k0 an ak +1 ≥ δ > 1 ∀k ≥ k0 ak ∞
gilt, so ist die Reihe
∑a
k
divergent.
k =0
Zusatz: Obige Bedingung mit δ ist auf jeden Fall dann erfüllt, wenn lim
k →∞
und < 1 bzw. > 1 ist.
ak +1 existiert ak
7.1 Grundbegriffe und Konvergenz
135
Es sei ausdrücklich darauf hingewiesen, dass obiges δ ≠ 1 wichtig ist: Es genügt nicht, wenn ak +1 < 1 ∀k ≥ k 0 bzw. ak
ak +1 > 1 ∀k ≥ k 0 ist – ein Schluss auf Konvergenz bzw. Diverak
∞
genz von
∑a
k
ist daraus nicht möglich; das Gleiche gilt, wenn lim n→∞
k =0
Ersetzt man den „Testausdruck“
ak +1 durch ak
k
ak +1 = 1 ist. ak
| ak | , so erhält man das
Wurzelkriterium: (i)
Lässt sich ein δ < 1 finden, sodass für alle k von einem Index k0 an k
| ak | ≤ δ < 1 ∀k ≥ k0 ∞
gilt, so ist die Reihe
∑a
k
absolut konvergent.
k =0
(ii)
Lässt sich ein δ > 1 finden, sodass für alle k von einem Index k0 an k
| ak | ≥ δ > 1 ∀k ≥ k0 ∞
gilt, so ist die Reihe
∑a
k
divergent.
k =0
Zusatz: Obige Bedingung mit δ ist auf jeden Fall dann erfüllt, wenn lim k | ak | existiert n→∞
und < 1 bzw. > 1 ist. Die Hinweise zur Anwendung des Quotientenkriteriums gelten analog für den Ausdruck k
| ak | .
Alternierende Reihen Definition: Eine Reihe heißt alternierend, wenn zwei aufeinander folgende Summanden verschiedene Vorzeichen haben, wenn also ak ⋅ ak +1 < 0 ist. Für die Konvergenz alternierender Reihen sowie vor allem für die Abschätzung des soge∞
nannten Abbruchfehlers (das ist der Fehler, der bei Ersetzen des Grenzwerts S =
∑a k =0
n
durch die endliche Summe S n =
∑a k =0
k
entsteht), gilt das sogenannte
k
136
7 Reihen
LEIBNIZ-Kriterium: ∞
Bilden die Absolutbeträge | ak | der Summanden einer alternierenden Reihe
∑a
k
eine
k =0
streng monoton fallende Nullfolge, so gilt: ∞
(i)
Die Reihe
∑a
k
ist konvergent (aber nicht unbedingt absolut konvergent!),
k =0
(ii)
für den Abbruchfehler nach n Summanden gilt: | S − S n | < | an+1 | .
7.2
Potenzreihen
Definition: Es sei a ∈ R fest, {bk }k∈n eine beliebige – nicht unbedingt konvergente Folge reeller ∞
Zahlen. Eine Reihe der Gestalt
∑ b (x − a )
k
k
(mit der Variablen x) heißt Potenzreihe mit
k =0
Koeffizienten bk und Entwicklungspunkt a. ∞
K = {t ∈ R |
∑ b (t − a )
k
k
ist konvergent} heißt Konvergenzpunktmenge der Potenzreihe.
k =0
Für die Konvergenzpunktmenge einer Potenzreihe gilt:
1. K ist niemals leer, da zumindest a ∈ K ist. Sowohl K = {a} als auch K = R ist möglich. 2. K ist stets eine zusammenhängende Teilmenge von R, also ein Intervall; deshalb spricht man auch vom Konvergenzintervall der Potenzreihe. Das Konvergenzintervall kann offen, halboffen (auf jeder Seite) oder abgeschlossen sein. 3. Ist das Intervall beschränkt, so ist der Entwicklungspunkt a der Intervallmittelpunkt. In diesem Fall heißt die halbe Intervallbreite der Konvergenzradius ρ der Potenzreihe. Das Konvergenzintervall K hat also die Gestalt (a − ρ , a + ρ ) 1) . 4. In den degenerierten Fällen K = {a} bzw. K = R definiert man den Konvergenzradius als ρ = 0 bzw. ρ = ∞ . 5. Es gilt also stets: Eine Potenzreihe konvergiert, wenn x in ] a − ρ , a + ρ [ liegt, sie divergiert für alle x außerhalb von [ a − ρ , a + ρ ] ; das Konvergenzverhalten in den Intervalleckpunkten bedarf stets einer Einzeluntersuchung. 1)
Die runden Klammern stehen hier für die Klammern [ oder ] (im Allgemeinen unbestimmt).
7.2 Potenzreihen
6. Existiert b = lim
k →∞
137 bk +1 oder b = lim k | bk | , so erhält man den Konvergenzradius ρ einer k →∞ bk
1 . Dies gilt auch sinngemäß für b = 0 oder b = ∞ , nämlich ρ = ∞ b bzw. ρ = 0 . Man muss dabei beachten, dass in der Potenzreihe alle Potenzen von x vorPotenzreihe als ρ =
∞
kommen; für eine Potenzreihe der Form
∑b x
2k
zum Beispiel ermittelt man ρx, indem
k
k =0 ∞
man nach der Substitution t = x 2 aus der Reihe
∑b t k
k
den Konvergenzradius ρt bestimmt,
k =0
daraus erhält man ρx als
ρt . ∞
Der Einfachheit halber sollen im Folgenden nur noch Potenzreihen der Form
∑b x k
k
, also
k =0
mit Entwicklungspunkt a = 0, betrachtet werden; durch die lineare Substitution xneu = x − a ließe sich sonst eine andere Potenzreihe auf diese Form bringen. Die meisten Anwendungen benutzen außerdem diese Form. Darüber hinaus sollen alle vorkommenden Potenzreihen einen positiven Konvergenzradius haben; der Trivialfall, dass eine Potenzreihe nur im Entwicklungspunkt konvergiert, spielt im Weiteren keine Rolle. ∞
Durch die Zuordnung x a
∑b x
k
(= Grenzwert) ist auf ] − ρ , ρ [ eine reellwertige Funk-
k
k =0 ∞
tion f (x) definiert. Für f ( x) =
∑b x k
k
gilt die
k =0
Gliedweise Differentiation und Integration: ∞
(i)
f (x) ist auf ] − ρ , ρ [ differenzierbar mit f ′( x) =
∞
′ ∑ (b x ) = ∑ b k x k
k
k =0
k
k −1
;
k =1
die Potenzreihe von f ′(x) hat den gleichen Konvergenzradius wie die von f (x) . (ii)
∞ bk x k d x = k =0
∫∑
b ∑ (∫ b x d x) = ∑ k + 1 x ∞
∞
k
k
k
k =0
k +1
+C
k =0
Die beliebige Konstante C entspricht dem – fehlenden – absoluten Glied in der Potenzreihe. Wie bei einer endlichen Summe (Polynom!) lassen sich also die Reihenfolge von Summation und Differentiation/Integration vertauschen.
138
7 Reihen
Da die Ableitung einer Potenzreihe wieder eine Potenzreihe (mit gleichem Konvergenzradius) ist, lässt sich diese Prozedur beliebig fortsetzen, das heißt: Jede durch eine Potenzreihe darstellbare Funktion ist beliebig oft differenzierbar. Dabei gilt für beliebiges m ∈ N: ∞
f ( m ) ( x) =
∑ k (k − 1)L(k − m + 1)b x
k −m
k
k =m
Außer der gliedweisen Differentiation gibt es noch eine weitere Analogie zwischen Potenzreihen und Polynomen:
Identitätssatz für Potenzreihen: ∞
∑
∞
ak x k =
k =0
∑b x
k
k
auf ] − δ , δ [
⇒
∀k ∈ n : ak = bk
k =0
In Worten: Haben zwei Potenzreihen auf einem offenen 0 enthaltenden Intervall den gleichen Grenzwert, dann müssen sie in allen entsprechenden Koeffizienten übereinstimmen, müssen also gleich aussehen. Wie bei Polynomen ist dieser Satz die Grundlage eines Koeffizientenvergleichs, der etwa bei der Lösung von Differentialgleichungen (vgl. Kapitel 9) angewandt werden kann. Außerdem beinhaltet dieser Satz auch die Tatsache, dass es für eine gegebene Funktion f (x) höchstens eine Potenzreihe geben kann, die gegen f (x) konvergiert.
Definition: Die Funktion f sei in einer Umgebung von a beliebig oft differenzierbar, es sei n ∈ N. ∞
(i)
Die Potenzreihe
∑ k =0
f (k ) ( a ) k ⋅ (x − a ) heißt die TAYLOR-Reihe von f bezüglich a. k! n
(ii)
Das Polynom pn ( x ) =
∑ k =0
f (k ) ( a ) k ⋅ ( x − a ) heißt das n-te TAYLOR-Polynom von f k!
bezüglich a. Zusatz: Ist a = 0, so sagt man einfach „TAYLOR-Reihe“ bzw. „n-tes TAYLOR-Polynom“, früher: „MCLAURIN-Reihe“ bzw. „n-tes MCLAURIN-Polynom“.
Das Konvergenzintervall einer TAYLOR-Reihe bestimmt man wie oben beschrieben, es ist im Allgemeinen kleiner als der Definitionsbereich von f. Die Frage, ob die TAYLOR-Reihe von f für alle x aus dem Konvergenzbereich tatsächlich gegen f (x) und nicht gegen einen anderen Wert konvergiert, beantwortet der
7.3 Fourier-Reihen
139
Satz von TAYLOR: Für festes a ∈ df und n ∈ N gilt: n
(i)
f ( x) =
∑ k =0
f (k ) ( a ) f (n+1) (ξ ) k ⋅ (x − a ) + (x − a )n+1 für alle x ∈ df; (n + 1) ! k!
dabei ist ξ ein von x und a abhängiger Wert zwischen den beiden. f (k ) ( a ) k ⋅ (x − a ) von f bezüglich a konvergent in x, k ! k =0 so ist deren Grenzwert genau dann der Funktionswert f (x), f (n+1) (ξ ) (x − a )n+1 = 0 ist für jedes beliebige ξ zwischen x und a. wenn lim n→∞ (n + 1) ! ∞
(ii)
Ist die TAYLOR-Reihe
∑
Konvergiert die TAYLOR-Reihe gegen die Funktion ( f (x) nennt man dann auch analytisch), f (n +1) (ξ ) (x − a )n+1 zur Abschätzung des Ab(n + 1) ! bruchfehlers benutzt werden, wenn man die Funktion durch das n-te TAYLOR-Polynom (das ist die n-te Partialsumme der Reihe!) approximiert. Diese sogenannte LAGRANGE-Darstellung des Restglieds zeigt darüber hinaus, dass eine umso kleinere Abweichung vom wahren Funktionswert zu erwarten ist, je enger x und a zusammen liegen. so kann gemäß (i) das sogenannte Restglied
Es sei ausdrücklich darauf hingewiesen, dass selbst im Falle der Konvergenz der TAYLORReihe die Restglieduntersuchung notwendig ist, da es Beispiele beliebig oft differenzierbarer Funktionen gibt, in denen die TAYLOR-Reihe nicht gegen die Funktion konvergiert. Solche Funktionen lassen sich folglich nicht durch eine Potenzreihe darstellen. Im Reellen ist also nicht jede C ∞-Funktion auch analytisch, was im Komplexen sehr wohl der Fall ist. Eine Zusammenstellung wichtiger Potenzreihenentwicklungen findet sich im Anhang.
7.3
FOURIER-Reihen
Definition: Mit P > 0 und n ∈ N+ nennt man eine Funktion Tn ( x) =
T ( x) =
a0 + 2 a0 + 2
n
∑ a
k
k =1 ∞
∑ a k =1
k
2π 2π cos k x + bk sin k x ein trigonometrisches Polynom, P P 2π 2π cos k x + bk sin k x eine trigonometrische Reihe. P P
140
7 Reihen
Trigonometrische Polynome sind offenbar P-periodische Funktionen; konvergiert eine trigonometrische Reihe T (x) gegen eine Funktion f (x), so ist diese ebenfalls P-periodisch. Für eine gegebene P-periodische Funktion f (x) hat man die
Definition: Die reellen Zahlen
und
am = 2 P bm = 2 P
P
∫ f ( x) cos m 2Pπ x dx
(mit m ∈ N)
0
P
∫ f ( x) sin m 2Pπ x dx
(mit m ∈ N+)
0
heißen die FOURIER-Koeffizienten der Funktion f (x). Bildet man für eine gegebene P-periodische Funktion f (x) aus den so definierten FOURIERKoeffizienten ein trigonometrisches Polynom, so hat dieses die sehr interessante
Approximationseigenschaft der FOURIER-Polynome: Unter allen mit festem n ∈ N+ gebildeten trigonometrischen Polynomen Tn(x) hat dasjenige, das mit den FOURIER-Koeffizienten gebildet wird, den geringsten Abstand d von der gegebenen Funktion f (x), approximiert diese also am besten. Dabei ist der Abstand („im quadratischen Mittel“) zwischen f (x) und Tn(x) definiert als 1
P 2 d = ( f ( x) − Tn ( x)) 2 d x . 0
∫
Damit ist natürlich nicht gesagt, dass für wachsende n die Approximation an einer festen Stelle x immer besser wird – anders ausgedrückt – dass die mit den FOURIER-Koeffizienten gebildete sogenannte FOURIER-Reihe T (x) punktweise gegen die Funktion f (x) konvergiert, es gilt jedoch der wichtige
Satz: (DIRICHLETsche Bedingung) Ist f (x) stückweise stetig auf [0, P] und gibt es darüber hinaus in [0, P] höchstens endlich viele Stellen, wo f (x) nicht stetig differenzierbar ist, a so existiert T ( x) = lim 0 + n →∞ 2
n
∑ a k =1
k
2π 2π cos k x + bk sin k x für jedes x, P P
und zwar gilt an Stetigkeitsstellen x: an Unstetigkeitsstellen x :
T ( x) = f ( x) , T (x) =
1 ( lim f ( x) + lim f ( x)) . x→ x − 2 x→ x +
7.3 Fourier-Reihen
141
Die FOURIER-Reihe einer stetigen Funktion f (x) konvergiert also überall gegen die Funktion selbst. Wie die FOURIER-Entwicklung bei einer nicht stetigen Funktion, die aber die DIRICHLETsche Bedingung erfüllt, aussieht, sieht man am besten an einem konkreten Beispiel; hier wurde die sogenannte Sägezahnkurve mit Periode P = 2 gewählt (siehe Bild 7.3.1): Mit festem C ∈ R ist
für x ∈ [− 1,1[ Cx f ( x) = . 2 - periodisch fortgesetzt sonst
Bild 7.3.1: Sägezahnkurve mit P = 2
Die FOURIER-Reihe ergibt sich unter Ausnutzung der Symmetrieeigenschaften von f (x) zu n
T ( x) =
2C (−1) k +1 2C [sin(πx) − 12 sin(2πx) + 13 sin(3πx) − L + L] . ⋅ sin( kπx) = k π
∑π k =1
Für feste n ∈ N lassen sich nun die trigonometrischen Polynome Tn (x) angeben, die die Sägezahnkurve bestmöglich approximieren. In Bild (7.3.2) sind die Graphen dieser trigonometrischen Polynome für die Werte 2, 5, 10 und 20 für n dargestellt. n=2
n=5
n = 10
n = 20
Bild 7.3.2: Trigonometrische Polynome der Sägezahnkurve aus jeweils n Summanden
142
7 Reihen
Deutlich ist zu sehen, dass sich im Stetigkeitsbereich die Kurve für größer werdende n immer mehr zu einer Geraden streckt, in der Nähe der Unstetigkeitsstellen von f (x) (also für x = ungerade Zahl) gibt es einen deutlichen Ausschlag, der zwar immer näher an die Unstetigkeitsstelle rückt, aber auch bei n = 20 nahezu unverändert in seiner Höhe bleibt. Dies ist das sogenannte GIBBSsche Phänomen. Bei der Berechnung der FOURIER-Koeffizienten können einige Regeln der Integralrechnung sehr nutzbringend angewandt werden, etwa:
1. Da die Integranden bei den Formeln für am und bm P-periodisch sind und die Integrale sich über eine ganze Periode erstrecken, kann der Integrationsbereich beliebig verschoben werden, es ist also am = 2 P
P
P 2
3P 4
P − 2
P − 4
∫ f ( x) cos m 2Pπ x dx = P2 ∫ f ( x) cos m 2Pπ x dx = P2 ∫ f ( x) cos m 2Pπ x dx 0
o.ä.,
für die bm entsprechend.
2. Ist der Graph von f achsen- oder punktsymmetrisch1), vereinfacht sich die Berechnung der FOURIER-Koeffizienten wie folgt:
(i)
(ii)
Ist f gerade, so sind alle bm = 0
und
Ist f ungerade, so sind alle am = 0 und
am = 4 P bm = 4 P
P 2
∫ f ( x) cos m 2Pπ x dx . 0
P 2
∫ f ( x) sin m 2Pπ x dx . 0
Eine Zusammenstellung häufig vorkommender FOURIER-Entwicklungen findet sich im Anhang.
Komplexe FOURIER-Entwicklung Nicht nur für theoretische Zwecke (FOURIER-Transformation, siehe Kapitel 12), sondern häufig auch für praktische Berechnungen ist die Benutzung der komplexen FOURIEREntwicklung nützlich: Für eine – im Allgemeinen komplexwertige – P-periodische Funktion f (x) definiert man die komplexen FOURIER-Koeffizienten cm mit m ∈ Z (!) durch
1)
Der Satz gilt auch, wenn die entsprechende Symmetriebedingung für f an endlich vielen Stellen des Definitionsbereichs nicht erfüllt ist. Dies tritt gerade an Intervalleckpunkten öfter ein (vgl. das vorher behandelte Beispiel der Sägezahnkurve).
7.3 Fourier-Reihen
143
1 cm = P
P 2
∫
f ( x) ⋅ e
−i
2π mx P
dx.
P − 2
Damit erhält man die komplexe FOURIER-Reihe als ~ T ( x) =
k =∞
∑c e k
i
2π kx P
.
k = −∞ k =∞
Allgemein versteht man unter
∑
k =∞
d k die Zerlegung in
∑
k =∞
dk +
k =0
k = −∞
∑d
−k
; Konvergenz liegt
k =1
vor, wenn beide Reihen konvergieren. ~ Für die komplexe FOURIER-Reihe T ( x) gilt hinsichtlich Approximationseigenschaft und Konvergenz das Gleiche wie für die reelle.
Für eine reellwertige P-periodische Funktion f (x) erhält man die komplexen FOURIERKoeffizienten durch für 12 (am − ibm ) cm = 12 a0 für 1 (a + ib ) für −m 2 −m
m>0 m=0 m (vgl. Abschnitt 2.4) auf V eine Norm induziert. Auf diese Weise wird durch das Standardskalarprodukt auf Rn die Norm n
v = (v1 ,L, vn ) =
∑v
2 i
,
i =1
die sogenannte EUKLIDische Norm , induziert, die – wenn nichts anderes ausdrücklich festgesetzt wird – in diesem Kapitel stets gemeint ist. Eine weitere wichtige Norm für den Rn, insbesondere im Zusammenhang mit numerischen Anwendungen, ist die sogenannte Maximumsnorm, gegeben durch
v
∞
= (v1 ,L, vn )
∞
= max | vi | . i =1,L,n
Es ist für den in diesem Abschnitt zu entwickelnden Konvergenzbegriff im Rn letztlich irrelevant, welche Norm den weiteren Untersuchungen zugrunde liegt, da für endlich dimensionale Vektorräume alle Normen zum gleichen Konvergenzbegriff führen.
https://doi.org/10.1515/9783110537161-155
146
8 Mehrdimensionale Analysis
Definition: Für eine gegebene Menge M, festes p0 ∈ M und ε > 0 heißt (i)
eine Funktion d : M × M → r eine Metrik (Abstandsfunktion) auf M, wenn a) d ( p, q) ≥ 0 und
d ( p, q) = 0 ⇔ p = q,
b) d ( p, q) = d (q, p) , c) d ( p, q) ≤ d ( p, r ) + d (r , q) ; (ii)
(M, d) ein metrischer Raum;
(iii)
U e ( p0 ) = {q ∈ M | d ( p0 , q) < ε } eine ε-Umgebung von p0.
In einem normierten Raum V ist durch die Festsetzung d ( v, w ) = w − v = Länge des Verbindungsvektors zwischen v und w stets eine Metrik gegeben; in V = Rn lautet diese explizit: n
d ((v1 , L , vn ), ( w1 , L , wn )) =
∑ (w − v ) i
2
i
i =1
Für n = 2 oder n = 3 entspricht dies genau dem üblichen anschaulichen Abstandsbegriff. In einem metrischen Raum (M, d) hat man für eine Teilmenge S von M die
Definition: (i) (ii) (iii)
S heißt offen S heißt abgeschlossen S heißt beschränkt
⇔ ⇔ ⇔
∀p ∈ M : ∃ε ∈ r + : U ε ( p) ⊆ S M \ S ist offen ∃ε ∈ r + ∃p ∈ M : U ε ( p ) ⊇ S
Anschaulich bedeutet Offenheit also, dass S keine Randpunkte hat; bei einer abgeschlossenen Menge gehören die Randpunkte dazu. Mithilfe der Metrik lässt sich in M ein Konvergenzbegriff einführen:
Definition: Eine Folge { pk }k∈n von Elementen aus M konvergiert gegen q ∈ M ( lim pk = q ) k →∞
lim d ( pk , q) = 0
⇔
k →∞
Im Rn ist es praktischer, stattdessen die dazu äquivalente sogenannte komponentenweise Konvergenz zu benutzen: (k )
(k )
lim ( p1 , L , pn ) = (q1 , L , qn )
k →∞
⇔
∀i = 1, L , n : lim pi k →∞
(k )
= qi
8.2 Funktionen mehrerer Veränderlicher
8.2
147
Funktionen mehrerer Veränderlicher
Unter einer Funktion von n Veränderlichen versteht man eine Funktion f : d → r , wobei d ⊆ r n ist.
Der Graph einer solchen Funktion gf ist eine Teilmenge des r n +1 , nämlich gf = {( x1 ,L, xn+1 ) ∈ r n+1 | ( x1 ,L, xn ) ∈ d ∧ xn+1 = f ( x1 ,L, xn )} .
Nur für n = 2 lässt sich ein Graph, der dann im Allgemeinen eine Fläche im R3 ist, noch anschaulich vorstellen und als Schrägbild zeichnen. Andererseits werden die Unterschiede zu Funktionen einer Veränderlichen, wie sie in den Kapiteln 3 bis 5 behandelt wurden, bereits für zwei unabhängige Veränderliche deutlich. Deshalb werden die meisten Definitionen und Sätze zunächst für n = 2 formuliert, die Übertragung auf größere n fällt dann nicht mehr schwer. Funktionen von zwei Veränderlichen werden meist als z = f ( x, y ) notiert, um unnötige Indices zu vermeiden. Um sich einen Überblick über den Funktionsverlauf von z = f ( x, y ) zu verschaffen, benutzt man sogenannte Schnitte:
1. Waagerechte Schnitte: Hierbei bestimmt man für festes c ∈ R die Menge H = {( x, y ) ∈ d | f ( x, y ) = c} . Meist ist dies eine Kurve in d, für die in der Kartographie der Begriff Höhenlinie gebräuchlich ist. Eine Höhenlinienskizze, das ist eine graphische Darstellung von Höhenlinien zu verschiedenen c-Werten, gibt Auskunft darüber, wie stark eine Funktion zunimmt, wenn man sich in d in eine bestimmte Richtung bewegt. Anschaulich erhält man eine Höhenlinienskizze dadurch, dass man im Dreidimensionalen den Graphen von f mit Parallelebenen zur (x, y)-Ebene („waagerechte Ebenen“) in verschiedenen Höhen c schneidet und die Schnittkurven in die (x, y)-Ebene projiziert. Für n > 2 geht man analog vor: Für feste c bestimmt man {( x1 ,L, xn ) ∈ d | c = f ( x1 ,L, xn )} ; statt von Höhenlinien spricht man dann von Niveauflächen.
2. Senkrechte Schnitte: Hierbei wird der Einfluss von jeweils einer Variablen allein auf die Funktionswerte von f untersucht. Indem etwa y = y0 (fester Wert) gesetzt wird, kann mithilfe der Funktion einer Veränderlichen g ( x) := f ( x, y0 ) die Abhängigkeit nur von x untersucht werden. Anschaulich erhält man den Graphen von g, indem man den Graphen von f mit der zur (x, z)-Ebene parallelen Ebene durch (0, y0 , 0) schneidet („senkrechte Ebene“). Analog erhält man den anderen senkrechten Schnitt durch Festhalten von x = x0. Bei der Verallgemeinerung auf n > 2 Veränderliche hält man alle bis auf eine Variable xi fest.
148
8 Mehrdimensionale Analysis
Völlig analog zu einer Veränderlichen wird bei einer Funktion f : d → r , d ⊆ r n , die Stetigkeit definiert:
Definition: Eine Funktion f heißt stetig in q ∈ d, wenn für alle Folgen pk in d mit lim p k = q stets k →∞
lim f (p k ) = f (q) ist.
k →∞
Für die meisten Anwendungen sind die hier betrachteten Funktionen mehrerer Veränderlicher, die als Werte reelle Zahlen haben, ausreichend. Die gesamte Theorie lässt sich jedoch leicht auf solche Funktionen übertragen, deren Werte im Rm (mit m > 1) liegen: Statt einer Funktion f von n Veränderlichen betrachtet man nun gleichzeitig die m Komponentenfunktionen fi von n Veränderlichen, die durch f (p ) = ( f1 (p), L , f m (p )) gegeben sind. Solche Funktionen sind zum Beispiel stetig, wenn alle fi stetig sind.
8.3
Partielle und vollständige Differenzierbarkeit
Die in Abschnitt 8.2 eingeführten senkrechten Schnitte, mit denen der Einfluss einer bestimmten Variablen auf den Funktionsverlauf dargestellt wird, sollen benutzt werden, um den aus Kapitel 4 bekannten Ableitungsbegriff für Funktionen einer Veränderlichen auf mehrere Veränderliche zu übertragen. Zunächst wird eine Funktion f (x, y) von zwei Veränderlichen in der Umgebung einer festen Stelle (xP, yP) betrachtet. Beim senkrechten Schnitt mit y = yP ergibt sich die Funktion einer Veränderlichen x a f ( x, y P ) . Diese wird gemäß Kapitel 4 auf Differenzierbarkeit überprüft. Entsprechende Überlegungen kann man auch bei festgehaltenem x = xP für die Funktion y a f ( xP , y ) anstellen. Man erhält die
Definition: f heißt in (xP, yP) partiell differenzierbar nach x ⇔ lim
∆x →0
f ( x P + ∆x , y P ) − f ( x P , y P ) existiert in R. ∆x
Ist dies der Fall, so heißt der Grenzwert die (erste) partielle Ableitung von f nach x an der ∂f Stelle (xP, yP) und wird mit (x , y ) oder mit fx (xP, yP) bezeichnet. ∂x P P Analog: Partielle Differenzierbarkeit nach y; f ( x P , y P + ∆y ) − f ( x P , y P ) ∂f (x , y ) = fy (xP, yP) = ∆lim y →0 ∂y P P ∆y
8.3 Partielle und vollständige Differenzierbarkeit
149
∂f (x , y ) = tan α1 ist die Tangentensteigung gegen die x-Richtung, ∂∂yf (xP , yP ) = tan α 2 ∂x P P ist diejenige gegen die y-Richtung (siehe Bild 8.3.1).
Bild 8.3.1: Partielle Ableitungen als Steigungen entsprechender Schnittkurven
Diese Definition macht unmittelbar klar, wie man die partielle Differenzierbarkeit nach x prüft bzw. die entsprechende partielle Ableitung berechnet: Man behandle die Variable y wie eine Konstante und leite mit den Regeln aus Kapitel 4 wie gewohnt nach x ab. Entsprechendes gilt umgekehrt für die partielle Ableitung nach y.
Höhere partielle Ableitungen Die partiellen Ableitungen nach x und y sind im Allgemeinen selbst wieder Funktionen von x und y, man kann sie also wiederum auf partielle Differenzierbarkeit nach x und y untersuchen. Man erhält so im Falle der Existenz die zweiten partiellen Ableitungen, im Einzelnen aus
∂f : ∂x
∂ ∂ f ∂2 f = f xx = ∂x ∂x ∂x 2
sowie
∂ ∂ f ∂2 f = f xy = ∂y ∂x ∂y∂x
aus
∂f : ∂y
∂ ∂ f ∂x ∂y
sowie
∂ ∂f ∂y ∂y
∂2 f = = f yx ∂x∂y
∂2 f = 2 = f yy ∂y
∂2 f ∂2 f und verschieden sein; für die meisten praktisch ∂x∂y ∂y∂x relevanten Beispiele gilt jedoch der Gemäß der Definition können
150
8 Mehrdimensionale Analysis
Satz von SCHWARZ über die Differentiationsreihenfolge: Sind alle ersten und zweiten partiellen Ableitungen stetig, so stimmen die gemischten ∂2 f ∂2 f partiellen Ableitungen überein, es ist also = . ∂x∂y ∂y∂x Ganz ähnlich definiert man dritte, vierte usw. partielle Ableitungen, der Satz von SCHWARZ wird dann sinngemäß übertragen. Partielle Differenzierbarkeit lässt sich analog auf Funktionen von n > 2 Veränderlichen übertragen:
Definition: Eine Funktion f : d → r , d ⊆ r n , heißt in p ∈ d partiell differenzierbar nach xk ⇔
lim h→0
f ( p1 , L , pk + h, L , pn ) − f ( p1 , L , pk , L , pn ) existiert in R. h ∂f oder ∂xk
Der dann existierende Grenzwert heißt partielle Ableitung nach xk und wird mit f xk bezeichnet.
Auch für solche Funktionen lassen sich ganz analog höhere partielle Ableitungen definieren; der Satz von SCHWARZ gilt auch hier.
Vollständige Differenzierbarkeit 2 xy Die Funktion f : r 2 → r , definiert durch f ( x, y ) = x 2 + y 2 0
Bild 8.3.2: Graph und Höhenlinien des Zylindroids
für ( x, y ) ≠ (0,0) für ( x, y ) = (0,0)
,
8.3 Partielle und vollständige Differenzierbarkeit
151
deren Graph ein sogenanntes Zylindroid ist (siehe Bild 8.3.2), ist überall nach x und y partiell differenzierbar, obwohl sie in (0,0) nicht einmal stetig ist. Dies zeigt, dass die partielle Differenzierbarkeit bei Funktionen mehrerer Veränderlicher nicht der Differenzierbarkeit bei Funktionen einer Veränderlichen entspricht. Ein Blick auf den Graphen und die Höhenlinien von f zeigt, woran das liegt: es ist unmöglich, in (0,0) eine „Tangentialebene“ an den Graphen von f zu konstruieren. Ein stärkerer Differenzierbarkeitsbegriff, den obiges Beispiel nicht erfüllt, findet sich in der
Definition: Eine Funktion f ( x, y ) heißt (vollständig) differenzierbar in ( xP , y P ) ∈ df , wenn sich d, e ∈ R finden lassen, sodass für jede beliebige Folge ( x (k ) , y (k ) ) von Punkten, die in df gegen ( xP , y P ) konvergieren, lim
f ( x (k ) , y ( k ) ) − f ( x P , y P ) − d ⋅ ( x ( k ) − x P ) − e ⋅ ( y ( k ) − y P ) ( x (k ) , y (k ) ) − ( x P , y P )
k →∞
= 0 ist.
Anschaulich bedeutet dies, dass der Graph von f an der Stelle ( xP , y P ) eine Tangentialebene ∂f besitzt. Darüber hinaus ist f dort partiell differenzierbar nach x und y, wobei d = ( xP , y P ) ∂x ∂f und e = ( xP , y P ) ist. Die Gleichung der Tangentialebene lautet demnach: ∂y T ( x, y ) = f ( x P , y P ) +
∂f (xP , y P ) ⋅ (x − xP ) + ∂f (xP , y P ) ⋅ ( y − y P ) ∂x ∂y
Setzt man dx = x − xP und dy = y − yP, so beschreibt der Ausdruck df =
∂f (xP , y P ) ⋅ d x + ∂f (xP , y P ) ⋅ d y , ∂x ∂y
das sogenannte vollständige (bzw. totale) Differential von f in ( xP , y P ) , die Änderung der Tangentialebene, wenn sich das Argument um (dx, dy) ändert. Für kleine |dx|, |dy| ist das Differential eine gute Approximation für die Änderung der Funktionswerte ∆ f = f ( xP + dx, y P + dy ) − f ( xP , y P ) , eine Tatsache, die bei der Fehlerrechnung (siehe Abschnitt 8.5) Anwendung findet. Die vollständige Differenzierbarkeit hat – wie oben ausgeführt – die partielle zur Folge. Umgekehrt gilt der
Satz: Wenn in einer offenen Umgebung von p ∈ df die partiellen Ableitungen existieren und in p stetig sind, so ist f in p vollständig differenzierbar.
152
8 Mehrdimensionale Analysis
Die Begriffe „vollständige Differenzierbarkeit“ und „vollständiges Differential“ lassen sich auf Funktionen mit mehr als zwei Veränderlichen wie folgt verallgemeinern:
Definition: Eine Funktion f : d → r heißt (vollständig) differenzierbar in q = (q1,…, qn) ∈ d, wenn es d1,…, dn ∈ R gibt, sodass für alle Folgen p(k) mit Werten aus d und lim p ( k ) = q gilt: k →∞
n
f (p ( k ) ) − f (q) −
∑d ⋅(p i
i
(k )
− qi )
i =1
lim
p(k ) − q
k →∞
=0
Das Differential an der Stelle q ist definiert als df =
∂f (q ) ⋅ dx1 + K + ∂ f (q ) ⋅ dxn . ∂x1 ∂xn
Es lässt sich auch ein Analogon zur Tangentialebene definieren; eine solche Tangentialhyperebene entzieht sich jedoch der anschaulichen Vorstellung. Der Begriff der vollständigen Differenzierbarkeit lässt sich ohne Mühe auf vektorwertige Funktionen mehrerer Veränderlicher verallgemeinern:
Definition: Es sei F : D → r m , D ⊆ Rn, durch F (p) = ( f1 (p), L , f m (p)) gegeben; es sei q ∈ D. Dann ist F genau dann vollständig differenzierbar in q (bzw. auf D), wenn alle Koordinatenfunktionen f i : D → r vollständig differenzierbar in q (auf D) sind.
8.4
Gradient, Richtungsableitung, Kettenregel
Definition: (i) Für eine an der Stelle p ∈ d vollständig differenzierbare Funktion f : D → r definiert man den Gradienten von f an der Stelle p durch ∂f ∂f grad p f = (p), L , (p) . ∂xn ∂x1 (ii) Ist F : D → r m vollständig differenzierbar in p, so bilden die Gradienten der Koordinatenfunktionen fi, zeilenweise geschrieben, die sogenannte JACOBI-Matrix J(p) von F.
8.4 Gradient, Richtungsableitung, Kettenregel
153
Der Gradient (= „Vektor der partiellen Ableitungen“), manchmal etwas missverständlich auch mit grad f (p) bezeichnet, hängt von p ab und liegt in Rn; für alle Stellen p, in denen f vollständig differenzierbar ist, kann durch p a grad p f eine Abbildung grad mit Werten in Rn definiert werden.
Definition: Für festes a ∈ Rn mit a = 1 definiert man die Richtungsableitung von f in Richtung a an der Stelle p durch f (p + ta) − f (p) ∂f (p) := lim . t → 0 ∂a t Ist f an der Stelle p vollständig differenzierbar und ist a ≠ 0, so ist auch die folgende Formel für praktische Rechnungen hilfreich:
a ∂f > (p) = < grad p f , ∂a a Im anschaulichen Fall n = 2 ist die Richtungsableitung also der Tangens des Steigungswinr kels α gegen die (x, y)-Ebene für die durch a vorgegeben Richtung (in Bild 8.4.1 mit a bezeichnet).
Bild 8.4.1: Steigungsdreieck zur Darstellung der Richtungsableitung
Eine einfache Überlegung zeigt, dass die in Abschnitt 8.3 eingeführte partielle Ableitung lediglich ein Spezialfall der oben definierten Richtungsableitung ist: Setzt man nämlich a = e k , wobei ek einen kanonischen Basisvektor bezeichnet, so erhält man die partielle Ableitung nach xk als Spezialfall der Richtungsableitung:
154
8 Mehrdimensionale Analysis ∂f ∂f (p) = (p) ∂xk ∂e k
Eine geometrische Bedeutung des Gradienten findet sich in folgendem
Satz: Ist gradp f ≠ 0 , so zeigt er in die Richtung des größten Anstiegs von f ; der Wert der größten Richtungsableitung von p aus ist grad p f . Im anschaulichen Fall n = 2 ist dies der Tangens des größten Steigungswinkels. Ist grad p f = 0 , so heißt p kritischer Punkt von f (siehe auch Abschnitt 8.5). Als weitere geometrische Eigenschaft des Gradienten sei erwähnt, dass dieser bei n = 2 auf jeder Höhenlinie senkrecht steht; für größere n gilt dies entsprechend für die Niveauflächen. Für die Hintereinanderausführung (Komposition) zweier differenzierbarer Funktionen gilt wie im Eindimensionalen die
Kettenregel: Die Funktion f ( x1 , L , xn ) sei auf der offenen Teilmenge d des Rn differenzierbar (äußere Funktion).
a) Die Funktion g : I → d, gegeben durch g (t ) = ( g1 (t ),L , g n (t )) , sei auf einem Intervall I von R differenzierbar (innere Funktion). Dann ist f o g : I → r auf I differenzierbar, und für die Ableitung gilt: n
( f o g )′(t ) =
∂f
∑ ∂x i =1
( g (t )) ⋅ g i′ (t )
i
b) Die Funktion g : M → d, gegeben durch g (t1 , L , t k ) = ( g1 (t1 , L , t k ), L , g n (t1 , L , t k )) , sei auf einer offenen Teilmenge M von Rk differenzierbar (innere Funktion). Dann ist f o g : M → r auf M differenzierbar, und für die partiellen Ableitungen gilt: ∂ ( f o g) (t1 , L , t k ) = ∂t j
n
∂f
∑ ∂x i =1
i
( g (t1 , L , t k )) ⋅
∂ gi (t1 , L , t k ) für alle j = 1,…, k ∂t j
Teil b) wird insbesondere dann angewandt, wenn eine Funktion f in Polar- oder Zylinderkoordinaten gegeben ist, aber die partielle Ableitung nach den kartesischen Koordinaten gesucht ist (oder umgekehrt).
8.5 Anwendungen der Differentialrechnung
8.5
155
Anwendungen der Differentialrechnung
Extremwerte Dabei spielen kritische Punkte (siehe Abschnitt 8.4) eine wichtige Rolle:
Satz: Damit die differenzierbare Funktion f in einem inneren Punkt p 1) einen Extremwert hat, muss dort grad p f = 0 sein, das heißt, alle partiellen Ableitungen müssen an der Stelle
p verschwinden. Wie im Falle einer Veränderlichen ist dies eine notwendige, keinesfalls hinreichende Bedingung für das Vorliegen eines Extremwerts. Im anschaulichen Fall n = 2 bedeutet das Vorliegen eines kritischen Punktes, dass dort die Tangentialebene waagerecht ist. Für n = 2 gibt es ein leicht anwendbares hinreichendes Kriterium zur weiteren Prüfung:
Satz: Die zweimal differenzierbare Funktion f ( x, y ) habe an der Stelle (xE , y E ) einen kritischen Punkt. ∂ 2 f ∂ 2 f ∂ 2 f 2 ( x E , y E ) , der Determinanten der sogenannten Dann gilt mit D = 2 ⋅ 2 − ∂x ∂y ∂x∂y HESSE-Matrix der zweiten partiellen Ableitungen: (i)
Ist D > 0, so hat f ( x, y ) im Punkt (xE , y E ) ein Extremum. Es ist ein Maximum, wenn es ist ein Minimum, wenn
1)
∂2 f ∂2 f ( x , y ) < 0 oder (xE , y E ) < 0 ist; E E ∂y 2 ∂x 2 2 ∂2 f (xE , y E ) > 0 oder ∂ f2 (xE , y E ) > 0 ist. 2 ∂y ∂x
(ii)
Ist D < 0, so liegt in (xE , y E ) kein Extremwert, sondern ein Sattelpunkt vor.
(iii)
Ist D = 0, so ist keine allgemeine Aussage möglich, es bedarf weiter gehender Untersuchungen über den Verlauf von f ( x, y ) .
Das ist ein Punkt, der nicht auf dem Rand des Definitionsbereichs liegt.
156
8 Mehrdimensionale Analysis
Extremwerte mit Nebenbedingungen Dabei sind Extrema für eine Funktion f von n Veränderlichen gesucht, die zusätzlich noch k Nebenbedingungen, gegeben durch k Gleichungen der Gestalt g j ( x1 ,L, xn ) = 0 , erfüllen. Eine Möglichkeit ist, mittels der k Gleichungen k Variablen in f zu eliminieren und so ein Extremwertproblem mit n − k Veränderlichen zu erhalten. Ist dies nicht möglich oder zu umständlich, so benutzt man die
Multiplikatorenregel von LAGRANGE: Mit den sogenannten LAGRANGEschen Multiplikatoren λ1 , L , λk betrachte man die durch k
F ( x1 , L , xn , λ1 , L , λk ) = f ( x1 , L , xn ) +
∑ λ g ( x ,L, x ) j
j
1
n
j =1
gegebene Funktion von n + k Veränderlichen und bestimme deren kritische Punkte. ∂F ∂F = 0 und = 0 die Gleichungen Man erhält aus ∂xi ∂λ j ∂f + ∂xi
k
∑λ j =1
∂g j j
∂xi
=0
für i = 1,…, n
und
g j ( x1 ,L, xn ) = 0 für j = 1,…, k.
Die Lösungen dieses nichtlinearen Gleichungssystems für die λj spielen in diesem Zusammenhang keine Rolle, die gefundenen xi sind mögliche Extrema, da die Gleichungen nur notwendige, aber keine hinreichenden Bedingungen liefern.
Lineare Ausgleichsrechnung Dies ist eine weitere Anwendung der Extremwertrechnung mehrerer Veränderlicher: Gegeben seien n Wertepaare (xi , yi ) (Stützstellen genannt); gesucht ist diejenige Funktion m
f ( x) =
∑a
k
f k ( x) ,
k =1
die „am besten auf die gegebenen Wertepaare passt“. Dabei sind die fk gegebene möglichst einfache Funktionen, zum Beispiel Potenzfunktionen, trigonometrische Funktionen o.Ä., die linear unabhängig sind. Bei der gesuchten sogenannten Ausgleichsfunktion f (x) sind die n
Koeffizienten ak so zu bestimmen, dass ∆ =
∑ ( f (x ) − y )
2
i
i
minimal wird. Ein Beispiel
i =1
hierfür ist die in Bild 8.5.1 dargestellte Ausgleichs- oder Regressionsgerade f ( x) = a1 + a2 x . ∆ ist eine Funktion der m Veränderlichen a1, …, am, sodass man ihr Minimum mittels Differentialrechnung bestimmen kann. ∂∆ = 0 für k = 1, …, m ergibt sich das sogenannte Normalengleichungssystem, ein Aus ∂ ak
8.5 Anwendungen der Differentialrechnung
157
Bild 8.5.1: Ausgleichsgerade zu fünf gegebenen Wertepaaren (xi, yi)
(m, m)-LGS der Form M ⋅ a = b . Dabei ist a der Vektor der gesuchten Koeffizienten der Ausgleichsfunktion, M und b ergeben sich aus den Stützstellen und den fk wie folgt: f1 ( x1 ) L f (x ) L A= 1 2 M M f (x ) L 1 n
Mit der (n, m)-Matrix
f m ( x1 ) f m ( x2 ) , M f m ( xn )
in der die Zeilenzahl (= Anzahl der Stützstellen) normalerweise deutlich größer als die Spaltenzahl ist (üblicherweise ist m ≤ 4), T
M = A ⋅A
erhält man
y1 b = A ⋅ M . y n T
und
Man beachte, dass aufgrund der Definition M stets symmetrisch ist. Für die Ausgleichsgerade f ( x) = a1 + a2 x ergibt sich das Normalengleichungssystem n
a1 ⋅
∑
n
xi + a 2 ⋅
∑
i =1
i =1 n
a1 ⋅
2
xi =
∑
∑
∑x y i
i
i =1
n
1 + a2 ⋅ i =1 { =n
n
n
xi =
i =1
∑y
i
i =1
welches die eindeutig bestimmte Lösung
n
n a2 =
n
n
∑ x y − ∑ x ⋅ ∑ y i
i
i
i =1
i =1
n
n
∑ i =1
xi − 2
n
∑ i =1
i
i =1 2
xi
,
a1 =
1 n
n
n
∑ y − a ∑ x i
i =1
2
i
i =1
hat.
158
8 Mehrdimensionale Analysis m
Für das Ausgleichspolynom p( x) =
∑a x
k −1
vom Grade m – 1 ist
k
k =1
1 x1 L x1m−1 A = M M M M , m −1 1 xn L xn
M=
n
∑
n
j =1 n
n
∑x
j
j =1
∑x
∑x
2 j
L
∑
L
∑
j =1
M
n
m −1 j
j =1
n
M
∑x j =1
j =1 n m xj , j =1 M n 2 m−2 xj j =1 n
xj
M m j
L
xj
∑
m −1
b=
j =1 n xjyj . j =1 M n m −1 xj yj j =1 n
∑y
j
∑
∑
Analog erhält man bei anderen Ausgleichsfunktionen M und b aus der Matrix A.
Fehlerrechnung Mithilfe des vollständigen Differentials lässt sich der maximale absolute Fehler abschätzen, den man erhält, wenn eine Größe z sich als Funktion von n mit Messfehlern ∆xi behafteten Messgrößen xi berechnen lässt. Für ∆z = f ( x1 + ∆x1 , L , xn + ∆xn ) − f ( x1 , L , xn ) erhält man aufgrund der Approximationseigenschaft des Differentials: n
| ∆z |≈| d f | =
∂f
∑ ∂x i =1
i
⋅ ∆xi ≤
∂f ∂f ⋅ | ∆x1 | + L + ⋅ | ∆xn |=: ∆z pess ∂x1 ∂xn
Setzt man in die partiellen Ableitungen die ermittelten Messwerte xi und für ∆xi den jeweiligen maximalen Messfehler ein, so gibt der letzte Ausdruck, mit ∆z pess bezeichnet, den schlimmstmöglichen Fehler von z an; dieser tritt ein, wenn sich alle Fehler „in eine Richtung“ überlagern, wenn also keine Fehlerauslöschung vorliegt. Aus dieser Formel erhält man leicht die bekannten Merkregeln: Bei einer Summe fehlerbehafteter Größen addieren sich die absoluten Fehler zum maximalen absoluten Fehler; bei einem Produkt addieren sich die relativen Fehler zum maximalen relativen Fehler.
Implizit definierte Funktionen Betrachtet man etwa die Gleichung x 2 + y ⋅ e x+ y = 0 , so lässt sich diese weder nach x noch nach y explizit auflösen. Für x = 0 ergibt sich offensichtlich y = 0 als einzige mögliche Lösung. Man kann nun fragen, ob dies auch in einer Umgebung U von 0 der Fall ist. Anders formuliert: Gibt es eine Funktion f : U →R derart, dass für alle x ∈ U und y = f ( x ) obige Gleichung erfüllt ist? Man sagt dann, dass die Funktion f durch obige Gleichung implizit definiert wird. Man beachte, dass man dieses f nicht explizit – durch Auflösen – angeben kann.
8.5 Anwendungen der Differentialrechnung
159
Die allgemeine Antwort für Gleichungen mit n Veränderlichen gibt der
Satz über implizit definierte Funktionen: Die Funktion F ( x1 , L , xn ) sei auf einer offenen Teilmenge G des Rn stetig partiell differenzierbar. ∂F Ferner gelte für ein festes (a1 , L , an ) ∈ G : F (a1 , L , an ) = 0 und (a1 , L , an ) ≠ 0 . ∂xn Dann gibt es in Rn-1 eine Umgebung U von (a1 , L , an−1 ) und eine auf U definierte partiell differenzierbare Funktion f derart, dass f (a1 , L , a n −1 ) = a n ist und dass auf U gilt:
F ( x1 , L , xn−1 , f ( x1 , L , xn−1 )) = 0 und
Fx Fx ∂f ∂f = − 1 ,…, = − n −1 ∂x1 Fxn ∂xn−1 Fxn
Umformuliert für zwei Veränderliche x und y (siehe einführendes Beispiel) lautet der Satz: Gegeben sei die Funktion F ( x, y ) mit F (a, b) = 0 und
∂F ( a , b ) ≠ 0. ∂y
Dann gibt es ein Intervall I mit a ∈ I und eine auf I differenzierbare Funktion y = f ( x ) derart, dass für alle x ∈ I F ( x, f ( x )) = 0 ist; für die Ableitung der implizit definierten Funktion f gilt:
f ′( x) = −
Fx ( x, f ( x)) Fy ( x, f ( x))
Differentiation unter dem Integralzeichen Auf D = [a, b] × [c, d ] sei eine stetig differenzierbare Funktion g ( x, y ) gegeben, ferner seien
u ( x) und v( x) auf [a, b] stetig differenzierbar mit Werten in [c, d ] . Für die durch v( x)
f ( x) =
∫ g ( x, y )d y u ( x)
auf [a, b] definierte Funktion gilt die
LEIBNIZ-Regel für die Differentiation nach einem Parameter x: f ( x) ist auf [a, b] differenzierbar; für die Ableitung gilt: v( x)
f ′( x) =
∫ g ( x, y)d y + g ( x, (v( x)) ⋅ v′( x) − g ( x, (u ( x)) ⋅ u′( x) x
u ( x)
160
8 Mehrdimensionale Analysis
Wichtige Sonderfälle ergeben sich, wenn u ( x) oder v( x) oder beide konstant sind, insbesondere ist d dx
8.6
C2
C2
C1
C1
∫ g ( x, y ) d y = ∫ g ( x, y ) d y . x
Doppel- und Dreifachintegrale
Das Konzept der RIEMANNschen Unter- und Obersumme wird hierzu auf höhere Dimensionen übertragen. Bei der Einführung der sogenannten Doppelintegrale, also bei n = 2, versucht man das Volumen bestimmter Körper – analog zu Inhalten bestimmter Flächen bei Funktionen einer Veränderlichen – durch einfachere Teilvolumina „auszuschöpfen“. Dazu sei f ( x, y ) eine Funktion von zwei Veränderlichen, die auf einer beschränkten und abgeschlossenen Teilmenge b des R2 stetig und positiv sei. Man betrachte den Körper K, der durch den Graphen von f nach oben, die (x, y)-Ebene nach unten und Senkrechte dazu längs des Randes von b als Mantelfläche begrenzt wird. Um das Volumen V eines solchen Körpers näherungsweise zu bestimmen, wird b, wie in Bild 8.6.1 dargestellt, in beliebige disjunkte Teilflächen b1,…, bm mit Flächeninhalten ∆bi zerlegt; in jeder Teilfläche bi sei ein Punkt Pi = ( xi , yi ) beliebig gewählt.
Bild 8.6.1: Zerlegung des Integrationsbereichs b
Das Teilvolumen über bi ist – für hinreichend kleine ∆bi – ungefähr ∆bi ⋅ f ( xi , yi ) , also m
V≈
∑ ∆b ⋅ f ( x , y ) . i
i
i
i =1
Diese Näherung wird umso besser, je feiner die Zerlegung von b wird, das heißt: 1.
m wird immer größer;
2.
mit d i = sup p − q wird max d i für wachsende m immer kleiner. p,q∈bi
i =1,Lm
8.6 Doppel- und Dreifachintegrale
161
Falls der Grenzwert dieses Prozesses existiert, stellt er das Volumen V des Körpers dar. Man hat damit – analog zu Kapitel 5 – die
Definition: Es sei b ⊆ R2 beschränkt und abgeschlossen, f ( x, y ) sei auf b beschränkt. Dann heißt f über b integrierbar, wenn es ein I ∈ R gibt, sodass für jede immer feiner m
werdende Zerlegung b1, …, bm von b die Summe
∑ ∆b ⋅ f ( x , y ) gegen I konvergiert. i
i
i
i =1
Die Zahl I heißt dann das Doppelintegral (oder Bereichsintegral oder Gebietsintegral) von f über dem Integrationsbereich b. Bezeichnungsweisen:
I=
∫ f db = ∫∫ f ( x, y)dxd y b
b
Hat f nur positive Werte, so stellt I das oben definierte Volumen dar. Dass diese Definition für das praktische Rechnen äußerst ungeeignet ist, liegt auf der Hand. Im Vergleich zu einer Veränderlichen, bei der der Integrationsbereich nur ein Intervall sein kann, hat man dafür in höheren Dimensionen wesentlich mehr Möglichkeiten. Viele Beispiele für b lassen sich wie folgt beschreiben:
Definition: Lässt sich B schreiben als B = {(x, y) ∈ R2 | a ≤ x ≤ b und g(x) ≤ y ≤ h(x)} oder B = {(x, y) ∈ R2 | a ≤ y ≤ b und g (y) ≤ x ≤ h (y)} mit auf [a, b] stetigen Funktionen g und h, so heißt b Normalbereich.
Bild 8.6.2: Normalbereich b bezüglich kartesischer Koordinaten
Viele in der Praxis vorkommende Integrationsbereiche lassen sich auf diese Art beschreiben. Damit lässt sich das Doppelintegral nun einfacher berechnen:
162
8 Mehrdimensionale Analysis
Satz: Ist b ein Normalbereich und f ( x, y ) stetig auf b, so ist
∫ b
b h( x)
f db =
∫∫
f ( x, y ) d y dx bzw.
a g ( x)
∫
b h( y )
f db =
b
∫ ∫ f ( x, y ) d x d y a g( y)
je nachdem, wie b als Normalbereich beschrieben ist. Auf diese Weise wird die Berechnung eines Doppelintegrals auf die Auswertung zweier eindimensionaler Integrale zurückgeführt. Die Berechnung muss dabei stets „von innen nach außen“, also im ersten Fall beginnend mit der Integration bezüglich y in von x abhängigen Grenzen (bei festgehaltenem x) durchgeführt werden; danach erfolgt die Integration des nun nur noch von x abhängigen Ausdrucks bezüglich x in festen Grenzen. Bei der Wahl der Integrationsreihenfolge ist stets darauf zu achten, dass die in der Beschreibung von B gegebenen festen Grenzen beim äußeren Integral stehen. Nur im Spezialfall, dass B ein achsenparalleles Rechteck darstellt, also dass B = {(x, y) ∈ R2 | a ≤ x ≤ b und c
≤ y ≤ d}
mit festen Werten a < b und c < d aus R ist, ist die Integrationsreihenfolge beim Doppelintegral beliebig. Für manche Integrationsbereiche, insbesondere für ring- oder kreisförmige Gebilde, ist eine Beschreibung als Normalbereich mit kartesischen Koordinaten schwierig oder unmöglich. Unter Benutzung von (r , ϕ ) bezeichnet man eine Teilmenge B ⊆ R2 als Normalbereich bezüglich Polarkoordinaten, wenn B=
{ ( r cosϕ , r sin ϕ ) ∈ R
B=
{(r cos ϕ , r sin ϕ ) ∈ R
2
2
ϕ1 ≤ ϕ ≤ ϕ2 und g (ϕ ) ≤ r ≤ h(ϕ )} oder
}
r1 ≤ r ≤ r2 und g (r ) ≤ ϕ ≤ h(r )
mit stetigen Funktionen g und h ist.
Bild 8.6.3: Normalbereich b bezüglich Polarkoordinaten
8.6 Doppel- und Dreifachintegrale
163
Für die Integration wird der sogenannte Transformationssatz, auf den im Zusammenhang mit Dreifachintegralen noch genauer eingegangen wird, benutzt; es gilt der
Satz: Ist b ein Normalbereich bezüglich Polarkoordinaten und f ( x, y ) stetig auf b, so ist
∫
ϕ 2 h (ϕ )
f db =
∫
bzw.
∫ ∫ f (r cos ϕ , r sin ϕ ) ⋅ r d r dϕ
ϕ1 g (ϕ )
b
r2 h ( r )
f db =
∫ ∫ f (r cos ϕ , r sin ϕ ) ⋅ r dϕ dr , r1 g ( r )
b
je nachdem, wie b als Normalbereich beschrieben ist. Ein besonders wichtiges Anwendungsbeispiel für dieses Vorgehen ist das folgende:
∫
Mittels Polarkoordinaten erhält man e − ( x
2
+ y2 )
d b = π , andererseits mittels kartesischen Ko-
r2
∫
ordinaten
∞ ∞
e −( x
2
+ y2 )
db =
r2
∫∫
∞ 2
2
e − x e − y d xd y = I 2 , wobei I =
− ∞− ∞
∫e
−x2
d x gesetzt wurde.
−∞
∞
∫
2
Insgesamt ist also e − x d x = π , ein Wert, der bei der Normierung des GAUSSschen Fehler−∞
integrals in der Wahrscheinlichkeitstheorie (siehe dazu Abschnitt 15.6) benutzt wird.
Dreifachintegrale Die Definition mittels RIEMANNscher Summe ist völlig analog zum Fall n = 2; bei der Übertragung ist lediglich „Flächeninhalt“ durch „Rauminhalt“ zu ersetzen. Im Gegensatz zum Doppelintegral, das man sich für positive Funktionen f als Volumen vorstellen kann, lässt sich das Dreifachintegral nicht mehr anschaulich interpretieren. Die Anwendungen – insbesondere in der Physik (Schwerpunkte oder Trägheitsmomente) – sind jedoch vielfältig. Wie im zweidimensionalen Fall erfolgt die praktische Rechnung mittels Normalbereichen.
Definition: Lässt sich B schreiben als B = {(x, y, z) ∈ R3 | a ≤ x ≤ b und g1(x) ≤ y ≤ g2(x) und h1(x,y) ≤ z ≤ h2(x,y)}
mit stetigen Funktionen gi und hi, so heißt b Normalbereich des R³. Wie im Falle n = 2 können auch hier die Variablen die Rollen tauschen, dafür gibt es jetzt insgesamt sechs Möglichkeiten.
164
8 Mehrdimensionale Analysis
Die Berechnung des Dreifachintegrals erfolgt mit dem
Satz: Ist b ein Normalbereich und f ( x, y, z ) stetig auf b, so ist
∫ b
b g 2 ( x ) h2 ( x , y )
f db =
∫ ∫ ∫ f ( x , y , z )d z d y d x a g1 ( x ) h1 ( x , y )
je nachdem, wie b als Normalbereich beschrieben ist. Auch hier erfolgt wieder die Auswertung der Integrale von innen nach außen. In den fünf anderen Fällen der Normalbereichsbeschreibung ändert sich die Reihenfolge der Integrationen entsprechend. Manchmal ist es günstiger, zur Beschreibung des Integrationsbereiches oder zur Berechnung des Integrals eine Koordinatentransformation vorzunehmen, etwa auf Zylinder- oder Kugelkoordinaten. Lassen sich die kartesischen Koordinaten ( x, y, z ) etwa durch (u , v, w) über
x = T1 (u, v, w) , y = T2 (u, v, w) , z = T3 (u, v, w) ausdrücken und ist J (u , v, w) die JACOBI-Matrix von T = (T1 , T2 , T3 ) , so gilt – als Verallgemeinerung der Substitutionsregel – der
Transformationssatz:
∫∫∫ f ( x, y, z) d xd y d z = ∫∫∫ f (T(u, v, w)) | det(J(u, v, w) | du d vd w , wobei T den Bereich B
s
s bijektiv auf b abbildet.
Verwendet man etwa Zylinderkoordinaten (r , ϕ , z ) , so heißt B ein Normalbereich bezüglich Zylinderkoordinaten, wenn er sich schreiben lässt als B = { (r cos ϕ , r sin ϕ , z ) ∈ R3 | a ≤ r ≤ b und g1(r) ≤ φ ≤ g2(r) und h1(r, φ) ≤ z ≤ h2(r, φ)}
mit stetigen Funktionen gi und hi. Ein Rollentausch der Variablen (r , ϕ , z ) ist wie oben möglich. Damit gilt für jede auf B stetige Funktion f ( x, y, z ) :
∫ B
b g 2 ( r ) h2 ( r ,ϕ )
f db =
∫ ∫ ∫ f (r cosϕ , r sin ϕ , z ) ⋅ r d z dϕ d r a g1 ( r ) h1 ( r ,ϕ )
Auch wenn man – etwa bei einem anders beschriebenen B – eine andere Integrationsreihenfolge als obige hat, erhält der Integrand aufgrund des Transformationssatzes bei Benutzung von Zylinderkoordinaten stets den gleichen Faktor r.
8.6 Doppel- und Dreifachintegrale
165
Bei Benutzung der Kugelkoordinaten
x = r cos ϕ cosψ , y = r sin ϕ cosψ , z = r sin ψ ergibt sich aufgrund des Transformationssatzes der zusätzliche Faktor r 2 cosψ im Integranden.
9
Gewöhnliche Differentialgleichungen
9.1
Grundlagen
Definition: Eine Gleichung, in der eine oder mehrere Ableitungen von y nach x stehen und in der außerdem x oder y (oder beide) vorkommen können, heißt eine (gewöhnliche) Differentialgleichung 1) (abgekürzt Dgl) für die gesuchte Funktion y(x) . Die höchste darin vorkommende Ableitungsordnung heißt Ordnung der Dgl. Indem man alle Terme auf eine Seite bringt, lässt sich jede Dgl n-ter Ordnung schreiben als Φ (x, y, y ′,…,y (n)) = 0; (I) dies ist die implizite Form der Dgl. Häufig gelingt es, diese nach der höchsten vorkommenden Ableitung aufzulösen. Die dann entstehende Form y (n) = ϕ (x, y, y ′,…,y (n – 1)) (E) nennt man die explizite Form der Dgl. Sind für eine Dgl n-ter Ordnung an einer Stelle x0 des Definitionsbereichs der gesuchten Funktion der Funktionswert und die Werte aller Ableitungen bis einschließlich der (n − 1) -ten vorgeschrieben, so heißen diese n Gleichungen Anfangsbedingungen für y. Eine Dgl mit Anfangsbedingungen heißt Anfangswertaufgabe oder Anfangswertproblem (abgekürzt AWP).
1)
Hängt y nicht nur von einer Variablen x, sondern von mehreren unabhängigen Veränderlichen ab, so ergeben sich gemäß 8.3 statt der üblichen die partiellen Ableitungen für y. Auf solche Weise entstehen partielle Differentialgleichungen; eine kurze Einführung in deren Behandlung erfolgt im nächsten Kapitel.
https://doi.org/10.1515/9783110537161-177
168
9 Gewöhnliche Differentialgleichungen
Definition: Eine Lösung einer gegebenen Dgl, die so viele frei wählbare Parameter enthält wie die Ordnung angibt, heißt allgemeine Lösung der Dgl. Eine Lösung einer Dgl, die die Anfangsbedingung(en) erfüllt, heißt spezielle oder besondere Lösung der Anfangswertaufgabe. Besonders wichtig für viele Anwendungen sind lineare Differentialgleichungen:
Definition: (i)
Eine Differentialgleichung der Gestalt
an ( x) y ( n ) + an−1 ( x) y ( n−1) + L + a1 ( x) y′ + a0 ( x) y = r ( x) (mit an ( x ) ≠ Nullfunktion) heißt lineare Differentialgleichung n-ter Ordnung (LDn). Die ai ( x ) heißen Koeffizienten(funktionen), die Funktion r ( x) Störfunktion oder Störglied oder rechte Seite der (LDn). (ii)
Sind die ai ( x ) konstant, so spricht man von einer linearen Differentialgleichung mit konstanten Koeffizienten (LDKn).
(iii)
Ist r ( x) ≡ 0 , so heißt die (LDn) homogen, ansonsten inhomogen.
Für die Lösungen linearer Differentialgleichungen gelten die gleichen Aussagen – sinngemäß übertragen – wie für lineare Gleichungssysteme (vgl. Abschnitt 2.3):
Satz zur Lösbarkeit linearer Differentialgleichungen: (i)
Sind y1 und y2 Lösungen einer homogenen (LDn), so ist für beliebige α , β ∈R auch y = α y1 + β y2 eine Lösung der Dgl.
(ii)
Ist y p eine spezielle Lösung einer inhomogenen (LDn) und ist yh eine beliebige Lösung der zugehörigen homogenen Dgl, so ist auch y = y p + yh eine Lösung der inhomogenen (LDn).
(iii)
Sind y p und yq Lösungen der gleichen inhomogenen (LDn), so ist y = y p − y q eine Lösung der zugehörigen homogenen Dgl.
Um die allgemeine Lösung einer inhomogenen (LDn) zu erhalten, bestimmt man zunächst die Lösungsgesamtheit H der zugehörigen homogenen Dgl (einen n-dimensionalen Unterraum des Vektorraums aller n-mal differenzierbaren Funktionen); dann beschafft man sich (z.B. durch einen passenden Ansatz) eine spezielle Lösung yp der inhomogenen (LDn); durch
y p + h = { y p + y h | yh ∈ h}
9.1 Grundlagen
169
ist die Lösungsgesamtheit der inhomogenen (LDn) – mit n frei wählbaren Parametern – gegeben. Die Frage nach der Existenz einer Lösung einer Anfangswertaufgabe beantwortet der
Satz von PICARD-LINDELÖF: Gegeben sei ein Anfangswertproblem n-ter Ordnung durch die Differentialgleichung
y ( n ) = f ( x, y, y ′, L , y ( n−1) )
und die Anfangsbedingungen
y ( x0 ) = y0 , y ′( x0 ) = y1 , L , y ( n−1) ( x0 ) = y n−1 .
Ferner sei die Funktion f (u1 , u2 , L , u n+1 ) der n + 1 Veränderlichen, die die rechte Seite der Dgl beschreibt, stetig in ( x0 , y0 ,L, yn−1 ) . Falls f (u1 , u2 , L , u n+1 ) an der Stelle ( x0 , y0 ,L, yn−1 ) stetig partiell differenzierbar nach
u2 , u3 , L , un+1 ist, existiert eine in einer Umgebung von x0 definierte eindeutig bestimmte Lösung des Anfangswertproblems. Die Voraussetzung über die Stetigkeit der partiellen Ableitungen kann durch die etwas schwächere LIPSCHITZ-Bedingung ersetzt werden: Gibt es eine Konstante L (die sogenannte LIPSCHITZ-Konstante) derart, dass | f ( x, y ) − f ( x, y ) | ≤ L y − y
∀( x, y ), ( x, y ) ∈ R
gilt, so ist die gegebene Anfangswertaufgabe eindeutig lösbar. Dabei bezeichnet R ein ( x0 , y0 ,L, yn−1 ) enthaltendes Rechteck im Rn+1 (das ist ein kartesisches Produkt von Intervallen). Üblicherweise bestimmt man bei der Lösung einer Anfangswertaufgabe n-ter Ordnung zunächst die allgemeine Lösung der Dgl, um dann durch Einsetzen der n Anfangsbedingungen die n frei wählbaren Parameter zu bestimmen. Nur bei numerischen Lösungen (siehe Kapitel 14) oder bei Benutzung der LAPLACE-Transformation (siehe Kapitel 12) ermittelt man sofort die Lösung des Anfangswertproblems. Genauso geht man bei der Behandlung sogenannter Randwertaufgaben vor, auf die in 9.6 noch näher eingegangen wird. Allerdings ist hier nicht immer die eindeutige Lösbarkeit gegeben; Randwertprobleme können unlösbar oder mehrdeutig lösbar sein, selbst wenn die allgemeine Lösung der Differentialgleichung bekannt ist. In den folgenden beiden Abschnitten werden zunächst die wichtigsten Lösungsmethoden zur Bestimmung der allgemeinen Lösung einer Differentialgleichung vorgestellt.
170
9.2
9 Gewöhnliche Differentialgleichungen
Differentialgleichungen erster Ordnung
1. Separierbare Dgl:
y ′ = g ( x ) ⋅ h( y )
dy und führe eine Trennung der Variablen (TdV) durch, indem man xdx dy und y-Terme auf verschiedene Seiten sortiert ( wird wie ein Bruch behandelt): dx
Man ersetze y ′ =
dy = g ( x) ⋅ dx h( y ) Durch formales unbestimmtes Integrieren dieser Gleichung erhält man ~ H ( y ) = G ( x) + C , ~ 1 wobei H ( y ) eine Stammfunktion von , G ( x) eine von g ( x) und C eine beliebige h( y ) reelle Konstante ist.
Gegebenenfalls lässt sich die letzte Gleichung nach y auflösen, wodurch man die allgemeine Lösung der separierbaren Dgl mit C als frei wählbarem Parameter erhält. Bemerkung: Das Verfahren lässt sich auch anwenden, wenn die rechte Seite der Dgl (in expliziter Form) nur von x oder nur von y abhängt, also h( y ) ≡ 1 bzw. g ( x) ≡ 1 ist.
2. Homogene Dgl:
y y′ = h x
y bzw. y = u ⋅ x erhält man aus der gegebenen Dgl für y ( x) x eine Dgl für u ( x) , nämlich u ′ ⋅ x + u = h (u ) ,
Durch die Substitution u =
oder durch Auflösen nach u ′ :
u′ =
h(u ) − u . x
Auf diese ist das in 1. beschriebene Verfahren (TdV) anwendbar; aus der gefundenen Lösung u ( x) erhält man durch die Resubstitution y = x ⋅ u ( x) die allgemeine Lösung der Dgl.
3. Durch lineare Substitution lösbar:
y ′ = h (ax + by + c)
(a, b, c ∈ R, b ≠ 0)
Durch die lineare Substitution u = ax + by + c erhält man aus der gegebenen Dgl für u′ − a y ( x) eine Dgl für u ( x) , nämlich = h(u ) , b
9.2 Differentialgleichungen erster Ordnung oder durch Auflösen nach u ′ :
171
u ′ = b ⋅ h (u ) + a .
Auf diese ist das in 1. beschriebene Verfahren (TdV) anwendbar; aus der gefundenen Lösung 1 u ( x) erhält man durch die Resubstitution y = (u ( x) − ax − c) die allgemeine Lösung der b gegebenen Dgl.
ax + by + c y ′ = h px + qy + r
4. Durch mehrere Substitutionen:
c 0 a) Bei = kürzt man den Bruch im Argument von h durch x; es ergibt sich eine Dgl r 0 ~ y der Form y ′ = h , was mittels 2. gelöst werden kann. x a b = 0 , so gibt es ein λ ∈ R mit ( p, q) = λ ⋅ (a, b) . b) Ist det p q Die Umformung
ax + by + c ~ ax + by + c = h = h (ax + by + c) y ′ = h px + qy + r ( ax + by + c ) + r − c λ λ führt zu einer Dgl, die mittels 3. lösbar ist.
c 0 a b a b α c ≠ 0 , so besitzt das LGS ⋅ = − eine eindeuc) Ist ≠ und det r 0 p q p q β r α tig bestimmte vom Nullvektor verschiedene Lösung . Damit führe man die Substitution β x = u +α , y = v + β
und erhält wegen
d y dv = eine Dgl für v(u): d x du
au + bv ~ v dv = h = h du u pu + qv Diese wird gemäß 2. gelöst. Durch mehrere Resubstitutionen erhält man schließlich die gesuchte allgemeine Lösung y(x).
172
9 Gewöhnliche Differentialgleichungen
5. Lineare Dgl erster Ordnung:
a1 ( x) y′ + a0 ( x) y = r ( x)
1. Schritt: Lösung der homogenen Dgl
a0 ( x ) ⋅ y , lässt sich (TdV) aus 1. anwenden: a1 ( x) a ( x) Ist A( x ) eine Stammfunktion von 0 und C eine beliebige reelle Konstante, so ist a1 ( x) Auf a1 ( x) y′ + a0 ( x) y = 0 , also y ′ = −
y h = C ⋅ e − A( x ) die allgemeine Lösung der homogenen linearen Dgl. 2. Schritt: Bestimmung einer speziellen Lösung der inhomogenen Dgl Mit der allgemeinen Lösung yh der homogenen Dgl führt man eine Variation der Konstanten durch: Man macht dazu den Ansatz y p = C ( x) ⋅ e − A( x ) und setzt diesen zur Bestimmung der unbekannten Funktion C ( x) in die inhomogene Dgl ein und erhält:
C ′( x) =
r ( x ) ⋅ e A( x ) a1 ( x)
Durch direkte Integration erhält man hieraus C ( x) und damit eine spezielle Lösung yp der inhomogenen Dgl. 3. Schritt: Allgemeine Lösung der inhomogenen Dgl Diese ergibt sich als y = yh + y p aus den Ergebnissen der vorherigen Schritte. Bemerkung: Hängen a0 und a1 nicht von x ab, sondern sind konstant, so ist es einfacher, das im nächsten Abschnitt beschriebene Verfahren für lineare Differentialgleichungen mit konstanten Koeffizienten anzuwenden.
y ′ + f ( x) y − y m g ( x) = 0
6. BERNOULLIsche Dgl:
Für m = 1 ist dies eine homogene lineare Dgl, ihre allgemeine Lösung erhält man mittels (TdV); für m ≠ 1 führe man die Substitution z = y1−m durch. 1
Wegen y = z 1− m , also y ′ =
m
1 ⋅ z 1−m ⋅ z ′ , erhält man für z(x) die Dgl 1− m
z ′ + (1 − m) f ( x) z − (1 − m) g ( x) = 0 , eine im Allgemeinen inhomogene lineare Dgl, die mittels 5. gelöst wird.
9.3 Lineare Differentialgleichungen mit konstanten Koeffizienten
7. RICCATIsche Dgl :
173
y ' = g 0 ( x) + g1 ( x) y + g 2 ( x) y 2
Diese lässt sich im Allgemeinen nicht in geschlossener Form lösen. Hat man jedoch – zum Beispiel durch Raten – eine spezielle Lösung yp der Dgl, so erhält man die allgemeine Lösung y durch Einführen einer Funktion u ( x) := y ( x) − y p ( x) wie folgt:
u ( x) ist allgemeine Lösung der Dgl
u ′ = ( g1 ( x) + 2 g 2 ( x) y p ( x )) ⋅ u + g 2 ( x) ⋅ u 2 ,
einer BERNOULLIschen Dgl mit m = 2, die sich mit der Substitution z =
1 (vgl. 6.) lösen u
lässt.
8. Exakte Dgl:
y′ = −
P ( x, y ) Q ( x, y )
Durch Einführung der Differentialschreibweise lässt sich dies umformen zu:
P ( x, y ) ⋅ d x + Q ( x, y ) ⋅ d y = 0 Ist nun P( x, y ) =
∂F ∂F und Q( x, y ) = einer Funktion F ( x, y ) , so bedeutet die letzte ∂x ∂y
Gleichung, dass das vollständige Differential von F überall gleich 0 ist, F ( x, y ) also konstant sein muss. Durch F ( x, y ) = C ist mit beliebigem C ∈ R die allgemeine Lösung y(x) implizit gegeben (vgl. hierzu Abschnitt 8.5). Ist zusätzlich eine Anfangsbedingung y ( x0 ) = y0 gegeben, so erhält man mit C0 = F ( x0 , y0 ) durch Auflösen nach y von F ( x, y ) = C0 die Lösung der Anfangswertaufgabe. Zur Existenz der Funktion F(x, y): Im Kapitel 11 wird gezeigt, dass bei differenzierbaren ∂ P ∂Q Funktionen P und Q dazu = sein muss. Gilt obige Integrabilitätsbedingung etwa ∂y ∂x auf einem Rechteck, so muss F ( x, y ) existieren. Wie man dieses F ( x, y ) , eine sogenannte Stammfunktion eines Vektorfelds, bestimmt, wird ebenfalls in Kapitel 11 behandelt.
9.3
Lineare Differentialgleichungen mit konstanten Koeffizienten
Wie im ersten Abschnitt dieses Kapitels bereits ausgeführt, erfolgt die Lösung der gegebenen linearen Dgl mit konstanten Koeffizienten in drei Schritten.
an y ( n ) + an−1 y ( n−1) + L + a1 y ′ + a0 y = r ( x) mit ak ∈ R, an ≠ 0
174
9 Gewöhnliche Differentialgleichungen
Zunächst wird yh, die allgemeine Lösung der zugehörigen homogenen Dgl, bestimmt; dann beschafft man sich eine spezielle Lösung der inhomogenen Dgl; im letzten Schritt addiert man diese beiden zur allgemeinen Lösung der inhomogenen Dgl. 1. Schritt: Allgemeine Lösung der homogenen Dgl Mit unbekanntem λ ∈ C setzt man den Ansatz y = e λx in die homogene Dgl ein und erhält
an λn + an−1λn−1 + L + a1λ + a0 = 0 . (C) (C) heißt die charakteristische Gleichung der (LDKn); sie ist eine algebraische Gleichung nten Grades und entsteht dadurch, dass y(k) durch λk ersetzt wird. Offensichtlich gilt:
λ0 ist Lösung von (C)
⇔
e λ x ist Lösung der homogenen (LDKn) 0
Als Gleichung n-ten Grades hat (C) in C genau n (nicht unbedingt verschiedene) Lösungen. Ist λ0 eine Lösung von (C), so können folgende vier Fälle eintreten: 1. λ0 ist einfache reelle Lösung: Diese korrespondiert mit der einen Lösung e λ x der (LDKn). 0
2. λ0 ist r-fache reelle Lösung: Dies führt zu den r linear unabhängigen Lösungen e λ x , xe λ x , L , x r −1e λ x der (LDKn). 0
0
0
3. λ0 ist einfache komplexe Lösung: Da (C) nur reelle Koeffizienten besitzt, ist dann auch λ0 = α − iβ Lösung von (C). Die beiden komplexen Lösungen führen zusammen zu den zwei linear unabhängigen reellen Lösungen eα x cos β x und eα x sin β x . 4. λ0 ist r-fache komplexe Lösung: Dann gilt dies auch für λ0 = α − iβ . Damit führen die insgesamt 2r komplexen Lösungen von (C) gemeinsam zu 2r reellen Lösungen, nämlich: eαx cos β x, x eαx cos β x, L , x r −1eαx cos β x, eαx sin β x, x eαx sin β x, L , x r −1eαx sin β x Da außerdem für verschiedene λ0, λ1 die Lösungen e λ x und e λ x linear unabhängig sind, erhält man also auf diese Weise stets n linear unabhängige Lösungen y1, …, yn der Dgl; 0
1
n
yh =
∑C y i
i
ist also die allgemeine Lösung der homogenen (LDKn).
i =1
2. Schritt: Bestimmung einer speziellen Lösung der inhomogenen Dgl Wie bei einer linearen Differentialgleichung erster Ordnung könnte man auch hier bei der im 1. Schritt gefundenen allgemeinen Lösung der homogenen Gleichung eine Variation der n Konstanten durchführen (sehr rechenintensiv!). Wegen der konstanten Koeffizienten führt jedoch ein direkter Ansatz schneller zum Ziel. Je nach Aussehen des Störglieds r(x) wird dabei eine spezielle Lösung yp mit unbekannten Parametern in die inhomogene Dgl eingesetzt mit dem Ziel, diese Parameter zu bestimmen.
9.3 Lineare Differentialgleichungen mit konstanten Koeffizienten
175
k
Gegebenes Störglied:
r ( x) = eαx ⋅
∑β x
i
(mit α ∈ C (R), βi ∈ R, k ∈ N gegeben)
i
i =0 k
Ansatz für Lösung:
y p ( x) = x q eαx ⋅
∑B x i
i
(mit α und k wie in r(x))
i =0
q gibt an, eine wievielfache Lösung α von (C) ist (häufig q = 0); die Bi werden nach Einsetzen in die Dgl mittels Koeffizientenvergleich bestimmt. Obiger allgemeiner Ansatz enthält insbesondere folgende häufig vorkommende Spezialfälle:
1. Ist r(x) ein Polynom vom Grade k, so ist yp(x) ein Polynom vom gleichen Grade. Ausnahme: Fehlen in der Dgl die Ableitungsordnungen 0, …, q – 1, so muss der Polynomansatz für yp(x) mit xq multipliziert werden.
2. Ist r ( x) = β ⋅ eαx , so führt der Ansatz y p ( x) = B ⋅ eαx zum Ziel. Ausnahme: Ist y p ( x) = B ⋅ eαx selbst Lösung der homogenen Dgl (also α Lösung von (C)), so muss der Ansatz zu y p ( x) = Bxeαx modifiziert werden; löst auch dieser Ausdruck die homogene (LDKn), so nimmt man y p ( x) = Bx 2 eαx usw., allgemein: Ist α q-fache Lösung von (C), so liefert der Ansatz y p ( x) = Bx q eαx eine spezielle Lösung der inhomogenen Dgl.
3. Ist r ( x) = β1 cos ω x + β 2 sin ω x , so führt der Ansatz y p ( x) = B1 cos ω x + B2 sin ω x zum Ziel. Dieser Ansatz (mit cos- und sin-Funktion!) muss auch dann genommen werden, wenn r(x) nur einen der beiden Terme enthält. Ist r ( x) = β cos(ω x + γ ) oder r ( x) = β sin(ω x + γ ) , so muss für die Durchführung des Koeffizientenvergleichs r(x) zunächst in die Form β1 cos ω x + β 2 sin ω x (mittels Additionstheorem) umgerechnet werden. Ausnahme: Ist y p ( x) = B1 cos ω x + B2 sin ω x selbst Lösung der homogenen (LDKn) (also wenn ±iω Lösung von (C) ist), so muss wie bei 2. der Ansatz mit entsprechenden Potenzen von x multipliziert werden, er lautet dann:
y p ( x) = B1 x q cos ω x + B2 x q sin ω x , wenn ±iω q-fache Lösung von (C) ist. Manchmal ist es praktischer, ein gegebenes Störglied r(x) additiv zu zerlegen und getrennt spezielle inhomogene Teillösungen zu bestimmen. Ist nämlich r ( x) = r1 ( x) + r2 ( x) und
y pi ( x) eine spezielle Lösung der inhomogenen Dgl mit der rechten Seite ri ( x) , so ist y p ( x) = y p1 ( x) + y p 2 ( x) eine spezielle Lösung der gegebenen (LDKn) mit dem Störglied r(x).
176
9 Gewöhnliche Differentialgleichungen
3. Schritt: Allgemeine Lösung der inhomogenen Dgl Die allgemeine Lösung der inhomogenen (LDKn) ist nun y = yh + y p . Sind zusätzlich Anfangsbedingungen y ( x0 ) = y0 , y ′( x0 ) = y1 , L , y ( n−1) ( x0 ) = y n−1 gegeben, so werden diese nun (nicht früher!) in die allgemeine Lösung y eingesetzt. Es folgt unmittelbar aus dem Satz von PICARD-LINDELÖF, dass für eine lineare Dgl mit konstanten Koeffizienten jedes Anfangswertproblem eindeutig lösbar ist – egal, welche Anfangswerte man an welcher Stelle vorschreibt.
9.4
Lineare Differentialgleichungen mit variablen Koeffizienten
Sind die Koeffizienten in der gegebenen (LDn)
a n ( x) y ( n ) + an −1 ( x) y ( n −1) + ... + a1 ( x) y ′ + a0 ( x) y = r ( x) nicht konstant, so kann weder das Verfahren mit der charakteristischen Gleichung (C) zur Bestimmung der allgemeinen Lösung der homogenen Dgl noch das Ansatzverfahren zur Gewinnung einer speziellen Lösung der inhomogenen Dgl (beide aus Abschnitt 9.3) angewandt werden. Aus dem Satz von PICARD-LINDELÖF folgt unmittelbar, dass ein Anfangswertproblem mit obiger (LDn) und Anfangswerten an der Stelle x0 bereits dann in einer Umgebung von x0 eindeutig lösbar ist, wenn r(x) und alle ai(x) stetig sind und an ( x0 ) ≠ 0 ist. x0 heißt dann regulärer Punkt. Sind darüber hinaus alle Funktionen in einer Umgebung von x0 analytisch (häufig sind die ai(x) Polynome), so ist auch die Lösung y analytisch, lässt sich also in eine Potenzreihe um x0 entwickeln. ∞
Zur Gewinnung der Lösung setzt man also den Potenzreihenansatz y =
∑ c (x − x ) k
0
k
in
k =0
die (LDn) ein. Durch Koeffizientenvergleich erhält man so eine Rekursionsgleichung für die unbekannten Konstanten ck (für k ≥ n). Mit beliebigen c0 , L , cn−1 ∈ r ist dies die allgemeine Lösung der (LDn). Durch Einsetzen der Anfangsbedingungen y (i ) ( x0 ) = yi in den Potenzreihenansatz erhält man y für die ersten n Koeffizienten ci = i als Startwerte der Rekursion, insgesamt also die Löi! sung des Anfangswertproblems.
9.4 Lineare Differentialgleichungen mit variablen Koeffizienten
177
Der Konvergenzradius der so ermittelten Potenzreihe ist mindestens so groß wie der kleinste der in der Dgl (nach Normierung des führenden Koeffizienten auf 1) vorkommenden Funktionen. Durch einen Potenzreihenansatz werden einige für die Anwendung wichtige Differentialgleichungen gelöst, etwa:
1. Die AIRYsche Differentialgleichung :
y ′′ − xy = 0
Diese tritt bei Problemen der Lichtintensität oder in der Theorie der Beugung von Radiowellen an der Erdoberfläche auf. Ihre allgemeine Lösung lässt sich durch eine Potenzreihe um 0 (Konvergenzradius ρ = ∞ ) in ∞
der Form y =
∑c x k
k
darstellen, wobei für die Koeffizienten
k =0
c2 = 0 und ck + 2 =
ck −1 für k ∈ N+ (k + 1)(k + 2)
gilt. Bei frei wählbaren c0 und c1 ergibt sich daraus mit l ∈ N+:
c0 2 ⋅ 5 ⋅ 8L (3l − 1) ⋅ 3l ⋅ l! c1 c3l +1 = 4 ⋅ 7 ⋅ 10L (3l + 1) ⋅ 3l ⋅ l! c3l −1 = 0 c3l =
2. Die HERMITEsche Differentialgleichung:
y ′′ − 2 xy ′ + λy = 0
Diese tritt u.a. in der Quantentheorie bei der Beschreibung von Molekülschwingungen auf. Auch hier lässt sich ihre allgemeine Lösung durch eine Potenzreihe um 0 (Konvergenzradius ∞
ρ = ∞ ) in der Form y =
∑c x k
k
darstellen, wobei für die Koeffizienten
k =0
ck + 2 =
2k − λ ck für k ∈ N (k + 1)(k + 2)
gilt. Mit frei wählbaren c0 und c1 ergibt sich daraus die allgemeine Lösung:
(4 − λ )λ 4 (8 − λ )(4 − λ )λ 6 λ y = c0 1 − x 2 − x − x − K 4! 6! 2! 2 − λ 3 (6 − λ )(2 − λ ) 5 (10 − λ )(6 − λ )(2 − λ ) 7 x + x + x + K + c1 x + 3 ! 5 ! 7 !
178
9 Gewöhnliche Differentialgleichungen
Für c0 = 0 ist dies eine ungerade, für c1 = 0 eine gerade Funktion. Ist λ eine gerade natürliche Zahl, etwa λ = 2n , so sind wegen der Rekursionsgleichung alle Koeffizienten cn+2 = cn+ 4 = cn+6 = L = 0 . Dies bedeutet, dass sich für gerade n die erste Teilreihe, für ungerade n die zweite auf ein Polynom n-ten Grades reduziert. Multipliziert man diese Polynome n
n
für gerade n mit
(−1) 2 ⋅ 2 2 ⋅ 3 ⋅ 5L (n − 1) ,
für ungerade n mit
(−1)
n −1 2
⋅2
n +1 2
⋅ 3 ⋅ 5L n ,
so erhält man die sogenannten HERMITE-Polynome Hn(x), also H 0 ( x) = 1, H 1 ( x) = 2 x, H 2 ( x) = −2 + 4 x 2 , H 3 ( x) = −12 x + 8 x 3 , L . Hn(x) ist somit die Lösung der HERMITEschen Dgl für λ = 2n , die zusätzlich die Anfangsbedingungen n
n
H n (0) = (−1) 2 ⋅ 2 2 ⋅ 3 ⋅ 5L (n − 1), H n′ (0) = 0 H n (0) = 0, H n′ (0) = (−1)
n −1 2
⋅2
n +1 2
⋅ 3 ⋅ 5L n
bei geradem n, bei ungeradem n
erfüllt.
3. Die LEGENDREsche Differentialgleichung :
(1 − x 2 ) y′′ − 2 xy′ + λ (λ + 1) y = 0
Diese spielt zum Beispiel bei der Bestimmung von Potentialfunktionen (das sind Lösungen der Potentialgleichung), die zusätzlich rotationssymmetrisch sind, eine Rolle. Auch hier lässt sich ihre allgemeine Lösung durch eine Potenzreihe um 0 (Konvergenzradius ∞
ρ = 1 ) in der Form y =
∑c x k
k
darstellen, wobei für die Koeffizienten
k =0
ck + 2 =
k (k + 1) − λ (λ + 1) ck für k ∈ N (k + 1)(k + 2)
gilt. Mit frei wählbaren c0 und c1 ergibt sich daraus die allgemeine Lösung, die sich ähnlich wie die der HERMITEschen Dgl darstellen lässt als y = c0 ⋅ (gerade Funktion) + c1 ⋅ (ungerade Funktion) Ist λ = n eine gerade natürliche Zahl, so wird der gerade Lösungsanteil ein Polynom vom Grade n; ist λ = n ungerade, so wird der ungerade Lösungsanteil ein Polynom vom Grade n. (2n)! wird, so Multipliziert man diese Polynome derart, dass der höchste Koeffizient zu n 2 (n!) 2 erhält man die sogenannten LEGENDRE-Polynome Ln(x) (mit Ln (1) = 1 ), also
9.4 Lineare Differentialgleichungen mit variablen Koeffizienten L0 ( x) = 1, L1 ( x) = x, L2 ( x) = −
179
1 3 2 3 5 + x , L3 ( x) = − x + x 3 , L . 2 2 2 2 (1 − x 2 ) y ′′ − xy ′ + λ2 y = 0
4. Die TSCHEBYSCHEFFsche Differentialgleichung :
Wie bei der sehr ähnlich aussehenden LEGENDREschen Dgl liefert der Potenzreihenansatz ∞
y=
∑c x
k
k
eine auf ] − 1,1 [ konvergente Potenzreihe als Lösung, deren Koeffizienten für
k =0
k ∈ N die Rekursionsformel ck + 2 =
k 2 − λ2 ck (k + 1)(k + 2)
erfüllen. Mit frei wählbaren c0 und c1 ergibt sich daraus die allgemeine Lösung, die sich wie oben darstellen lässt als y = c0 ⋅ (gerade Funktion) + c1 ⋅ (ungerade Funktion) . Ist λ eine gerade natürliche Zahl, so wird der erste Lösungsanteil zu einem geraden Polynom vom Grade n; ist λ ungerade, reduziert sich der zweite auf ein ungerades Polynom vom Grade n. Bis auf konstante Normierungsfaktoren sind dies die im Zusammenhang mit der Approximation von Funktionen (siehe Kapitel 14) genauer behandelten TSCHEBYSCHEFF-Polynome T0 ( x) = 1, T1 ( x) = x, T2 ( x) = −
1 3 + x 2 , T3 ( x) = − x + x 3 , L . 2 4
Bisher wurde vorausgesetzt, dass der Entwicklungspunkt x0 der Potenzreihe regulär ist, das heißt, dass an ( x0 ) ≠ 0 ist. Fällt diese Voraussetzung weg, so führt der Potenzreihenansatz ∞
y=
∑ c (x − x ) k
0
k
im Allgemeinen nicht mehr zum Ziel.
k =0
In der ingenieurmäßigen Anwendung kommt dies nur für lineare Differentialgleichungen zweiter Ordnung vor.
Definition: Für die lineare Dgl 2. Ordnung a2 ( x) y ′′ + a1 ( x) y ′ + a0 ( x) y = r ( x) heißt x0 schwach singulär, wenn a2 ( x0 ) = 0 ist und analytisch bezüglich x0 sind.
a ( x) a1 ( x) ( x − x0 ) und 0 ( x − x0 ) 2 a2 ( x ) a2 ( x )
180
9 Gewöhnliche Differentialgleichungen
Liegt ein singulärer Punkt vor, so führt eine Modifikation des Potenzreihenansatzes zum Ziel, die hier für den anwendungsrelevanten Fall einer homogenen Dgl mit x0 = 0 beschrieben werden soll: Mit dem sogenannten Index s, der im Allgemeinen komplex sein kann, setzt man den Ansatz ∞
y = xs ⋅
∑c x
k
k
in die homogene Dgl ein. Dabei fordert man, dass c0 ≠ 0 ist, da sonst s
k =0
nicht eindeutig bestimmbar wäre. Darüber hinaus kann sogar c0 = 1 verlangt werden, da die Dgl homogen ist. Der Koeffizientenvergleich liefert dann neben einer Rekursionsgleichung für die ck eine quadratische Gleichung zur Bestimmung von s. Für die Lösungen s1 und s2 können verschiedene Fälle eintreten: 1. Fall: s1 = s2 Da die quadratische Gleichung reell ist, kann dies nur dann der Fall sein, wenn s1 reell ist. ∞
Einsetzen in die Rekursionsgleichung ergibt mit c0 = 1 eine Lösung y1 = x s1 ⋅
∑c x
k
der
k
k =0 ∞
Dgl. Eine zweite Lösung erhält man durch den Ansatz
y 2 = y1 ⋅ ln x + x s1 ⋅
∑d x
k
k
;
k =1
da beide Lösungen linear unabhängig sind, erhält man die allgemeine Lösung als Linearkombination daraus. 2. Fall: s1 ≠ s2 und s1 − s2 ∉ z Sind beide reell, so erhält man durch Einsetzen der beiden Indices in die Rekursions∞
gleichung mit c0 = 1 bzw. d0 = 1 die zwei linear unabhängigen Lösungen y1 = x s1 ⋅
∑c x
k
k
k =0 ∞
und y 2 = x s2 ⋅
∑d x k
k
, die zur allgemeinen Lösung linear kombiniert werden.
k =0
Sind s1 und s2 konjugiert komplex zueinander, so sind Re y1 und Im y1 linear unabhängige reelle Lösungen der Dgl. 3. Fall: s1 ≠ s2 und s1 − s2 ∈ z ∞
Dazu müssen s1 und s2 reell sein, s1 sei die größere der beiden. Dann ist y1 = x s1 ⋅
∑c x
k
k
k =0 ∞
wie oben eine Lösung der Dgl, die zweite erhält man als y 2 = A ⋅ y1 ⋅ ln x + x s2 ⋅
∑d x k
k
, die
k =0
Konstante A kann ggf. 0 sein. Beide sind linear unabhängig und können zur allgemeinen Lösung linear kombiniert werden.
9.5 Differentialgleichungen zweiter Ordnung
181
Als wichtigste Anwendung für dieses Verfahren gilt die BESSELsche Differentialgleichung x 2 y′′ + xy ′ + ( x 2 − ν 2 ) y = 0 ; die Konstante ν heißt Ordnung der BESSELschen Dgl (nicht zu verwechseln mit der Differentiationsordnung, die 2 ist!). Nicht mit einem Potenzreihenansatz, sondern durch eine geschickte Substitution löst man die EULERsche Differentialgleichung an x n y ( n ) + an−1 x n−1 y ( n−1) + L + a1 xy ′ + a0 y = r ( x) mit ak ∈ R, an ≠ 0 . Für positive x erhält man durch die Substitution x = e t bzw. t = ln x auf ganz R eine Dgl für u (t ) := y (e t ) . Bei der praktischen Berechnung ist die Schreibweise mit dem Differentialoperator D sehr hilfreich, die folgendermaßen für eine differenzierbare Funktion u (t ) defidu D u := niert ist: dt Wegen der Kettenregel ist
d y du dt −t = ⋅ = e{ Du, d x dt d x 1 x
allgemein
xk
D dk y = k! u k dx k
für k = 0, 1,…, n. D
n
Damit erhält man als neue Dgl für u (t ) die lineare Dgl
∑ a k! k u = r (e ) , die konstante t
k
k =0
Koeffizienten hat. Darauf wendet man das in Abschnitt 9.3 beschriebene Lösungsverfahren an und erhält die allgemeine Lösung für u (t ) . y ( x) := u (ln x) ist dann die gesuchte allgemeine Lösung der gegebenen EULERschen Dgl.
9.5
Differentialgleichungen zweiter Ordnung
Die in vielen physikalischen und technischen Anwendungen vorkommenden Differentialgleichungen zweiter Ordnung sind entweder linear oder lassen sich durch eine lineare Differentialgleichung annähern (zum Beispiel die Gleichung des mathematischen Pendels). Die hier dargestellten weiteren Lösungsverfahren beruhen meist auf der Idee, durch Substitution eine Dgl 1. Ordnung zu gewinnen, die sich mit den vorher beschriebenen Verfahren lösen lässt. Oft müssen jedoch die in Kapitel 14 beschriebenen numerischen Verfahren benutzt werden, da eine in geschlossener Form darstellbare Lösung nicht existiert.
182
9 Gewöhnliche Differentialgleichungen
1. Direkt integrierbare Dgl:
y ′′ = ϕ ( x )
Zweimalige Integration nach x liefert
y = ϕ 2 ( x) + C1 x + C2
2. Dgl ohne y:
F ( x, y ′, y ′′) = 0
mit ϕ 2′′( x) = ϕ ( x) .
Die Substitution u := y ′ ergibt die Dgl 1. Ordnung F ( x, u, u ′) = 0 für u. Aus deren allgemeiner Lösung u (x) (mit einer frei wählbaren Konstanten C1) erhält man durch Integration die allgemeine Lösung der gegebenen Dgl y ( x) = u1 ( x) + C2 mit u1′ ( x) = u ( x) .
3. Auf Dgl-en 1. Ordnung reduzierbar: Die Substitution y′ = p , also y′′ = y′′ =
y′′ = ϕ ( y )
dp , ergibt über die Kettenregel eine Dgl für p( y ) : dx
dp dp d y dp = ⋅ =p . d x dy d x dy
Aus der gegebenen Dgl ergibt sich somit eine erste Dgl 1. Ordnung: p
dp = ϕ ( y) dy
Trennung der Variablen (siehe Abschnitt 9.2) ergibt über 1 2
p 2 = Φ ( y ) + C1
∫ pdp = ∫ ϕ ( y)d y
(mit Φ′ = ϕ ).
Daraus ergibt sich wegen p = y′ eine zweite Dgl 1. Ordnung, nämlich dy = ± 2[Φ( y ) + C1 ] , dx die ebenfalls separierbar ist. Deren Lösung lässt sich unter Umständen nicht nach y auflösen, in jedem Falle aber nach x.
4. Dgl ohne x:
y ′′ = ϕ ( y, y′)
Man geht wie bei 3. vor: Durch die Substitution: y′ = p , y′′ = p gebenen Dgl eine Dgl 1. Ordnung für p:
p
dp erhält man aus der gedy
dp = ϕ ( p, y ) dy
Über deren Typ lässt sich im Gegensatz zu 3. im Allgemeinen nichts aussagen. Aus p( y ) erhält man wie bei 3. die gesuchte Lösung der Dgl – ggf. in impliziter Form.
9.6 Lineare Rand- und Eigenwertaufgaben
9.6
183
Lineare Rand- und Eigenwertaufgaben
Definition: Eine lineare Randwertaufgabe ist eine lineare Differentialgleichung n-ter Ordnung a n ( x) y ( n ) + an −1 ( x) y ( n −1) + ... + a1 ( x) y ′ + a0 ( x) y = r ( x) zusammen mit n sogenannten Randbedingungen. Das sind Gleichungen der Form n −1
∑ (α
ik
y ( k ) ( x0 ) + β ik y ( k ) ( x1 )) = γ i
(für i = 1, ..., n),
k =0
die für zwei gegebene feste Stellen x0 und x1 erfüllt sein müssen. Dabei sind die α ik , β ik und γ i gegebene reelle Zahlen. Häufig werden die lineare Dgl in der Form L{ y} = r ( x) und die linearen Randbedingungen als Ri { y} = γ i (für i = 1, ..., n) notiert. Die Randwertaufgabe heißt homogen, falls die Dgl und die Randbedingungen homogen sind, d.h., wenn r(x) ≡ 0 und γ1 = γ2 = ... = γn = 0 gilt; ansonsten heißt sie inhomogen. Bei der Lösung einer linearen Randwertaufgabe geht man ähnlich vor wie bei der Lösung von Anfangswertaufgaben: 1. Schritt: Man bestimmt mit den in den Abschnitten 9.3 und 9.4 beschriebenen Verfahren die allgemeine Lösung der (LDn). Diese hat (vgl. Abschnitt 9.1) die Gestalt y = yh + y p = C1 y1 + L + Cn yn + y p . Dabei sind die yi n linear unabhängige Lösungen (Basislösungen) der homogenen Dgl und yp eine spezielle Lösung der inhomogenen Dgl, die Ci sind frei wählbare Parameter. 2. Schritt: Durch Einsetzen obiger allgemeiner Lösung in die n linearen Randbedingungen ergibt sich ein (n, n) -LGS zur Bestimmung der Ci: C1Ri{y1} + C2Ri{y2} + ... + Cn Ri{yn} = γi – Ri{yp}
(für i = 1, ..., n)
3. Schritt: Über die Lösbarkeit dieses LGS gibt folgende Determinante D Auskunft: R1{ y1} R1{ y2 } R { y } R2 { y2 } D = det (Ri { yk }) = 2 1 . . Rn { y1} Rn { y 2 }
. R1{ yn } . R2 { y n } . . . Rn { yn }
Ist D ≠ 0 , so ist das inhomogene lineare Randwertproblem eindeutig lösbar; ist D = 0, so ist die Randwertaufgabe unlösbar oder mehrdeutig, aber nie eindeutig lösbar.
184
9 Gewöhnliche Differentialgleichungen
Definition: Eine lineare Eigenwertaufgabe ist eine lineare homogene Randwertaufgabe, bei der ein Parameter λ in der Dgl und/oder in den Randbedingungen vorkommt und die Lösbarkeit der Randwertaufgabe von den Werten dieses Parameters abhängt. Alle λ-Werte des Parameters, für die die homogene Randwertaufgabe nichttriviale Lösungen besitzt, heißen Eigenwerte der Dgl und die zugehörigen nichttrivialen Lösungen der Dgl Eigenlösungen oder Eigenfunktionen. Man beachte bei der Lösung einer linearen Eigenwertaufgabe, dass die Dgl und die Randbedingungen homogen sind, die triviale Lösung also stets die lineare Randwertaufgabe löst, man ist also nur an weiteren (von λ abhängigen) Lösungen interessiert: 1. Schritt: Man bestimmt mit den in den Abschnitten 9.3 und 9.4 beschriebenen Verfahren die allgemeine Lösung y = C1 y1 + L + Cn y n der homogenen (LDn) L{ y} + λ y = 0 . Dabei sind yi die n linear unabhängigen Lösungen (Basislösungen) der homogenen Dgl und die Ci sind frei wählbare Parameter. 2. Schritt: Durch Einsetzen obiger homogener Lösung in die n linearen Randbedingungen Ri{y} = 0 ergibt sich ein homogenes (n, n) -LGS zur Bestimmung der Ci, welches noch den Parameter λ enthält. C1Ri{y1} + C2Ri{y2} + ... + Cn Ri{yn} = 0
(für i = 1, ..., n)
3. Schritt: Man bestimme alle λ, für die die Determinante der Koeffizientenmatrix, also R1{ y1} R1{ y 2 } R { y } R2 { y2 } det (Ri { y k }) = 2 1 . . Rn { y1} Rn { y2 }
. R1{ yn } . R2 { yn } =0 . . . Rn { yn }
ist. Dies sind die gesuchten Eigenwerte. Gibt es keine Eigenwerte, so hat die Randwertaufgabe nur die triviale Lösung. 4. Schritt: Einsetzen der Eigenwerte, Berechnen der zugehörigen Ci sowie daraus der Lösungen ergibt die gesuchten Eigenlösungen.
9.7 Differentialgleichungssysteme erster Ordnung
9.7
185
Differentialgleichungssysteme erster Ordnung
Definition: Ein System von n Dgl-en 1. Ordnung der Gestalt yi′ = f i ( x, y1 , y2 ,..., yn ) (für i = 1, L , n ) für n gesuchte Funktionen y1 , y2 , L , yn heißt ein Differentialgleichungssystem erster Ordnung. Dabei sind die fi Funktionen von n + 1 Veränderlichen. In Vektorschreibweise: y ′ = F( x, y ) y1 f1 ( x, y1 , L , y n ) n +1 n mit y = M und F : r → r egeben durch F ( x, y ) = M . y f ( x, y , L , y ) 1 n n n Sind die Funktionen fi lineare Funktionen in den yi (i = 1, ... , n), so liegt ein System linearer Dgl-en vor: y1′ = a11 ( x) y1 + a12 ( x) y 2 + L + a1n ( x ) y n + r1 ( x ) M M M M M y n′ = an1 ( x) y1 + an 2 ( x) y2 + + ann ( x) yn + rn ( x) Sind alle ri (x) ≡ 0 (i = 1, ... , n), so heißt das Dgl-System homogen, sonst inhomogen.
y ′ = A( x)y + r ( x)
In Matrizenschreibweise: a11 ( x) . mit A( x) = . . an1 ( x)
. . . . .
. . . . .
. a1n ( x) . . . . . . . ann ( x )
und
r1 ( x) . r ( x) = . . . rn ( x)
Ist A(x) = A konstant, so liegt ein Dgl-System mit konstanten Koeffizienten vor. Analog zum Satz von PICARD-LINDELÖF gilt auch für Dgl-Systeme ein
Existenz- und Eindeutigkeitssatz: Gegeben sei das Dgl-System y ′ = F( x, y ) mit den Anfangsbedingungen y1(x0) = y10, y2(x0) = y20, ... , yn(x0) = yn0. Weiter seien die fk(u1, u2, ... , un+1) für k = 1, ... , n, also die Komponenten von F, in einer Umgebung der Stelle (x0, y10, y20, ... , yn0) ∈ Rn+1 stetig und besitzen dort stetige partielle Ableitungen nach uk ( k = 2, ... , n + 1). Dann existiert in einer geeigneten Umgebung des Anfangspunktes x0 genau eine Lösung des Anfangswertproblems.
186
9 Gewöhnliche Differentialgleichungen
Jede Dgl n-ter Ordnung der Gestalt y ( n ) = f ( x, y, y ′, L , y ( n −1) ) für eine gesuchte Funktion y lässt sich in nahe liegender Weise in ein Dgl-System erster Ordnung für n gesuchte Funktionen y1, y2,…, yn umschreiben: Mit der Substitution yk := y ( k −1) für k = 1, ... , n erhält man die Gleichungen y1′ = y 2 y2′ = y3 M ′ y n = f ( x, y1 , y2 , L , yn ) y2 y3 in Vektorschreibweise y ′ = F( x, y ) mit F( x, y ) = . M f ( x, y , y , L , y ) 1 2 n Damit ergibt sich die Fassung des Satzes von PICARD-LINDELÖF, wie in Abschnitt 9.1 dargestellt, als Spezialfall obigen Existenz- und Eindeutigkeitssatzes. Darüber hinaus ist diese Substitution jedoch vor allem wichtig für numerische Anwendungen (siehe Kapitel 14), da alle numerischen Verfahren für die Lösung von Dgl-en erster Ordnung sich ohne weiteres auf Systeme erster Ordnung – und damit auf Dgl-en n-ter Ordnung – übertragen lassen. Auf die Lösung linearer Dgl-Systeme mit konstanten Koeffizienten, also y ′ = A ⋅ y + r (x) , soll im Folgenden näher eingegangen werden: Wie bei linearen Dgl-en addieren sich auch hier die allgemeine Lösung des homogenen Systems und eine spezielle Lösung des inhomgenen Systems zur allgemeinen Lösung des inhomogenen Systems, deshalb:
Allgemeine Lösung eines homogenen Dgl-Systems y ′ = A ⋅ y : 1. Schritt: Man berechne das charakteristische Polynom pA (λ ) = det ( A − λE) und bestimme damit die Eigenwerte λi als dessen Nullstellen (siehe auch Abschnitt 2.5). 2. Schritt: Für einen Eigenwert λ0 gibt es vier verschiedene Möglichkeiten: a) λ0 ist einfache reelle Nullstelle von pA(λ): Dann ist y = c ⋅ e λx Lösung des Dgl-Systems, wobei c Eigenvektor zum Eigenwert λ0 ist.
9.7 Differentialgleichungssysteme erster Ordnung
187
b) λ0 = α + iβ ist einfache komplexe Nullstelle von pA(λ), also auch λ0 : Ist c = c r + ic i Eigenvektor zu λ0, so sind y1 = (c r cos(βx ) − c i sin(β x)) ⋅ eαx und
y 2 = (c i cos(βx ) + c r sin( βx)) ⋅ eαx linear unabhängige Lösungen des Dgl-Systems.
c) λ0 ist m-fache reelle Nullstelle von pA(λ): Hat A - λ0E den Rang n – m, dann gehören zu λ0 m linear unabhängige Eigenvektoren c1 , c 2 , L , c m ; die c k e λ x (k = 1, ... , m) stellen dann m linear unabhängige Lösungen des Dgl-Systems zum Eigenwert λ0 dar. 0
Ist rg (A - λ0E) > n – m, dann existieren weniger linear unabhängige Eigenvektoren als die Vielfachheit m des Eigenwerts λ0. In diesem Fall ergibt sich mit r
p r ( x) =
∑b x
k
k
eine Lösung y = p r ( x )e λ x . Dabei erhält man die Vektoren b k 0
k =0
(k = 1, ... , r) aus (A - λ0E) b r = 0 (A – λ0E) b r −1 = rb r (A – λ0E) b r −2 = (r − 1)b r −1 M (A – λ0E) b 0 = b1 . d) λ0 ist mehrfache komplexe Nullstelle von pA(λ): Die zugehörigen Eigenvektoren c und die Koeffizientenvektoren der Polynome
p r (x) , wie in c) ermittelt, sind nun komplex. Realteile und Imaginärteile von c e λ x 0
und p r ( x)e λ x sind linear unabhängige Lösungen des Dgl-Systems. 0
Zur Lösung inhomogener linearer Dgl-Systeme mit konstanten Koeffizienten – auch höherer als erster Ordnung – ist es hilfreich, den in Abschnnitt 9.4 eingeführten Differentialoperator du D u := zu benutzen. Ein System aus n Gleichungen für n gesuchte Funktionen lässt sich dx dann schreiben als P11 ( D) y1 + P12 ( D ) y 2 + ... + P1n ( D) y n = r1 ( x) P21 ( D) y1 + P22 ( D) y2 + ... + P2 n ( D) yn = r2 ( x) M Pn1 ( D) y1 + Pn 2 ( D) y2 + ... + Pnn ( D ) yn = rn ( x) .
188
9 Gewöhnliche Differentialgleichungen
Dabei sind die Pik Polynome – im Allgemeinen – unterschiedlicher Grade, deren Koeffizienten sich aus denjenigen des Dgl-Systems ergeben. Durch algebraische Umformungen, die ähnlich durchzuführen sind wie bei der Lösung linearer Gleichungssysteme (siehe Abschnitt 2.3), und durch Differentiationen entsteht eine „Dreiecksmatrix“ Q11 ( D) y1 = f1 ( x) Q21 ( D) y1 + Q22 ( D ) y2 = f 2 ( x) M Qn1 ( D) y1 + Qn 2 ( D ) y 2 + ... + Qnn ( D ) y n = f n ( x) mit Polynomen Qik. Die erste Gleichung ist eine lineare Dgl mit konstanten Koeffizienten für eine gesuchte Funktion y1, die gemäß Abschnitt 9.3 gelöst wird. Die gewonnene Lösung wird in die zweite Gleichung eingesetzt; aus dieser wird sodann y2 bestimmt usw. Ist die Anzahl der gesuchten Funktionen yi relativ klein, so erhält man aus dem quadratischen System
P11 ( D) L P1n ( D) y1 r1 ( x) M ⋅ M = M M P ( D) L P ( D) y r ( x ) nn n1 n n mittels der CRAMERschen Regel (siehe Abschnitt 2.3) mit vernünftigem Aufwand die Lösung des Dgl-Systems, etwa für n = 2:
P11 ( D ) P12 ( D) y1 r1 ( x) ⋅ = P21 ( D ) P22 ( D) y 2 r2 ( x)
Aus
ergeben sich die Einzelgleichungen
( P11 ( D ) P22 ( D ) − P12 ( D) P21 ( D)) y1 = P22 ( D )r1 ( x) − P12 ( D )r2 ( x) und
( P11 ( D ) P22 ( D ) − P12 ( D) P21 ( D)) y 2 = P11 ( D )r2 ( x) − P21 ( D )r1 ( x) ,
die beide mit den Methoden aus Abschnitt 9.3 gelöst werden können.
10
Partielle Differentialgleichungen
Im Gegensatz zu gewöhnlichen Differentialgleichungen spielt für partielle Differentialgleichungen eine „allgemeinen Lösung“, die durch Einsetzen von Rand- oder Anfangsbedingungen zu einer „partikulären Lösung“ des gegebenen Problems wird, keine Rolle. Dies liegt vor allem daran, dass man eine solche „allgemeine Lösung“ nur in einigen wenigen meist nicht relevanten Fällen überhaupt ermitteln kann (siehe Abschnitt 10.2). Und selbst dann lässt sich diese nicht wie bei gewöhnlichen Differentialgleichungen („mit beliebigen Konstanten Ci ∈ R“) klar beschreiben, sondern enthält Ausdrücke wie „mit beliebigen n-mal differenzierbaren Funktionen“, was zeigt, dass eine solche Lösungsmannigfaltigkeit letztlich nicht überschaubar ist. Meist lassen sich durch „gezieltes Raten“ Lösungen der oft recht einfachen „reinen“ Differentialgleichungen ermitteln, das Problem besteht darin, dass gleichzeitig Anfangs- und/oder Randbedingungen erfüllt sein müssen. Ist die Eindeutigkeit der Lösung eines vorgelegten Problems – meist mit Mitteln der Funktionalanalysis – bewiesen, so kann die Lösung oft nur numerisch ermittelt werden. Deshalb soll in diesem Kapitel nur in die Problematik der partiellen Differentialgleichungen eingeführt werden. Es sollen hier Lösungsansätze und Klassifizierungen vorgestellt werden, mit deren Hilfe man einige Lösungen der Differentialgleichung erhalten kann, ohne dabei auf die Erfüllung etwaiger Nebenbedingungen zu achten.
10.1
Grundlegende Begriffe
Definiton: Eine partielle Differentialgleichung (PDgl) ist eine Gleichung, die eine unbekannte Funktion u von mehreren Veränderlichen und gewisse partielle Ableitungen dieser Funktion mit den Veränderlichen zu einer Beziehung verknüpft. Unter der Ordnung der PDgl versteht man die Ordnung der höchsten partiellen Ableitung, die in dieser Beziehung vorkommt. Die meisten in Physik und Technik vorkommenden partiellen Differentialgleichungen sind erster oder zweiter Ordnung; deshalb wird hier nur auf solche eingegangen. Darüber hinaus hängen die gesuchten Funktionen meist von den Ortskoordinaten und/oder der Zeit ab; durch die entsprechenden Bezeichnungen x, y, z und t wird dem Rechnung getragen, auch wenn bei der Behandlung zwischen Orts- und Zeitkoordinaten kein prinzipieller Unterschied besteht.
https://doi.org/10.1515/9783110537161-199
190
10 Partielle Differentialgleichungen
Die gesuchte Funktion wird – unabhängig von ihrer technischen Bedeutung – stets mit u bezeichnet. In Analogie zu gewöhnlichen Differentialgleichungen, wo die Ordnung die Anzahl der frei wählbaren Konstanten in der allgemeinen Lösung angibt, müsste eine allgemeine Lösung einer PDgl eine entsprechende Anzahl beliebig wählbarer differenzierbarer Funktionen enthalten. Das dies praktisch keine Rolle spielt, liegt auf der Hand. In der Praxis wird aus einer die PDgl erfüllenden allgemeineren Lösungsmannigfaltigkeit eine solche Lösung ausgewählt, die zusätzlich gewisse Nebenbedingungen erfüllt. Wie bei gewöhnlichen Differentialgleichungen können dies Anfangs- oder Randbedingungen sein; es gibt somit bei partiellen Differentialgleichungen reine Anfangs- oder Randwertaufgaben, aber auch gemischte Anfangs-Randwertaufgaben.
Definition: Eine PDgl heißt linear, wenn die gesuchte Funktion u und alle ihre Ableitungen in einem linearen Zusammenhang auftreten, bei dem die Koeffizienten der Linearitätsbeziehung Funktionen der unabhängigen Veränderlichen sein können. Eine PDgl heißt quasilinear, wenn sie in den höchsten Ableitungen von u linear ist. Einige Beispiele partieller Differentialgleichungen in Physik und Technik sind:
Wellengleichung:
utt = a 2 (u xx + u yy + u zz )
für u (t , x, y, z )
Telegraphengleichung:
utt + aut + bu = c 2u xx
für u (t , x)
Wärmeleitungsgleichung:
ut = k (u xx + u yy + u zz )
für u (t , x, y, z ) mit k > 0
Potentialgleichung:
u xx + u yy + u zz = 0
für u ( x, y, z )
Alle genannten Differentialgleichungen sind von zweiter Ordnung und linear.
10.2
Partielle Differentialgleichungen erster Ordnung
Eine PDgl erster Ordnung für eine Funktion u von zwei Veränderlichen x, y hat die Gestalt F(x, y, u, ux, uy) = 0. Bestimmte einfache Typen lassen sich auf die Lösung gewöhnlicher Differentialgleichungen (siehe Kapitel 9) zurückführen:
1. Kommt in der Differentialgleichung nur die Ableitung nach einer der beiden Veränderlichen vor, zum Beispiel nur ux, so kann die PDgl als gewöhnliche Differentialgleichung aufgefasst und mit den in Kapitel 9 behandelten Methoden gelöst werden. Die in der allgemei-
10.2 Partielle Differentialgleichungen erster Ordnung
191
nen Lösung enthaltene frei wählbare Konstante wird durch eine beliebige Funktion ϕ ( y ) ersetzt, man erhält so die allgemeine Lösung der PDgl. Diese Vorgehensweise lässt sich verallgemeinern: Hängt die gesuchte Funktion u von mehr als zwei Veränderlichen ab und kommen in der Differentialgleichung nur die Ableitungen nach einer davon vor, so bestimmt man die allgemeine Lösung der entstehenden gewöhnlichen Differentialgleichung; die darin vorkommenden Konstanten werden durch beliebige Funktionen, die nur von den anderen Veränderlichen abhängen, ersetzt, um die allgemeine Lösung zu erhalten.
2. Mit der Separationsmethode (Trennung der Veränderlichen) lassen sich ggf. Lösungen der Gestalt u ( x, y ) = v( x) ⋅ w( y ) ermitteln (die PDgl kann aber darüber hinaus weitere Lösungen haben, die sich nicht mit getrennten Veränderlichen darstellen lassen). Ist es nach Einsetzen dieses Ansatzes in die PDgl möglich, die Ausdrücke mit x auf der einen und die mit y auf der anderen Seite der Gleichung zusammenzufassen, so müssen beide Seiten der Gleichung konstant von einem Wert K sein. Es entstehen dadurch zwei gewöhnliche Differentialgleichungen für v(x) und w( y ) , die gemäß Kapitel 9 gelöst werden. Die Separationsmethode soll am Beispiel xu x − yu y = 0 demonstriert werden: Der Ansatz u ( x, y ) = v( x) ⋅ w( y ) liefert wegen u x = v′( x) ⋅ w( y ) und u y = v( x) ⋅ w′( y ) die beiden gewöhnlichen Differentialgleichungen x ⋅ v′( x) =K v( x)
und
y ⋅ w′( y ) =K, w( y )
v( x) = C1 x K
und
w( y ) = C2 y K
deren Lösungen
die partikuläre Lösung u ( x, y ) = C ⋅ ( xy ) K ergeben. Besonders häufig kommen lineare Differentialgleichungen vor. Für eine von n Veränderlichen x1 , L , xn abhängige gesuchte Funktion u ( x1 , L , xn ) = u (x) hat eine lineare PDgl erster Ordnung die Gestalt a1 (x)u x1 + a2 (x)u x2 + K + an (x)u xn + c(x)u + d (x) = 0 . Ist d (x) ≡ 0 , so heißt die PDgl homogen, ansonsten inhomogen. Wie bei gewöhnlichen linearen Differentialgleichungen erhält man auch bei partiellen aus einer Lösung einer inhomogenen Dgl und beliebigen Linearkombinationen von Lösungen der homogenen Dgl durch Summenbildung weitere Lösungen der inhomogenen Gleichung. Ist in einer homogenen PDgl 1. Ordnung zusätzlich c(x) = 0, so gilt darüber hinaus:
1. Für eine beliebige differenzierbare Funktion Φ(τ ) ist mit einer Lösung u auch u~ = Φ(u ) Lösung der PDgl.
192
10 Partielle Differentialgleichungen
2. Sind u1, …, un Lösungen der PDgl, so ist für eine beliebige differenzierbare Funktion Ψ (τ 1 ,L ,τ n ) auch u~ = Ψ (u1 , L , u n ) eine Lösung der PDgl. Auch mit dem Superpositionsprinzip, das genauso für lineare PDgl beliebiger Ordnung gilt, lassen sich aus bekannten Lösungen weitere konstruieren: Sind u1 und u2 Lösungen der gleichen linearen PDgl mit den Inhomogenitäten d1 bzw. d2, so ist für beliebige α1, α2 ∈ R durch u = α1u1 + α 2u 2 eine Lösung der PDgl für die Inhomogenität d = α1d1 + α 2 d 2 gegeben. Mit der sogenannten Charakteristiken-Methode lassen sich Lösungen einer quasilinearen (und damit auch einer linearen) PDgl erster Ordnung ermitteln. Eine quasilineare PDgl 1. Ordnung für eine gesuchte Funktion u von drei Veränderlichen ( x, y, z ) = x lässt sich in der Gestalt a(x, u )u x + b(x, u )u y + c(x, u )u z = d (x, u ) schreiben (für eine andere Variablenzahl analog). Die angesprochene Lösung gewinnt man in folgenden Schritten:
1. Aus den Proportionen d x : d y : d z : du = a (x, u ) : b(x, u ) : c(x, u ) : d (x, u ) gewinne man ein möglichst einfaches System gewöhnlicher Differentialgleichungen, das charakteristische Dgl-System, etwa d y b(x, u ) = , d x a ( x, u )
d z c ( x, u ) = , d x a ( x, u )
Man kann auch entsprechend Dgl-Systeme mit
d u d ( x, u ) = für a ≠ 0 d x a ( x, u )
d d d , oder bilden, wenn b ≠ 0 bzw. d y dz du
c ≠ 0 bzw. d ≠ 0 ist.
2. Mit den Methoden aus Abschnitt 9.7 ermittle man die allgemeine Lösung des sogenannten charakteristischen Systems in Abhängigkeit von x (oder analog von den anderen Veränderlichen): y = ψ 1 ( x, c1 , c2 , c3 ) , z = ψ 2 ( x, c1 , c2 , c3 ) und u = ψ 3 ( x, c1 , c2 , c3 ) ; die ci bezeichnen dabei die Integrationskonstanten. Durch Auflösen nach diesen erhält man die Charakteristiken: c1 = ϕ1 ( x, y, z , u ) , c2 = ϕ 2 ( x, y, z , u ) , c3 = ϕ 3 ( x, y, z , u )
3. Sind Φ1 (τ 1 ,τ 2 ), Φ 2 (τ 1 ,τ 2 ), Φ 3 (τ 1 ,τ 2 ) und Φ 4 (τ 1 ,τ 2 ,τ 3 ) beliebig wählbare stetig differenzierbare Funktionen in den τi (i = 1, 2, 3), so erhält man Lösungen der quasilinearen Dgl in impliziter Form durch
10.2 Partielle Differentialgleichungen erster Ordnung
193
ϕ1 ( x, y, z, u ) = Φ1 (ϕ 2 ( x, y, z, u ), ϕ 3 ( x, y, z, u )) oder ϕ 2 ( x, y, z, u ) = Φ 2 (ϕ1 ( x, y, z, u ), ϕ 3 ( x, y, z , u )) oder ϕ 3 ( x, y, z, u ) = Φ 3 (ϕ1 ( x, y , z, u ), ϕ 2 ( x, y, z, u )) oder Φ 4 (ϕ1 ( x, y, z , u ), ϕ 2 ( x, y, z , u ), ϕ 3 ( x, y, z , u )) = 0 . Das Vorgehen soll an der inhomogenen linearen PDgl 1. Ordnung für zwei Veränderliche xu x + u y = x + y − u 1 424 3 d ( x ,u )
demonstriert werden:
1. Aus den Proportionen d x : d y : d u = x : 1 : ( x + y − u ) erhält man die gewöhnlichen Dgl-en dy 1 = dx x
du x + y − u = . dx x
und
2. Aus deren sukzessive ermittelten Lösungen y=
1 ln x 2 + c1 2
und
u=
c2 x 1 + + ln x 2 − 1 + c1 x 2 2
erhält man durch Auflösen die Charakteristiken c1 = y −
1 x2 ln x 2 =: ϕ1 ( x, y , u ) und c2 = ux − + x − xy =: ϕ 2 ( x, y, u ) . 2 2
3. Mit einer beliebigen Funktion Φ (τ ) erhält man daraus über ϕ 2 = Φ (ϕ1 ) eine implizite Lösung für u ( x, y ) , die sich nach u zu einer Lösung der PDgl auflösen lässt: u=
1 x Φ( y − 12 ln x 2 ) + − 1 + y x 2
Aus einer solchen Lösungsschar einer PDgl lässt sich ggf. durch Einsetzen einer Nebenbedingung die beliebige Funktion Φ bestimmen, ähnlich wie es beim Einsetzen von Anfangs- oder Randbedingungen bei gewöhnlichen Differentialgleichungen der Fall ist. Dies soll hier am Beispiel der CAUCHYschen Anfangswertaufgabe vorgeführt werden: Für die quasilineare PDgl 1. Ordnung für die gesuchte Funktion u ( x, y ) a( x, y, u )u x + b( x, y, u )u y = d ( x, y, u ) bedeutet dies, dass eine solche Lösungsfläche u = u(x,y) zu ermitteln ist, die eine gegebene Raumkurve
d(τ ) = ( x(τ ), y (τ ), u (τ )), τ ∈ I enthält.
194
10 Partielle Differentialgleichungen
Dabei setzt man in die Charakteristiken ϕ1 ( x, y, u ) = c1 und ϕ 2 ( x, y, u ) = c2 aus der allgemeinen Lösung d(τ) ein und erhält so c1 (τ ) = ϕ1 ( x(τ ), y (τ ), u (τ )) und c2 (τ ) = ϕ 2 ( x(τ ), y (τ ), u (τ )) . Aus ϕ1 ( x, y , u ) = c1 (τ ) und ϕ 2 ( x, y, u ) = c2 (τ ) eliminiert man τ und erhält so die Lösung der PDgl, die die Raumkurve d(τ) enthält, in impliziter Form.
10.3
Lineare und quasilineare partielle Differentialgleichungen zweiter Ordnung
Für Funktionen u(x, y) von zwei Veränderlichen ist Auxx + B1uxy + B2uyx + Cuyy + Dux + Euy + Fu = G die allgemeine Form einer linearen PDgl 2. Ordnung; dabei sind A, B1,…, G Funktionen von x und y. Ist uxy = uyx (Satz von SCHWARZ), ergibt sich daraus mit 2B = B1 + B2 Auxx + 2Buxy + Cuyy + Dux + Euy + Fu = G als allgemeine Form. Quasilineare PDgl 2. Ordnung lassen sich am einfachsten schreiben als Auxx + 2Buxy + Cuyy = G, wobei nun A, B, C und G von x, y, ux, uy und u abhängen können. Ein häufig in der Technik vorkommender Spezialfall hiervon sind fastlineare PDgl, bei denen die Funktionen A, B und C nur von x und y abhängen dürfen.
Definition: Die Funktion d(x, y) = (AC – B2) (x, y) heißt Diskriminante der fastlinearen PDgl A(x, y)uxx + 2B(x, y)uxy + C(x, y)uyy = G(x, y, ux, uy, u). Man kann zeigen, dass das Vorzeichen von d invariant gegenüber Variablentransformationen ( x, y ) a (ξ ,η ) des R2 ist, es dient also zur
Klassifikation fastlinearer partieller Differentialgleichungen zweiter Ordnung In Anlehnung an entsprechende Bezeichnungen bei Kegelschnitten erhält man die
10.3 Lineare und quasilineare partielle Differentialgleichungen zweiter Ordnung
195
Definition: Es sei d(x, y) die Diskriminante einer fastlinearen PDgl. Diese heißt hyperbolisch,
wenn
d < 0,
parabolisch,
wenn
d = 0,
elliptisch,
wenn
d>0
2
auf einem Gebiet des R ist. Demnach ist für u (t , x) die Wellengleichung eine hyperbolische, die Wärmeleitungsgleichung eine parabolische und für u ( x, y ) die Potentialgleichung eine elliptische Differentialgleichung. Die einzelnen Typen lassen sich durch Variablentransformationen ( x, y ) a (ξ ,η ) des R² auf einfach zu lösende Formen, sogenannte kanonische Formen, transformieren, und zwar im hyperbolischen Fall:
vξη + F (ξ ,η , v, vξ , vη ) = 0 bzw. vξξ − vηη + F (ξ ,η , v, vξ , vη ) = 0 ,
im parabolischen Fall:
vηη + F (ξ ,η , v, vξ , vη ) = 0 ,
im elliptischen Fall:
vξξ + vηη + F (ξ ,η , v, vξ , vη ) = 0 .
Wegen der Vielfalt der möglichen Formen partieller Differentialgleichungen zweiter Ordnung gibt es keine durchgängige Theorie zur Lösung; es können deshalb hier nur einige nützliche Lösungshinweise gegeben werden.
1. Analog zu Gleichungen erster Ordnung kann in den Fällen, wo in der PDgl nur Ableitungen nach einer Variablen vorkommen, die entsprechende gewöhnliche Dgl gelöst werden; die in der Lösung vorkommenden Integrationskonstanten werden als beliebige Funktionen von der/den anderen Variablen aufgefasst. 2. Für homogene PDgl 2. Ordnung lässt sich wie bei denen erster Ordnung die Separationsmethode anwenden, wenn darin keine gemischte Ableitung vorkommt und zusätzlich die jeweiligen Koeffizientenfunktionen bei den reinen partiellen Ableitungen nur von der entsprechenden Variablen abhängen; der Koeffizient von u darf eine Linearkombination von Funktionen jeweils einer Veränderlichen sein. Der Ansatz u(x,y) = v(x) w(y) führt auf zwei gewöhnliche Differentialgleichungen. Entsprechendes gilt für drei Veränderliche. Offensichtlich sind obige Voraussetzungen im Falle konstanter Koeffizienten erfüllt. Der Separationsansatz kann manchmal jedoch auch dann die Ermittlung einer Lösung ermöglichen, wenn die Voraussetzungen zum Einsatz der Separationsmethode nicht alle erfüllt sind. Die Separationsmethode ist dann nur als Probierverfahren zu verstehen.
196
10 Partielle Differentialgleichungen
3. Hängt die rechte Seite G einer inhomogenen PDgl nur von einer Veränderlichen, zum Beispiel von x, ab, so ergibt sich aus dem Ansatz u p ( x, y ) = v ( x ) eine gewöhnliche Dgl, die eine partikuläre Lösung der inhomogenen PDgl liefert. Bei homogenen linearen PDgl gibt es neben dem Superpositionsprinzip (vgl. Abschnitt 10.2) noch andere Möglichkeiten, aus bekannten Lösungen einer PDgl weitere zu konstruieren:
Satz: (i) Für Lösungen uk einer linearen homogenen PDgl ist jede endliche Linearkombination n
u=
∑c u
k k
auch eine Lösung dieser Gleichung.
k =1 ∞
(ii) Ist die durch gliedweise Differentiation aus
∑c u k
k
gewonnene Reihe gleichmäßig
k =1 ∞
konvergent, so ist auch u =
∑c u k
k
eine Lösung der PDgl.
k =1
(iii) Ist uα(x,y) Lösung einer linearen homogenen PDgl, die neben den unabhängigen Variablen x und y noch von einem kontinuierlichen Parameter α abhängt und ist c(α) eine Funktion, so ist auch α2
∫
u = c(α ) uα ( x, y )dα α1
eine Lösung, falls das Integral existiert. ∞
In der Praxis arbeitet man beim Aufbau einer Lösung durch eine Reihe u =
∑c u
k k
mit
k =1
unbestimmten Koeffizienten ck, die mithilfe der Nebenbedingungen bestimmt werden. Für lineare homogene PDgl mit konstanten Koeffizienten gilt darüber hinaus: Für jede Lösung u(x,y) und beliebige a, b ∈ R ist u~ ( x, y ) = u ( x − a, y − b) auch Lösung der PDgl. Eine lineare PDgl mit konstanten Koeffizienten für eine gesuchte Funktion u(x, y) lässt sich manchmal auch mittels LAPLACE-Transformation (siehe Abschnitt 12.2) lösen: Wird die gegebene PDgl LAPLACE-transformiert bezüglich x, so entsteht für die LAPLACETransformierte U(s, y) eine gewöhnliche Dgl in y. Deren Lösung ergibt durch Rücktransformation die gesuchte Lösung der PDgl.
11
Vektoranalysis
11.1
Kurven und Flächen im Raum
In diesem Abschnitt soll die Beschreibung von Kurven und Flächen im Raum behandelt werden. Dabei werden die in den Abschnitten 6.3 und 6.4 mit anderer Zielsetzung bereits besprochenen Parameterdarstellungen wieder aufgegriffen. Die hier dargestellten Begriffe und Zusammenhänge gelten meist für beliebige n ∈ N+, sind aber in der Anwendung meist nur für n = 3 (bei Kurven auch für n = 2) sinnvoll. Dementsprechend soll n hier verstanden werden.
Definition: (i)
Eine Funktion c: I→ R n (mit I ⊆ R Intervall) heißt Weg oder Kurve im R n. Es ist also c(t ) = (c1 (t ),L , cn (t )) . Die ci(t) heißen Koordinatenfunktionen von c(t).
(ii)
Ein Weg c heißt differenzierbar (bzw. stetig), wenn alle ci differenzierbar (bzw. stetig) sind.
(iii)
Ein stetiger Weg c: [ a, b ]→ R n heißt geschlossen, wenn c(a) = c(b) ist.
(iv)
Der Wertebereich bzw. das Bild c(I) heißt Träger(menge) oder Spur des Weges und wird mit [c] oder manchmal auch nur mit c bezeichnet.
Im Folgenden seien Wege stets als genügend oft differenzierbar vorausgesetzt. Durch komponentenweises Differenzieren erhält man den Tangenten- oder Geschwindigdc keitsvektor eines Weges: := c& (t ) := (c&1 (t ), L , c&n (t )) . dt Die Ableitung nach dem Parameter t, der in vielen Anwendungen tatsächlich die Zeit darstellt, wird meist mit dem Differentiationspunkt statt des Differentiationsstrichs notiert.
Ableitungsregeln: d da db (a + b) = + dt dt dt
d da db (a ⋅ b) = ⋅b + a⋅ dt dt dt
d da db ×b + a× (a × b) = dt dt dt
d dϕ db (ϕ b) = b +ϕ dt dt dt
https://doi.org/10.1515/9783110537161-207
198
11 Vektoranalysis
Aus dem Geschwindigkeitsvektor c& (t ) erhält man:
Definition: (i)
(Bahn-)Geschwindigkeit:
v(t ) = c& (t ) = c&12 (t ) + K + c&n2 (t ) b
b
(ii)
Bogenlänge:
s=
∫
c& (t ) d t =
∫
c&12 (t ) + K + c& n2 ( t ) d t
a
a
(iii)
Tangenteneinheitsvektor:
T(t ) =
1 c& (t ) &c (t )
(iv)
Hauptnormaleneinheitsvektor:
N (t ) =
1 & T(t ) T& (t )
Flächen im R3 können als Graph einer reellwertigen Funktion von zwei reellen Veränderlichen entstehen (vgl. dazu Abschnitt 8.2). Aber genauso, wie es ebene Kurven gibt, die sich nicht als Graph einer Funktion einer reellen Veränderlichen darstellen lassen, lassen sich leicht Flächen F angeben, die nicht gemäß Abschnitt 8.2 beschrieben werden können (zum Beispiel Kugeloberfläche). Bei diesen benutzt man wie bei ebenen Kurven eine sogenannte Parameterdarstellung: Das ist eine stetig differenzierbare Funktion Φ : K → r 3 , wobei der Parameterbereich K ein Gebiet1) des R2 ist. F ist dann Φ(K ) .
Φ1 (u, v) ∂ Φi der ersten partiellen AbleitunIn Φ(u, v) = Φ 2 (u, v) muss die JACOBI-Matrix J = ∂ uk Φ (u, v) 3 gen maximalen Rang, hier also 2, haben, damit degenerierte Fälle ausgeschlossen sind. Hält man den Parameter v = v0 fest, so ist u a Φ(u, v0 ) die Parameterdarstellung einer auf F verlaufenden Kurve, der sogenannten u-Koordinatenlinie (kurz: u-Linie). Ihr Tangentenvektor werde mit Φ u bezeichnet. Analog erhält man Φ v als Tangentenvektor an die vKoordinatenlinie. Wegen des maximalen Rangs der JACOBI-Matrix sind Φ u und Φ v linear unabhängig, sie spannen also die Tangentialebene an F in P = Φ(u0 , v0 ) auf, die also durch
Φ(u0 , v0 ) + λ ⋅ Φ u (u0 , v0 ) + µ ⋅ Φ v (u0 , v0 ) mit λ, µ ∈ R gegeben ist.
1)
Das ist eine offene und zusammenhängende Teilmenge des R2.
11.2 Vektorfelder
199
Aufgrund der linearen Unabhängigkeit von Φ u und Φ v ergibt sich die
Definition: Φ × Φv n ( u 0 , v0 ) = u Φ ×Φ v u P = Φ(u0 , v0 ) .
heißt Normaleneinheitsvektor oder Flächennormale in (u0 , v0 )
u Ist F der Graph einer Funktion f :K→R, so ist durch Φ(u , v) = v eine Parameter f (u , v) darstellung der Fläche gegeben. Die Tangentenvektoren Φ u und Φ v ergeben sich dann zu 1 0 Φ u ( u 0 , v0 ) = 0 und Φ ( u , v ) = 1 , v 0 0 f (u , v ) f (u , v ) u 0 0 v 0 0 der Normaleneinheitsvektor ist
11.2
− f u (u0 , v0 ) − f v ( u 0 , v0 ) . 1 + f u2 (u0 , v0 ) + f v2 (u0 , v0 ) 1 1
Vektorfelder
Definition: Es sei D ⊆ Rn. (i)
Eine Funktion v : D → r n heißt Vektorfeld auf D. Es ist also
v( x1 , L , xn ) = (v1 ( x1 , L , xn ), L , vn ( x1 , L , xn ) ) 1). Die vi heißen Koordinatenfunktionen des Vektorfelds.
1)
(ii)
Ein Vektorfeld v heißt stetig (bzw. differenzierbar), wenn alle vi : D→R stetig (bzw. differenzierbar) sind.
(iii)
In diesem Zusammenhang wird eine Funktion φ : D→R oft Skalarfeld genannt.
Aus rein schreibtechnischen Gründen werden Vektoren hier zeilenweise notiert.
200
11 Vektoranalysis
In der Physik behandelte Kraftfelder (zum Beispiel elektrisches und magnetisches Feld, Gravitationsfeld) oder Geschwindigkeitsfelder (zum Beispiel Strömung) sind Vektorfelder in oben beschriebenem Sinne. Besonders häufig vorkommende Vektorfelder sind: c bzw. 1. v( x, y ) = ⋅ ( x, y ) mit D = R2\{(0,0)} 3 2 2 x + y c ⋅ ( x, y , z ) v ( x, y , z ) = mit D = R3\{(0,0,0)}: 3 2 2 2 x + y + z Bei geeigneter Wahl von c beschreibt v das elektrische Feld einer im Nullpunkt platzierten Punktladung (ebenes bzw. räumliches COULOMB-Feld) oder ein Gravitationsfeld, dessen Zentrum im Ursprung liegt. 2. v( x, y ) =
c (− y , x ) x2 + y2
mit D = R2\{(0,0)}
Bei geeigneter Wahl von c beschreibt v das Magnetfeld eines stromdurchflossenen Leiters, der im Nullpunkt senkrecht auf der (x, y)-Ebene steht. x2 + 1) mit D = {(x, y) ∈ R2 | x ∈ [ − l, l ]} l2 Bei geeigneter Wahl von c beschreibt v das ebene Strömungsfeld einer laminaren Strömung in einem zur y-Achse parallelen Kanal der Breite 2l. 3. v( x, y ) = c ⋅ (0, −
Definition:
Es sei φ : D→R ein differenzierbares Skalarfeld.
∂ϕ ∂ϕ (p ),L , (p) auf D ⊆ Rn ein VektorDann ist durch v := grad ϕ , also v(p) := ∂ xn ∂ x1 feld definiert. Ein solches Vektorfeld heißt Gradienten- oder Potentialfeld; umgekehrt heißt φ Potential oder Stammfunktion des Vektorfelds v. Nicht jedes Vektorfeld ist ein Potentialfeld – andererseits ist diese Eigenschaft besonders interessant im Zusammenhang mit der Berechnung von Kurvenintegralen (siehe Abschnitt 12.4). Zur Beantwortung der Frage, ob ein gegebenes Vektorfeld v ein Potentialfeld ist, dient als Notwendiges Kriterium:
Soll ein gegebenes Vektorfeld v ein Potentialfeld sein, so müssen die sogenannten Integrabilitätsbedingungen gelten, das heißt, es muss ∂ vi ∂ v j = ∂ x j ∂ xi für alle i, j ∈ {1,…, n} sein.
11.2 Vektorfelder
201
Dieses Kriterium ist im Allgemeinen keinesfalls hinreichend – so erfüllt das unter 2. genannte Magnetfeld zwar die Integrabilitätsbedingung, besitzt aber trotzdem kein Potential. Ist allerdings der Definitionsbereich des Vektorfelds offen und einfach zusammenhängend (siehe folgende Definition), so ist obiges Kriterium auch hinreichend. Definition:
Eine wegzusammenhängende Teilmenge D des Rn heißt einfach zusammenhängend, wenn sich jeder in D verlaufende geschlossene Weg stetig auf einen Punkt zusammenziehen lässt. In diesem Sinne ist etwa der ganze Rn, jeder Halbraum, jede Kugel und jede sternförmige Teilmenge des Rn einfach zusammenhängend; das Gleiche gilt auch für Rn\{p}, wenn n ≥ 3 ist. Man beachte jedoch, dass etwa R2\{(0,0)} nicht einfach zusammenhängend ist! Die im Folgenden skizzierte Methode zur Bestimmung eines Potentials ϕ eines gegebenen Vektorfelds v kann auch dazu benutzt werden, die Existenz eines Potentials zu prüfen, denn wenn D nicht einfach zusammenhängend ist, andererseits v aber die Integrabilitätsbedingungen erfüllt, wie es etwa beim ebenen COULOMB-Feld der Fall ist, kann ein Potential existieren, muss aber nicht. Bestimmung eines Potentials ϕ eines gegebenen Vektorfelds v: 1. Da
∂ϕ ∂ x1
= v1 sein soll, bestimme man eine Stammfunktion ϕ~ ( x1 , L , xn ) von v1 bezüg-
lich x1 bei festgehaltenen x2 , L , xn . Damit gilt für das gesuchte ϕ :
ϕ ( x1 , L , xn ) = ϕ~ ( x1 , L , xn ) + g1 ( x2 , L , xn ) ,
(1)
wobei g1 eine beliebige Funktion von x2 , L , xn ist. ∂ϕ ∂ ϕ~ ∂ g1 = v2 sein soll, muss also + = v2 (2) ∂ x2 ∂ x2 ∂ x2 gelten. Aus Gleichung (2) muss x1 eliminiert werden können – ist dies nicht der Fall, so besitzt ϕ kein Potential; das Verfahren wird an dieser Stelle abgebrochen. 2. Da
3. Aus (2) bestimmt man durch Integration bezüglich x2 nun g1 ( x2 , L , xn ) ; diese enthält
(analog zu φ in 1.) eine beliebige Funktion g 2 ( x3 , L , xn ) . 4. Das so erhaltene g1 ( x2 , L , xn ) wird in (1) eingesetzt. Aus
∂ϕ = v3 wird nun analog ∂ x3
zu 2. g 2 ( x3 , L , xn ) ausgenutzt. 5. Man fahre so fort, bis alle beliebigen Funktionen gi in φ bestimmt sind und nur noch eine beliebige Konstante übrig ist.
202
11 Vektoranalysis
Bemerkung: Die Reihenfolge der Veränderlichen kann natürlich beliebig gewählt werden, ∂ϕ = vi genau einmal beman muss nur darauf achten, dass jede Bestimmungsgleichung ∂ xi nutzt wird.
11.3
Divergenz und Rotation
In diesem Abschnitt sei D ⊆ R3, ϕ : D → r ein Skalarfeld, v, w : D → r 3 seien Vektorfelder; es sei c ∈ R und a ∈ R3. Definition:
(i)
Das durch div v :=
∂ v1 ∂ v2 ∂ v3 + + auf D definierte Skalarfeld heißt Divergenz ∂x ∂y ∂z
von v. (ii)
(iii)
∂v ∂v ∂v ∂v ∂v ∂v Das durch rot v := 3 − 2 , 1 − 3 , 2 − 1 auf D definierte Vektor ∂y ∂z ∂z ∂x ∂x ∂y feld heißt Rotation von v. Ist div v = 0, so heißt v quellenfrei; ist rot v = 0, so heißt v wirbelfrei.
In der Physik werden Divergenz und Rotation häufig im sogenannten Nabla-Kalkül notiert:
∂ ∂ ∂ („Pseudovektor“), mit dem Dabei bezeichnet ∇ den Differentialoperator , , ∂x ∂ y ∂z gemäß den üblichen Vektoroperationen aus Kapitel 2 geschrieben werden kann: Divergenz (Skalarprodukt):
div v = ∇ ⋅ v
Rotation (Vektorprodukt):
rot v = ∇ × v
Gradient (skalare Multiplikation):
grad ϕ = ∇ϕ
Rechenregeln:
(i)
div a = 0
(ii)
div (ϕ v) = (grad ϕ ) ⋅ v + ϕ (div v)
(iii) (v)
div (c v) = c (div v)
(iv)
div ( v + w ) = div v + div w
(vi)
rot (ϕ v) = (grad ϕ ) × v + ϕ (rot v)
(vii)
rot a = 0 rot (c v) = c (rot v)
(viii)
rot ( v + w ) = rot v + rot w
(ix)
rot (grad ϕ ) = 0
(x)
div (rot w ) = 0
11.4 Kurvenintegrale
203
Analog zum Potential φ eines Vektorfelds v, für das grad φ = v ist, erhält man: Definition:
Ein Vektorfeld w, dessen Rotation ein gegebenes Vektorfeld v ist, für das also rot w = v ist, heißt Vektorpotential von v; v heißt dann Wirbelfeld. Gemäß obiger Rechenregel (x) ist, falls v ein Vektorpotential besitzt, div v = 0; besitzt v ein Potential φ, so ist rot v = 0.1) Das heißt – anders formuliert: Satz:
(i)
Ist v ein Wirbelfeld, also v = rot w, so ist v quellenfrei, das heißt div v = 0.
(ii)
Ist v ein Potentialfeld, also v = grad φ, so ist v wirbelfrei, das heißt rot v = 0.
Ist D zusätzlich offen und einfach zusammenhängend, so gilt auch die Umkehrung: Jedes quellenfreie Vektorfeld ist ein Wirbelfeld; jedes wirbelfreie Vektorfeld ist ein Potentialfeld. Ist v ein auf einfach zusammenhängendem D definiertes wirbel- und quellenfreies Vektorfeld, so gilt für das dann existierende Potential φ von v: ∆ϕ =
∂ 2ϕ ∂ 2ϕ ∂ 2ϕ + + =0 ∂ x2 ∂ y 2 ∂ z 2
Dabei bezeichnet ∆ den sogenannten LAPLACE-Operator, im Nabla-Kalkül folgendermaßen dargestellt: ∂2 ∂2 ∂2 ∆ := ∇ ⋅ ∇ = div(grad) = + + ∂ x2 ∂ y2 ∂ z2
11.4
Kurvenintegrale
Definition:
Es sei D ⊆ Rn, φ: D→R ein stetiges Skalarfeld, v: D→Rn ein stetiges Vektorfeld, es sei c:[ a, b]→D ein stetig differenzierbarer Weg. Dann definiert man das Kurvenintegral (Wegintegral, Linienintegral) durch
∫ c
b
∫
ϕ d r := ϕ (c(t )) c& (t ) d t
(1. Art)
b
∫
v d r := v(c(t )) ⋅ c& (t ) d t
(2. Art)
a
∫ v d r für ∫ v d r und spricht von einem Ringintegral. c
vgl. auch Abschnitt 8.4
∫ c
a
Ist c geschlossen, so schreibt man
1)
bzw.
c
204
11 Vektoranalysis
Das Kurvenintegral 1. Art kann etwa zur Berechnung der Gesamtmasse längs eines Weges (zum Beispiel eines Drahtes) genommen werden, wenn φ die ortsabhängige Massedichte beschreibt; für ϕ ≡ 1 ergibt sich die Bogenlänge von c. Wichtiger noch sind die Anwendungen des Kurvenintegrals 2. Art: Beschreibt nämlich das Vektorfeld v ein ebenes oder räumliches Kraftfeld, so liefert das Kurvenintegral den Wert der benötigten Arbeit, um längs des Weges von c(a) nach c(b) zu gelangen, bzw. die dabei gewonnene Energie. Gemäß obiger Definition benötigt man zur Berechnung des Kurvenintegrals eine Parameterdarstellung des Weges c. Nun lässt sich ein gegebener „geometrischer“ Weg (genauer gesagt: der Träger [c] des Weges) auf verschiedenste Weise unter Beibehaltung der Durchlaufungsrichtung parametrisieren. Ist nämlich ein Weg c:[ a, b]→D gegeben und ist h:[ e, f ]→ [ a, b] eine differenzierbare Funktion mit h(e) = a und h(f) = b, so stellt d:[ e, f]→D, gegeben durch d(t) := c(h(t)), den „gleichen“ Weg dar, genauer gesagt: [c] = [d] und Anfangs- und Endpunkt sind jeweils gleich. d ist eine sogenannte Umparametrisierung von c. Mit der Substitutionsregel (siehe Abschnitt 5.3) ergibt sich jedoch unmittelbar, dass
∫ vdr = ∫ vdr c
d
ist. Das Kurvenintegral ist also nur vom Träger des Weges und seiner Durchlaufungsrichtung, nicht jedoch von der gewählten Parametrisierung abhängig. Deshalb findet man manchmal auch die Notation
∫ v d r statt ∫ v d r . [c]
c
( Bezeichnet c den sich durch Umkehrung der Durchlaufungsrichtung ergebenden Weg, also ( c(t ) = c(a + b − t ) , so gilt für das Kurvenintegral:
∫ v d r = −∫ v d r ( c
c
Die Änderung der Durchlaufungsrichtung von [c] kehrt also das Vorzeichen um. Ist c ein Weg von p1 nach p2 und d ein Weg von p2 nach p3, so bezeichnet man den zusammengesetzten Weg von p1 nach p3 mit c ⊕ d . Dafür definiert man das Kurvenintegral durch
∫ v d r := ∫ v d r + ∫ v d r . c ⊕d
c
d
Besonders einfach lassen sich Kurvenintegrale für Potentialfelder berechnen. Es gilt nämlich:
11.4 Kurvenintegrale
205
Satz:
Ist v ein Potentialfeld und c ein Weg in D von p nach q, so ist
∫ v d r = ϕ (q) − ϕ (p) . c
Dabei ist φ:D→R ein Potential von v, das heißt, es gilt v = grad φ. Der Wert des Kurvenintegrals hängt bei einem Potentialfeld also nicht vom Verlauf des Weges, sondern nur von seinem Anfangs- und Endpunkt ab. Insbesondere hat es den Wert 0, wenn der Weg geschlossen ist. Im Zusammenhang mit der Wegunabhängigkeit eines Kurvenintegrals erfolgt die Defintion:
Ein Vektorfeld v heißt konservativ, wenn für beliebige p, q ∈ D und alle Wege c von p nach q das Kurvenintegral
∫ v d r den gleichen Wert hat. c
Die Tatsache, dass
∫ v d r vom Wege unabhängig ist, ist offensichtlich äquivalent dazu, dass c
∫ v d r = 0 für jeden geschlossenen in D verlaufenden Weg ist. c
Jedes Potentialfeld ist demgemäß konservativ. Ist zusätzlich D offen und einfach zusammenhängend, so gilt auch die Umkehrung, also zusammen mit Ergebnissen aus Abschnitt 11.2 folgender Satz:
Es sei v ein Vektorfeld, das auf einer offenen und einfach zusammenhängenden Teilmenge des Rn definiert ist. Dann sind folgende vier Aussagen äquivalent: (i)
v ist konservativ.
(ii)
Für jeden geschlossenen Weg c ist
∫ vdr = 0 . c
(iii)
v erfüllt die Integrabilitätsbedingungen
(iv)
v ist ein Potentialfeld, also v = grad φ.
∂ vi ∂ v j für alle i, j ∈ {1,…, n}. = ∂ x j ∂ xi
206
11 Vektoranalysis
11.5
Oberflächenintegrale
Definition:
Mit D ⊆ R³ sei f : D→R ein stetiges Skalar- und v: D→R³ ein stetiges Vektorfeld. Ferner sei F eine in D enthaltene Fläche im R³, die durch eine auf G ⊆ R² definierte Parameterdarstellung Φ(u, v) gegeben ist, also F = Φ(G). Dann definiert man die Oberflächenintegrale über F durch
∫ f dσ = ∫ ( f o Φ) F
bzw.
Φu × Φv d b =
G
∫ v dσ = ∫ (v o Φ) ⋅ (Φ F
∫∫ f (Φ(u, v))
Φ u × Φ v d u d v (1. Art)
G u
× Φv ) d b =
G
∫∫ v(Φ(u, v)) ⋅ (Φ
u
× Φ v ) d u d v (2. Art).
G
Wie die Kurvenintegrale eine Verallgemeinerung der in Kapitel 5 behandelten eindimensionalen darstellen, sind die Oberflächenintegrale eine solche der in Abschnitt 8.6 behandelten Doppelintegrale. Man kann ähnlich wie bei Kurvenintegralen zeigen, dass auch Oberflächenintegrale nicht von der gewählten Parametrisierung der Fläche F abhängen. Mit Oberflächenintegralen 1. Art kann man zum Beispiel die Gesamtmasse der Fläche F berechnen, wenn f die Dichte, bezogen auf eine Flächeneinheit, darstellt; für f ≡ 1 liefert
∫ f dσ
den Flächeninhalt von F.
F
Auch Oberflächenintegrale 2. Art lassen sich physikalisch deuten: Ist v das Geschwindigkeitsfeld einer stationären Strömung, so gibt
∫ v dσ
das Volumen der in einer Zeiteinheit
F
durch die Fläche F hindurch fließenden Flüssigkeitsmenge an. Kurvenintegrale 2. Art sind – wie im vorigen Abschnitt behandelt – orientierte Integrale, das heißt, ihr Vorzeichen hängt von der Wahl der Durchlaufungsrichtung ab. Ähnlich ist es mit Oberflächenintegralen: Vertauscht man nämlich in der Parametrisierung von F lediglich die Rollen von u und v, so bekommt wegen Φ v × Φ u = − (Φ u × Φ v ) das Oberflächenintegral
∫ v dσ
das umgekehrte Vorzeichen. Deshalb wird die Parametrisierung Φ( u, v) üblicherwei-
F
se so gewählt, dass die Flächennormale Φ u × Φ v nach außen zeigt. Es sei darauf hingewiesen, dass nicht jede Fläche im R³ orientierbar ist; das Möbiusband ist ein bekanntes Beispiel einer nicht-orientierbaren Fläche.
11.6 Integralsätze von Gauss, Green und Stokes
11.6
207
Integralsätze von GAUSS, GREEN und STOKES
Im Integralsatz von GAUSS wird ein Zusammenhang zwischen Oberflächenintegralen (siehe Abschnitt 11.5) und den in Abschnitt 8.6 behandelten Dreifachintegralen hergestellt. Er lässt sich am Beispiel einer strömenden Flüssigkeit leicht veranschaulichen: Es ist plausibel, dass die durch die Oberfläche eines räumlichen Gebiets herausströmende Flüssigkeitsmenge gleich derjenigen ist, die die Quellen im Innern hervorbringen – exakt formuliert: Integralsatz von GAUSS:
Es sei D ein Gebiet im R³, V ein in D enthaltener räumlicher Bereich, der durch eine nach außen orientierte Fläche F begrenzt wird, die ebenfalls in D liegt. Ferner sei v: D → R³ ein stetig differenzierbares Vektorfeld. Dann gilt: ∂ v1
∂ v2
∂ v3
∫ v dσ = ∫ div v db = ∫∫∫ ∂ x + ∂ y + ∂ z d x d y d z F
V
V
Aus dem Integralsatz von GAUSS lässt sich durch Reduktion auf die Dimension 2 der Satz von GREEN folgern: Darin wird eine Beziehung zwischen einem Ringintegral und einem Doppelintegral hergestellt. Integralsatz von GREEN:
Es sei D ein einfach zusammenhängendes Gebiet im R², dessen Rand ∂ D ein geschlossener Weg c ist, der so parametrisiert sei, dass sich beim Durchlaufen D stets links befindet. Ist v ein auf einem D = D ∪ ∂ D umfassenden Bereich differenzierbares ebenes Vektorfeld, so gilt: ∂ v2
∂ v1
∫ v dr = ∫∫ ∂ x − ∂ y d x d y c
D
Im Satz von STOKES wird eine Verbindung zwischen einem räumlichen Ringintegral und dem Oberflächenintegral der eingeschlossenen Fläche hergestellt, im Einzelnen: Integralsatz von STOKES:
Es sei D ein Gebiet im R³, das die orientierte Fläche F enthält. Deren Rand ∂ F sei ein geschlossener Weg c, der derart parametrisiert sei, dass für einen in Richtung der Flächennormalen gerichteten Beobachter beim Durchlaufen des Weges die Fläche stets links liegt. Ferner sei v: D → R³ ein stetig differenzierbares Vektorfeld. Dann gilt:
∫ rot v dσ = ∫ v dr F
c
208
11 Vektoranalysis
Reduziert man v auf ein ebenes Vektorfeld, indem die Abhängigkeit von z sowie die dritte Komponente in v weggelassen werden, so wird F zu einem einfach zusammenhängenden Gebiet im R². Der Satz von STOKES ergibt dann wieder die Aussage des Satzes von GREEN, sodass in der Ebene alle drei Integralsätze identisch sind.
12
Integraltransformationen
12.1
FOURIER-Transformation
Dieser Abschnitt knüpft inhaltlich an die komplexe FOURIER-Entwicklung (siehe Abschnitt 7.3) an. Eine P-periodische Funktion f (t), die den DIRICHLET-Bedingungen genügt, lässt sich demnach schreiben als k =∞
f (t ) =
∑
ck e
i
2π kt P
,
k = −∞
wobei die komplexen FOURIER-Koeffizienten (cm ) m∈z sich berechnen lassen als 1 cm = P
P 2
∫
f (t ) ⋅ e
−i
2π mt P
dt .
P − 2
Der P-periodischen Funktion f (t) ist also durch die FOURIER-Entwicklung eindeutig eine Folge (cm ) m∈z komplexer Zahlen, also eine Funktion c: Z → C, das sogenannte Spektrum von f (t), zugeordnet. Da c auf Z definiert ist, heißt das Spektrum diskret. Durch die FOURIER-Analyse wird also einer P-periodischen Originalfunktion f (t), definiert auf R, eine auf Z definierte komplexwertige Spektralfunktion c zugeordnet; durch die FOURIER-Synthese gilt dies auch umgekehrt. 2π 2π k , also ∆ω = ω k +1 − ωk = , so ergibt sich aus den P P beiden ersten Formeln durch Einsetzen:
Setzt man zur Abkürzung ω k =
1 f (t ) = 2π
∆πω − iω k s ∆ω ⋅ f ( s ) ⋅ e d s ⋅ e iω π k = −∞ − ∆ω k =∞
∑
∫
k
t
Dieser Zusammenhang soll nun auf nichtperiodische Funktionen verallgemeinert werden: Dazu lässt man in der letzten Formel P gegen +∞, also ∆ω gegen 0 gehen. Dadurch wird die unendliche Summe zu einem Integral bezüglich ω über ganz R, insgesamt ergibt sich also die FOURIERsche Integraldarstellung der Zeitfunktion f (t):
https://doi.org/10.1515/9783110537161-219
210
12 Integraltransformationen 1 f (t ) = 2π
∞ f ( s ) ⋅ e −iωs d s ⋅ e iω t dω −∞ −∞ ∞
∫ ∫
(FI)
Das innere Integral in (FI) ist eine komplexwertige Funktion F (ω ) mit ω ∈ R: ∞
F (ω ) =
∫ f (t ) ⋅ e
−iωt
d t 1)
−∞
Die sogenannte Spektralfunktion F (ω ) heißt FOURIER-Transformierte der Zeitfunktion f (t), geschrieben F (ω ) = F ( f (t )) . Da F auf R definiert ist, spricht man hier von einem kontinuierlichen Spektrum. Die FOURIER-Transformierte kann gemäß obiger Formel für alle Zeitfunktionen f (t ) defi∞
niert werden, für die
∫ | f (t ) | dt existiert. -∞
Definiert man ∞
a (ω ) =
∫
∞
und
f (t ) ⋅ cos(ω t ) d t
−∞
b (ω ) =
∫ f (t ) ⋅ sin(ω t ) d t , −∞
für reellwertige f (t ) also und
a (ω ) = Re F (ω )
b (ω ) = − Im F (ω ) ,
so erhält man aus (FI) die reelle FOURIERsche Integraldarstellung der Zeitfunktion f (t) als f (t ) =
1
π
∞
∫ (a(ω ) cos(ω t ) + b(ω ) sin(ω t )) dω . 0
Man beachte die formale Analogie zu f (t ) =
a0 + 2
∞
∑ (a
k
cos(k t ) + bk sin( k t )) ,
k =1
der FOURIER-Reihen-Entwicklung einer 2π -periodischen Funktion f (t). Über die Polarkoordinaten-Darstellung von F (ω ) erhält man somit das Amplitudenspektrum A(ω ) sowie das Phasenspektrum ϕ (ω ) als
1)
Manchmal wird bei der Definition der FOURIER-Transformierten auch der Faktor aus F(ω) abgeleiteten Formeln ändern sich entsprechend.
1 2π
hinzugefügt; die weiteren
12.1 Fourier-Transformation
211
A(ω ) := | F (ω ) | = a 2 (ω ) + b 2 (ω )
bzw. ϕ (ω ) := arg( F (ω )) = − arctan
b (ω ) 1) . a (ω )
Für Zeitfunktionen f (t ) und g (t ) , die absolut integrierbar über R sind, deren FOURIERTransformierte F (ω ) bzw. G (ω ) sind und für die die entsprechenden Integrale existieren, gelten folgende Rechenregeln:
(i)
Linearität:
F (α f + β g )(t )) = α F (ω ) + β G (ω )
(ii)
Konjugation:
F ( f (t )) = F (−ω )
(iii)
Ähnlichkeit:
F ( f (α t )) =
(iv)
Zeitverschiebung:
F ( f (t − t0 )) = e − iω t F (ω )
(v)
Frequenzverschiebung:
F (e − iω t f (t )) = F (ω − ω0 )
(vi)
Selbstdualität:
ω F für α ≠ 0 |α | α
1
0
0
∞
∫
∞
f (t )G (t ) dt =
−∞ ∞
(vii)
PARSEVAL-Gleichung:
∫
∫ F (t ) g (t ) dt −∞
f (t ) g (t ) dt =
−∞
1 2π
∞
∫ F (ω )G (ω ) dω −∞
Für auf R stetige Funktionen f (t ) und g (t ) , von denen eine beschränkt und die andere absolut integrierbar ist, hat man – nicht nur in diesem Zusammenhang – folgende Definition:
Die Faltung f ∗ g der beiden Funktionen f und g ist gegeben durch ∞
( f ∗ g )(t ) =
∫ f (t − τ ) g (τ ) dτ . −∞
Unter obigen Voraussetzungen ist f ∗ g stetig und absolut integrierbar auf R. Offenbar gilt f ∗ g = g ∗ f ; ferner liefert eine einfache Rechnung den Faltungssatz:
(F ( f ∗ g ))(ω ) = F (ω ) ⋅ G (ω ) in Worten: Die Faltung im Originalbereich entspricht einer Multiplikation im Bildbereich. 1)
ggf. + Korrekturterm
212
12 Integraltransformationen
Die „Umkehrung“ des Faltungssatzes ist der Multiplikationssatz::
(F ( f ⋅ g ))(ω ) =
1 ( F ∗ G )(ω ) 2π
in Worten: Die Multiplikation im Originalbereich entspricht einer Faltung im Bildbereich dividiert durch 2π. Differentiation und FOURIER-Transformation
1. Ist f zusätzlich differenzierbar und ist f ′ absolut integrierbar über R, so existiert auch die FOURIER-Transformierte von f ′ , und es gilt:
F ( f ′(t )) ω = iωF (ω ) 2. Ist zusätzlich t ⋅ f (t ) absolut integrierbar, so ist die FOURIER-Transformierte F (ω ) nach ω differenzierbar, und es gilt: F ′(ω ) = −F (itf (t )) ω Umkehrung der FOURIER-Transformation
Streng mathematisch gesehen ist die FOURIER-Transformation nicht umkehrbar, denn dazu müsste die Zuordnung f (t ) a F ( f (t )) injektiv sein, verschiedene Zeitfunktionen müssten also auch verschiedene FOURIER-Transformierte haben. Da die FOURIER-Transformation jedoch über ein Integral definiert ist und dessen Wert sich ja nicht ändert, wenn die Integrandenfunktion an abzählbar vielen Stellen geändert wird, können durchaus zwei verschiedene Zeitfunktionen f1 (t ) und f 2 (t ) die gleiche FOURIER-Transformierte F(ω) haben. Darüber hinaus kommt sicher nicht jede auf R definierte komplexwertige Funktion als FOURIER-Transformierte F( ω) infrage. Betrachtet man jedoch hinreichend glatte Zeitfunktionen f (t ) , etwa aus dem sogenannten SCHWARZschen Funktionenraum S(R) = { f ∈ C ∞ | sup | t p f ( q ) (t ) | < ∞ ∀p, q ∈ n} , t∈r
so erhält man aus (FI) die Umkehrformel:
Ist f ∈ S(R) und F (ω ) = F ( f (t )) , so ist f (t ) =
F −1 ( F (ω )) =
1 2π
1 2π
∞
∫ F (ω )e -∞
∞
∫ F (ω )e -∞
itω
dω
it ω
dω , man schreibt also:
12.2 Laplace-Transformation
213
Für viele Anwendungszwecke ist S(R) zu klein; die Umkehrformel liefert also nun für gegebenes F (ω ) nicht unbedingt die gesuchte Zeitfunktion f (t ) ; weiß man jedoch, dass f in t stetig ist, so ist durch obige Formel der Funktionswert eindeutig bestimmt. In der Praxis benutzt man meist Tabellen (siehe Anhang), um unter Benutzung der oben dargestellten Rechenregeln zu einer gegebenen Funktion F (ω ) eine Zeitfunktion f (t ) zu bestimmen, deren FOURIER-Transformierte F (ω ) ist.
12.2
LAPLACE-Transformation
Viele elementare Funktionen f (t ) sind nicht FOURIER-transformierbar, da die für die Existenz des definierenden Integrals wichtige Bedingung der absoluten Integrierbarkeit über R nicht erfüllt ist. So besitzt nicht einmal die sehr einfache Einheitssprungfunktion σ (t), die auch Heaviside-Funktion genannt wird und durch 1 für t ≥ 0 0 für t < 0
σ (t ) =
1)
gegeben ist, eine FOURIER-Transformierte. Die Anwendungsmöglichkeiten der FOURIERTransformation sind dadurch ziemlich eingeschränkt. Deshalb benutzt man für viele Anwendungen die verwandte LAPLACE-Transformation, die auf eine erheblich größere Funktionenklasse anwendbar ist. Dabei wird für Zeitfunktionen f (t ) nun vorausgesetzt, dass f (t ) = 0 für alle t < 0 gilt. Darüber hinaus wird die zu transformierende Zeitfunktion mit einem „Abklingterm“ e −δ t multipliziert und dann die FOURIER-Transformation aus Abschnitt 11.1 angewandt. Man erhält so die Definition:
Für s = δ + iω ∈ c heißt ∞
∞
∫
∫ f (t )⋅ e
0
0
F ( s ) = ( f (t ) e −δ t ) ⋅ e −iω t d t =
−s t
dt
die LAPLACE-Transformierte der Zeitfunktion f (t ) und wird mit L( f (t )) bezeichnet.
1)
Welcher Funktionswert an der Sprungstelle t = 0 vorgeschrieben wird, ist im Zusammenhang mit Integraltransformationen unerheblich.
214
12 Integraltransformationen
FOURIER- und LAPLACE-Transformierte sind gemäß Definition komplexwertige Funktionen, wobei erstere von reellen, die zweite von komplexen Argumenten abhängt. Für Zeitfunktionen f (t ) , die für negative t verschwinden, gilt gemäß Definition: L( f (t )) s = F (e −δ t f (t ))
ω
für s = δ + iω ∈ c
Existenz der LAPLACE-Transformierten:
Für die Zeitfunktion f (t ) gelte: 1. Auf jedem beschränkten Intervall ist f (t ) stückweise stetig. 2. Es gibt M, α ∈ R mit | f (t ) | ≤ M eα t für alle t ≥ 0 . Dann existiert auf {s ∈ C | Re s > α} die LAPLACE-Transformierte F ( s ) = L( f (t )) . Die Klasse der LAPLACE-transformierbaren Funktionen ist also erheblich größer als die der FOURIER-transformierbaren, sie umfasst insbesondere elementare Funktionen wie trigonometrische Funktionen, Polynome, Exponentialfunktionen und andere (siehe Tabelle im Anhang). Rechenregeln:
(i)
Linearität:
L(α f + β g )(t )) = α L( f (t )) + β L( g (t ))
(ii)
Konjugation:
L( f (t )) = L( f (t )) s
(iii)
Ähnlichkeitssatz:
L( f (α t )) s =
_________ s
1
α
L( f (t ))
für α ≠ 0
s
α
(iv)
Verschiebungssatz:
L( f (t − t0 )) = e − s t L( f (t ))
(v)
Dämpfungssatz:
L(e − a t f (t )) = L( f (t )) s + a
(vi)
Ist f (t ) T-periodisch auf R+ und f (t ) = 0 für negative t, so gilt:
für t0 > 0
0
s
1 L( f (t )) = 1 − e − sT
T
∫ f (t ) ⋅ e
−s t
dt
0
Für Zeitfunktionen, die auf r − verschwinden – und nur diese werden LAPLACEtransformiert – vereinfacht sich das Faltungsintegral aus Abschnitt 12.1 zu t
( f ∗ g )(t ) =
∫ f (t − τ ) g (τ ) dτ . 0
12.2 Laplace-Transformation
215
Auch hier gilt, wie bei der FOURIER-Transformation, der Faltungssatz
L(( f ∗ g )(t )) = L( f (t )) ⋅ L( g (t )) . Umkehrung der LAPLACE-Transformation
Hier gelten die bei der FOURIER-Transformation gemachten Ausführungen völlig analog. Die ebenfalls aus (FI) zu gewinnende Umkehrformel lautet nun:
L −1 ( F ( s )) =
1 2π
∞
∫ -∞
F ( s ) e s t dω =
1 2π
∞
∫ F (δ + iω )e
( δ + iω ) t
dω
-∞
In der Praxis ermittelt man zu einer gegebenen Funktion F(s) eine Zeitfunktion f (t ) mit F ( s ) = L ( f (t )) meist dadurch, dass man unter Benutzung obiger Rechenregeln F(s) so umformt, dass man die einzelnen Terme in einer entsprechenden Tabelle (siehe Anhang) findet.
Wenn auch die Ableitung einer Zeitfunktion LAPLACE-transformierbar ist, so gilt für diese:
L( f ′(t )) = s ⋅ L( f (t )) − f (0) Durch vollständige Induktion erhält man daraus – unter der Voraussetzung der Existenz: n −1
L( f ( n ) (t )) = s n ⋅ L( f (t )) −
∑s
n −1− k
f ( k ) (0)
k =0
Durch Benutzung dieser Formel erhält man eine sehr wichtige Anwendung der LAPLACETransformation, die Lösung linearer Differentialgleichungen mit Anfangsbedingungen an der Stelle t = 0: Bildet man die LAPLACE-Transformierte beider Seiten der Differentialgleichung, so ergibt sich durch Einsetzen der Anfangswerte eine algebraische Gleichung für die LAPLACETransformierte F(s) der Lösungsfunktion. Deren Rücktransformierte L −1 ( F ( s)) ist die gesuchte Lösung des Anfangswertproblems. Häufig ist die Rücktransformierte einer gebrochen rationalen Funktion gesucht. Dazu bestimmt man zunächst deren – reelle oder komplexe – Partialbruchzerlegung gemäß Abschnitt 3.2. Die sich dann ergebenden Partialbrüche lassen sich leicht mithilfe der Tabelle im Anhang rücktransformieren.
13
Funktionentheorie
In diesem Kapitel soll ein kurzer Abriss der Theorie der Funktionen einer komplexen Veränderlichen gegeben werden. Komplexe Funktionen sind nicht nur zum Verständnis vieler Bereiche aus Physik und Technik unverzichtbar, sondern sie dienen auch dazu, Zusammenhänge der reellen Analysis besser zu verstehen – manche Resultate im Reellen wären, wenn überhaupt, ohne den „Umweg“ über das Komplexe höchstens mit erheblichem Mehraufwand zu erzielen. Auf die Darstellung topologischer Zusammenhänge wird nur im unbedingt notwendigen Umfang eingegangen. Beispiele komplexer Funktionen, die oft die Fortsetzung entsprechender reeller Funktionen sind (etwa Polynome, trigonometrische Funktionen, Exponentialfunktionen), wurden bereits in Abschnitt 3.6 behandelt. Wie bereits dort praktiziert, soll eine komplexe Variable mit z = x + iy bezeichnet werden.
13.1
Komplexe Differentiation
Definition:
Es sei D eine offene Teilmenge von C, f : D → c und z0 ∈ D gegeben. f ( z ) − f ( z0 ) in C existiert.1) z − z0 Der Grenzwert heißt Ableitung von f und wird mit f ′( z 0 ) bezeichnet.
(i)
f heißt komplex differenzierbar in z0, wenn lim
(ii)
f heißt holomorph (auf D), wenn f für alle z0 ∈ D komplex differenzierbar ist.
(iii)
Ist f holomorph auf ganz C, so heißt f ganz.
z → z0
Die völlig analoge Definition zum reellen Fall hat zur Folge, dass alle elementaren Ableitungsregeln (Summen-, Produkt-, Quotienten- und Kettenregel), die sich unmittelbar aus einer Grenzwertbetrachtung ergeben, für holomorphe Funktionen genauso gelten. Beim Vergleich von komplexer und reeller Differenzierbarkeit, wie sie in den Abschnitten 4.3 bzw. 8.3 definiert wurde, erweist sich, dass die komplexe erheblich „stärker“ ist, es gilt: 1)
Der Grenzwertbegriff ist gemäß Abschnitt 8.1 (mit C = R²) zu definieren.
https://doi.org/10.1515/9783110537161-227
218
13 Funktionentheorie
Satz:
f (z ) ist komplex differenzierbar in z 0 = x0 + iy0 genau dann, wenn die reellen Funktionen u ( x, y ) = Re f ( z ) und v( x, y ) = Im f ( z ) in ( x0 , y0 ) gemäß Abschnitt 8.3 vollständig differenzierbar sind und in ( x0 , y0 ) die CAUCHY-RIEMANNschen Differentialgleichungen ∂u ∂v = ∂x ∂y
und
∂u ∂v =− ∂y ∂x
gelten. Aus dem Beweis dieses Satzes folgt unmittelbar:
bzw.
f ′( z0 ) =
∂u ∂v ∂f ( x0 , y 0 ) + i ( x0 , y0 ) =: ( z0 ) ∂x ∂x ∂x
f ′( z0 ) =
∂v ∂u ∂f ( x0 , y 0 ) − i ( x0 , y0 ) =: −i ( z0 ) ∂y ∂y ∂y
Daraus und aus der Definition der komplexen Differenzierbarkeit ergeben sich für die Ableitungen der in Abschnitt 3.6 aufgeführten elementaren Funktionen die gleichen Ausdrücke wie im Reellen, die in Abschnitt 4.4 zusammengestellten Formeln gelten also auch überall da, wo sie sich sinnvoll auf komplexe Funktionen übertragen lassen. Wegen des Satzes von SCHWARZ erfüllen Real- und Imaginärteil einer holomorphen Funkti∂2w ∂2w on jeweils die Potentialgleichung + = 0 (siehe Abschnitt 10.1); Real- und Imagi∂ x2 ∂ y 2 närteil einer holomorphen Funktion heißen deshalb zueinander konjugierte Potentiale. Ist f auf D holomorph, so gilt dies auch für f ′ ; es gilt damit – im Unterschied zu R – der Satz von GOURSAT:
Jede holomorphe Funktion ist beliebig oft differenzierbar.
13.2
Komplexe Integration
In Analogie zur in Abschnitt 4.6 definierten Differentiation komplexwertiger Funktionen einer reellen Veränderlichen definiert man das Integral einer Funktion h : I → c , I ⊆ R, durch b
∫ a
b
b
∫
∫
a
a
h(t ) d t = (Re h(t )) dt + i (Im h(t )) d t .
Die imaginäre Einheit i wird also wie eine reelle Konstante behandelt.
13.2 Komplexe Integration
219
Zur Integration komplexer Funktionen f (z ) erhält man daraus durch Verallgemeinerung des reellen Kurvenintegrals (siehe Kapitel 11) die Definition:
Ist f : D → c , D ⊆ C, stetig und c : [a, b] → D ein stetig differenzierbarer Weg in D, so heißt
∫ c
b
f ( z ) d z :=
∫ f (c(t )) ⋅ c′(t ) dt a
das (komplexe) Kurven- oder Wegintegral über f längs c. Ist c ein geschlossener Weg, so schreibt man
∫ f ( z) d z c
statt
∫ f ( z) d z . c
Wie im Reellen ist auch hier das Kurvenintegral nicht von der Parametrisierung, sondern nur vom Träger des Weges und der Durchlaufungsrichtung abhängig. Die Frage, wann das komplexe Kurvenintegral wegunabängig ist, das heißt, wann sein Wert nur von Anfangs- und Endpunkt abhängt, beantwortet der folgende Satz:
Ist die komplexe Funktion f (z ) auf einem offenen einfach zusammenhängenden Gebiet D definiert, so sind die folgenden vier Aussagen äquivalent: (i)
f (z ) ist holomorph.
(ii)
∫ f ( z) d z
ist vom Wege unabhängig, das heißt für p, q ∈ D und beliebige in D
c
verlaufende Wege von p nach q ergibt sich für das Kurvenintegral derselbe Wert. (iii) (iv)
Das Kurvenintegral über jeden geschlossenen in D verlaufenden Weg ist 0. f (z ) besitzt in D eine Stammfunktion (bezüglich der komplexen Differentiation).
Ist eine der Aussagen (i) – (iv) erfüllt, so ist für festes z0 und beliebiges q aus D sowie für einen beliebigen Weg c von z0 nach q durch ~ F (q) = f ( z ) d z
∫ c
eine Stammfunktion von f (z ) definiert; das Kurvenintegral längs eines beliebigen Weges von p nach q hat den Wert F (q) − F ( p ) , wobei F (z ) eine beliebige Stammfunktion von f (z ) ist. Die Implikation „(i) ⇒ (iii)“ stellt den Inhalt des CAUCHYschen Integralsatzes dar; die Äquivalenz „(i) ⇔ (ii)“ heißt Satz von MORERA.
220
13.3
13 Funktionentheorie
Die klassischen Sätze der Funktionentheorie
In diesem Abschnitt wird deutlich, dass sich viele wichtige Resultate über holomorphe Funktionen nicht unbedingt auf beliebig oft differenzierbare reelle Funktionen übertragen lassen. Im Folgenden sei f (z ) stets eine auf einer offenen Teilmenge D von C definierte holomorphe Funktion, z0 ∈ D. Maximumsprinzip:
Es sei f (z ) nicht konstant auf der offenen Menge U. Dann nimmt | f ( z ) | in U kein Maximum an; besitzt | f ( z ) | in einem inneren Punkt z0 ein globales Minimum, so ist f ( z 0 ) = 0 . CAUCHYsche Integralformel:
Es sei D zusätzlich einfach zusammenhängend, c ein im positiven Sinne (gegen den Uhrzeigersinn) durchlaufener Weg in D, z0 liege im Innern dieser geschlossenen Kurve. Dann gilt: f (z)
∫ z−z c
d z = 2π i ⋅ f ( z0 )
0
Das heißt, dass die Punkte auf der Kurve c alle Funktionswerte von f im Innern festlegen. CAUCHYsche Integralformel für Ableitungen:
Unter den gleichen Voraussetzungen lässt sich die CAUCHYsche Integralformel verallgemeinern: n!
f ( z)
∫ (z − z ) c
n +1
d z = 2π i ⋅ f ( n ) ( z 0 )
0
Potenzreihenentwicklung:
f (z ) lässt sich um jeden beliebigen Entwicklungspunkt z0 ∈ D in einer Potenzreihe ∞
f ( z) =
∑ c (z − z )
k
0
k
k =0
entwickeln. Dabei ist der Konvergenzradius ρ mindestens so groß wie der Radius des größten Kreises um z0, der noch ganz in D enthalten ist. Es gilt auch die Umkehrung, das heißt insgesamt, dass die Menge aller in Potenzreihen entwickelbarer Funktionen gleich der Menge aller holomorpher Funktionen ist. Das ist der Inhalt des Satzes von WEIERSTRASS. Nach dem Satz von TAYLOR bzw. der CAUCHYschen Integralformel für Ableitungen gilt für die Koeffizienten der Potenzreihe: ck =
f (k ) ( z0 ) 1 f ( z) = dz k! 2π i c ( z − z 0 ) k +1
∫
13.4 Isolierte Singularitäten und Laurent-Reihen
221
Für die Koeffizienten ck gelten die CAUCHYschen Abschätzungsformeln: Ist M das Maximum von | f ( z ) | auf einem in D enthaltenen Kreis um z0 mit Radius r, so ist | ck |=
M . rk
Daraus ergibt sich der bemerkenswerte Satz von LIOUVILLE:
Ist f (z ) auf ganz C definiert und beschränkt, so ist f (z ) konstant. Aus diesem Satz, der kein Analogon in R hat, folgt nun leicht der bereits in Abschnitt 3.6 erwähnte Fundamentalsatz der Algebra:
Jedes nicht-konstante komplexe Polynom besitzt eine Nullstelle.
13.4
Isolierte Singularitäten und LAURENT-Reihen
Definition:
Es seien f : D → c und z0 ∈ C gegeben. (i)
z0 heißt isolierte Singularität von f, wenn z0 ∉ D ist und es eine Umgebung von U von z0 gibt, die ganz in D ∪ {z0} enthalten ist.
(ii)
Die Ordnung von f in z0 ist definiert als ord( f , z 0 ) = sup{n ∈ z | lim
z → z0
(iii)
f ( z) exisitiert in c} ( z − z0 ) n
z0 heißt hebbare Singularität
⇔
ord( f , z 0 ) ≥ 0
z0 heißt Pol(stelle)
⇔
ord( f , z 0 ) < 0
z0 heißt wesentliche Singularität
⇔
ord( f , z0 ) = −∞
Da das Supremum einer Teilmenge von R nur dann −∞ ist, wenn die Menge leer ist, exisf ( z) und damit auch tiert also bei einer wesentlichen Singularität z0 der Grenzwert von ( z − z0 ) n von f ( z )( z − z 0 ) n für kein n ∈ Z. Für holomorphe Funktionen gilt darüber hinaus der Satz von CASORATI-WEIERSTRASS:
Hat die holomorphe Funktion f (z ) in z0 eine wesentliche Singularität, so gibt es zu jedem w ∈ C in einer beliebigen Umgebung U von z0 eine Folge zk mit Werten aus U \{z0} und lim z k = z 0 derart, dass lim f ( z k ) = w ist. k →∞
k →∞
222
13 Funktionentheorie
Der Satz besagt also, dass in jeder noch so kleinen Umgebung einer wesentlichen Singularität die Funktionswerte über die ganze Zahlenebene „verstreut“ liegen. Eine Verschärfung dieses Satzes stammt von PICARD: Höchstens ein w ∈ C wird in jeder noch so kleinen Umgebung von z0 nicht als Wert angenommen.
Isolierte Singularitäten holomorpher Funktionen lassen sich mittels Grenzbetrachtung auch folgendermaßen klassifizieren: 1. In z0 liegt eine hebbare Singularität vor:
Dann existiert lim f ( z ) = a in C; durch die Festsetzung z → z0
f (z) z ∈ D ~ f ( z) = z = z0 a
lässt sich f (z ) zu einer holomorphen Funktion MANNscher Hebbarkeitssatz).
~ f : D ∪ {z 0 } → c fortsetzen (RIE-
2. In z0 liegt eine Polstelle vor:
Dann ist lim f ( z ) = ∞ ; außerdem gibt es ein n ∈ N+ derart, dass lim f ( z )( z − z 0 ) n in C z → z0
z → z0
existiert. Das kleinste n mit dieser Eigenschaft heißt Polstellenordnung Pol( f , z 0 ) . Offensichtlich ist Pol( f , z 0 ) = −ord( f , z 0 ) ; für hebbare Singularitäten wird die Polstellenordnung als 0 definiert. 3. In z0 liegt eine wesentliche Singularität vor:
Dann existiert lim f ( z ) nicht in C ∪ {∞}, das heißt für verschiedene Annäherungen von z z→ z0
an z0 bekommt man ggf. verschiedene Grenzwerte. Definition:
Besitzt die holomorphe Funktion f nur hebbare Singularitäten und Polstellen, so heißt sie meromorph. Besitzt die holomorphe Funktion in z0 eine isolierte Singularität, so lässt sich die Potenzreihenentwicklung durch Hinzunahme von Termen ( z − z 0 ) k mit negativen Exponenten zur sogenannten LAURENT-Entwicklung
∑ c (z − z ) k
k∈z
0
k
verallgemeinern.
13.4 Isolierte Singularitäten und Laurent-Reihen
223
Es gilt der Satz von LAURENT:
Die Funktion f (z ) sei auf einem Ringgebiet D = {z ∈ c | r < | z − z 0 | < R} holomorph (r = 0 und R = ∞ sind möglich). Dann lässt sich f (z ) auf D eindeutig durch eine LAURENT-Reihe
∑c (z − z ) 0
k
k
darstellen. Die Koeffizienten ck erhält man genauso wie die
k∈z
der TAYLOR-Reihe durch ck =
1 f ( z) dz , 2π i c ( z − z 0 ) k +1
∫
wobei c ein gegen den Uhrzeigersinn einmal durchlaufener geschlossener Kreisweg um z0 mit Radius ρ ∈] r , R [ ist. ∞
c −k
∑ (z − z
∞
∑
c k ( z − z 0 ) k Nebenteil der LAURENT-Reihe. k ) k =0 k =1 0 Analog zur TAYLOR-Entwicklung gilt für die LAURENT-Koeffizienten die CAUCHYsche Abschätzung: Dabei heißt
Hauptteil und
Ist c der oben beschriebene Kreisweg und M ∈ R derart gewählt, dass | f ( z ) |≤ M auf dem Kreis gilt, so ist | ck | ≤
M
ρk
.
An den LAURENT-Koeffizienten mit negativem Index lässt sich leicht der Typ der isolierten Singularität in z0 ablesen: 1. Verschwinden alle ck mit negativen Indizes, so liegt eine hebbare Singularität vor; der Hauptteil der LAURENT-Reihe ist 0. 2. Gibt es nur endlich viele nicht verschwindende ck mit negativem Index, so liegt ein Pol vor; das Maximum n ∈ N+ aller Indizes k, für die c−k ≠ 0 ist, gibt die Polstellenordnung an; der Hauptteil der LAURENT-Reihe hat nur endlich viele Summanden. 3. Gibt es unendlich viele nicht verschwindende ck mit negativem Index, so liegt eine wesentliche Singularität vor; der Hauptteil der LAURENT-Reihe hat unendlich viele Summanden.
224
13 Funktionentheorie
13.5
Der Residuenkalkül
Der Residuensatz ist einer der wichtigsten Sätze der Funktionentheorie. Mit diesem Satz werden Integrale über geschlossene Wege berechnet, in deren Inneren endlich viele isolierte Singularitäten der zu integrierenden Funktion liegen, die im Wesentlichen den Integralwert bestimmen. Der Residuenkalkül findet auch Anwendung bei der reellen Integralrechnung. Definition: Ist z0 eine isolierte Singularität der holomorphen Funktion f , so heißt der Ausdruck 1 Re s ( f , z 0 ) := f ( z)d z 2π i K ( z )
∫
r
0
das Residuum von f in z0. Dabei ist Kr(z0) der einmal in mathematisch positiver Richtung durchlaufene Kreisweg um z0 mit einem solchen Radius r, dass im Innern dieses Kreises z0 die einzige isolierte Singularität von f ist. Durch Zurückführen auf die Berechnung solcher Residuen lassen sich kompliziertere Kurvenintegrale einfach berechnen. Es gilt der Residuensatz:
Es sei G eine einfach zusammenhängende Teilmenge von C, f besitze in G endlich viele isolierte Singularitäten z 0 , z1 , L , z n und sei ansonsten holomorph auf G. Dann gilt für jeden einmal in positiver Richtung durchlaufenen geschlossenen Weg in G, der alle Singularitäten von f einschließt:
∫ c
n
f ( z )d z = 2π i
∑ Re s ( f , z ) k
k =0
Zur praktischen Berechnung von Residuen: 1. Unmittelbar mit der Definition lässt sich Re s ( f , z 0 ) in einfachen Fällen berechnen. So 1 erhält man etwa für f ( z ) = , n ∈ N+, mit der CAUCHYschen Integralformel für ( z − z0 ) n Ableitungen: 1 n = 1 Re s ( f , z 0 ) = 0 n ≠ 1
2. Ist
∑c (z − z ) k
0
k
die LAURENT-Reihe von f , so ist Re s ( f , z0 ) = c−1 .
k∈z
3. Hat f in z0 einen einfachen Pol, so ist Re s ( f , z 0 ) = lim [( z − z 0 ) f ( z )] . z → z0
4. Hat f in z0 einen Pol der Ordnung n, so ist Re s ( f , z 0 ) =
1 lim [( z − z 0 ) n f ( z )]( n−1) . (n − 1)! z → z 0
5. Hat f in z0 einen einfachen Pol und ist g in einer Umgebung von z0 holomorph, so ist Re s ( f ⋅ g , z0 ) = g ( z 0 ) Re s ( f , z0 ) .
13.5 Der Residuenkalkül
225
6. Sind g und h holomorph in einer Umgebung von z0 und hat h in z0 eine einfache Nullstelle g g ( z0 ) und ist g ( z 0 ) ≠ 0 , so ist Re s ( , z 0 ) = . h h′( z 0 ) Anwendung auf reelle Integrale 2π
∫ R(cos t , sin t ) dt
1. Integrale vom Typ
mit einer stetigen Funktion R( x, y ) :
0
Die Idee ist, das gegebene reelle Integral als Ergebnis der Auswertung eines komplexen Kurvenintegrals über den geschlossenen Kreisweg c(t ) = e i t aufzufassen. 1 1 1 1 z + und sin t = z − , womit sich das gegebene 2 z 2i z reelle Integral als komplexes Kurvenintegral schreiben lässt:
Aus z = e i t erhält man cos t =
2π
1
1 1
1 1
∫ R(cos t, sin t ) dt = ∫ R 2 z + z , 2i z − z i z d z 0
c
1 zur Kompensation von c′(t ) . iz
Dabei dient der Faktor
Besitzt R keine isolierte Singularität auf dem Einheitskreis, so lässt sich das komplexe Integral mithilfe des Residuensatzes leicht berechnen. 2π
Anwendung dieser Technik liefert zum Beispiel
dt
∫ 1 + ε cos t = 0
2π 1− ε 2
für ∈ ] 0, 1 [.
∞
2. Integrale vom Typ
∫ f (t ) d t
(Konturintegration):
−∞
Die Idee ist, die reelle Funktion f in die komplexe Ebene fortzusetzen und über den geschlossenen Weg c(t ) (siehe Bild 13.5.1) zu integrieren.
Bild 13.5.1: Geschlossener Weg c(t) bei der Konturintegration
226
13 Funktionentheorie
c(t) ist zusammengesetzt aus dem Geradenstück von –r bis r auf der x-Achse und dem oberen Halbkreisbogen mit Radius r. Der Radius ist dabei so groß zu wählen, dass alle Singularitäten von f, die in der oberen Halbebene liegen, von c(t) umschlossen werden. Wenn keine Singularität auf der reellen Achse liegt, lässt sich das Kurvenintegral mit dem Residuensatz berechnen:
∫ f ( z )d z = 2π i ∑ Re s ( f , z ) k
Im z k > 0
c
∫
Andererseits ist
r
f ( z)d z =
c
∫ f (t ) d t + ∫ f ( z ) d z . −r
Hr
r
Für r→∞ ändert sich die linke Seite nicht,
∫ f (t ) dt
geht gegen das gesuchte reelle Integral
−r
und
∫ f ( z)d z
gegen 0, wenn lim z ⋅ f ( z ) = 0 ist. Es gilt also der z →∞
Hr
Satz:
Hat die komplexe Fortsetzung von f nur endlich viele isolierte Singularitäten in der oberen Halbebene und ist ansonsten holomorph auf einem die reelle Achse umfassenden Gebiet und gilt außerdem lim z ⋅ f ( z ) = 0 , so ist z →∞
∞
∫ f (t )dt = 2π i ∑ Re s ( f , z ) . k
Im zk >0
−∞
Die Voraussetzung lim z ⋅ f ( z ) = 0 ist insbesondere dann erfüllt, wenn f eine gebrochen z →∞
rationale Funktion ist, bei der der Nennergrad um mindestens 2 größer ist als der Zählergrad und die in gekürzter Darstellung keine reellen Singularitäten besitzt. 3. FOURIER-Integrale: ∞
Das FOURIER-Integral
∫e
iω t
f (t ) dt (vgl. Abschnitt 12.1) ist aus den beiden reellen Integra-
−∞ ∞
∞
len
∫ −∞
cos ω t f (t ) d t und
∫ sin ω t f (t ) dt
zusammengesetzt; deshalb wendet man die gleiche
−∞
Technik wie in 2. auf e i ω z f ( z ) an. Die Voraussetzung lim z ⋅ f ( z ) = 0 kann nun zu z →∞
„ z ⋅ f (z ) ist beschränkt“ abgeschwächt werden; es ist also ∞
∫e −∞
iω t
f (t ) d t = 2π i
∑ Re s (e Im zk >0
iω z
f ( z ), z k ) .
13.6 Konforme Abbildungen und Möbius-Transformationen
13.6
227
Konforme Abbildungen und MÖBIUS-Transformationen
Eine Funktion einer komplexen Veränderlichen soll hier als Abbildung der reellen Ebene in sich selbst betrachtet werden. Die geometrischen Eigenschaften holomorpher Funktionen sollen dabei untersucht werden. Dazu muss zunächst der Begriff „Unendlich“ präzisiert werden: Während man in R durch Hinzunahme eines größten und eines kleinsten Elements ∞ bzw. −∞ den kompakten Abschluss von R erreichen kann, ist dies wegen der fehlenden Ordnung in C nicht möglich. Zur Konstruktion von ∞ in C bildet man die GAUSSsche Zahlenebene bijektiv auf die Einheitskugeloberfläche S 2 = {( x, y, u ) ∈ r 3 | x 2 + y 2 + u 2 = 1} ohne einen Punkt N („Nordpol“) durch die stereographische Projektion ϕ ab. Dabei wird einem Punkt P ∈ S 2 \{N} derjenige eindeutig bestimmte Punkt ( x, y ) in der die „Äquatorebene“ bildenden GAUSSschen Zahlenebene zugeordnet, der sich als Schnittpunkt mit der Geraden durch P und N ergibt. Auf diese Weise wird jedes z ∈ C „getroffen“; N = {0,0,1} selbst wird mit ∞ identifiziert.
Bild 13.6.1: Stereographische Projektion
Für ( x, y, u ) ∈ S 2 \{N} ist also
ϕ ( x, y , u ) =
1 ( x + iy ) , 1− u
die Umkehrabbildung ϕ −1 ergibt sich zu
ϕ −1 ( x + iy ) =
1 (2 x,2 y, x 2 + y 2 − 1) . x2 + y2 + 1
Zusätzlich ist ϕ (0,0,1) = ∞ zu setzen. Auf diese Weise kann man cˆ := c ∪ {∞} mit S 2 , der sogenannten RIEMANNschen Zahlenkugel, identifizieren. Eine (Kreis-)Umgebung U von ∞ kann man sich nun folgendermaßen vorstellen: Man bilde auf der Kugeloberfläche einen (kleinen) Kreis um den Nordpol und projiziere dessen Inhalt in die GAUSSsche Zahlenebene – das Bild ist der Bereich außerhalb eines Kreises um den Nullpunkt.
228
13 Funktionentheorie
Definition:
ˆ , so heißt f genau dann holomorph auf U, wenn f (z ) für Ist U ⊆ cˆ und ist f : U → c 1 alle z ∈ U , z ≠ ∞, holomorph und f komplex differenzierbar in 0 ist. z
Durch die Zusatzdefinitionen f (0) = ∞ und f (∞) = 0 wird damit f ( z ) =
1 zu einer auf cˆ z
holomorphen Funktion. Konforme und biholomorphe Abbildungen Definition:
(i) Eine lineare Abbildung L : r 2 → r 2 heißt winkeltreu, wenn für alle v, w ∈ r 2 | v | ⋅ | w | ⋅ < L (v), L( w) > = | L(v) | ⋅ | L( w) | ⋅ < v, w > ist; sie heißt orientierungstreu, wenn die Determinante der Abbildungsmatrix positiv ist. (ii) Eine (reell) differenzierbare Funktion f : U → V (U, V ⊆ R²) heißt konform, wenn sie bijektiv ist und für jede Stelle p ∈ U die JACOBI-Matrix eine winkel- und orientierungstreue lineare Abbildung darstellt. (iii) Eine holomorphe Funktion f : U → V heißt biholomorph, wenn sie bijektiv und auch die Umkehrfunktion holomorph ist. Man kann zeigen, dass die Begriffe „konform“ und „biholomorph“ äquivalent sind. Offensichtlich sind die linearen Transformationen f ( z ) = az + b (mit a ≠ 0) und die Exponentialfunktion, beschränkt auf {z ∈ C | −π < Im z < π}, konforme Abbildungen. Ein weiteres wichtiges Beispiel sind Gebrochen lineare Transformationen
Diese Funktionen, die auch MÖBIUS-Transformationen genannt werden, haben die Gestalt f ( z) =
az + b (mit a, b, c, d ∈ C). cz + d
Damit f injektiv ist, muss ad − bc ≠ 0 sein. Für c = 0 ergeben sich die linearen Transformad tionen, für c ≠ 0 hat f in − eine isolierte Singularität. c Die Umkehrfunktion von f ergibt sich zu f −1 ( z ) =
dz − b , − cz + a
13.6 Konforme Abbildungen und Möbius-Transformationen ist also ebenfalls eine MÖBIUS-Transformation, die in
229
a eine isolierte Singularität besetzt. c
a d f lässt sich durch die Zusatzdefinitionen f − = ∞ und f (∞) = zu einer konformen c c Abbildung von cˆ nach cˆ fortsetzen. Die MÖBIUS-Transformationen bilden bezüglich der Komposition von Abbildungen eine Gruppe, die isomorph zu der Gruppe aller komplexen (2,2)-Matrizen mit nicht verschwindender Determinante ist, im Einzelnen: Sind f1 ( z ) =
a1 z + b1 a z + b2 rz + s und f 2 ( z ) = 2 , so ist ( f1 o f 2 )( z ) = mit c1 z + d1 c2 z + d 2 tz + u r s a1 = t u c1
b1 a2 ⋅ d1 c2
b2 . d 2
Jede MÖBIUS-Transformation lässt sich als Komposition aus drei besonders einfachen gebrochen linearen Transformationen als „Grundbausteinen“ darstellen, nämlich aus einer 1 Translation z a z + b , einer Drehstreckung z a az und der Inversion z a , genauer: z a) Für c = 0 liegt wegen az + b a b = z+ d d d eine Drehstreckung mit anschließender Translation vor. b) Für c ≠ 0 lässt sich über bc − ad 1 a az + b ⋅ + = 2 d c cz + d c z+ c d 1 f (z ) zerlegen in die Translation z a z + , gefolgt von der Inversion z a , dann der c z bc − ad a z und schließlich der Translation z a z + . Drehstreckung z a c c2 Eine von der Identität f ( z ) = z verschiedene MÖBIUS-Transformation hat – als Funktion von cˆ nach cˆ – höchstens zwei Fixpunkte, nämlich: a) Für c = 0 und a = d ist ∞ der einzige Fixpunkt; ist a ≠ d, so gilt außerdem für z 0 = die Fixpunktgleichung f ( z 0 ) = z 0 . b) Für c ≠ 0 lässt sich die Fixpunktgleichung in die quadratische Gleichung cz02 + (d − a) z 0 − b = 0
b d −a
230
13 Funktionentheorie
umformen, die höchstens zwei verschiedene Lösungen hat. Deshalb ist jede gebrochen lineare Transformation durch die Angabe der Funktionswerte an drei Stellen, also durch wi = f ( zi ) (mit i = 1, 2, 3), eindeutig bestimmt, denn: Nimmt man an, dass zwei gebrochen lineare Transformationen f und g an den drei Stellen zi die gleichen Funktionswerte wi haben, so hat die MÖBIUS-Transformation g −1 o f die drei Fixpunkte z1, z2 und z3, sie ist also die Identität, es ist also f = g. Eine wichtige geometrische Eigenschaft einer MÖBIUS-Transformation ist, dass sie Geraden und Kreise invariant lässt, das heißt: Geraden und Kreise der GAUSSschen Zahlenebene können als Bilder unter der stereographischen Projektion von Kreisen auf der RIEMANNschen Zahlenkugel aufgefasst werden, wenn man zu einer Geraden den Wert ∞ hinzunimmt; man nennt sie deshalb auch MÖBIUS-Kreise. ˆ →c ˆ eine gebrochen lineare Transformation, so ist das Bild eines MÖBIUSIst nun f : c Kreises wieder ein solcher. 1 z ergibt sich die sogenannte Kreisverwandtschaft, im Einzelnen gilt für das Bild unter f (z ) :
Für die gerade in elektrotechnischen Anwendungen besonders wichtige Funktion f ( z ) =
a) das Bild einer Ursprungsgeraden ist eine Ursprungsgerade; b) das Bild einer Geraden, die nicht durch den Nullpunkt geht, ist ein Kreis, der durch den Nullpunkt geht (wobei dieser nicht als Wert angenommen wird) und umgekehrt; c) ein Kreis, der nicht durch den Nullpunkt geht, wird in einen ebensolchen abgebildet. Definition:
Für eine offene Teilmenge U von C oder cˆ bildet die Menge aller konformen Abbildungen von U nach U bezüglich der Komposition von Abbildungen eine Gruppe, die sogenannte Automorphismengruppe Aut U . Spezielle MÖBIUS-Transformationen bilden die Automorphismengruppen wichtiger Teilmengen U von cˆ : a) Die Automorphismengruppe von cˆ umfasst die Menge aller MÖBIUS-Transformationen. b) Die Automorphismengruppe von C ist die Menge aller komplexen Polynome ersten Grades f ( z ) = az + b , das sind die MÖBIUS-Transformationen mit c = 0. c) Bezeichnet h = {z ∈ C | Im z > 0} die obere Halbebene der GAUSSschen Zahlenebene, so ist deren Automorphismengruppe gegeben durch az + b Aut h = a, b, c, d ∈ r mit ad − bc = 1 . cz + d
13.6 Konforme Abbildungen und Möbius-Transformationen
231
d) Ist e das Innere des Einheitskreises, also e = {z ∈ C | | z | < 1}, so ist z−w Aut E = a a, w ∈ c mit | a |= 1 und | w |< 1 . wz −1
e) Aut c * = {a ⋅ z a ∈ c * } ∪ {a ⋅ z −1 a ∈ c * } f) Aut e * = {a ⋅ z a ∈ c und | a |= 1} Im Mittelpunkt vieler geometrischer Untersuchungen steht die Frage, wie bestimmte Teilmengen von C konform in einfachere abgebildet werden können, da aufgrund der Winkeltreue zum Beispiel orthogonale Gitter dabei erhalten bleiben. Das Hauptergebnis heißt RIEMANNscher Abbildungssatz:
Ist G ⊆ C, G ≠ C (!), ein einfach zusammenhängendes Gebiet, so gibt es eine konforme Abbildung f : G → e (e ist das Innere des Einheitskreises). Ist zusätzlich z0 ∈ G gegeben, so ist diese Abbildung durch die Forderungen f ( z 0 ) = 0 und f ′( z 0 ) ∈ R+ eindeutig bestimmt. Die Voraussetzung G ≠ C ist dabei unverzichtbar, denn wäre G = C, so wäre jede holomorphe Funktion nach e zwangsläufig konstant, also nicht konform. So kann zum Beispiel die obere Halbebene h durch die gebrochen lineare Transformation i−z f ( z) = konform auf e abgebildet werden, Analoges gilt für die untere Halbebene. i+ z Will man den ersten Quadranten q = {z ∈ C | Re z > 0 und Im z > 0} konform auf e abbilden, so kann dies nicht mit einer MÖBIUS-Transformation geschehen, denn deren Umkehrfunktion ließe sich auf den Rand von e, den Einheitskreis fortsetzen. Dessen Bild, ein Kreis oder eine Gerade, müsste dann der Rand von q sein. i − z2 Die durch f ( z ) = gegebene konforme Abbildung leistet das Gewünschte. i + z2 Für weitere Beispiele sei auf die Spezialliteratur verwiesen.
14
Grundzüge der Numerik
14.1
Grundlagen
Problem und Algorithmus
Aufgabe der Numerik ist die Bereitstellung konstruktiver Methoden, meist aus Analysis und Linearer Algebra, mit denen sich gesuchte Ausgangsdaten durch Ausführung endlich vieler arithmetischer und logischer Rechenoperationen aus gegebenen Eingangsdaten ermitteln lassen. Die Gesamtheit solcher Operationen heißt Algorithmus, genauer: Definition:
(i) Ein Algorithmus besteht aus einer endlichen Menge genau beschriebener Anweisungen, die unter Benutzung von vorgegebenen Anfangsdaten in exakt festgelegter Schrittfolge auszuführen sind, um die Lösung des gegebenen Problems zu erhalten. (ii) Eine Lösung heißt stabil, wenn sie sich bei kleiner Änderung der Eingangsdaten nur geringfügig ändert. (iii) Ein Algorithmus heißt stark (bzw. schwach) stabil, wenn ein im n-ten Rechenschritt eintretender Rechenfehler in den Folgeschritten abnimmt (bzw. in der gleichen Größenordnung bleibt). Verstärkt sich der Rechenfehler in den Folgeschritten, so heißt der Algorithmus instabil. Zahldarstellung und Fehleranalyse
Jede reelle Zahl lässt sich als – ggf. unendliche – Summe von ganzzahligen Vielfachen geeigneter Potenzen einer festen Basiszahl d ∈ N, d ≥ 2, darstellen. Im täglichen Leben benutzt man das Dezimalsystem, also d = 10, in elektronischen Rechenanlagen wird üblicherweise mit d = 2, 8 oder 16 gearbeitet. In dieser sogenannten d-adischen Darstellung ist a ∈ R über n
a = ±(
∑
∞
ak d k +
k =0
https://doi.org/10.1515/9783110537161-243
∑a k =1
−k
d −k ) mit ak ∈ {0,…, d – 1}
234
14 Grundzüge der Numerik
eindeutig durch die Koeffizientenfolge an an−1 L a0 a−1a−2 L , die sogenannten Ziffern, gegeben, wenn man fordert, dass der höchstindizierte Koeffizient an ≠ 0 ist; man spricht dann von wesentlichen oder tragenden Ziffern. Üblicherweise setzt man zwischen a0 und a−1 ein Komma oder einen Punkt (für d = 10 Dezimalkomma bzw. Dezimalpunkt genannt). Verschwinden alle negativ indizierten ak, so ist a ∈ Z, anderenfalls nicht. Gibt es nur endlich viele negativ indizierte ak ≠ 0 oder wiederholen sich endliche Abschnitte davon immer wieder (man spricht dann von einer periodischen Darstellung), so ist a rational, anderenfalls irrational. Definition:
Jede Zahl a ≠ 0 kann in eindeutiger Weise so dargestellt werden, dass die tragenden Ziffern unmittelbar hinter dem Komma beginnen. Diese Darstellung a = ±(an d n + an−1d n−1 + ...) = ±(an d −1 + an−1d −2 + ...)d n+1 = ±(0, an an−1 ...) ⋅ d n+1 = m ⋅ d q heißt normalisierte Gleitkommadarstellung. Dabei heißt m die Mantisse und q der Exponent von a. In Rechenanlagen werden Zahlen in Gleitkommadarstellung mithilfe gleich langer Worte beschrieben, die sich aus n Ziffern zusammensetzen, von denen s zur Mantisse und e zum Exponenten gehören, also n = s + e. Besitzt die Zahl a mehr als s tragende Ziffern, so passt diese Zahl nicht in das Zahlwort und muss daher verkürzt werden. Diese Verkürzung bedeutet eine Verfälschung der Zahl, und mit dieser fehlerhaften Zahl muss gerechnet werden. Die Verkürzung erfolgt nach den üblichen Rundungsregeln. Definition:
Bezeichnet x den wahren Wert einer reellen Zahl und ~ x einen Näherungswert, so heißt (i) (ii) (iii)
∆x = x − ~ x ∆x = x − ~ x
wahrer Fehler von ~ x, absoluter Fehler von ~ x,
∆x x−~ x = ~ ~ x x
∆x relativer Fehler von ~ x (näherungsweise gleich: ). x
Normalerweise sind x und damit auch ∆x nicht bekannt. Deshalb wird bei konkreten Rechnungen ∆x durch das Supremum aller möglichen ∆x , den maximalen absoluten Fehler
α x , ersetzt. Entsprechend bezeichnet ρ x das Supremum aller relativen Fehler, den maximalen relativen Fehler. Offensichtlich ist
α ~ x −αx ≤ x ≤ ~ x + α x und ~x = ρ x . x
14.1 Grundlagen
235
Als Fehlerquellen beim numerischen Rechnen treten neben den erwähnten Rundungsfehlern, die auf die endliche Maschinendarstellung der Zahlen zurückzuführen sind, im Wesentlichen drei verschiedene Fehlerarten auf: a) Verfahrensfehler
Viele numerische Verfahren sind Näherungsverfahren in dem Sinne, dass der exakte Wert – theoretisch – erst nach unendlich vielen Rechenschritten erreicht wird, zum Beispiel dann, wenn die Grenzfunktion einer Potenzreihe durch die n-te Partialsumme näherungsweise dargestellt wird. Diese durch das gewählte Verfahren bedingten Fehler, die von der Rechengenauigkeit des benutzten Rechners unabhängig sind und genauso bei exakter „Handrechnung“ auftreten, stehen im Vordergrund der Fehleranalyse der meisten hier behandelten numerischen Verfahren. b) Eingangsfehler
Eine zu berechnende Ausgangsgröße z hänge von n Eingangsdaten xi ab, die jeweils mit Fehlern ∆xi behaftet sind: xi = ~ xi + ∆xi Für den absoluten Fehler ∆ z der Ausgangsgröße z = f ( x1 , L , xn ) gilt nach dem in Abschnitt 8.5 behandelten Fehlerfortpflanzungsgesetz: n
∆z ≤
∑ i =1
x1 , L , ~ xn ) ∂f ( ~ ∆xi ∂xi
x1 , L , ~ xn ) ∂f ( ~ nennt man absolute Konditionszahl in Bezug auf die i-te ∂xi ~ x x1 , L , ~ xn ) ∂f ( ~ Komponente, τ i = ~ i ~ ist die relative Konditionszahl. f ( x1 , L , xn ) ∂xi Die Größe σ i =
Die Konditionszahl gibt an, um welchen Faktor die i-te Komponente der Eingangsdaten verstärkt oder gedämpft in den absoluten bzw. relativen Fehler der Ausgangsgröße eingeht. Ein Problem mit relativ großen Konditionszahlen bezeichnet man als schlecht konditioniert. c) Rechnungsfehler
Rechnungsfehler entstehen durch fortgesetzte Akkumulation von Rundungsfehlern, da die Rechenergebnisse, die mit (verfälschten) Maschinenzahlen erzielt wurden, wieder durch solche (angenähert) dargestellt werden müssen; für den Einfluss der Rechnungsfehler spielt die Stabilität des verwendeten Algorithmus eine entscheidende Rolle.
236
14.2
14 Grundzüge der Numerik
Nichtlineare Gleichungen
Nichtlineare Gleichung einer Unbekannten
Jede Gleichung mit einer Unbekannten x lässt sich stets als Nullstellenproblem f ( x) = 0 ausdrücken. Ist Auflösen nach x nicht möglich, so kann die Bestimmung einer Näherungslösung von f ( x) = 0 iterativ erfolgen: Dazu wählt man einen „groben“ Näherungswert x0 der gesuchten Lösung ξ als Startwert des Iterationsverfahrens und berechnet mit einer gegebenen Rechenvorschrift ϕ einen neuen Wert x1 = ϕ ( x0 ) . Mit diesem verfährt man analog, das heißt man berechnet x2 = ϕ ( x1 ) , allgemein: xk +1 = ϕ ( xk ) für alle k ∈ N Wenn eine so konstruierte Folge {xk }k ∈n (mit stetiger Funktion ϕ ) überhaupt einen Grenzwert a in R hat, dann muss a = ϕ (a) gelten, a muss also ein sogenannter Fixpunkt der Funktion ϕ sein. Deshalb heißt ein solches Näherungsverfahren auch Fixpunkt-Iteration. Um dieses Iterationsverfahren hier anzuwenden, muss also das Nullstellenproblem f ( x) = 0 in ein äquivalentes Fixpunktproblem ϕ ( x) = x umgeformt werden. Konvergenz des allgemeinen Iterationsverfahrens:
Es sei ϕ (x) differenzierbar auf [a, b] und ϕ ([a, b]) ⊆ [a, b] . Gibt es ein M ∈ ] 0, 1[ , für das ϕ ′( x) ≤ M für alle x ∈ [a, b] ist, so gilt: (i) (ii)
ϕ ( x) = x besitzt in [a, b] genau eine Lösung ξ und die durch xk +1 = ϕ ( xk ) gegebene Folge konvergiert für jeden beliebigen Startwert x0 gegen ξ.
Für den Abbruch nach n Iterationen gelten folgende Fehlerabschätzungen:
xn − ξ ≤
Mn x1 − x0 1− M
a priori-Abschätzung
xn − ξ ≤
M xn − xn−1 1− M
a posteriori-Abschätzung
Ein besonders häufig benutztes Beispiel einer Fixpunkt-Iteration ist das NEWTONsche Iterationsverfahren:
14.2 Nichtlineare Gleichungen Dabei ist ϕ ( x) = x −
237
f ( x) , also ist die Iterationsvorschrift durch f ′( x) f ( xk ) xk +1 = xk − f ′( xk )
gegeben. Es ist bei der Wahl von [a, b] darauf zu achten, dass f (x) keine waagerechte Tangente besitzt. f ( x) f ′′( x ) Die obige hinreichende Konvergenzbedingung auf [ a, b] lautet nun ≤ M 0 ist, a := x1 und b := b und beginne damit wieder beim 2. Schritt. Ist T (annähernd) 0, so ist ξ := x1 und das Verfahren beendet. Das Verfahren läuft so lange, bis es im 3. Schritt einmal abgebrochen wird oder bis die Intervallbreite von [a, b] kleiner als eine vorgegebene Genauigkeitsschranke ist.
Bild 14.2.2: Erster Schritt der Regula falsi
Der logische Aufbau des Bisektionsverfahrens ist genau derselbe – nur der Wert x1 ist nicht die Nullstelle der jeweiligen Sekanten, sondern einfach der Intervallmittelpunkt x1 =
a+b . 2
Es ist offensichtlich, dass das Bisektionsverfahren im Allgemeinen mehr Schritte benötigt als die Regula falsi. Nichtlineare Gleichungssysteme
Betrachtet werden n Gleichungen für n Unbekannte x1 , x 2 ,..., x n der Gestalt f i ( x1 , x2 ,..., xn ) = 0 mit i = 1,…, n , wobei die Funktionen fi : D → R , D ⊆ Rn , differenzierbar sein sollen. f1 ( x1 , L , xn ) Mit F( x1 , L , xn ) = M lässt sich obiges Gleichungssystem als vektorwertiges f ( x ,L, x ) n n 1 Nullstellenproblem F(x) = 0 schreiben.
14.2 Nichtlineare Gleichungen
239
Für jedes i = 1,…, n forme man die i-te Gleichung in eine Fixpunktgleichung der Gestalt ϕ 1 ( x1 , L , xn ) ϕ i ( x1 , x2 ,..., xn ) = xi , wodurch man mittels Φ( x1 , L , xn ) = M das gegebene ϕ ( x ,L, x ) n n 1 Nullstellenproblem in ein vektorwertiges Fixpunktproblem Φ(x) = x umformuliert hat. Ausgehend von einem passend gewählten Startvektor x0 berechnet man wie im eindimensionalen Fall die Lösung x* als Grenzwert der durch x k +1 = Φ(x k ) definierten Vektorfolge. Konvergenz der mehrdimensionalen Fixpunkt-Iteration:
Es sei D ein n-dimensionaler Quader, also D = [a1 , b1 ] × K × [an , bn ] , es sei Φ : D → r n stetig partiell differenzierbar auf D nach jedem xi, und es gelte Φ( D) ⊆ D . Gibt es darüber hinaus ein M ∈ ] 0, 1[ derart, dass ∂ϕ i (x) M ≤ ∂ xj n
für jedes i, j ∈ {1,…, n} und alle x ∈ D
ist, so gilt: Φ(x) = x hat in D genau eine Lösung x*; die durch x k +1 = Φ(x k ) gegebene Folge konvergiert für jeden beliebigen Startvektor x0 gegen x*.
Mit den Voraussetzungen wie oben gelten für die mehrdimensionale Fixpunkt-Iteration folgende Fehlerabschätzungen:
Es gibt eine Norm L des Rn und ein α ∈ ] 0, 1 [, sodass für alle x, y ∈ D
Φ( x ) − Φ ( y ) ≤ α x − y ist. Damit gilt für alle n ∈ N:
αn x1 − x 0 1−α α x n − x∗ ≤ x n − x n−1 1−α
x n − x∗ ≤
a priori-Abschätzung a posteriori-Abschätzung
Verwendet man zur Iteration speziell die Funktion Φ(x) = x − J −1 (x) ⋅ F(x) , wobei J(x) die ∂ f ( x) (mit i, j ∈ {1, …, n}) von F(x) bezeichnet, so erhält man analog JACOBI-Matrix i ∂ xj zum eindimensionalen Fall als Verallgemeinerung der NEWTON-Iteration das
240
14 Grundzüge der Numerik
NEWTON-RAPHSON-Verfahren: ∂ f ( x) von F(x). 1. Schritt: Man berechne die JACOBI-Matrix J (x) = i ∂ xj
2. Schritt: Man bestimme eine Näherungslösung x0 von F(x) = 0 und berechne ∆x aus dem linearen Gleichungssystem J (x 0 ) ⋅ ∆x = −F(x 0 ) . 3. Schritt: Mit x1 = x 0 + ∆x statt x0 beginne man im 2. Schritt mit der nächsten Iteration. Es sei darauf hingewiesen, dass in jedem Schritt die JACOBI-Matrix J(xk) neu zu berechnen ist. Wie beim vereinfachten NEWTON-Verfahren kann man jedoch auch hier – auf Kosten der Konvergenzgeschwindigkeit – in jedem Schritt mit J(x0) rechnen. Aus Stabilitätsgründen ist es sinnvoll, das LGS J (x 0 ) ⋅ ∆x = −F(x 0 ) zu lösen und nicht – wie bei der Übertragung aus der Fixpunktgleichung formuliert – die Inverse der JACOBI-Matrix zu benutzen (siehe dazu auch den nächsten Abschnitt zu linearen Gleichungssystemen).
14.3
Numerische Lösung linearer Gleichungssysteme
Im Folgenden werden quadratische lineare Gleichungssysteme mit n Gleichungen für n Unbekannte betrachtet, die sich also gemäß Abschnitt 2.3 als Matrizengleichung A ⋅ x = b schreiben lassen. Das LGS soll eindeutig lösbar sein, das heißt, A ist eine reguläre Matrix. Es soll hier zwischen expliziten und iterativen Lösungsverfahren (wie in Abschnitt 14.2 behandelt) unterschieden werden. Das GAUSSsche Eliminationsverfahren
Dieses wurde bereits in Abschnitt 2.3 behandelt. Es ist ein explizites Verfahren, es liefert (theoretisch) die exakte Lösung. Allerdings ist der Algorithmus instabil, das heißt, es kann durch die Akkumulation von Rechnungsfehlern insbesondere bei größeren Systemen zu einem derart großen Gesamtfehler kommen, dass das erzielte Ergebnis absolut unbrauchbar ist. Näheres dazu wird weiter unten ausgeführt. Ziel des Eliminationsverfahrens ist, durch elementare Zeilenumformungen die Koeffizientenmatrix A auf eine obere Dreiecksmatrix R = (rij) zu bringen. In dieser sind alle Hauptdiagonalelemente rii ≠ 0, da A maximalen Rang hat. Ein LGS der Form R ⋅ x = b (mit rij = 0 für i>j) lässt sich leicht mit der sogenannten Rückwärtselimination xn− j =
1 rn− j ,n− j
j
(bn− j −
∑r
n − j ,n − j + k
⋅ xn− j +k ) für j = 0,L, n − 1
k =1
lösen; die Komponenten der Lösung werden dabei in der Reihenfolge von n bis 1 bestimmt.
14.3 Numerische Lösung linearer Gleichungssysteme
241
Genauso einfach ist die Auflösung eines LGS L ⋅ x = b mit einer unteren Dreiecksmatrix (lij = 0 für j > i); sie wird mit der Vorwärtselimination xj =
1 (b j − l jj
j −1
∑l
jk
⋅ x k ) für j = 1,L, n
k =1
vorgenommen. LR-Zerlegung
Ist es möglich, durch elementare Zeilenoperationen A in eine obere Dreiecksmatrix R umzuformen, ohne dabei Zeilenvertauschungen vorzunehmen, so lassen sich diese Operationen als eine untere Dreiecksmatrix L−1 mit lauter Einsen auf der Hauptdiagonale zusammenfassen – es ist also A = L ⋅ R . Das so entstandene LGS A ⋅ x = L R ⋅ x = b lässt sich leicht in zwei Schritten lösen: { =y
Zunächst löst man L ⋅ y = b durch Vorwärtselimination und anschließend R ⋅ x = y durch Rückwärtselimination. Ist bei der Umformung von A auf R im r-ten Umformungsschritt das Element a~rr , mit dem die Spalte abwärts zu Null gemacht werden soll, selbst Null, so ist eine Zeilenvertauschung unerlässlich. Zeilenvertauschungen können als Multiplikation mit einer sogenannten Permutationsmatrix, die man durch Permutation der Zeilen der Einheitsmatrix erhält, ausgedrückt werden. In diesem Fall ist also P ⋅ A = L ⋅ R . Da Permutationsmatrizen stets zu sich selbst invers sind, lässt sich auch hier die Lösung von A ⋅ x = b unter Benutzung der LR-Zerlegung in zwei Schritten lösen: Zunächst löst man L ⋅ y = Pb durch Vorwärtselimination und anschließend R ⋅ x = y durch Rückwärtselimination. Spaltenpivotisierung und Zeilenäquilibrierung
Bei der Durchführung der LR-Zerlegung muss im r-ten Umformungsschritt das Element a~r + k , r a~rr ≠ 0 sein, da zu den darunter stehenden Zeilen jeweils das − ~ -Fache addiert wird. arr Die durch Rundung entstehenden Rechnungsfehler sind kleinstmöglich, wenn der obige Faktor betraglich höchstens 1 ist. Dies lässt sich stets dadurch erreichen, dass durch Zeilenvertauschung das betraglich größte Element der entsprechenden Spalte an die Stelle (r , r ) tritt. Dieses Vorgehen heißt Spaltenpivotisierung. Multipliziert man die Zeilen (Gleichungen) mit Konstanten, so ändert sich die Lösung nicht. Wegen der üblicherweise verwendeten Gleitpunktarithmetik ist es sinnvoll, wenn alle bei der Umformung benutzten Zahlen möglichst die gleiche Größenordnung haben. Dies erreicht man, indem man jede Zeile „auf 1 normiert“, das heißt mit einem Faktor λi = (Norm der iten Zeile)−1 multipliziert. Dies nennt man Zeilenäquilibrierung.
242
14 Grundzüge der Numerik
Nachiteration
Trotz Pivotstrategie und Zeilenäquilibrierung kann die ermittelte Lösung ~ x durch Rundungsfehler sehr ungenau sein. Im Allgemeinen kann ~ x durch Nachiteration verbessert werden: Ist x die exakte (unbekannte) Lösung des LGS, so gilt für ∆x = x − ~ x: A ⋅ ∆x = A ⋅ (x − ~ x) = A ⋅x− A⋅~ x=r { =b
Die Lösung ∆x des LGS mit der Koeffizientenmatrix als rechter Seite wird zur ermittelten Lösung ~ x addiert, gegenüber ~ x verbesserte Lösung des gegebenen LGS.
A und dem Residuum r = b − A ⋅ ~ x ~ ~ ~ x = x + ∆x ist im Allgemeinen eine
Das Verfahren kann bei Bedarf wiederholt werden, meist reicht jedoch eine einmalige Nachiteration. Fehlerrechnung bei der expliziten Lösung linearer Gleichungssysteme
Bei der expliziten Lösung eines LGS entsteht definitionsgemäß kein Verfahrensfehler (wie zum Beispiel bei Iterationsverfahren), da man das Ergebnis ja nach endlich vielen Schritten erhält. Der Gesamtfehler setzt sich hier aus Eingangs- und Rechnungsfehlern zusammen. Da sich der Fehler stets auf eine vektorielle Größe bezieht, wird zum Maß der Abweichung der in Abschnitt 8.1 eingeführte Normbegriff benutzt. Für Vektoren des Rn spielt dabei weniger die in Kapitel 8 benutzte EUKLIDische Norm eine Rolle, sondern in der Numerik werden meist n
Summennorm
v 1 :=
∑| v |
oder
i
i =1
Maximumsnorm
v
∞
:= max | vi | i =1,L,n
benutzt. Die daraus für (n, n)-Matrizen induzierten Normen sind n
Spaltensummennorm
j =1,L, n
∑| a
:= max
∑| a
A 1 := max
ij
|
i =1 n
Zeilensummennorm
A
∞
i =1,L,n
ij
j =1
|.
bzw.
14.3 Numerische Lösung linearer Gleichungssysteme
243
Damit gilt für in diesem Sinne verbundene Vektor- bzw. Matrizennormen der Satz: ~ Es sei A ⋅ x = b bzw. A ⋅ ~ x = b (mit regulärer Matrix A). Dann gilt: ~ (i) x−~ x ≤ A −1 ⋅ b − b (ii)
x−~ x x
≤ A ⋅ A −1 ⋅
~ b−b b
für b ≠ 0
Das bedeutet, dass die Norm von A −1 der maximale Verstärkungsfaktor des absoluten Fehlers der rechten Seite, die durch cond A = A ⋅ A −1 definierte Konditionszahl der maximale Verstärkungsfaktor des relativen Fehlers der rechten Seite ist. Iterative Verfahren
Die mehrdimensionale Fixpunkt-Iteration, wie im vorigen Abschnitt für nichtlineare Gleichungssysteme beschrieben, kann auch zur Lösung linearer Gleichungssysteme benutzt werden. Obwohl Iterationsverfahren im Gegensatz zu expliziten Verfahren prinzipiell einen Verfahrensfehler aufweisen, ist der resultierende Gesamtfehler oft wesentlich kleiner als bei einem expliziten Verfahren mit einer Matrix mit hoher Konditionszahl, da der Rechnungsfehler hier wegen der größeren Stabilität der verwendeten Algorithmen eine untergeordnete Rolle spielt. Beim JACOBI-Verfahren wird das gegebene LGS, also das Nullstellenproblem A ⋅ x − b = 0 auf folgende Weise in ein Fixpunktproblem Φ(x) = x umgewandelt: Man löse die i-te Zeile des LGS (für jedes i = 1, L, n ) nach xi auf – dies geschieht unter der Voraussetzung, dass jedes aii ≠ 0 ist. Definiert man die (n, n)-Matrix C und b ∈ Rn durch aik für i ≠ k b − cik = aii , di = i , a ii 0 für i = k so stellt das so aufgelöste LGS das Fixpunktproblem C ⋅ x + d = x dar, welches mit der in Abschnitt 14.2 beschriebenen Fixpunkt-Iteration gelöst wird. Die dazu nötigen Rechenschritte ergeben – komponentenweise dargestellt – das Gesamtschrittverfahren von JACOBI:
Mit gegebenem Startvektor x (0) = ( x1( 0) , L , xi(0 ) , L, xn( 0) ) berechnet man für i = 1, L, n die i-te Komponente von x (ν +1) = Φ(x (ν ) ) durch x
(ν +1) i
1 = bi − aii
n
∑a
ik
k =1 k ≠i
x
(ν ) k
.
244
14 Grundzüge der Numerik
Aus obiger Formel wird klar, dass zur Berechnung jeder der n Komponenten von x (ν +1) nur die Komponenten von x (ν ) benutzt werden. Das bedeutet, dass diese in beliebiger Reihenfolge oder auch parallel bestimmt werden können – neue Komponenten werden erst dann verwendet, wenn alle berechnet sind. Berechnet man die Komponenten von x (ν +1) jedoch nacheinander in aufsteigender Indexreihenfolge, so hat man zum Zeitpunkt der Berechnung der i-ten Komponente bereits die Komponenten 1, …, i – 1 von x (ν +1) berechnet, man kann also diese, zusammen mit den Komponenten i + 1, …, n von x (ν ) , zur Berechnung der i-ten Komponente von x (ν +1) verwenden. Programmiertechnisch führt man dies am einfachsten durch, indem man „neue“ und noch zu verwendende „alte“ Komponenten auf einem Vektor x speichert. Dies ist das Einzelschrittverfahren von GAUSS-SEIDEL:
Beginnend mit x = x (ν ) berechnet man sukzessive für i = 1, L, n die Werte n 1 xi = aik xk . bi − aii k =1 k ≠i (ν +1) Nach der letzten Berechnung setzt man x =x.
∑
Es stellt sich heraus, dass im Falle der Konvergenz beider Verfahren das GAUSS-SEIDELVerfahren im Allgemeinen schneller konvergiert. Bei beiden Verfahren spielt die Reihenfolge der Gleichungen des Systems eine wichtige Rolle: Allein durch Zeilenvertauschung im LGS kann Konvergenz herbeigeführt werden oder verloren gehen. Hinreichende Kriterien für die Konvergenz des JACOBI-Verfahrens: n
1. Zeilensummenkriterium:
∑| a
ik
| < | aii |
kj
| < | a jj |
k =1 k ≠i n
2. Spaltensummenkriterium:
∑| a k =1 k≠ j n
3. Kriterium von SCHMIDT-V.MISES:
n
∑∑ i =1 k =1 k ≠1
aik aii
2
0 ist. Im Hinblick auf dieses Kriterium kann man jedes LGS A ⋅ x = b stets so umformen, dass daraus ein konvergentes GAUSS-SEIDEL-Verfahren entsteht: Durch Multiplikation mit der regulären Matrix AT von links erhält man das äquivalente LGS A T A ⋅ x = A Tb ,
dessen Koeffizientenmatrix A T A symmetrisch und positiv definit ist.
14.4
Interpolation
Eine Funktion f sei an n+1 diskreten Stützstellen x0 < x1 < L < xn durch ihre Funktionsoder Stützwerte y k = f ( xk ) ( k = 0, 1, …, n) gegeben. Unter Interpolation versteht man die Aufgabe, zu einem beliebigen Argument x ∈ [ x0 , xn ] mit x ∉ {x0 , L , xn } einen angenäherten Funktionswert f (x) zu berechnen. Diese Aufgabe tritt insbesondere dann auf, wenn man von einer unbekannten Funktion nur Messwerte yk an den Stützstellen xk hat, den Funktionsverlauf dazwischen aber für weitere Berechnungen benötigt. Außerdem kann man auf diese Weise auch relativ komplizierte Funktionen durch einfachere (etwa durch Polynome) näherungsweise darstellen. Direkter Polynomansatz n
Es gibt genau ein Polynom Pn ( x) =
∑a x i
i
, also grad Pn ≤ n, das die n + 1 Stützstellen
i =0
( xk , yk ) „trifft“. Die Begründung gibt gleichzeitig die Berechnungsmethode an: Aus der Forderung Pn ( xk ) = y k ergibt sich für die unbekannten Koeffizienten ai ein LGS der Größe (n + 1, n + 1) der Form a0 + a1x0 + a2x02 + ... + anx0n = y0 a0 + a1x1 + a2x12 + ... + anx1n = y1 … a0 + a1xn + a2xn2 + ... + anxnn = yn
246
14 Grundzüge der Numerik
In Matrizenschreibweise: 1 x0 x02 L x0n a0 y0 1 x1 x12 L x1n a1 y1 = ⋅ M M M M M 1 x x 2 xnn an y n n n 144 42 4443 =M
Eine Matrix der Gestalt M – manchmal auch ihre Transponierte – heißt VANDERMONDEMatrix; ihre Determinante ist ( xi − xk ) . Da alle Stützstellen verschieden sind, ist M regu-
∏ i >k
lär, die Koeffizienten von Pn (x) sind also eindeutig bestimmt. Die numerische Berechnung des Interpolationspolynoms durch Lösung des obigen LGS erweist sich im Allgemeinen als sehr unpraktisch, da die VANDERMONDE-Matrix schlecht konditioniert ist. Deshalb benutzt man zur praktischen Berechnung von Pn (x) andere Ansätze. LAGRANGEscher Polynomansatz
Dabei wird das Interpolationspolynom Pn (x) direkt durch folgenden Ansatz bestimmt: Pn ( x) = y0 L0 ( x) + y1 L1 ( x) + K + yn Ln ( x) , wobei die Lk (x) , die sogenannten LAGRANGEschen Polynome, alle den Grad n haben und für k ∈ {0, 1, …, n} durch n
Lk ( x) =
( x − x0 )...( x − xk −1 )( x − xk +1 )...( x − xn ) x − xi = ( x x − k i k − x0 )...( xk − xk −1 )( xk − xk +1 )...( xk − xn )
∏x i =0 i≠k
0 für k ≠ i gegeben sind. Damit gilt Pn ( xi ) = yi für jedes i, denn es ist Lk ( xi ) = . 1 für k = i
Mit dieser Methode lässt sich das Interpolationspolynom Pn (x) direkt – also ohne Lösung eines LGS – angeben. Diese Form ist weniger für praktische Berechnungen als für theoretische Herleitungen geeignet, man erhält daraus den Fehlerterm des Interpolationspolynoms:
Die zu interpolierende Funktion f sei (n + 1)-mal stetig differenzierbar. Dann existiert zu jedem x ∈ [ x0 , xn ] ein ξ ∈]x0 , xn [ derart, dass f ( x) = Pn ( x) +
f ( n+1) (ξ ) ( x − x0 )( x − x1 )...( x − xn ) (n + 1)!
ist. In der Praxis benutzt man den betraglichen Maximalwert von f ( n+1) ( x) dazu, um den maximalen Interpolationsfehler auf dem Intervall [ x0 , xn ] abzuschätzen.
14.4 Interpolation
247
Für Interpolationspolynome höheren Grades ist die Bestimmung der LAGRANGE-Polynome rechenaufwendig, daher benutzt man in diesen Fällen den NEWTONschen Polynomansatz
In den Ansatz Pn ( x) = γ 0 + γ 1 ( x − x0 ) + γ 2 ( x − x0 )( x − x1 ) + K + γ n ( x − x0 )( x − x1 ) K ( x − xn−1 ) setzt man zur Bestimmung der Koeffizienten γk nacheinander x = x0 , x = x1 bis x = xn ein und erhält so das gestaffelte lineare Gleichungssystem y0 = γ 0 y1 = γ 0 + γ 1 ( x1 − x0 ) y 2 = γ 0 + γ 1 ( x2 − x0 ) + γ 2 ( x2 − x0 )( x2 − x1 ) M y n = γ 0 + γ 1 ( xn − x0 ) + γ 2 ( xn − x0 )( xn − x1 ) + K + γ n ( xn − x0 ) K ( xn − xn−1 ) welches sich durch Vorwärtselimination leicht lösen lässt. Die Lösung des obigen LGS lässt sich schematisch erhalten mit folgender Definition:
Für ( xi , yi ) mit i = 0, L , n erhält man die dividierten Differenzen rekursiv durch: f [ xi ] := yi für i = 0, L , n Für k = 1, L , n und für i = 0, L , n − k : f [ x i , x i + 1 , L , x i + k ] :=
f [ x i + 1 ,L, x i + k ] − f [ x i , L, x i + k − 1 ] xi + k − xi
Übersichtlich wird die Berechnung in einem Dreiecksschema, das für n = 2 folgende Gestalt hat: f [ x0 ] ↘
f [ x0 , x1 ] =
f [ x1 ] − f [ x0 ] x1 − x0
↗
↘
f [ x0 , x1 , x2 ] =
f [ x1 ] ↘
↗
f [ x2 ] − f [ x1 ] f [ x1 , x2 ] = x2 − x1 ↗
f [ x2 ]
f [ x1 , x2 ] − f [ x0 , x1 ] x2 − x0
248
14 Grundzüge der Numerik
Durch Hinzunahme weiterer Wertepaare kann das Dreiecksschema beliebig nach unten bzw. rechts fortgesetzt werden; es ist dabei von Vorteil, dass die Stützstellen nur voneinander verschieden, nicht jedoch der Größe nach geordnet sein müssen. Die eingekästelten Werte sind gerade die gesuchten Koeffizienten γ k = f [ x0 , L , xk ] ; der k −1
n
NEWTON-Ansatz führt also zu
Pn ( x) =
∑
∏ (x − x )
f [ x0 , L , x k ]
k =0
.
j
j =0
Hat man eine größere Zahl von Stützstellen, so erweist sich die Interpolation durch ein Polynom entsprechend hohen Grades als recht unvorteilhaft. Man kann dann an den Rändern des Interpolationsbereiches beobachten, dass Pn (x) zum „Überschwingen“ neigt und keinesfalls dem (vermuteten) Verlauf von f ( x) = e
x2 − 2
f (x) folgt, zum Beispiel dann, wenn die Funktion
(GAUSSsche Glockenkurve) auf einem Bereich [− a, a ] interpoliert werden soll.
Das liegt daran, dass die Funktion für x → ±∞ gegen 0 geht, also ein Verhalten hat, das keinem Polynom entspricht; diese gehen ja für jeden beliebigen Grad > 0 an den Rändern gegen ±∞ . Deshalb benutzt man, wenn die Anzahl der Stützstellen größer ist, die Stückweise Interpolation
Man fasst wenige benachbarte Stützstellen (üblicherweise maximal 4) zusammen und bestimmt auf diesem Bereich jeweils das Interpolationspolynom entsprechenden Grades. Die Gesamtinterpolation erfolgt somit durch eine aus mehreren Polynomen niedrigeren Grades zusammengesetzte Funktion. Sind die Stützstellen äquidistant, das heißt haben alle Stützstellen den gleichen Abstand h, so lässt sich der maximale Interpolationsfehler auf dem Intervall I = [x0, xn] gemäß folgender Tabelle angeben:
1)
Polynomgrad
Interpolationsart
Maximaler Fehler
0
Treppenfunktion
1 h max f ′( x) 2 x∈I
1
Lineare Interpolation (Polygonzug)
1 2 h max f ′′( x) x∈I 8
2
Quadratische Interpolation durch 3 Punkte
3
Kubische Interpolation durch 4 Punkte, wobei x zwischen den beiden mittleren liegt1)
1 9 3
h 3 max f ′′′( x) x∈I
3 4 h max f ( 4) ( x) x∈I 128
Für beliebige x aus dem Interpolationsintervall muss der Faktor 1/24 statt 3/128 lauten.
14.4 Interpolation
249
Der Nachteil der stückweisen Interpolation ist, dass die Interpolationsfunktion an den Stützstellen üblicherweise nicht differenzierbar ist; für n = 0 ist sie noch nicht einmal stetig. Deshalb benutzt man meist die sogenannte Spline-Interpolation
Um eine möglichst glatte Interpolationsfunktion S (x) zu erhalten, verlangt man, dass diese auf dem Interpolationsintervall [x0, xn] hinreichend oft stetig differenzierbar ist. Im Inneren jedes Teilintervalls [xk, xk+1] ist dies klar, da hier die Näherung durch ein Polynom stattfindet. Damit jedoch auch an der Stützstelle xk Differenzierbarkeit vorliegt, muss hier das Teilpolynom auf [xk−1, xk] an das auf [xk, xk+1] „angepasst“ werden, man benötigt also mehr „Freiheitsgrade“ (= Koeffizienten der Teilpolynome) als bei der stückweisen Interpolation. Die Interpolationsfunktion sei aus n Polynomen S k (x) mit gleichem Maximalgrad folgendermaßen zusammengesetzt: für S 0 ( x) S ( x) für S ( x) = 1 M S n−1 ( x) für
x ∈ [ x0 , x1 ] x ∈ [ x1 , x2 ] M
.
x ∈ [ xn−1 , xn ]
Die Interpolationsbedingungen führen zu den Gleichungen
und
S k ( xk ) = y k
mit k = 0, L , n − 1 (an den linken Intervallgrenzen)
S k ( xk +1 ) = yk +1
mit k = 0, L , n − 1 (an den rechten Intervallgrenzen),
also insgesamt 2n Gleichungen. Fordert man zusätzlich die stetige Differenzierbarkeit an allen inneren Stützstellen, also S k′ ( xk +1 ) = S k′ +1 ( xk +1 ) für k = 0, L , n − 2 , so ergeben sich weitere n – 1 Gleichungen, insgesamt sind also 3n – 1 Bedingungen von den n Teilpolynomen zu erfüllen. Haben diese alle den Grad 2, so gibt es insgesamt 3n zu bestimmende Koeffizienten, das resultierende lineare Gleichungssystem ist also unterbestimmt. Man kann noch eine weitere Bedingung (zum Beispiel Wert der Ableitung an einer der beiden Grenzen des Interpolationsbereichs) vorschreiben. Auf diese Weise erhält man die quadratische Spline-Interpolation. Üblich ist es, auch noch die Stetigkeit der zweiten Ableitung, also die stetige Krümmung zu fordern; man erhält somit zu den oben genannten 3n – 1 Bedingungen durch S k′′( xk +1 ) = S k′′+1 ( xk +1 ) für k = 0, L , n − 2 weitere n – 1 Gleichungen. Um diese insgesamt 4n – 2 Bedingungen erfüllen zu können, müssen die Teilpolynome S k (x) den Grad 3 haben. Damit das daraus resultierende LGS zur Bestimmung der 4n Koeffizienten eindeutig lösbar wird, können zwei weitere Bedingungen,
250
14 Grundzüge der Numerik
sogenannte Randpunktrestriktionen (das sind Bedingungen über Ableitungswerte in den Randpunkten) vorgegeben werden. Beispiele üblicher Randpunktrestriktionen finden sich weiter unten. Auf diese Weise erhält man den häufig benutzten kubischen Spline. Das zu lösende (4n, 4n)-LGS lässt sich im Allgemeinen etwas bequemer durch Einführung der Momente mk = S ′′( xk ) lösen. Sind für k = 0, L , n − 1 die Teilpolynome S k (x) durch S k ( x) = ak ,0 + ak ,1 ( x − xk ) + ak , 2 ( x − xk ) 2 + ak ,3 ( x − xk ) 3 gegeben, so liefern obige Bedingungen für einen kubischen Spline n – 1 Gleichungen für die Momente: hk −1mk −1 + 2(hk −1 + hk )mk + hk mk +1 = 6(d k − d k −1 ) für k = 1, L , n − 1 yk +1 − yk benutzt, die sich für den hk Fall von äquidistanten Stützstellen noch entsprechend vereinfachen. Dabei wurden die Abkürzungen hk = xk +1 − xk und d k =
Die Randpunktrestriktionen liefern zwei weitere Gleichungen für m0 und mn, sodass sich insgesamt ein tridiagonales LGS für die mk ergibt. Aus den Momenten erhält man die Koeffizienten der Splinepolynome: ak,0 = yk,
ak ,1 = d k −
hk (2mk + mk +1 ) , 6
ak , 2 =
mk , 2
ak , 3 =
mk +1 − mk . 6hk
Häufig benutzte Randpunktrestriktionen finden sich in der folgenden Tabelle: Art der Spline-Funktion
Resultierende Gleichung für m0 und mn
natürlicher Spline: S ′′( x0 ) = S ′′( xn ) = 0
m0 = 0 und mn = 0
eingespannter Spline: S ′( x0 ) und S ′( xn ) gegeben
m0 =
3 m (d 0 − S ′( x0 )) − 1 h0 2
mn =
m 3 ( S ′( xn ) − d n −1 ) − n −1 hn −1 2
Konstante Krümmung in Randnähe
m0 = m1 und mn = mn−1
Gegebene Krümmung am Rand
m0 = S ′′( x0 ) und mn = S ′′( xn )
14.5 Ausgleichsrechnung
14.5
251
Ausgleichsrechnung
Dieses Thema wurde schon teilweise in Abschnitt 8.5 behandelt; da die Ausgleichsrechnung jedoch ein wichtiges Instrument bei der näherungsweisen Funktionsdarstellung ist, soll sie hier unter diesem Aspekt nochmals angesprochen werden. Gegeben seien n + 1 Stützstellen ( xi , yi ) einer Funktion y = f (x) , deren Typ (Gerade, Parabel, o.Ä.) bekannt ist, deren spezielle Parameter aber unbekannt sind. Aufgabe der Ausgleichsrechnung ist es, die Parameter so zu bestimmen, dass das damit berechnete f (x) von allen Funktionen dieses Typs „am besten“ auf die Messpunkte „passt“. Dazu wird das GAUSS-Prinzip der kleinsten Fehlerquadrate ausgenutzt, das heißt, die beste n
Anpassung liegt vor, wenn ∆ =
∑ ( f (x ) − y )
2
i
i
kleinstmöglich ist (L2-Approximation).
i =0
Lineare Ausgleichsrechnung
Dabei geht man davon aus, dass die Ausgleichsfunktion f (x) als Linearkombination von r Basisfunktionen f k (x ) vorliegt. Üblicherweise ist r nicht größer als 4, während die Anzahl n + 1 der Stützstellen deutlich größer ist; die Interpolationsaufgabe würde also zu einem überbestimmten LGS für die Koeffizienten führen. n
Der Ansatz f ( x) = α1 f1 ( x) + K + α r f r ( x)
wird in ∆ =
∑ ( f (x ) − y )
2
i
i
eingesetzt – die
i =0
Forderung, dass die so entstehende Funktion ∆ (α1 , L , α r ) den kleinstmöglichen Wert annehmen soll, beinhaltet eine Extremwertaufgabe für eine Funktion mit r Veränderlichen. Deren Lösung erhält man aus dem linearen (r , r ) -Gleichungssystem M ⋅α = b ,
wobei sich die einzelnen Größen mit folgender (n + 1, r ) -Matrix f1 ( x0 ) L f (x ) L A= 1 1 M f (x ) L 1 n
f r ( x0 ) f r ( x1 ) M f r ( xn )
berechnen lassen zu α1 x0 T M = A A , α = M und b = A ⋅ M . α x r n T
252
14 Grundzüge der Numerik
Die Matrix M ist symmetrisch; da die Basisfunktionen f k (x ) linear unabhängig sind, besitzt A maximalen Rang und ist M regulär, das LGS ist also eindeutig lösbar. Besonders häufig wird ein sogenannter Polynomausgleich durchgeführt. Dabei ist die Ausgleichsfunktion ein Polynom vom Grade r – 1, mit den Basisfunktionen f k ( x) = x k −1 (für k = 1, L , r ) ergeben sich A und M zu
n +1 1 x0 L x0 A = M M M und M = M n r −1 r −1 1 xn L xn x j =0 j r −1
∑
n
∑
j =0 . M n 2 r −2 xj j =0 n
xj
L
∑x
L
∑
j =0
M n
∑x
r j
j =0
r −1
j
Für die Ausgleichsgerade f ( x) = α 0 + α1 x erhält man (vgl. Abschnitt 8.5) die Lösung n n xi yi − xi ⋅ yi i =0 i =0 i =0 , 2 n n 2 (n + 1) xi − xi i =0 i =0 n
(n + 1) a1 =
∑
∑
∑
∑
∑
a0 =
n 1 n y a xi . − 1 i n + 1 i =0 i =0
∑
∑
Daraus abgeleitete Anwendungsbeispiele: 1. Funktionstyp f ( x) = ce dx mit c > 0: Die Hilfsfunktion h( x) = ln f ( x) = ln c + dx ist eine Gerade. Für die Stützstellen (xi , ln yi ) bestimme man die Ausgleichsgerade h( x) = α 0 + α1 x wie oben und setze dann c = eα und d = a1. 0
d
2. Funktionstyp f ( x ) = c e x mit c > 0: 1 betrachte man die Hilfsfunktion h( z ) = ln f ( 1z ) = ln c + dz . x 1 Für die Stützstellen , ln yi bestimme man die Ausgleichsgerade h( z ) = α 0 + α1 z und xi Mit der neuen Variablen z =
setze c = eα und d = a1. 0
Nichtlineare Ausgleichsrechnung
Hängt die Ausgleichsfunktion f (x) nicht linear von ihren Parametern α1 , L , α r ab, so ergeben sich beim Einsetzen der Stützstellen xi Ausdrücke der Gestalt f i (α1 , L , α r ) , die nicht
14.6 Approximation durch orthogonale Funktionen
253
linear in α1 , L , α r sind. Für eine geschätzte Näherungslösung β = ( β1 , L , β r ) lassen sich die Funktionen f i (α1 , L , α r ) mit dem Satz von TAYLOR linearisieren: f i (α1 , L , α r ) ≈ f i (β1 , L , β r ) +
r
∂ fi
∑ ∂α k =1
(β)∆ α k mit ∆α = α − β
k
∂f ∂ f0 (β) L 0 (β) y0 − f 0 (β) ∂αr ∂ α1 Mit A = M M M und z = ergibt sich analog zur linearen Aus∂ fn ∂ fn y − f ( β ) (β) n n (β) L ∂ α r ∂ α1 gleichsrechnung ∆α als Lösung des LGS ( A T A) ⋅ ∆α = A T z , woraus man mit α = β + ∆α die gesuchten Parameter erhält.
14.6
Approximation durch orthogonale Funktionen
Die auf dem Intervall [a, b] näherungsweise darzustellende Funktion f (x) soll quadratb
integrabel sein (geschrieben: f ∈ L2 [a, b]), das heißt,
∫ ( f ( x)) d x 2
soll in R existieren (was
a
zum Beispiel für stückweise stetige Funktionen der Fall ist). b
Ist < ⋅,⋅ > ein Skalarprodukt in L2 [a, b] – meist wird das durch < f , g > =
∫ f ( x) g ( x) d x a
gegebene verwendet – so wird gemäß Abschnitt 8.1 durch f = < f , f > eine Norm auf L2 [a, b] definiert. Bezeichnet {ϕ i | i = 0, L , m} ein Orthogonalsystem in L2 [a, b], das heißt, ist < ϕ i , ϕ k > = 0 für i ≠ k, so kann unter allen Linearkombinationen aus {ϕ i | i = 0, L , m} diejenige bestimmt werden, die im quadratischen Mittel am wenigsten von einem gegebenen f ∈ L2 [a, b] abweicht, für deren Koeffizienten ck also 2
m
∆ (c0 , c1 ,..., cm ) = f −
∑c ϕ k
k
( x)
k =0
minimal wird. Wegen der Orthogonalität der ϕ i erhält man diese Koeffizienten leicht als ck =
< f ,ϕ k > , < ϕ k,ϕ k >
254
14 Grundzüge der Numerik
die gesuchte Näherungsfunktion Pm(x) besitzt dann die Gestalt m
Pm ( x) =
< f ,ϕ k > ϕ k ( x) . k,ϕ k >
∑ =
∫ f ( x) g ( x) d x a
noch das sogenannte Skalarprodukt mit Gewichtsfunktion w(x) infrage: b
< f , g >w =
∫ f ( x) g ( x) w( x) d x a
Dabei muss die sogenannte Gewichtsfunktion w(x) eine auf [a, b] integrierbare und nichtnegative Funktion mit nur endlich vielen Nullstellen sein, für die außerdem für alle k ∈N b
∫
µ k = x k w( x) d x existiert. a
Offensichtlich ergibt sich das übliche Skalarprodukt mit der Gewichtsfunktion w( x) = 1 . Um die Funktion f im quadratischen Mittel mit einem Orthogonalsystem bezüglich eines Skalarprodukts mit Gewichtsfunktion zu approximieren, ist die Funktion m
∆ (c0 , c1 ,..., cm ) = f −
∑
2
b
∫
ck ϕ k ( x ) = ( f ( x ) −
k =0
a
m
∑ c ϕ ( x)) w( x) d x 2
k
k
k =0
zu minimieren. Besonders häufig wird die Approximation mit orthogonalen Polynomen durchgeführt. Dazu wird die Basis {1, x, L , x m } des Unterraums aller Polynome mit Grad ≤ m bezüglich des Skalarprodukts < ⋅,⋅ > w gemäß dem Verfahren von GRAM-SCHMIDT orthogonalisiert. Man erhält auf diese Weise eine Rekursionsformel für die orthogonalen Polynome qk (x) : Aus den Startwerten q0 ( x) = 1 und q1 ( x) = x −
< x, 1 > w berechnet man die übrigen Poly< 1,1 > w
nome für 2 ≤ k ≤ m durch qk ( x) = ( x − Bk )qk −1 ( x) − Ck qk −2 ( x) , wobei Bk =
< x qk −1 , qk −1 > w < x qk −1 , qk −2 > w und Ck = ist. < qk −1 , qk −1 > w < qk − 2 , qk − 2 > w
Ist speziell das Approximationsintervall [a, b] = [−1,1] und die Gewichtsfunktion w( x) = 1 , so erhält man auf diese Weise die LEGENDRE-Polynome Lk (x) :
14.6 Approximation durch orthogonale Funktionen L0 ( x) = 1 , L1 ( x) = x , L2 ( x) =
255
3 2 1 5 3 x − , L3 ( x) = x 3 − x , … 2 2 2 2
Außer mit obiger allgemeiner Rekursionsformel lassen sich die LEGENDRE-Polynome auch durch folgende spezielle berechnen: Lk ( x) =
2k − 1 k −1 Lk −2 ( x) xLk −1 ( x) − k k
Das Näherungspolynom Pm (x) lässt sich bei Verwendung von LEGENDRE-Polynomen darm
stellen als Pm ( x) =
< f , Lk > Lk ( x) , wobei für die den Koeffizienten ck bildenden Grök k >
∑ < L ,L k =0
ßen gilt: < Lk , Lk > =
1
2 k +1
und
< f , Lk > =
∫ f ( x) L ( x) d x k
−1
Das Integral wird mit den im nächsten Abschnitt behandelten numerischen Integrationsmethoden berechnet. Für das Approximationsintervall [a, b] = [−1,1] und die Gewichtsfunktion w( x) =
1 1 − x2
ergeben sich die TSCHEBYSCHEFF-Polynome Tk (x) : T0 ( x) = 1 , T1 ( x) = x , T2 ( x) = 2 x 2 − 1 , T3 ( x) = 4 x 3 − 3x , … Außer mit obiger allgemeiner Rekursionsformel lassen sich die TSCHEBYSCHEFF-Polynome auch durch folgende spezielle berechnen: Tk ( x) = 2 xTk −1 ( x) − Tk −2 ( x) Das Näherungspolynom Pm (x) lässt sich bei Verwendung von TSCHEBYSCHEFF-Polynomen m
darstellen als Pm ( x) =
< f , Tk > w Tk ( x) , wobei nun gilt: k k >w
∑ < T ,T k =0
π < Tk , Tk > w = π 2
1
für k = 0 für
und
k ≥1
< f , Tk > =
∫ −1
f ( x)Tk ( x) 1 − x2
dx
Das letzte Integral wird wieder numerisch berechnet. Ist die zu approximierende Funktion f P-periodisch, so ist gemäß Abschnitt 7.3 das trigonometrische Polynom pm ( x ) =
a0 + 2
m
∑ a k =1
k
2π 2π cos k x + bk sin k x P P
256
14 Grundzüge der Numerik
die beste Näherung für f im quadratischen Mittel, wenn die ak und bk die FOURIERKoeffizienten sind, also für ak = 2 P
P
∫ 0
f ( x) cos k 2π x d x P
und
bk = 2 P
P
∫ f ( x) sin k 2Pπ x d x . 0
Das gleiche Ergebnis erhält man, wenn man mit der Gewichtsfunktion w( x) = 1 das Ortho2π 2π 2π 2π x, L , cos m x, sin x, L , sin m x} zur Approximation gemäß gonalsystem {1, cos P P P P obigem allgemeinen Verfahren benutzt. Zur numerischen Berechnung der FOURIER-Koeffizienten wählt man n + 1 äquidistante P Stützstellen xi = i ⋅ , i = 0, L , n derart, dass im kleinsten Periodenintervall der vorkomn menden sin- und cos-Terme zwei Stützstellen liegen, also n = 2m. Die Integrale, die ak und bk darstellen, werden mit der summierten Sehnentrapezregel (siehe folgender Abschnitt) berechnet, womit sich die Näherungswerte der FOURIER-Koeffizienten ergeben zu n −1 ~ 2 1 P k ⋅ 2π a~k = f (0) + 2 f i ⋅ cos i ⋅ + f ( P) und bk = n n n n i =1
∑
n −1
P
∑ f i ⋅ n cos i ⋅ i =1
k ⋅ 2π . n
Besonders geschickt ist es, n als Zweierpotenz, etwa als n = 2 p , zu wählen, da dann durch die besonderen Eigenschaften der trigonometrischen Funktionen der Rechenaufwand deutlich verringert werden kann. Dadurch nimmt die Zahl der benötigten Additionen und Multiplikationen von etwa n 2 auf n ⋅ ld n ab, man erhält so die schnelle FOURIER-Transformation (FFT = fast Fourier transform).
14.7
Numerische Integration
Ziel der numerischen Integration ist die näherungsweise Berechnung bestimmter Integrale b
I=
∫ f ( x) d x . Angewandt wird die numerische Integration immer dann, wenn die Werte a
von f nur an bestimmten Stützstellen xk, k = 0, 1, L , n , vorliegen (zum Beispiel durch Messung ermittelt) oder wenn man eine Stammfunktion von f nicht in geschlossener Form ange2
ben kann (wie etwa bei f ( x) = e − x ).
14.7 Numerische Integration
257
Definition: b
(i) Eine Näherungsformel für das Integral I =
∫
n
f ( x) d x der Gestalt Q =
a
∑α
k
f ( xk ) mit
k =0
αk ∈ R heißt Quadraturformel. Die αk heißen Gewichte. (ii) Eine Quadraturformel hat den Genauigkeitsgrad m, wenn sie für alle Polynome bis zum Grade m den exakten Wert des Integrals liefert. Teilt man das Integrationsintervall durch n + 1 Stützstellen xk = a + k ⋅ h in n gleichgroße b−a und fordert, dass die entstehende Quadraturformel den Teilintervalle der Länge h = n Genauigkeitsgrad n hat, so lassen sich die dazu notwendigen Gewichte αk aus einem LGS bestimmen, dessen Koeffizienten die Transponierte der VANDERMONDE-Matrix, gebildet aus den Stützstellen xk, ist; die αk sind also eindeutig bestimmt. Auf diese Weise entstehen die sogenannten NEWTON-COTES-Formeln, die man geschlossen nennt, wenn die beiden Intervallgrenzen in die Berechnung einbezogen werden. n
Mit α k = c n β k , also Q = cn
∑β
k
f ( xk ) , sind die Gewichte für n = 0,L , 4 in nachfolgender
k =0
b−a und N = n + 1 die Anzahl der verwendeten Stützn stellen, mit max | f (n ) | ist das betragliche Maximum der n-ten Ableitung auf dem Integrationsintervall gemeint. Tabelle aufgeführt. Dabei ist h =
Geschlossene NEWTON-COTES-Formeln
N
cn
β0
1
b−a
1
2
h 2
1
1
3
h 3
1
4
1
4
3h 8
1
3
3
1
5
2h 45
7
32
12
32
β1
β2
β3
β4
7
maximaler Fehler
Name
(b − a ) 2 max | f ′ | 2
Rechteckregel
h3 max | f ′′ | 12
Sehnentrapezregel
h5 max | f ( 4) | 90
SIMPSON-Regel
3h 5 max | f ( 4) | 80
3/8-Regel
8h 7 max | f ( 6) | 945
258
14 Grundzüge der Numerik
Bezieht man die Integrationsgrenzen nicht in die Quadraturformel mit ein, verwendet man also die N = n − 1 Stützstellen xk = a + k ⋅ h , k = 1, L , n − 1 , so erhält man auf die gleiche Weise die offenen NEWTON-COTES-Formeln. Diese werden zum Beispiel verwendet, wenn die Integrandenfunktion an den Grenzen nicht definiert ist. Offene NEWTON-COTES-Formeln
N
cn
β1
1
b−a
1
2
b−a 2
1
1
3
b−a 3
2
−1
β2
β3
maximaler Fehler
Name
h3 max | f ′′ | 3
Tangententrapezregel
3h 3 max | f ′′ | 4 2
14h 5 max | f ( 4) | 45
Einige Namen der Quadraturformeln enthalten geometrische Begriffe; hier lassen sich die Näherungswerte anschaulich deuten (siehe Bild 14.7.1 und 14.7.2).
Bild 14.7.1: zur Sehnentrapezregel
Bild 14.7.2: zur Tangententrapezregel
Untersucht man in obiger Tabelle die Abhängigkeiten der maximalen Fehler von der jeweiligen Ableitungsordnung, dann ist bei der Sehnentrapezregel, für die n = 1 ist, unmittelbar klar, dass alle Polynome bis zum Grade 1 exakt integriert werden, da deren zweite Ableitung ja verschwindet. Der Fehlerterm der SIMPSON-Formel, mit der wegen n = 2 ja alle Polynome bis zum Grade 2 exakt integriert werden sollten, hängt jedoch von der vierten Ableitung ab. Dies bedeutet, dass auch für Polynome vom Grad 3 sich aus Q noch der exakte Integralwert ergibt. Dies ist kein Zufall; Entsprechendes gilt auch für die offenen NEWTON-COTES-Formeln.
14.7 Numerische Integration
259
Restglieder der NEWTON-COTES-Formeln: b
Zur näherungsweisen Bestimmung von I =
∫ f ( x) d x
werde die NEWTON-COTES-Formel
a
b−a ergibt sich bei Verwendung der n Stützstellen xk = a + k ⋅ h , k = 0, L , n bzw. k = 1, L , n − 1 , für das Restglied Rn = I − Q , Q (geschlossen bzw. offen) verwendet. Mit h =
wenn f hinreichend oft stetig differenzierbar und ξ ∈]a, b[ ist, die Formel n
⇒
Rn =
h n+3 f ( n+ 2 ) (ξ ) t (t − 1) ⋅ K ⋅ (t − n) d t (n + 2)! 0
n ungerade
⇒
Rn =
h n+ 2 f ( n+1) (ξ ) t (t − 1) ⋅ K ⋅ (t − n) d t (n + 1)! 0
n gerade
⇒
Rn =
h n+1 f ( n ) (ξ ) t (t − 1) ⋅ K ⋅ (t − n + 1) d t n! 0
n ungerade
⇒
Rn =
h n f ( n −1) (ξ ) t (t − 1) ⋅ K ⋅ (t − n + 1) d t (n − 1)! 0
(i) geschlossen: n gerade
∫ n
∫
n
(ii) offen:
∫
n
∫
Ist n ungerade, so ist also sowohl für die geschlossene als auch die offene Formel der Genauigkeitsgrad genau so hoch wie vom Ansatz gefordert, nämlich n bzw. n – 2; für gerade n ist er um 1 höher als gefordert. Ist n groß, zum Beispiel wenn das Integrationsintervall [a, b] groß ist, so benutzt man nicht eine Fortführung obiger Tabellen für größere n, sondern wendet für zwei bzw. drei benachbarte Stützstellen die Sehnentrapezregel bzw. die SIMPSON-Regel an und addiert die Teilintegrale zum Gesamtintegral. Man erhält so Summierte Integrationsformeln:
b−a den n Integrationsbereich in n gleichgroße Teilintervalle [ xk , xk +1 ] und wendet auf jedes die Sehnentrapezregel an, so erhält man die summierte Sehnentrapezregel: (i) Teilt man unter Verwendung der n + 1 Stützstellen xk = a + k ⋅ h mit h =
∑ QST =
n −1 h f (a) + 2 f ( xk ) + f (b) 2 k =1
Für den Fehler gilt die Abschätzung
∑
∑ | I − QST |≤
b−a 2 h max | f ′′( x ) | . a≤ x ≤b 12
260
14 Grundzüge der Numerik
b−a den 2n Integrationsbereich in n gleichgroße Teilintervalle [ x2 k , x2 k + 2 ] der Breite 2h und wendet auf jedes die SIMPSON-Regel an, so erhält man die summierte SIMPSON-Regel: (ii) Teilt man unter Verwendung der 2n + 1 Stützstellen xk = a + k ⋅ h mit h =
QS∑ =
n n −1 h f (a) + 2 f ( x2 k ) + 4 f ( x2 k −1 ) + f (b) 3 k =1 k =1
∑
∑
| I − QS∑ | ≤
Für den Fehler gilt die Abschätzung
b−a 4 h max | f ( 4) ( x) | . a ≤ x ≤b 180
Mithilfe der Fehlerformeln kann man die Anzahl der mindestens benötigten Stützstellen berechnen, um mit einer der summierten Regeln das Integral mit einer vorgegebenen Genauigkeit zu bestimmen. Dabei kann man sich zunutze machen, dass der Fehler von h2 bzw. h4 abhängt, denn bei Halbierung von h, das heißt, bei Verdoppelung der Anzahl der Teilintervalle, verringert sich der maximale Fehler um den Faktor 4 bzw. 16. Darüber hinaus kann man hier wie bei jedem Verfahren, bei dem eine Größe näherungsweise durch ein Diskretisierungsverfahren mit konstanter Schrittweite h berechnet wird und der Fehler sich in Potenzen von hp darstellen lässt, zur weiteren Verbesserung der Näherung ein allgemeines Verfahren anwenden, die sogenannte
RICHARDSON-Extrapolation
Ein unbekannter Wert M (hier das Integral I) werde durch einen von einer Schrittweite h abhängigen Näherungswert N (h) dargestellt (zum Beispiel durch eine Quadraturformel); der von h abhängige Fehler lasse sich durch ein Polynom in h darstellen, dessen Exponenten ki aufsteigend geordnet seien und deren kleinster mindestens 1 ist: M = N ( h) + K1 h k + K 2 h k + K + K r h k r = N ( h) + O ( h k ) 1
2
1
Ziel ist, eine Formel mit höherer Fehlerordnung zu finden. h (mit t ≥ 2) ersetzt, die entstehende Gleichung mit t k t multipliziert und davon die ursprüngliche subtrahiert, entsteht eine Formel für M, in der h mindestens den – größeren – Exponenten k2 hat, die Fehlerordnung wurde also erhöht:
Wird in obiger Formel h durch
1
t k N ( ht ) − N (h) N ( ht ) − N (h) k h + O ( h ) = N + + O( h k ) ( ) t tk −1 tk −1 1
M =
2
1
2
1
14.7 Numerische Integration
261 t k N ( ht ) − N (h) für tk −1 1
Der nach dem RICHARDSON-Verfahren verbesserte Näherungswert R =
1
h berechnet wurde, approximiert M mit t N ( ht ) − N (h) ist . tk −1
M, der unter Benutzung der Schrittweiten h und
O(h k ) , die Verbesserung gegenüber N ( ht ) 2
1
Durch mehrfache Anwendung dieses Verfahrens lassen sich weitere Fehlerterme eliminieren. Besonders häufig wird dieses Verfahren mit t = 2, also durch Halbierung der Schrittweite, angewandt. Für die ersten vier Werte von k1 findet man die entsprechenden Formeln in der folgenden Tabelle. RICHARDSON-Extrapolation bei Halbierung der Schrittweite
Fehlerordnung
Extrapolationsformel
Verbesserung
1
2 N ( h2 ) − N (h)
N ( h2 ) − N (h)
2
4 N ( 2h ) − N (h) 3
N ( h2 ) − N (h) 3
3
8 N ( 2h ) − N (h) 7
N ( h2 ) − N (h) 7
4
16 N ( h2 ) − N (h) 15
N ( h2 ) − N (h) 15
Wendet man die RICHARDSON-Extrapolation mit Schrittweitenhalbierung auf die Sehnentrab−a an, so ergibt sich gerade die SIMPSON-Formel mit 2n Teilintervallen. pezregel mit h = n Die RICHARDSON-Extrapolation mit fortgesetzter Schrittweitenhalbierung zusammen mit der Sehnentrapezregel liefern die Grundlage der ROMBERG-Integration, für die auf die weiterführende Literatur verwiesen sei. GAUSSsche Integrationsformeln
Bei den bisher behandelten Integrationsverfahren wurden die Stützstellen in der Quadraturn
formel Q =
∑α
k
f ( xk ) äquidistant gewählt. Werden diese zusätzlich zu den Gewichten als
k =0
freie Parameter angesehen, so kann man mit diesen insgesamt 2n + 2 Parametern Quadraturformeln herleiten, deren Genauigkeitsgrad 2n + 2 ist. Man benutzt dazu die Nullstellen zk des LEGENDRE-Polynoms Ln+1 ( x) sowie die LAGRANGE-Interpolation (siehe frühere Abschnitte in diesem Kapitel). Da die LEGENDRE-Polynome auf [−1, 1] definiert sind, muss das zu be-
262
14 Grundzüge der Numerik
rechnende Integral mithilfe der Substitutionsregel in ein Integral von −1 bis 1 umgerechnet b
werden. Bei der Berechnung von I =
∫ f ( x) d x geht man folgendermaßen vor: a
n
b−a z (b − a) + b + a , wobei man die β k und xk = k 2 2 k =0 Parameter βk und zk unten stehender Tabelle entnimmt. In Q =
∑α
k
f ( xk ) setze man α k =
n+1
Stützstellen zk ( k = 0,…, n)
Gewichte βk
2
z1 = − z0 = 0,577350269190
β 0 = β1 = 1
z2 = − z0 = 0,774596669241
β2 = β0 = 0,555555555556
z1 = 0
β1 = 0,888888888889
z3 = − z0 = 0,861136311594
β3 = β0 = 0,347854845137
z2 = − z1 = 0,339981043585
β2 = β1 = 0,652145154863
z4 = − z0 = 0,906179845939
β4 = β0 = 0,236926885056
z3 = − z1 = 0,538469310106
β3 = β1 = 0,478628670499
z2 = 0
β2 = 0,568888888889
z5 = − z0 = 0,932469514203
β5 = β0 = 0,171324492379
z4 = − z1 = 0,661209386466
β4 = β1 = 0,360761573048
z3 = − z2 = 0,238619186083
β3 = β2 = 0,467913934573
3
4
5
6
( k = 0,…, n)
Für den Verfahrensfehler der GAUSS-Integration gilt: | R |≤
(b − a ) 2 n+3 [(n + 1)!]4 max | f ( 2 n+ 2 ) ( x) | (2n + 3)[(2n + 2)!]3 a≤ x≤b
Die Anwendung der GAUSSschen Quadraturformeln setzt voraus, dass die zu integrierende Funktion f an beliebigen Argumentstellen x, also auch an den Stützstellen xk, berechnet werden kann. Liegt f jedoch nur tabelliert und nicht in geschlossener Form vor, so sind die benötigten Funktionswerte zu interpolieren, wodurch im Allgemeinen ein Genauigkeitsverlust eintritt.
14.8 Numerische Differentiation
14.8
263
Numerische Differentiation
Eine Funktion f (x) sei an den Stützstellen xk gegeben, die den festen Abstand h haben; es ist also xk +i = xk + i ⋅ h . Aufgabe ist, Näherungsformeln für die ersten und zweiten Ableitungen an den Stützstellen zu entwickeln. Bezeichnungen: y k = f ( xk ) , yk′ = f ′( xk ) , y ′k′ = f ′′( xk ) Normalerweise werden nicht alle Stützstellenwerte zur näherungsweisen Berechnung von yk′ und yk′′ herangezogen, sondern nur die in der Nähe von xk. Dabei kann man auf verschiedene Weisen vorgehen: Eine Möglichkeit ist die Benutzung der TAYLOR-Entwicklung mit Entwicklungspunkt xk, eine andere ist, die Stützstellen um xk zu benutzen, um ein Interpolations- oder ein Ausgleichspolynom zu berechnen und dieses dann abzuleiten. Ableitung mittels TAYLOR-Polynom
Aus der TAYLOR-Entwicklung von f (x) um xk 2
f ( x) =
∑ l =0
f ( l ) ( xk ) f ′′′(ξ ) ( x − xk ) l + ( x − xk ) 3 l! 3!
erhält man nach Einsetzen von x = xk +1 = xk + h und x = xk −1 = xk − h sowie durch Subtraktion bzw. Addition die Formeln y ′k =
yk +1 − yk −1 h 2 − f ′′′(ξ ) 2h 6
und
y ′k′ =
y k +1 − 2 y k + y k −1 h2
−
h2 f 12
( 4)
(ξ ) ,
wobei – wie in den folgenden Formeln auch – ξ stets eine Stelle zwischen den jeweils beteiligten Stützstellen bezeichnet. Die Formel für die erste Ableitung heißt zentraler Differenzenquotient, sie ist von der Fehlerordnung 2 bezüglich der Schrittweite h (mit O(h2)). Ableitung mittels Interpolationspolynom
Durch die Stützstellen ( xk +i , y k +i ) mit i = 0, L , n wird das Interpolationspolynom p(x) vom Grade n gelegt. Die Ableitung an der Stelle xk liefert die folgenden Näherungsformeln: Für n = 1: analog:
yk′ =
1 h ( yk +1 − yk ) − f ′′(ξ ) 2 h
vorwärtiger Differenzenquotient
y ′k =
1 h ( yk − yk −1 ) − f ′′(ξ ) h 2
rückwärtiger Differenzenquotient
264
14 Grundzüge der Numerik
Für n = 2:
Für n = 3:
und
y′k =
1 h2 (−3 yk + 4 yk +1 − yk + 2 ) + f ′′′(ξ ) 2h 3
yk′ +1 =
1 h2 ( − y k + yk + 2 ) − f ′′′(ξ ) 2h 6
yk′ + 2 =
1 h2 ( yk − 4 yk +1 + 3 yk + 2 ) + f ′′′(ξ ) 2h 3
y ′k =
1 h3 (−11y k + 18 y k +1 − 9 y k + 2 + 2 y k + 3 ) − f 6h 4
( 4)
(ξ )
y ′k +1 =
1 h3 (−2 y k − 3 y k +1 + 6 y k + 2 − y k + 3 ) + f 6h 12
y ′k + 2 =
1 h3 ( y k − 6 y k +1 + 3 y k + 2 + 2 y k + 3 ) − f 6h 12
y ′k +3 =
1 h3 (4) (−2 yk + 9 y k +1 − 18 yk + 2 + 11yk +3 ) + f (ξ ) 6h 4
y ′k′ =
( 4)
(4)
(ξ )
(ξ )
1 11 (12 yk − 30 yk +1 + 24 yk + 2 − 6 y k +3 ) + h 2 f ( 4) (ξ ) 2 12 6h
y ′k′+1 =
1 h2 (6 y k − 12 y k +1 + 6 y k + 2 ) − f 2 12 6h
y ′k′+ 2 =
1 h2 ( 6 12 6 ) y − y + y − f k +1 k +2 k +3 12 6h 2
y ′k′+ 3 =
1 11 (−6 y k + 24 y k +1 − 30 y k + 2 + 12 y k + 3 ) + h 2 f 2 12 6h
( 4)
(ξ ) ( 4)
(ξ ) ( 4)
(ξ )
Dabei sind die Ableitungen an Stützstellen in der Mitte aufgrund der Fehlerterme bessere Approximationen für die wahren Werte als die am Rand des Interpolationsintervalls. Ableitung mittels Ausgleichspolynom
Legt man durch die fünf Stützstellen ( xk − 2 , yk −2 ) , ( x k −1 , y k −1 ) , ( xk , yk ) , ( x k +1 , y k +1 ) und ( xk +2 , yk +2 ) ein Ausgleichspolynom p(x) dritten Grades und ersetzt die Stützwerte yk+i durch die Werte des Ausgleichspolynoms y k +i = p( xk +i ) , so kann man auch die Ableitungen y′k + i durch die Werte yk′ + i approximieren. Man erhält für die ersten Ableitungen: yk′ − 2 = yk′ − 2 =
1 25 (−125 yk − 2 + 136 yk −1 + 48 yk − 88 yk +1 + 29 yk + 2 ) − h3 f ( 4 ) (ξ ) 84h 42
14.9 Numerische Lösung gewöhnlicher Differentialgleichungen
y ′k −1 = y k′ −1 = y k′ = y k′ =
265
1 17 3 (−38 y k − 2 − 2 y k −1 + 24 y k + 26 y k +1 − 10 y k + 2 ) + h f 84h 84
( 4)
(ξ )
1 h 4 (5) ( y k − 2 − 8 yk −1 + 8 yk +1 − yk + 2 ) + f (ξ ) 12h 30
y k′ +1 = y k′ +1 =
1 17 (10 y k − 2 − 26 y k −1 − 24 y k + 2 y k +1 + 38 y k + 2 ) − h 3 f 84h 84
y k′ + 2 = y k′ + 2 =
1 25 3 ( 4 ) (−29 yk −2 + 88 y k −1 − 48 y k − 136 y k +1 + 125 yk + 2 ) + h f (ξ ) 84h 42
(4)
(ξ )
Für die zweite Ableitung an der mittleren Stützstelle gilt: yk′′ = yk′′ =
1 h 4 ( 4) ( 16 30 16 ) − y + y − y + y − y + f (ξ ) 2 1 1 2 k − k − k k + k + 12h 2 90
Es ist nicht sinnvoll, für die Berechnung der ersten beiden Ableitungen Polynome höheren als dritten Grades heranzuziehen, da diese eine größere Welligkeit im Interpolations- oder Ausgleichsbereich aufweisen und damit zu erheblichen Abweichungen in den Ableitungen führen können. Schrittweitenabhängige Fehler
In allen Formeln zur näherungsweisen Bestimmung der ersten und zweiten Ableitung sind die Verfahrensfehler mindestens von quadratischer Ordnung. Der Schluss liegt also nahe, dass man durch eine Verkleinerung der Schrittweite mit jeder Formel den Ableitungswert mit beliebiger Genauigkeit bestimmen kann. Andererseits steht bei jeder Näherungsformel aufgrund der Ableitungsdefinition h oder h² im Nenner. Dadurch ist der Rundungsfehler 1 1 oder 2 , wird also bei Verkleinerung von h größer. proportional zu h h Es gibt also eine optimale Schrittweite, bei der der Gesamtfehler am kleinsten ist. Bei konkreter Kenntnis des jeweiligen Rundungsfehlers, der ja maschinenabhängig ist, lässt sich diese analytisch leicht bestimmen.
14.9
Numerische Lösung gewöhnlicher Differentialgleichungen
Bei der numerischen Lösung einer Differentialgleichung wird stets ein Anfangs- oder Randwertproblem behandelt, es wird nicht die allgemeine Lösung einer Differentialgleichung bestimmt. Die Lösungsfunktion y (x) wird dabei nicht in geschlossener Form berechnet, sondern es werden Näherungen yk an – oft äquidistanten – Stützstellen xk für y ( xk ) erzeugt.
266
14 Grundzüge der Numerik
Aus diesen Stützstellen lässt sich ggf. durch die in den Abschnitten 14.4. bis 14.6 beschriey ( x) der Lösungsfunktion berechnen. benen Methoden eine Näherungsfunktion ~ Damit das zu lösende Anfangswertproblem eindeutig lösbar ist, gelte gemäß Abschnitt 9.1 auf dem Lösungsgebiet R nach dem Satz von PICARD-LINDELÖF eine LIPSCHITZ-Bedingung | f ( x, y ) − f ( x, y ) | ≤ L y − y
∀( x, y ), ( x, y ) ∈ R .
Einschrittverfahren zur Lösung von Anfangswertproblemen erster Ordnung
Ein AWP erster Ordnung ist gegeben durch
y ′ = f ( x, y ) mit y ( x0 ) = y0 .
Bei einem Einschrittverfahren wird ausgehend vom durch die Anfangsbedingung gegebenen Startpunkt ( x0 , y0 ) eine Stelle ( x1 , y1 ) berechnet, wobei mit einer gegebenen Schrittweite h x1 = x0 + h ist und y1 sich – gemäß dem gewählten Verfahren – aus ( x0 , y0 ) berechnen lässt. Im nächsten Schritt verfährt man analog mit ( x1 , y1 ) als Startpunkt, um ( x2 , y2 ) zu berechnen: Es ist x2 = x1 + h , y2 wird nun mit der gleichen Formel aus ( x1 , y1 ) berechnet wie vorher y1 aus ( x0 , y0 ) . Es ergibt sich aber ein wichtiger Unterschied zum ersten Schritt: Während im ersten Schritt der Eingangswert y0 als gegebener Anfangswert genau dem gesuchten y ( x0 ) entspricht, ist im zweiten und allen folgenden der Eingangswert y1 bzw. yk selbst bereits eine Näherung für y ( x1 ) bzw. y ( xk ) . Außer dem von h abhängigen lokalen Verfahrensfehler, den man bei Durchführung eines Schrittes macht, ist bei Einschrittverfahren der globale Verfahrensfehler zu berücksichtigen, der dadurch entsteht, dass ab dem zweiten Schritt auch die Eingangswerte nicht mehr exakt sind. Dieser ist um eine Fehlerordnung von h schlechter als der lokale Verfahrensfehler. Allen Verfahren liegt dabei die gleiche Idee zugrunde: Um eine Rechenvorschrift für den Schritt von x0 auf x1 zu erhalten, wird die Differentialgleichung über [ x0 , x1 ] integriert: x1
∫ x0
x1
y ′dx =
∫ x0
f ( x, y ( x )) d x ⇒
y ( x1 ) = y ( x0 ) +
x1
∫ f (x, y(x ))d x
(*)
x0
Um einen Näherungswert y1 für y ( x1 ) zu bestimmen, wird obiges Integral mit verschiedenen Methoden der numerischen Integration (vgl. Abschnitt 14.7) ausgewertet.
14.9 Numerische Lösung gewöhnlicher Differentialgleichungen
267
Das EULERsche Polygonzug-Verfahren
Berechnet man das Integral in (*) mit der Rechteck-Regel, ergibt sich das EULERsche Polygonzug-Verfahren: xk +1 = xk + h y k +1 = yk + h ⋅ f ( xk , yk ) Der lokale Verfahrensfehler (bei einem Schritt) ist deshalb von O(h2), der globale von O(h). Das Verfahren von HEUN
Wendet man auf das Integral in (*) die Sehnentrapez-Regel an, ergibt sich der zu berechnende Wert y1 auch auf der rechten Seite; man erhält eine implizite Gleichung, die näherungsweise durch eine Fixpunkt-Iteration gelöst wird. Der Iterationsfehler hat dabei bereits nach dem ersten Schritt die Größenordnung des Integrationsfehlers, deshalb werden beim HEUNschen Prädiktor-Korrektor-Verfahren in jedem Schritt höchstens zwei Iterationen durchgeführt. Der Startwert wird im EULERschen Polygonzug-Verfahren gewonnen (Prädiktor); die Iterationsformel heißt Korrektor. xk +1 = xk + h [0 ]
yk +1 = yk + h ⋅ f ( xk , yk ) [ν +1]
y k +1
= yk +
h h [ν ] ⋅ f ( xk , y k ) + ⋅ f ( xk +1 , yk +1 ) für ν = 0 (,1) 2 2
lokaler Verfahrensfehler: O(h3)
globaler Verfahrensfehler: O(h²)
Das RUNGE-KUTTA-Verfahren
Wendet man auf das Integral in (*) eine Modifikation der SIMPSON-Regel an, ergibt sich das klassische RUNGE-KUTTA-Verfahren: xk +1 = xk + h k1 = h ⋅ f (xk , yk ) h k k 2 = h ⋅ f xk + , y k + 1 2 2 h k k 3 = h ⋅ f xk + , y k + 2 2 2 k 4 = h ⋅ f ( x k + h, y k + k 3 ) y k +1 = yk +
1 6
(k1 + 2k2 + 2k3 + k 4 )
lokaler Verfahrensfehler: O(h5)
globaler Verfahrensfehler: O(h4)
268
14 Grundzüge der Numerik
Mehrschrittverfahren
Anders als bei Einschrittverfahren wird beim Schritt auf yk+1 nicht nur yk benutzt, sondern noch weitere s davor liegende Werte yk − s , yk − s +1 ,L, yk −1 . Dabei setzt man für i = k − s,L, k zur Abkürzung:
f i := f ( xi , yi ) .
Wie beim Einschrittverfahren wird wieder das Integral in (*) approximiert, und zwar folgendermaßen: ( x− s , f − s ), ( x− s +1 , f − s +1 ), L , ( x0 , f 0 ) sind s + 1 Stützstellen der Integrandenfunktion außerhalb des Integrationsbereiches. Das dadurch gegebene Interpolationspolynom vom Grade s wird auf den Integrationsbereich fortgesetzt und dort integriert. Man erhält mit k ∈ {0, 1,…, n} für s = 2:
y k +1 = yk +
h (23 f k − 16 f k −1 + 5 f k −2 ) 12
bzw. s = 3:
y k +1 = yk +
h (55 f k − 59 f k −1 + 37 f k −2 − 9 f k −3 ) 24
das (drei- bzw. vierschrittige) ADAMS-BASHFORTH-Verfahren. Bei fehlerfrei angenommenen Startwerten ergibt sich ein lokaler Verfahrensfehler O(h5). Bezieht man die – unbekannte – Stützstelle ( xk +1 , f k +1 ) in die Interpolation ein, so erhält man − analog zu 3. − ein implizites Verfahren, das ADAMS-MOULTON-Verfahren: Für s = 2:
h (23 f k − 16 f k −1 + 5 f k −2 ) 12 h y k +1 = yk + (9 f ( xk +1 , ykP+1 ) + 19 f k − 5 f k −1 + f k −2 ) 24 y kP+1 = yk +
(Prädiktor) (Korrektor)
bzw. für s = 3:
h (55 f k − 59 f k −1 + 37 f k −2 − 9 f k −3 ) (Prädiktor) 24 h (251 f ( xk +1 , ykP+1 ) + 646 f k − 264 f k −1 + 106 f k −2 − 19 f k −3 ) y k +1 = yk + 720
y kP+1 = yk +
(Korrektor) Wie bei den Einschrittverfahren ist auch hier die Ordnung des globalen Fehlers um eine Potenz schlechter – er ist also von vierter Ordnung wie beim RUNGE-KUTTA-Verfahren. Der Rechenaufwand, insbesondere die Anzahl der Funktionsauswertungen von f, ist bei Mehrschrittverfahren geringer. Allerdings braucht man zum Start eines Mehrschrittverfahrens neben dem gegebenen Anfangswert noch s weitere „ältere“ Werte. In der Praxis verschafft man sich dieses „Anfangs-
14.9 Numerische Lösung gewöhnlicher Differentialgleichungen
269
stück“, indem man ein Einschrittverfahren s-mal durchläuft und dann mit den insgesamt s + 1 Stützstellen ein Mehrschrittverfahren startet. Die Koeffizienten der obigen Korrektor-Formel für s = 3 deuten wegen ihrer Größe und den wechselnden Vorzeichen auf Probleme mit der numerischen Stabilität hin. Es erweist sich jedoch als ausreichend, den Prädiktor für s = 3 mit dem Korrektor für s = 2 zu kombinieren – auch hier ist der lokale Verfahrensfehler O(h5). Differentialgleichungssysteme erster Ordnung und Anfangswertprobleme höherer Ordnung
Ein Differentialgleichungssystem erster Ordnung mit Anfangsbedingung ist gemäß Abschnitt 9.7 gegeben durch y′ = F ( x, y ) mit y ( x0 ) = y ( 0) , wobei nun F und y vektorielle Größen sind, die den skalaren Größen f und y bei Differentialgleichungen erster Ordnung entsprechen. Da alle Formeln der hier behandelten Ein- und Mehrschrittverfahren linear in diesen Größen sind, lassen sich diese ohne Weiteres zur Lösung von Differentialgleichungssystemen mit Anfangsbedingungen benutzen, indem man die entsprechenden Größen als Vektoren auffasst. In Abschnitt 9.7 wurde bereits darauf hingewiesen, wie durch die Substitution y k = y ( k −1) jede Differentialgleichung n-ter Ordnung y ( n ) = f ( x, y, L , y ( n−1) ) in ein Differentialgleichungssystem y′ = F ( x, y ) erster Ordnung umgewandelt werden kann, welches sich dann wie oben beschrieben lösen lässt. Randwertaufgaben
Exemplarisch soll hier nur die numerische Lösung der Randwertaufgabe zweiter Ordnung y ′′ = f ( x, y, y′) mit y (a ) = y a und y (b) = yb behandelt werden, zum Einen, weil die meisten technisch relevanten Randwertaufgaben zweiter Ordnung sind, zum Anderen, weil die dabei zur Anwendung kommenden Verfahren leicht modifiziert1) auch für andere Randwertaufgaben benutzt werden können. Beim Schießverfahren wird die numerische Lösung des Randwertproblems durch eine Iteration von Lösungen verwandter Anfangswertprobleme bestimmt, genauer: Mit einem beliebigen geratenen Wert s wird die Anfangswertaufgabe y ′′ = f ( x, y, y′) mit y (a ) = y a und y ′(a ) = s
1)
Für Einzelheiten sei auf die weiterführende Spezialliteratur verwiesen.
270
14 Grundzüge der Numerik
mit einem der oben beschriebenen Verfahren gelöst. Die von s abhängige Lösung y s wird nur zufällig hinreichend genau die zweite Anfangsbedingung y s (b) = yb erfüllen – im Allgemeinen wird der Ausdruck A( s ) := y s (b) − yb ungleich 0 sein. Die Aufgabe, das richtige s* zu finden, für das y s* (b) = yb ist, das also die gesuchte Lösung y s* der Randwertaufgabe ergibt, ist also ein Nullstellenproblem für die Funktion A(s). Zu dessen Lösung kann im Prinzip jedes der im Abschnitt 14.2 beschriebenen Verfahren verwendet werden. Es bieten sich insbesondere Regula falsi und Bisektionsverfahren an, da hierfür keine Ableitung von A berechnet werden muss. Bei Verwendung des NEWTON-Verfahrens müsste diese numerisch mit den Methoden aus Abschnitt 14.8 bestimmt werden. Die Konvergenz der Nullstellenverfahren ist natürlich nur dann gegeben, wenn das Randwertproblem eindeutig lösbar ist, was ja nicht immer der Fall ist (vgl. hierzu auch Kapitel 9). Ist die Ordnung der Differentialgleichung größer als 2, muss bei Verwendung des Schießverfahrens nicht nur der Anfangswert für die erste, sondern auch für weitere Ableitungen an der Stelle a „geraten“ werden. Dementsprechend sind dann auch mehr Randbedingungen nicht erfüllt, sodass sich analog zu oben ein mehrdimensionales Nullstellenproblem für A(s) ergibt. Dieses wird meist mit dem NEWTON-RAPHSON-Verfahren gelöst. Beim Differenzenverfahren werden die in der Differentialgleichung vorkommenden Ableitungen durch Differenzenquotienten gemäß Abschnitt 14.8 ersetzt und die Näherungslösung an den Stellen xk = a + k ⋅ h bestimmt. Dies soll an der linearen Randwertaufgabe y ′′ = a0 ( x) y + a1 ( x) y ′ + r ( x) mit y (a ) = y a und y (b) = yb demonstriert werden: b−a und xk = a + k ⋅ h erhält man an den Stützstellen xk gemäß Abschnitt 14.8 n näherungsweise die Ableitungswerte
Mit h =
y ′( xk ) ≈
yk +1 − y k −1 y − 2 yk + yk −1 und y ′′( xk ) ≈ k +1 , 2h h2
die in die Differentialgleichung eingesetzt werden. Für k = 1, L , n − 1 ergeben sich nach Umstellen n – 1 Gleichungen folgender Art für die yk ≈ y ( xk ) : h h 2 2 − 1 − a1 ( x k ) y k −1 + 2 + h a 0 ( x k ) y k + − 1 + a1 ( x k ) y k +1 = − h r ( x k ) 2 2
(
)
Diese Gleichungen für die inneren Diskretisierungspunkte werden ergänzt durch die sich aus den Randbedingungen ergebenden Gleichungen y0 = ya und y n = yb , sodass man insgesamt zur Bestimmung der yk ein (n + 1, n + 1) -LGS der Gestalt M ⋅ y = b erhält mit
14.9 Numerische Lösung gewöhnlicher Differentialgleichungen
271
m00 = mnn = 1 , mkk = 2 + h 2 a0 ( xk ) , mk ,k −1 = −1 −
h h a1 ( xk ) , mk ,k +1 = −1 + a1 ( xk ) für k = 1, L , n − 1 , 2 2
mij = 0 sonst; b0 = ya , bn = yb , bk = −h 2 r ( xk ) für k = 1, L , n − 1 . (Man beachte die Indizierung von 0 bis n !) Die sich ergebende Tridiagonalmatrix ist für kleine h, also große n, fast singulär, sodass sich Nachkorrektur (siehe Abschnitt 14.3) empfiehlt. Ist die gegebene Differentialgleichung nicht linear in y und y ′ , so ergibt sich statt M ⋅ y = b ein nichtlineares Gleichungssystem für die yk, welches mit den Verfahren aus Abschnitt 14.2 iterativ gelöst wird. Bei Verwendung des NEWTON-RAPHSON-Verfahrens ist die JACOBIMatrix dann eine Tridiagonalmatrix.
15
Wahrscheinlichkeitsrechnung
15.1
Kombinatorische Grundlagen
Die Kombinatorik hat Anzahluntersuchungen bei Mengen sowie Zusammenstellungen und Auswahlen daraus zum Gegenstand. Es ist somit unmittelbar einleuchtend, dass sie in vielen Bereichen der Ingenieurmathematik eine Rolle spielt. In der Wahrscheinlichkeitsrechnung (Stochastik) ist sie jedoch –insbesondere bei diskreten Verteilungen – unverzichtbar, weshalb die wesentlichen Grundlagen der Kombinatorik an dieser Stelle behandelt werden. Permutationen
Gegeben sei eine (endliche) n-elementige Menge M (zum Beispiel M = {1,2, L , n}) . Eine Permutation von M ist eine Anordnung aller Elemente von M. Die Menge aller Permutationen von M heißt symmetrische Gruppe und wird mit S(M) oder einfach Sn bezeichnet. Für die Anzahl aller Permutationen von M, also die Elementzahl von Sn , gilt: P(n) = n! Sind nicht alle Elemente von M unterscheidbar, das heißt, ist M die disjunkte Vereinigung von k Teilmengen M1, …, Mk, deren ni Elemente jeweils nicht unterscheidbar sind, so gibt es
n n! = (mit n = n1 + K + nk ) n , K , n n ! K nk ! k 1 1 Möglichkeiten, diese anzuordnen. Modellvorstellung: In einer Urne befinden sich n = n1 + L + nk gleich große Kugeln, von denen jeweils ni die gleiche Farbe haben. Gesucht ist die Anzahl aller Möglichkeiten, diese so in einer Reihe anzuordnen, dass optisch andere Ergebnisse entstehen. n heißt Multinomialkoeffizient, er ist eine Verallgemeinerung des in Der Ausdruck n1 , L , nk Abschnitt 1.5 definierten Binomialkoeffizienten, denn
https://doi.org/10.1515/9783110537161-283
274
15 Wahrscheinlichkeitsrechnung n n n n! n! = = = = . n1 , n2 n1!n2 ! n1!(n − n1!) n1 n2
Kombinationen
Bei einer k-Kombination aus einer n-elementigen Menge M werden k Elemente entnommen, wobei es beim Ergebnis nicht auf die Reihenfolge der entnommenen Elemente ankommt. Dies kann ohne oder mit Wiederholung geschehen. Modellvorstellung: Aus einer Urne mit von 1 bis n durchnummerierten Kugeln werden k Kugeln gezogen, und zwar ohne bzw. mit Zurücklegen der jeweils gezogenen Kugel; es kommt beim Ergebnis nur auf die gezogenen Zahlen an. Dafür gibt es und
n K k (n) = k n + k − 1 K k′ (n) = k
Möglichkeiten
(ohne Wiederholung)
Möglichkeiten
(mit Wiederholung).
n Damit ist die Anzahl aller k-elementigen Teilmengen einer n-elementigen Menge. k Variationen
Kommt es bei der gleichen Situation wie oben zusätzlich auf die Anordnung im Ergebnis an, so spricht man von k-Variationen ohne und mit Wiederholung. Modellvorstellung: Aus einer Urne mit von 1 bis n durchnummerierten Kugeln werden k Kugeln nacheinander gezogen und das Ergebnis anschließend notiert, und zwar ohne bzw. mit Zurücklegen der jeweils gezogenen Kugel. Dafür gibt es und
Vk (n) =
n! (n − k )!
Vk′ (n) = n k
Damit ist nk die Anzahl von Mk.
Möglichkeiten
(ohne Wiederholung)
Möglichkeiten
(mit Wiederholung).
15.2 Ereignisse und Wahrscheinlichkeit
15.2
275
Ereignisse und Wahrscheinlichkeit
Ein Experiment, das nach vorher genau festgelegten Regeln durchgeführt wird und beliebig oft wiederholbar ist, dessen Ausgang wegen unbekannter oder nicht kontrollierbarer Faktoren aber nicht vorhersehbar ist, heißt Zufallsexperiment. Typische Beispiele sind das Werfen eines gleichmäßigen Würfels oder das Ziehen eines Loses aus einer Urne, aber auch das Messen einer (fehlerbehafteten) Messgröße oder der Stromverbrauch eines zufällig ausgewählten Kunden eines Energieversorgungsunternehmens. Das Ergebnis einer einmaligen Durchführung eines Zufallsexperiments heißt Elementarereignis, die Menge aller Elementarereignisse heißt Ergebnis- oder Stichprobenraum Ω des Zufallsexperiments. Ein Ereignis A ist eine Teilmenge von Ω, also ein Element der Potenzmenge von Ω. So ist beim Würfeln Ω = {1, 2, 3, 4, 5, 6}; die Teilmenge A = {2, 3, 5} stellt das Ereignis „Würfeln einer Primzahl“ dar. Definition:
Eine Teilmenge S der Potenzmenge von Ω heißt Ereignisraum, wenn sie eine σ-Algebra bildet, das heißt, wenn 1. S ≠ ∅ ist, 2. für alle A ∈ S auch A = Ω \ A ∈ S ist, ∞
3. für jeweils abzählbar viele Ai ∈ S auch
UA ∈S i
ist.
i =0
Ist Ω höchstens abzählbar (insbesondere endlich), so wird die Potenzmenge selbst als Ereignisraum genommen. Die in Abschnitt 1.1 eingeführten Mengenoperationen werden im Zusammenhang mit einem Ereignisraum S anders ausgedrückt: Definition:
Für zwei Ereignisse A und B eines Ereignisraums S sagt man: (i)
A ∩ B ist eingetreten
⇔
A und B sind eingetreten;
(ii)
A ∪ B ist eingetreten
⇔
A oder B ist eingetreten;
(iii)
A ist eingetreten
⇔
A ist nicht eingetreten.
(iv)
A und B heißen unvereinbar
⇔
A∩ B = ∅ .
(v)
∅ heißt unmögliches, Ω sicheres Ereignis.
276
15 Wahrscheinlichkeitsrechnung
Da Ereignisse als Teilmengen des Ergebnisraums Ω aufgefasst werden können, gelten natürlich die in Abschnitt 1.1 formulierten Regeln für Mengenoperationen sinngemäß. Tritt ein Ereignis A bei n-facher Ausführung eines Zufallsexperiments k-mal ein, so hat es k die relative Häufigkeit h( A) = . n Offensichtlich ist stets 0 ≤ h( A) ≤ 1 sowie h(∅) = 0 und h(Ω ) = 1. Wird nun n sehr groß, so stellt man bei mehrfacher Wiederholung dieser Versuchsreihe fest, dass sich (annähernd) immer der gleiche Wert für die relative Häufigkeit von A einstellt – man könnte (empirisch) einen Wert p = lim h( A) als Wahrscheinlichkeit des Ereignisses A n →∞
bezeichnen. Für eine exakte Definition der Wahrscheinlichkeit benutzt man die KOLMOGOROFF-Axiome:
Es sei S ein Ereignisraum. Eine Funktion p : S → r heißt Wahrscheinlichkeitsmaß, wenn 1. 0 ≤ p( A) ≤ 1 für alle A ∈ S, 2. p(Ω) = 1 und ∞ ∞ 3. p Ai = p( Ai ) für abzählbar viele paarweise unvereinbare Ereignisse Ai i =0 i =0
∑
U
gilt. Das Tripel (Ω , S, p) heißt Wahrscheinlichkeitsraum. Hieraus folgt unmittelbar: (i)
A⊆ B ⇒
(ii)
p(∅) = 0 (aber nicht: p( A) = 0 ⇒
(iii) (iv) (v)
p( A ) = 1 − p( A) p( A ∪ B) = p( A) + p ( B) − p ( A ∩ B ) (Additionssatz) p( A ∪ B ∪ C ) = p ( A) + p( B) + p(C ) − p( A ∩ B) − p( A ∩ C ) − p( B ∩ C ) + p( A ∩ B ∩ C )
p( A) ≤ p( B) A = ∅ !)
Aus diesen Axiomen lässt sich für einen endlichen (!) Stichprobenraum Ω der Satz von LAPLACE folgern: Haben alle Elementarereignisse aus Ω die gleiche Wahrscheinlichkeit, so gilt für A ∈ S: p( A) =
Anzahl der für A günstigen Elementarereignisse Anzahl aller Elementarereignisse
15.2 Ereignisse und Wahrscheinlichkeit
277
Unter Benutzung der in Abschnitt 15.1 aufgeführten Formeln aus der Kombinatorik lässt sich damit häufig die Wahrscheinlichkeit eines Ereignisses A bestimmen. Der Quotient aus dem Satz von LAPLACE wird auch als Definition der klassischen Wahrscheinlichkeit bezeichnet. Es sei aber ausdrücklich nochmals darauf hingewiesen, dass dies nur bei endlichem Stichprobenraum und nur bei gleichwahrscheinlichen Elementarereignissen möglich ist! Definition:
Für A, B ∈ S mit p( A) ≠ 0 definiert man die bedingte Wahrscheinlichkeit „B unter der p ( A ∩ B) Bedingung A“ durch p ( B | A) = . p ( A) p ( B | A) gibt also die Wahrscheinlichkeit für das Eintreten von B unter der Bedingung an, dass A bereits eingetreten ist. Durch Ausmultiplizieren dieser und der analogen Beziehung für p ( A | B) erhält man den Multiplikationssatz:
p ( A ∩ B) = p ( B | A) ⋅ p( A) = p ( A | B ) ⋅ p( B) Ist A1 , A2 ,L, An eine Ereignisbasis von S, das heißt, ist Ω die disjunkte Vereinigung der Ai, so gilt mit beliebigem B ∈ S der Satz von BAYES:
p ( Ak | B ) =
p ( Ak ) ⋅ p ( B | Ak ) n
∑ p ( A ) ⋅ p (B | A ) i
i
i =1 n
Dabei ist
∑ p ( A ) ⋅ p (B | A ) = p (B) (totale Wahrscheinlichkeit). i
i
i =1
Definition:
(i)
Zwei Ereignisse A und B heißen (stochastisch) unabhängig genau dann, wenn p ( A ∩ B) = p ( A) ⋅ p( B) ist.
(ii)
Die Ereignisse A1 , A2 ,L, An heißen (stochastisch) unabhängig genau dann, wenn p ( Ai1 ∩ L ∩ Aik ) = p ( Ai1 ) ⋅ K ⋅ p ( Aik ) für jede beliebige Auswahl von 2 bis n Ereignissen aus A1 , A2 ,L, An ist.
Es sei ausdrücklich darauf hingewiesen, dass die in (ii) definierte Unabhängigkeit von mehr als zwei Ereignissen mehr ist als nur die paarweise Unabhängigkeit von jeweils zwei Ereignissen aus A1 , A2 ,L, An . Sind zwei Ereignisse A und B unabhängig, so gilt dies auch für A und B , A und B sowie A und B .
278
15 Wahrscheinlichkeitsrechnung
15.3
Zufallsvariable und Verteilung
Häufig ist das Ergebnis eines Zufallsexperiments eine Zahl (zum Beispiel Augenzahl beim Würfeln) oder es kann ihm eine Zahl zugeordnet werden (etwa Wert einer zufällig gezogenen Spielkarte). Ein solcher Zahlenwert heißt Zufallsgröße oder Zufallsvariable, genauer: Definition:
Gegeben sei ein Wahrscheinlichkeitsraum (Ω , S, p). Eine Funktion X : Ω → r heißt Zufallsvariable (oder stochastische Variable), wenn für jedes a ∈ R und jedes Intervall I ⊆ R die Urbilder X −1 ({a}) und X −1 ( I ) zu S gehören, anders formuliert: Die Wahrscheinlichkeit dafür, dass die Zufallsgröße X den Wert a oder Werte im Intervall I annimmt, lässt sich bestimmen, und die KOLMOGOROFF-Axiome gelten für p. Übliche Schreibweisen:
p( X = a) := p( X −1 ({a}))
Wahrscheinlichkeit, dass X den Wert a annimmt
p( X ∈ I ) := p( X −1 ( I ))
Wahrscheinlichkeit, dass X in das Intervall I fällt
Ist etwa I = [a, b [ , so schreibt man p (a ≤ X < b) statt p( X ∈ I ) o.Ä. Definition:
Die für eine Zufallsvariable X durch F ( x) := p ( X ≤ x) definierte Funktion F : r → [0,1] heißt Verteilungsfunktion der Zufallsvariablen X. Eigenschaften der Verteilungsfunktion:
1. lim F ( x) = 0 und lim F ( x) = 1 ; x →−∞
x →+∞
2. F ist monoton wachsend (im Allgemeinen aber nicht streng monoton wachsend); 3. F ist rechtsseitig stetig und hat höchstens abzählbar viele Sprungstellen; 4. p ( x1 < X ≤ x2 ) = F ( x2 ) − F ( x1 ) für alle x1, x2 ∈ R mit x1 ≤ x2 ; 5. p ( X = x) = F ( x) − lim F (t ) für alle x ∈ R. t→x−
15.3 Zufallsvariable und Verteilung
279
Definition:
Eine Zufallsvariable X heißt diskret (synonym: hat eine diskrete Verteilung) genau dann, wenn 1. p ( X = xi ) = pi > 0 für höchstens abzählbar viele xi ∈ R gilt, 2. in jedem beschränkten Intervall von R höchstens endlich viele solcher xi liegen, 3. p (a < X ≤ b) = 0 ist, falls ]a, b] kein solches xi enthält. Die Funktion f : r → [0,1] , definiert durch p f ( x) = i 0
für x = xi , sonst
heißt Wahrscheinlichkeitsfunktion der (diskreten) Zufallsvariablen X. Für die Verteilungsfunktion F einer diskreten Zufallsvariablen gilt: F ( x) =
∑ f (x ) = ∑ p i
i
xi ≤ x
xi ≤ x
F ist also eine sogenannte Treppenfunktion, deren „Stufen“ an den Stellen xi jeweils die positive Sprunghöhe pi haben (siehe Bild 15.3.1).
Bild 15.3.1: Die Verteilungsfunktion einer diskreten Zufallsvariablen
Wegen der KOLMOGOROFF-Axiome muss
∑ f (x ) = ∑ p i
i
i
= 1 sein.
i
Es ist zu beachten, dass diese Summe bei unendlicher Indexmenge eine konvergente Reihe ist, damit eine diskrete Verteilung vorliegt.
280
15 Wahrscheinlichkeitsrechnung
Definition:
Eine Zufallsvariable X heißt stetig (synonym: hat eine stetige Verteilung) genau dann, wenn es eine nichtnegative reellwertige Funktion f gibt derart, dass x
∫ f (t ) dt
F ( x) =
−∞
ist (siehe Bild 15.3.2). f heißt Dichte(funktion) oder Wahrscheinlichkeitsdichte der (stetigen) Zufallsvariablen X. Sie ist also die Ableitung der Verteilungsfunktion F. ∞
Damit f (t ) Dichtefunktion einer stetigen Verteilung ist, muss
∫ f (t ) dt = 1 sein. −∞
Bild 15.3.2: Dichte und Verteilungsfunktion einer stetigen Zufallsvariablen
Ferner gilt für beliebige x1, x2 ∈ R mit x1 ≤ x2: p ( x1 < X ≤ x2 ) = p ( x1 ≤ X < x2 ) = p ( x1 < X < x2 ) = p ( x1 ≤ X ≤ x2 ) x2
= F ( x2 ) − F ( x1 ) =
∫ f (t ) d t x1
Daraus folgt, dass für jedes x ∈ R p ( X = x) = 0 ist, ohne dass das Ereignis X = x unmöglich ist! (Im Gegensatz dazu gilt jedoch nach Abschnitt 15.2: A unmöglich ⇒ p ( A) = 0 ). Außerdem gilt für kleine ∆x :
p ( x ≤ X ≤ x + ∆x) ≈ ∆x ⋅ f ( x)
Es gibt viele Parallelen zwischen der Wahrscheinlichkeitsfunktion einer diskreten und der Dichtefunktion einer stetigen Zufallsvariablen (siehe auch Abschnitt 15.4), jedoch unterscheiden sie sich hinsichtlich der Bedeutung von f (x) für festes x ∈ R: Während bei einer diskreten Zufallsvariablen dieser Wert die Wahrscheinlichkeit dafür angibt, mit der X genau den Wert x annimmt, ist er bei stetigen Zufallsvariablen ein Näherungswert für die Wahrscheinlichkeit, mit der X in ein kleines Intervall bei x fällt, bezogen auf dessen Intervallgröße. Man kann sich vorstellen, dass die Werte einer diskreten Zufallsvariablen durch Zählung, die einer stetigen durch – fehlerbehaftete – Messung ermittelt werden.
15.4 Maßzahlen einer Verteilung
15.4
281
Maßzahlen einer Verteilung
Durch die Verteilungsfunktion F (x) oder die Wahrscheinlichkeitsfunktion bzw. Dichtefunktion f (x) ist die Wahrscheinlichkeitsverteilung einer diskreten bzw. stetigen Zufallsvariablen X vollständig gegeben. Wie man die eine aus der anderen erhält, wurde im vorigen Abschnitt ausgeführt. Oft ist es hilfreich und ausreichend, wesentliche Merkmale einer Verteilung im Ganzen durch gewisse „summarische Größen“, sogenannte Maßzahlen, auszudrücken, ohne auf die Einzelwerte der Verteilung einzugehen. Definition:
Für eine Zufallsvariable X mit Wahrscheinlichkeits- bzw. Dichtefunktion f (x) definiert man ihren Mittelwert oder Erwartungswert, mit µ oder mit E(X) bezeichnet, a) im diskreten Fall durch
∑ x f (x ) ;
µ = E( X ) =
i
i
i ∞
∫
b) im stetigen Fall durch
µ = E( X ) = x f ( x) d x . -∞
Es ist zu beachten, dass der Mittelwert einer Verteilung nicht unbedingt existiert, denn nur dann, wenn bei einer diskreten Verteilung nur endlich viele Werte mit positiver Wahrscheinlichkeit angenommen werden oder bei einer stetigen Verteilung die Dichtefunktion nur auf einem beschränkten Intervall positiv ist, existieren Summe bzw. Integral, ohne dass dies durch eine zusätzliche Konvergenzuntersuchung verifiziert werden muss. So besitzt etwa die diskret verteilte Zufallsvariable mit der Wahrscheinlichkeitsfunktion 1 f ( x) = x( x + 1) 0
für x = 1, 2, 3, L
sonst
keinen Mittelwert, da die harmonische Reihe nicht konvergent ist. Gleiches gilt für die CAUCHY-Verteilung, deren Dichtefunktion durch f ( x) = gegeben ist.
1 π (1 + x 2 )
282
15 Wahrscheinlichkeitsrechnung
Definition:
Für eine Zufallsvariable X mit Wahrscheinlichkeits- bzw. Dichtefunktion f (x) sowie eine Funktion g:R→R ist durch Z: = g(X) eine Zufallsvariable definiert. Deren Mittelwert/Erwartungswert heißt mathematischer Erwartungswert der Funktion g(X) (kurz: Erwartung von g(X)) und wird mit E(g(X)) bezeichnet; dieser wird also berechnet a) im diskreten Fall durch:
E( g ( X )) =
∑ g(x ) f (x ) ; i
i
i ∞
b) im stetigen Fall durch:
E ( g ( X )) =
∫ g ( x) f ( x ) d x . -∞
Wie der Mittelwert muss auch E(g(X)) nicht für jede Verteilung bzw. jede Funktion g(x) existieren. Rechenregeln für Erwartungswerte:
Für beliebige Zufallsvariable X und Y und c, d ∈ R gilt: (i)
E (c ) = c ,
(ii)
E (cX + dY ) = c ⋅ E( X ) + d ⋅ E (Y ) ,
(iii)
E ( X ⋅ Y ) = E( X ) ⋅ E(Y ) , falls X und Y unabhängig sind.1)
Mit g ( x ) = x r (für r ∈ N+) erhält man die Definition:
Für eine Zufallsvariable X heißt E ( X r ) das r-te Moment der Verteilung (bzw. der Zufallsvariablen X). Falls µ = E ( X ) existiert, heißt E (( X − µ ) r ) das r-te zentrale Moment der Verteilung. Das zweite zentrale Moment einer Verteilung, welches im Falle der Existenz stets ≥ 0 ist, heißt Varianz von X und wird mit Var (X) oder mit σ 2 bezeichnet.
σ = Var ( X ) heißt Standardabweichung der Verteilung. Existiert Var (X), so heißt
1)
1 E (( X − µ ) 3 ) die Schiefe der Verteilung. σ3
Zur Definition der Unabhängigkeit siehe Abschnitt 15.7
15.4 Maßzahlen einer Verteilung
283
σ2 =
Die Varianz ist also definiert durch
∑(x
i
− µ ) 2 f ( xi ) im diskreten
i ∞
bzw.
∫
σ 2 = ( x − µ ) 2 f ( x) d x im stetigen Fall. -∞
Es sei noch einmal ausdrücklich darauf hingewiesen, dass es aufgrund der Definition Verteilungen gibt, die keine Varianz besitzen, sogar dann, wenn sie einen Mittelwert haben. Mit den Rechenregeln für Erwartungswerte erhält man die folgenden Rechenregeln für die Varianz:
Für beliebige Zufallsvariable X und Y und c ∈ R gilt: (i)
Var ( X ) = E( X 2 ) − (E ( X )) 2
(ii)
Var ( X ) = 0 ⇔
(iii)
Var (cX ) = c 2 Var ( X )
(iv)
Var ( X + Y ) = Var ( X ) + Var (Y ) , falls X1 und X2 unabhängig sind 1)
X = const
Aus einer Zufallsvariablen X mit Mittelwert µ und Standardabweichung σ > 0 erhält man X −µ die zu X gehörige Zufallsvariable in Standardform; sie hat den Mittelwert durch Z := σ 0 und die Standardabweichung 1. Einen Zusammenhang zwischen Mittelwert und Varianz einer beliebigen Verteilung X beschreibt die TSCHEBYSCHEFFsche Ungleichung:
Für beliebiges c ∈ R+ ist insbesondere gilt mit k ∈ N+ und c = k ⋅ σ :
σ2 , c2 1 p(| X − µ | ≥ k ⋅ σ ) ≤ 2 . k
p(| X − µ | ≥ c) ≤
Definition:
Für α ∈] 0,1[ heißt ξα := min{ x ∈ r | F ( x) ≥ α } das α - Quantil der Verteilung. Das 0.5-Quantil heißt Median, Zentralwert oder 50% -Wert der Verteilung.
1)
Zur Definition der Unabhängigkeit siehe Abschnitt 15.7
284
15 Wahrscheinlichkeitsrechnung
Für eine diskrete Zufallsvariable ist also ξα die „linke Ecke“ derjenigen „niedrigsten Stufe“ der die Verteilungsfunktion darstellenden Treppenfunktion (siehe Bild 15.3.1), deren Höhe ≥ α ist. ξα
Für eine stetige Zufallsvariable ist ξα eindeutig durch α =
∫ f ( x) dx gegeben.
−∞
15.5
Spezielle diskrete Verteilungen
In diesem Abschnitt werden besonders häufig vorkommende diskrete Verteilungen behandelt. Dabei nimmt die Zufallsvariable X höchstens abzählbar viele Werte xi mit positiver Wahrscheinlichkeit an. Die Verteilung von X ist also vollständig durch die Angabe der Wahrscheinlichkeitsfunktion f : R → R gegeben, für die gemäß Abschnitt 15.3 gilt: p = p( X = xi ) f ( x) = i 0
für x = xi sonst
Der Einfachheit halber wird im Folgenden die Wahrscheinlichkeitsfunktion f (x) nur für diejenigen x angegeben, für die f (x) positiv sein kann. Die Verteilungsfunktion F(x) erhält man gemäß F ( x) = f ( xi ) = pi ; die Summe ist stets endlich.
∑
∑
xi ≤ x
xi ≤ x
Abschnitt
15.3
mittels
Diskreten Verteilungen liegt häufig ein sogenanntes BERNOULLI-Experiment zugrunde. Dies ist ein Zufallsexperiment, das nur die beiden Ausgänge „Erfolg“ und „Misserfolg“ haben kann, die mit Wahrscheinlichkeit p ∈ [0,1] („Erfolgswahrscheinlichkeit“) und q = 1 − p („Misserfolgswahrscheinlichkeit“) eintreten. 1. Gleichverteilung
Eine Zufallsvariable X heißt gleichverteilt auf {x1, x2, …, xn} ⊆ R , wenn jeder dieser n Werte mit gleicher Wahrscheinlichkeit 1n angenommen wird. Es ist also
f ( xi ) =
1 n
für alle i = 1, …, n.
Damit erhält man für den Mittelwert und die Varianz
µ = E( X ) =
1 n
n
∑x
1 σ = Var ( X ) = n 2
(arithmetisches Mittel)
i
i =1
n
∑ i =1
1 xi − n 2
n
∑ i =1
2
xi .
15.5 Spezielle diskrete Verteilungen
285
Anwendungsbeispiel: Mit einem gleichmäßigen Würfel werde einmal gewürfelt. Die Zufallsvariable X ist die dabei erzielte Augenzahl aus {1, 2, …, 6}, die jede mit Wahrscheinlichkeit 16 angenommen wird. 2. Binomialverteilung
Ein BERNOULLI-Experiment mit Erfolgswahrscheinlichkeit p werde n-mal ausgeführt. Die Zufallsvariable X gebe die Anzahl k der Erfolge an. X kann nur die Werte {0, 1, …, n} mit positiver Wahrscheinlichkeit annehmen. Für k ∈ {0, 1, …, n} ist f (x) gegeben durch: n f (k ) = p( X = k ) = ⋅ p k ⋅ (1 − p ) n−k k
X heißt binomialverteilt mit Parametern n ∈ N und p ∈ [0,1], kurz X ∼ Bi(n, p). Aus f (x) erhält man für den Mittelwert und für die Varianz
µ = E( X ) = n ⋅ p σ 2 = Var ( X ) = n ⋅ p ⋅ (1 − p) .
Anwendungsbeispiel: Aus einer Urne mit N Kugeln, von denen M „Gewinn“ bedeuten, werde n-mal gezogen und nach jedem Zug die gezogene Kugel zurückgelegt, sodass die M Erfolgswahrscheinlichkeit stets p = ist. Bezeichnet X die Anzahl der gezogenen „GeN winne“ in n Zügen, so ist X ∼ Bi(n, p). 3. Hypergeometrische Verteilung
Zieht man aus der unter 2. beschriebenen Urne n Kugeln ohne Zurücklegen, so ist dies keine n-fache Wiederholung des gleichen BERNOULLI-Experiments, da sich in jedem Zug je nach Anzahl der bereits gezogenen „Gewinne“ die Erfolgswahrscheinlichkeit p ändert. Die Zufallsvariable X, die die Anzahl k der „Gewinne“ in n Zügen angibt, ist also nicht binomialverteilt, sondern hypergeometrisch mit den Parametern N, M und n, kurz X ∼ H(N, M, n). Für k ∈ {0, 1, …, n} ist f (x) gegeben durch: M N − M ⋅ k n − k f (k ) = p( X = k ) = N n
Man beachte, dass es bei der hypergeometrischen Verteilung für k ∈ {0, 1, …, n} Fälle geben kann, die aufgrund der speziellen Wahl der Parameter N, M und n unmöglich sind: So ist zum Beispiel p( X = 0) gleich 0, wenn n größer als die Anzahl N − M der „Nieten“ ist. Man mache sich klar, dass solche Sonderfälle aufgrund der Eigenschaften des Binomialkoeffizienten in obiger Beschreibung von f (k ) bereits enthalten sind.
286
15 Wahrscheinlichkeitsrechnung
Aus f (x) erhält man für den Mittelwert und für die Varianz
µ = E( X ) = n ⋅
M N
σ 2 = Var ( X ) = n ⋅
M M N −n ⋅ 1 − ⋅ . N N N −1
M (das ist hier die ErfolgswahrscheinN lichkeit nur vor dem ersten Zug!), so ergibt sich der gleiche Mittelwert wie bei Bi(n, p). Zieht man nur wenige Male aus einer sehr großen Grundgesamtheit, ist also n 0 den durch ganzzahlige Rundung entstandenen Wert t . Der wahre Wert t kann als auf [ t − 0,5, t + 0,5[ gleichverteilte Zufallsvariable angesehen werden. 2. WEIBULL- und Exponentialverteilung, Lebensdauerverteilungen
Eine Zufallsvariable X heißt WEIBULL-verteilt mit den Parametern λ , β ∈ R+, wenn für die Dichtefunktion f gilt: 0 f ( x) = β β −1 λβ ⋅ (λx) ⋅ e −( λx )
für x < 0 für x ≥ 0
1 ⋅ Γ + 1 λ β 1 1 2 und für die Varianz σ 2 = Var ( X ) = 2 ⋅ Γ + 1 − Γ 2 + 1 . λ β β Dabei bezeichnet Γ(x) die in Abschnitt 5.4 definierte Gammafunktion.
Daraus ergibt sich für den Mittelwert
µ = E( X ) =
1
Für β = 1 ergibt sich als wichtiger Spezialfall die Exponentialverteilung mit Parameter λ mit der Dichtefunktion 0 für x < 0 f ( x) = . − λx für x ≥ 0 λ ⋅ e Deren Mittelwert ist µ = E ( X ) =
1
λ
, deren Varianz σ 2 = Var ( X ) =
1
λ2
.
WEIBULL- und Exponentialverteilung gehören zu den sogenannten Lebensdauerverteilungen. Die stetige Zufallsvariable X beschreibt dabei die Lebensdauer eines technischen Gerätes, eines Prozesses oder eines Menschen, ihre Verteilungsfunktion F(x) gibt also die Wahrscheinlichkeit dafür an, bis zum Zeitpunkt x „ausgefallen“ zu sein. Komplementär dazu ist die Intaktwahrscheinlichkeit R( x) = 1 − F ( x) , mit der die Wahrscheinlichkeit berechnet wird, dass das beobachtete Objekt zum Zeitpunkt x noch „intakt“ ist. Der Alterungsprozess wird dabei durch die sogenannte Ausfallrate 1 r (t ) = lim p (t < X ≤ t + ∆ t | X > t ) ∆ t →0+ ∆ t beschrieben, die häufig empirisch ermittelt werden kann. Damit erhält man die Verteilungsfunktion der die Lebensdauer beschreibenden Zufallsvariablen X durch
15.6 Spezielle stetige Verteilungen
289
0 x F ( x) = −∫ r (t ) d t 1 − e 0
für x < 0 . für x ≥ 0
Die Dichtefunktion ergibt sich daraus durch Differentiation nach x. Ist r(t) konstant vom Werte λ, so ergibt sich die Exponentialverteilung mit Parameter λ, aus r (t ) = β ⋅ λβ ⋅ t β −1 ergibt sich die WEIBULL-Verteilung mit den Parametern λ und β. Dieser Ansatz wird häufig zur Berechnung von Versicherungsprämien bei Lebensversicherungen benutzt; die Parameter λ und β werden dabei aus statistischen Aufzeichnungen, sogenannten Sterbetafeln, ermittelt. 3. Normalverteilung
Eine Zufallsvariable X heißt normalverteilt mit den Parametern µ ∈ R und σ ∈ R+ (kurz: X ∼ N(µ, σ2)), wenn für alle x ∈ R die Dichtefunktion f gegeben ist durch: f ( x) = ∞
Unter Benutzung von
∫e
−x2
1
σ 2π
⋅e
−
( x − µ )2 2σ 2
d x = π (siehe Abschnitt 8.6) ergeben sich Mittelwert und
−∞
Varianz tatsächlich zu E(X) = µ bzw. Var (X) = σ2, was obige Parameterbezeichnung sinnvoll erscheinen lässt.
Bild 15.6.1: Dichte der Normalverteilung mit verschiedenen Varianzen (σ1 < σ2)
Die Normalverteilung wird auch als GAUSS-Verteilung bezeichnet, der Graph ihrer Dichtefunktion ist die GAUSSsche Glockenkurve (siehe Bild 15.6.1).
290
15 Wahrscheinlichkeitsrechnung
Die zu X ∼ N(µ, σ2) gehörige Zufallsvariable in Standardform Z =
X −µ
σ
ist ebenfalls nor-
malverteilt, es ist also Z ∼ N(0,1). Ihre Verteilung heißt Standardnormalverteilung; Dichtebzw. Verteilungsfunktion werden üblicherweise mit ϕ (x) bzw. Φ(x) bezeichnet. Die Werte von Φ(x) sind im Anhang tabelliert. x −µ x −µ p( x1 < X ≤ x2 ) = Φ 2 − Φ 1 . σ σ
Für X ∼ N(µ, σ2) und x1, x2 ∈ R mit x1 < x2 ist
Nach dem Grenzwertsatz von DE MOIVRE-LAPLACE lässt sich die Binomialverteilung durch eine Normalverteilung approximieren, genauer: Die Wahrscheinlichkeitsfunktion f von X ∼ Bi(n, p) kann näherungsweise durch f * ( x) =
1 2π np(1 − p)
e
−
( x − np ) 2 2 np (1− p )
also die Dichtefunktion einer mit den Parametern µ = np und σ 2 = np(1 − p ) normalverteilten Zufallsvariablen dargestellt werden. Für k1, k2 ∈ {0, …, n} gilt darüber hinaus: k2 k + 0,5 − np k − 0,5 − np n p(k1 ≤ X ≤ k2 ) = ∑ p k (1 − p )n − k ≈ Φ 2 − Φ 1 k = k1 k np(1 − p) np(1 − p)
Man beachte die sogenannte „Stetigkeitskorrektur“ ±0,5 im Argument von Φ . Für die Anwendbarkeit dieser Approximationen gilt die Faustregel: Für np(1 – p) > 9 kann Bi(n, p) gut durch N(np, np(1 – p)) angenähert werden. Mithilfe der letzten Approximationsformel erhält man das Gesetz der großen Zahlen:
Ein BERNOULLI-Experiment mit Erfolgswahrscheinlichkeit p0 werde n-mal wiederholt. X bezeichne die Anzahl der Erfolge. Dann gilt für jedes beliebige ε ∈ R+: X lim p − p0 < ε = 1 n
n →∞
15.7 Mehrdimensionale Verteilungen
291
4. Logarithmische Normalverteilung
Eine Zufallsvariable X heißt logarithmisch normalverteilt mit den Parametern µ* ∈ R und σ* ∈ R+, falls für ihre Dichtefunktion f gilt: 0 (ln x − µ * ) 2 − f ( x) = 1 *2 e 2σ * ⋅ x 2 σ π Daraus ergibt sich für den Mittelwert und für die Varianz
µ = E( X ) = e µ
für x ≤ 0 für x > 0 *
+ 0.5σ *2
σ 2 = Var ( X ) = e 2 µ
*
+σ *2
*2
(eσ − 1) .
Ist X logarithmisch normalverteilt mit den Parametern µ* und σ*, so ist ln X ∼ N(µ*, σ*2). Die logarithmische Normalverteilung ist ebenfalls eine Lebensdauerverteilung.
15.7
Mehrdimensionale Verteilungen
Werden bei einem Zufallsexperiment mehrere Größen gleichzeitig betrachtet (zum Beispiel Gewicht und Körpergröße einer zufällig ausgewählten Person), so reicht eine (eindimensionale) Zufallsvariable zur Beschreibung nicht mehr aus. Das Ergebnis des Zufallsexperiments wird durch einen sogenannten Zufallsvektor beschrieben, der so viele Komponenten hat, wie Merkmale beobachtet werden. Man spricht von mehrdimensionalen Verteilungen. Diese spielen auch bei der Begründung der im nächsten Kapitel behandelten Schätz- und Testverfahren eine wichtige Rolle. Der Einfachheit halber werden hier zunächst zweidimensionale Verteilungen betrachtet, die Verallgemeinerung auf größere n fällt nicht schwer. Eine zweidimensionale Zufallsvariable ist durch ihre Verteilungsfunktion F:R2→R gegeben, wobei diese – analog zum eindimensionalen Fall – durch F ( x, y ) = p ( X ≤ x, Y ≤ y ) gegeben ist (das Komma auf der rechten Seite bedeutet inhaltlich „und“). Damit erhält man: p (a1 < X ≤ b1 , a2 < Y ≤ b2 ) = F (b1 , b2 ) − F (a1 , b2 ) − F (b1 , a2 ) + F (a1 , a2 )
292
15 Wahrscheinlichkeitsrechnung
Definition:
(i) Eine zweidimensionale Zufallsvariable heißt diskret, wenn sie in jedem beschränkten Gebiet des R2 höchstens abzählbar viele Werte (xi, yj) mit positiver Wahrscheinlichkeit pij annehmen kann. Für die Wahrscheinlichkeitsfunktion f :R2→R gilt also p f ( x, y ) = ij 0
für ( x, y ) = ( xi , y j ) . sonst
Daraus ergibt sich die Verteilungsfunktion F:R2→R zu F ( x, y ) =
∑ ∑ f (x , y ) . i
j
xi ≤ x y j ≤ y
(ii) Eine zweidimensionale Zufallsvariable heißt stetig, wenn sich ihre Verteilungsfunktion F:R2→R durch ein Doppelintegral der Form y x
F ( x, y ) =
∫ ∫ f ( s , t ) d sd t −∞ − ∞
ausdrücken lässt. Die nichtnegative Funktion f heißt Dichte(funktion) oder Wahrscheinlichkeitsdichte der Verteilung. Wie im eindimensionalen Fall muss für Wahrscheinlichkeits- bzw. Dichtefunktion gelten:
∑∑ i
∞ ∞
f ( xi , y j ) = 1
∫ ∫ f ( x, y) d xd y = 1
bzw.
j
− ∞− ∞
Jeder zweidimensionalen Zufallsvariablen (X, Y) lassen sich zwei eindimensionale Verteilungen, die sogenannten Randverteilungen, dadurch zuordnen, dass man sich nur für die Verteilung jeweils einer Komponente von (X, Y) interessiert. Man definiert F1 ( x) := p( X ≤ x, Y beliebig)
und
F2 ( y ) := p( X beliebig, Y ≤ y )
als Verteilungsfunktionen der Randverteilungen. Aus F ( x, y ) und f ( x, y ) der zweidimensionalen Verteilung erhält man somit (i) im diskreten Fall:
f1 ( x) =
∑ f ( x, y )
bzw.
f 2 ( y) =
∑ f ( x, y) x
y
für die Wahrscheinlichkeitsfunktionen sowie F1 ( x ) =
∑ f (x ) 1
xi ≤ x
i
bzw.
F2 ( y ) =
∑ f (y ) 2
yj≤y
für die Verteilungsfunktionen der Randverteilungen;
j
15.7 Mehrdimensionale Verteilungen
293
∞
(ii) im stetigen Fall:
f1 ( x) =
∫
∞
f ( x, y ) d y
bzw.
f 2 ( y) =
−∞
∫ f ( x, y ) d x −∞
für die Dichtefunktionen sowie y
x
F1 ( x) =
∫
f1 ( s ) d s
bzw.
F2 ( y ) =
−∞
∫ f (t ) dt 2
−∞
für die Verteilungsfunktionen der Randverteilungen.
Definition:
Die beiden Zufallsvariablen X und Y einer zweidimensionalen Verteilung mit Verteilungsfunktion F ( x, y ) heißen unabhängig genau dann, wenn F ( x, y ) = F1 ( x) ⋅ F2 ( y ) gilt. Dabei bezeichnen F1 und F2 die Randverteilungen von (X,Y). Äquivalent dazu sind die beiden folgenden Aussagen:
(i) Für Wahrscheinlichkeits- bzw. Dichtefunktionen gilt:
f ( x, y ) = f1 ( x) ⋅ f 2 ( y )
(ii) Für beliebige Paare (a1,b1) und (a2,b2) aus R² sind die Ereignisse „X nimmt einen Wert in ]a1,b1] an“ und „Y nimmt einen Wert in ]a2,b2] an“ unabhängig im Sinne der Definition in Abschnitt 15.2. Durch Verallgemeinerung auf zwei Veränderliche erhält man anlog zu Abschnitt 15.4 die Definition:
Für eine Funktion g:R2→R und eine Zufallsvariable (X,Y) definiert man den mathematischen Erwartungswert (kurz: die Erwartung) von g(X,Y) a) im diskreten Fall durch:
E ( g ( X , Y )) =
∑∑ g ( x , y ) f ( x , y ) ; i
i
j
i
j
j
∞ ∞
b) im stetigen Fall durch:
E ( g ( X , Y )) =
∫ ∫ g ( x, y ) f ( x, y ) d x d y . − ∞-∞
Randverteilungen und deren Wahrscheinlichkeits- bzw. Dichtefunktionen, Unabhängigkeit und mathematischer Erwartungswert lassen sich analog für n Zufallsvariable X1, …, Xn (mit n > 2) definieren. Für n Zufallsvariable X1, …, Xn gelten
294
15 Wahrscheinlichkeitsrechnung
Additionssatz und Multiplikationssatz für Mittelwerte:
(i) (ii)
E( X 1 + K + X n ) = E( X 1 ) + K + E( X n ) Falls X1, …, Xn unabhängig sind: E( X 1 ⋅ K ⋅ X n ) = E( X 1 ) ⋅ K ⋅ E( X n )
Für zwei Zufallsvariable X und Y erhält man damit Var ( X + Y ) = Var ( X ) + Var (Y ) + 2[E ( X ⋅ Y ) − E ( X ) ⋅ E(Y )] , woraus im Falle der Unabhängigkeit von X und Y die schon in Abschnitt 15.4 zitierte Formel für die Varianz einer Summe folgt. Definition:
(i)
Der Ausdruck E ( X ⋅ Y ) − E ( X ) ⋅ E(Y ) heißt Kovarianz von X und Y und wird mit cov (X, Y) oder σXY bezeichnet.
(ii)
Sind die Varianzen σ X2 und σ Y2 von X und Y positiv, so heißt ρ XY := der Korrelationskoeffizient und β XY :=
σ XY σ X ⋅σY
σ XY der Regressionskoeffizient von X σX2
und Y. Mit diesen Bezeichnungen wird obige Varianz-Formel zu Var ( X + Y ) = σ X2 + σ Y2 + 2σ XY . Die Kovarianz σXY ist ein Maß für die Abhängigkeit zwischen X und Y, sie kann positive und negative Werte annehmen und ist genau dann 0, wenn X und Y unabhängig sind. Der Korrelationskoeffizient ρXY ist ein Maß für die lineare Abhängigkeit von X und Y; er kann nur Werte zwischen −1 und +1 annehmen. Ist | ρXY | = 1, so ist Y = β X + κ , wobei β das Vorzeichen von ρXY trägt. Der Regressionskoeffizient ist die Steigung der sogenannten Regressionsgerade, das ist diejenige Gerade β X + κ , für die die mittlere quadratische Abweichung von Y minimal ist, das heißt, für die E ((Y − β X − κ ) 2 ) ein Minimum hat.1) Mittelwert und Varianz der Summe von X1, …, Xn lassen sich also mittels obiger Regeln bestimmen, es ist jedoch im Allgemeinen nicht leicht, die Verteilung von X = X 1 + K + X n anzugeben, sogar dann, wenn die Xi unabhängig sind.
1)
Man beachte die Analogie zu der in Abschnitt 8.5 behandelten Ausgleichsgeraden.
15.8 Testverteilungen
295
Es gilt jedoch der Satz über die Summe normalverteilter Zufallsvariablen:
X1, …, Xn seien unabhängige normalverteilte Zufallsvariable mit Xi ∼ N(µi,σi2). Dann ist die Summe X = X 1 + K + X n ebenfalls normalverteilt mit E ( X ) = µ1 + K + µ n und Var ( X ) = σ 12 + K + σ n2 . Ein allgemeineres Resultat ist insbesondere für die Statistik wichtig; es heißt dann Zentraler Grenzwertsatz:
X1, …, Xn seien unabhängige identisch verteilte Zufallsvariable mit Mittelwert µ und Varianz σ2. Dann ist für große n die Summe X = X 1 + K + X n asymptotisch normalverteilt, also X ∼ N(nµ, nσi2). Bezeichnet Zn die zu X gehörige Zufallsvariable in Standardform, X − nµ also ist Z n = , so konvergiert für n → ∞ die zugehörige Verteilungsfunktion σ n Fn (x) gegen die Verteilungsfunktion Φ(x) der Standardnormalverteilung.
15.8
Testverteilungen
Die in diesem Abschnitt behandelten sogenannten Testverteilungen beschreiben stetige Zufallsvariablen, die aus anderen durch bestimmte Rechenausdrücke zusammengesetzt sind. Diese Terme erscheinen zunächst einmal nicht unbedingt nahe liegend, sie ergeben sich jedoch aus Fragestellungen der im nächsten Kapitel behandelten Schätz- und Testtheorie. 1. χ2 -Verteilung
Es seien X1, …, Xn unabhängige standardnormalverteilte Zufallsvariable. Daraus erhält man durch X = X 12 + K + X n2 eine stetige Zufallsvariable, für deren Dichtefunktion gilt: 0 f ( x) = n x −1 − 1 2 2 ⋅ x ⋅ e n 2 2 Γ( 2n )
für x ≤ 0
für x > 0
296
15 Wahrscheinlichkeitsrechnung
Γ(x) bezeichnet dabei die in Abschnitt 5.4 eingeführte Gammafunktion. Man beachte, dass für n = 1 und n = 2 die Dichte f auf R+ streng monoton fällt, für n > 2 besitzt f in x = n – 2 ein Maximum (siehe Bild 15.8.1). Die Zufallsvariable X heißt χ2-verteilt mit dem Parameter (Freiheitsgrad) n ∈ N+. Es ist
µ = E( X ) = n
und
σ 2 = Var ( X ) = 2n .
Für die gebräuchlichsten Werte und diverse Freiheitsgrade sind die Quantile der χ2Verteilung im Anhang tabelliert. Für fehlende Freiheitsgrade lassen sich die Quantile mit
Bild 15.8.1: Dichtefunktion der χ2-Verteilung mit verschiedenen Freiheitsgraden
hinreichender Genauigkeit mit linearer Interpolation bestimmen. Da eine χ2-verteilte Zu x−n fallsvariable X asymptotisch normalverteilt ist, lässt sich für große n F ( x) ≈ Φ 2n setzen. 2. STUDENTsche t-Verteilung
Es seien Y und Z unabhängige Zufallsvariable, Y sei standardnormal- und Z χ2-verteilt. DarY eine stetige Zufallsvariable, für deren Dichte gilt: aus erhält man durch X = Z n n +1 n +1 − Γ 2 2 x 2 ⋅ 1 + f ( x) = n n πn ⋅ Γ 2 Offensichtlich ist f eine gerade Funktion, ihr Verlauf ähnelt der GAUSSschen Glockenkurve (siehe Bild 15.8.2).
15.8 Testverteilungen
297
Bild 15.8.2: STUDENTsche t-Verteilung für verschiedene Freiheitsgrade
Die Zufallsvariable X heißt t-verteilt mit dem Freiheitsgrad n ∈ N+. Für n = 1 ergibt sich die CAUCHY-Verteilung, die keinen Mittelwert besitzt; für n > 1 ist der Mittelwert µ = 0 . Für n = 1 und n = 2 besitzt die t-Verteilung keine Varianz; für n > 2 ist diese σ 2 =
n . n−2
Der letzte Wert ist für große n annähernd 1. Wegen des Verlaufs der Dichtefunktion und der Werte für Mittelwert und Varianz kann die t-Verteilung für große n hinreichend gut durch die Standardnormalverteilung approximiert werden. Für die gebräuchlichsten Werte und diverse Freiheitsgrade sind die Quantile der t-Verteilung im Anhang tabelliert, die Zeile n = ∞ enthält die Quantile der Standardnormalverteilung. 3. FISHERsche F-Verteilung
Es seien Y und Z unabhängige χ2-verteilte Zufallsvariable mit den Freiheitsgraden m bzw. n. Daraus erhält man durch X =
Y Z ⋅ m n
−1
eine stetige Zufallsvariable, für deren Dichte gilt:
0 m + n m n m f ( x) = Γ m+ n −1 − 2 m 2 n 2 ⋅ x 2 ⋅ (n + mx) 2 Γ( m2 ) ⋅ Γ( n2 )
für x ≤ 0 für x > 0
Die Zufallsvariable X heißt F-verteilt mit den Freiheitsgraden (m, n). Für die gebräuchlichsten Werte und diverse Freiheitsgrade sind die Quantile der t-Verteilung im Anhang tabelliert. Für n > 2 existiert der Mittelwert, er ist für n > 4 existiert auch die Varianz, es gilt
n ; n−2 2 n 2 ( m + n − 2) σ 2 = Var ( X ) = . m(n − 2) 2 (n − 4)
µ = E( X ) =
16
Statistik
16.1
Grundlagen
Soll eine relativ große oder gar unendliche Menge M auf ein bestimmtes Merkmal untersucht werden, so ist dies meist zu aufwendig oder gar unmöglich. Man beschränkt sich daher auf die Untersuchung einer zufällig ausgewählten Teilmenge T, einer aus der Grundgesamtheit gezogenen Zufallsstichprobe. Es ist Inhalt der sogenannten induktiven Statistik (schließende Statistik), die beim Schluss von den aus T gewonnenen Ergebnissen auf die Grundgesamtheit M auftretende Unsicherheit mithilfe der Wahrscheinlichkeitstheorie zu quantifizieren. Dem liegt das sogenannte statistische Standardmodell zugrunde: Eine Grundgesamtheit wird hinsichtlich eines Merkmals durch eine Zufallsvariable X beschrieben. So ist man zum Beispiel bei der Untersuchung des Alters aller Studierenden einer bestimmten Fachrichtung in Deutschland an der diskreten Zufallsvariable „X = Lebensalter in Jahren“ interessiert. Kennt man deren Verteilung (mit ihren zugehörigen Parametern), so weiß man, wie die Altersstruktur der untersuchten Personengruppe aussieht. Eine Zufallsstichprobe T = {x1 , L , xn } aus M wird in diesem Modell durch n unabhängige Xi repräsentiert, die alle die gleiche Verteilung wie X haben (Xi = „Zufallsvariable X im i-ten Zug“). Die gezogene Stichprobe {x1 ,L, xn } wird als Realisation der n-dimensionalen Zufallsvariablen ( X 1 , L , X n ) aufgefasst. Die Unabhängigkeit der Xi, die für sämtliche hier dargestellten Ergebnisse wesentlich ist, wird dadurch gewährleistet, dass bei der Erzeugung der Stichprobe das Modell „Ziehen mit Zurücklegen“ zugrunde gelegt wird. Ist der Stichprobenumfang n klein gegenüber der AnN zahl N der Grundgesamtheit (Faustregel: n < ), so kann auch „Ziehen ohne Zurücklegen“ 10 verwendet werden. Zur summarischen Beschreibung der Werte einer Stichprobe {x1 ,L, xn } werden folgende Begriffe aus der sogenannten deskriptiven Statistik (beschreibenden Statistik) verwendet: Mittelwert:
x=
1 n
n
∑x
i
i =1
https://doi.org/10.1515/9783110537161-309
300
16 Statistik
Varianz:
s2 =
1 n −1
n
∑
( xi − x ) 2 =
i =1
1 n − 1
n
∑x
i
i =1
2
− nx 2
Die Wurzel aus der Varianz ist die Standardabweichung s. Wird die Grundgesamtheit durch eine zweidimensionale Zufallsvariable (X, Y) beschrieben, ist man also an der gleichzeitigen Erfassung zweier Merkmale (zum Beispiel Körpergröße und -gewicht) interessiert, so besteht die Zufallstichprobe aus Paaren {( x1 , y1 ), L , ( xn , yn )} . Bezeichnen sx bzw. sy die Standardabweichungen der x- bzw. y-Werte allein (siehe oben), so ist definiert: Kovarianz:
s xy =
Korrelationskoeffizient:
r=
Regressionskoeffizient:
b=
1 n −1
n
∑
( xi − x )( yi − y ) =
i =1
1 n −1
n
∑(x y i
i
− n x y)
i =1
s xy sx ⋅ s y s xy sx
2
Die damit gebildete Gerade y = b( x − x ) + y heißt Regressionsgerade (der Stichprobe); es ist die in Abschnitt 8.5 in anderem Zusammenhang behandelte Ausgleichsgerade der Paare ( xi , yi ) .
16.2
Schätzen von Parametern
Wie in Abschnitt 16.1 dargestellt, kann eine Grundgesamtheit durch eine Zufallsvariable X beschrieben werden. Diese hängt meist von einem oder mehreren Parametern ab (siehe dazu die Beispiele im vorigen Kapitel). Häufig hängen diese Parameter eng mit Mittelwert oder Varianz der Verteilung zusammen. So erweisen sich die Parameter µ und σ der Normalverteilung gerade als Mittelwert und Varianz dieser Verteilung; der Parameter α der Exponentialverteilung ergibt den Kehrwert des Mittelwerts der Verteilung. Es liegt nahe, zur Schätzung von Mittelwert und Varianz der Grundgesamtheit die entspre1 n xi als chenden Werte aus einer Zufallsstichprobe {x1 ,L, xn } zu nehmen, also ist x = n i=1
∑
1 n −1 benutzen. Dies ist die sogenannte Momentenmethode. Schätzung für (den wahren Wert) µ und s 2 =
n
∑(x
i
i =1
− x ) 2 als eine solche für σ zu
16.2 Schätzen von Parametern
301
In jedem Fall ist der zu schätzende Parameter ϑ eine Funktion g von den Werten der Zufallsstichprobe. Diese wird gemäß dem statistischen Standardmodell als Realisation der ndimensionalen Zufallsvariablen ( X 1 , L , X n ) betrachtet. Damit ist der aus der Zufallsstich~ probe berechnete Schätzwert ϑ = g ( x1 , L , xn ) für ϑ eine Realisation der Zufallsvariablen θ = g ( X 1 , L , X n ) . Eine solche Funktion heißt Schätzfunktion. Definition:
Es sei θ = g ( X 1 , L , X n ) eine Schätzfunktion für ϑ . (i)
g heißt erwartungstreu
⇔
E (θ ) = E ( g ( X 1 , L X n )) = ϑ .
(ii)
g heißt effizient
⇔
Die Varianz E ((θ − ϑ ) 2 ) von g ( X 1 ,L X n ) ist endlich, und es gibt keine andere Schätzfunktion g* für θ mit kleinerer Varianz.
(iii)
g heißt konsistent
⇔
∀ε ∈ r + : lim p (| θ − ϑ | < ε ) = 1 . n →∞
Die durch x und s2 gegebenen Schätzfunktionen sind erwartungstreu. Man beachte, dass 1 dies für die Varianz deshalb gilt, weil der Faktor in s2 als gewählt wurde und nicht n −1 1 – wie manchmal auch – als . n Effiziente Schätzfunktionen für die Parameter einer Grundgesamtheit erhält man mit der Maximum-Likelihood-Methode: Will man die Parameter ϑ1 , L , ϑr einer Grundgesamtheit X schätzen, die durch ihre Wahrscheinlichkeits- bzw. Dichtefunktion f ( x, ϑ1 , L , ϑr ) gegeben ist, so bilde man durch Einsetzen der Stichprobenwerte x1 ,L , xn für x die sogenannte Likelihood-Funktion l * (ϑ1 , L , ϑr ) = ln[ f ( x1 , ϑ1 , L , ϑr ) ⋅ K ⋅ f ( xn , ϑ1 , L , ϑr )] und bestimme deren Maximum gemäß Abschnitt 8.5, indem alle partiellen Ableitungen Null gesetzt werden. Durch Auflösen nach den Parametern ϑi erhält man r Gleichungen der Gestalt
ϑi = g i ( x1 , L, xn ) . g i ( X 1 , L , X n ) ist dann eine effiziente Schätzfunktion für ϑi . Diese sogenannten Punktschätzungen lassen sich genauso auf zweidimensionale Grundgesamtheiten anwenden. Insbesondere lassen sich mit der Momentenmethode Korrelationsund Regressionskoeffizient aus den entsprechenden Größen der (zweidimensionalen) Stichprobe schätzen. Es ist klar, dass die erhaltenen Schätzwerte die wahren Parameter im Allgemeinen nicht exakt treffen. Es liegt also nahe, basierend auf der durchgeführten Punktschätzung ein Inter-
302
16 Statistik
vall anzugeben, in dem der zu schätzende Parameter der Grundgesamtheit liegt. Während bei numerischen Verfahren ein solches „Unsicherheitsintervall“ durch die Approximation des wahren Werts bedingt ist (siehe hierzu Kapitel 14), entsteht es bei Parameterschätzungen durch die zufällige Auswahl der Stichprobe. In der Numerik kann man aufgrund der durchgeführten Fehleranalyse also sicher davon ausgehen, dass der wahre Wert im angegebenen Intervall liegt; bei Parameterschätzungen kann dies nur mit einer anzugebenden Wahrscheinlichkeit gelten. Diese sogenannte Konfidenzzahl γ hat typischerweise Werte wie 90%, 95% oder 99%. Bei den sogenannten Intervallschätzungen berechnet man also aus der gezogenen Stichprobe Konfidenzintervalle, in denen die zu schätzenden Parameter mit einer Wahrscheinlichkeit γ liegen. Bei den im Folgenden dargestellten Konfidenzintervallen wird vorausgesetzt, dass die Grundgesamtheit X normalverteilt ist. Wegen des Zentralen Grenzwertsatzes lassen sich die Ergebnisse jedoch für genügend große Stichproben ohne weiteres auf beliebig verteilte Grundgesamtheiten übertragen. Bei Erwartungswertschätzungen ist dies bereits für n > 30 möglich, bei Varianzschätzungen sollte n > 100 sein. Konfidenzintervall für den Mittelwert µ bei bekannter Varianz σ 2
1. Schritt:
Zur gegebenen Konfidenzzahl γ bestimme man aus der Standardnormal1+ γ verteilung c mit F (c) = . 2
2. Schritt:
Aus der Stichprobe berechne man x = c ⋅σ
1 n
n
∑x
i
.
3. Schritt:
Man berechne a =
4. Schritt:
Das Konfidenzintervall für µ ist [ x − a, x + a ] .
n
.
i =1
Konfidenzintervall für den Mittelwert µ bei unbekannter Varianz σ 2
1. Schritt:
2. Schritt:
Zur gegebenen Konfidenzzahl γ bestimme man aus der STUDENTschen 1+ γ t-Verteilung mit n − 1 Freiheitsgraden c mit F (c) = . 2 Aus der Stichprobe berechne man x=
3. Schritt: 4. Schritt:
1 n
n
∑
xi
i =1
Man berechne a =
c⋅s
und
s2 =
1 n − 1
. n Das Konfidenzintervall für µ ist [ x − a, x + a ] .
n
∑x
i
i =1
2
− nx .
16.2 Schätzen von Parametern
303
Konfidenzintervall für die Varianz σ 2
1. Schritt:
2. Schritt:
Zur gegebenen Konfidenzzahl γ bestimme man aus der χ2-Verteilung mit 1− γ 1+ γ n − 1 Freiheitsgraden c1 und c2 mit F (c1 ) = und F (c2 ) = . 2 2 Aus der Stichprobe berechne man 1 n 1 n 2 xi − nx . x= xi s2 = und n i=1 n − 1 i=1
∑
3. Schritt:
∑
(n − 1) ⋅ s 2 (n − 1) ⋅ s 2 Das Konfidenzintervall für σ 2 ist , . c2 c1
Konfidenzintervall für die Erfolgswahrscheinlichkeit p eines BERNOULLI-Experiments
Ein BERNOULLI-Experiment werde n-mal durchgeführt, dabei treten k Erfolge ein. Ein nahe k liegender Schätzwert für p ist die relative Häufigkeit . n Zur Ermittlung des Konfidenzintervalls geht man folgendermaßen vor: 1. Schritt:
2. Schritt:
3. Schritt:
Zur gegebenen Konfidenzzahl γ bestimme man aus der Standardnormal1+ γ verteilung c mit F (c) = . 2 Man bestimme die Nullstellen p1 und p2 der nach oben geöffneten Parabel k2 g ( x ) = ( n + c 2 ) x 2 − ( 2k + c 2 ) x + . n Das Konfidenzintervall für p ist [ p2 , p1 ] , wobei p2 < p1 ist.
Im Folgenden sei bei der zweidimensionalen Grundgesamtheit ( X , Y ) für jedes feste X = x Y normalverteilt mit von x unabhängiger Varianz σY2. Konfidenzintervall für den Regressionskoeffizienten βXY
1. Schritt:
2. Schritt:
Zur gegebenen Konfidenzzahl γ bestimme man aus der STUDENTschen t1+ γ Verteilung mit n − 2 Freiheitsgraden c mit F (c) = . 2 Aus der Stichprobe berechne man s xy 2 2 sx2, sy2, sxy, b = 2 und a = (n − 1)(s y − b 2 s x ) . sx c⋅ a
3. Schritt:
Man berechne l =
4. Schritt:
Das Konfidenzintervall für βXY ist [b − l , b + l ] .
s x (n − 1)(n − 2)
.
304
16 Statistik
Konfidenzintervall für den Korrelationskoeffizienten ρXY
1. Schritt:
2. Schritt:
Zur gegebenen Konfidenzzahl γ bestimme man aus der Standardnormal1+ γ c verteilung c mit F (c) = und setze a = . 2 n −3 Aus der Stichprobe berechne man s sx2, sy2, sxy, und r = xy . sx ⋅ s y 1+ r . 1− r
3. Schritt:
Man berechne z 0 = 12 ln
4. Schritt:
Das Konfidenzintervall für ρXY ist [tanh( z 0 − a), tanh( z 0 + a )] .
16.3
Testen von Hypothesen
Eine Hypothese über eine Grundgesamtheit X, zum Beispiel über die Art der Verteilung von X oder über einen Parameter ϑ von X, soll anhand einer Zufallsstichprobe auf ihren – wahrscheinlichen – Wahrheitsgehalt untersucht werden. Dabei wird aufgrund einer aus der Stichprobe ermittelten Testgröße die Nullhypothese H0 (etwa „X ist exponentialverteilt“ oder „ µ ≥ µ 0 “) gegen das Gegenteil, die Alternativhypothese H1 (also „X ist nicht exponentialverteilt“ bzw. „ µ < µ 0 “), getestet. Liegt die Testgröße t außerhalb des Annahmebereichs, dessen Größe vom sogenannten Signifikanzniveau α – auch Irrtumswahrscheinlichkeit genannt – abhängt, so wird H0 zu Gunsten von H1 verworfen. Im Allgemeinen ist α sehr klein (etwa 0.05 oder 0.01 o.ä.), die Komplementärwahrscheinlichkeit 1 – α heißt Sicherheitswahrscheinlichkeit oder statistische Sicherheit. Bei der aus dem Test einer Hypothese resultierenden Entscheidung können grundsätzlich zwei verschiedene Fehler gemacht werden: Fehler 1. Art: Aufgrund der Stichprobe wird die Nullhypothese verworfen, obwohl sie richtig ist. Die Wahrscheinlichkeit dafür gibt das Signifikanzniveau α an. Das Risiko, einen Fehler 1. Art zu machen, heißt – aus der Qualitätssicherungstheorie entlehnt – Produzentenrisiko. Testverfahren, bei denen die resultierenden Entscheidungen aufgrund eines gegebenen Signifikanzniveaus getroffen werden, heißen Signifikanztests. Fehler 2. Art: Aufgrund der Stichprobe wird die Nullhypothese akzeptiert, also nicht verworfen, obwohl sie falsch ist. Die Wahrscheinlichkeit β für einen Fehler 2. Art ist also in gewisser Weise gegenläufig zum Signifikanzniveau α. Da die Konsequenzen aus den Fehlern 2. Art (Konsumentenrisiko) im Allgemeinen als nicht so gravierend angesehen werden,
16.3 Testen von Hypothesen
305
steht bei der Konstruktion der hier dargestellten Signifikanztests stets im Vordergrund, α möglichst klein zu halten. Tests, die H0 und H1 als gleichberechtigte Hypothesen ansehen, heißen Alternativtests; sie werden bei der Qualitätssicherung benutzt.
χ 2-Test Mit diesem Test wird untersucht, ob die Grundgesamtheit X eine bestimmte Verteilung hat. Hängt die Verteilung von einem oder mehreren Parametern ab, so werden diese zunächst aus der Stichprobe mit den in Abschnitt 16.2 beschriebenen Verfahren geschätzt. H0: H1:
„X besitzt die Verteilungsfunktion F(x) (ggf. mit den Parametern ϑ1 , L , ϑr ).“ „X ist nicht gemäß F(x) verteilt.“
1. Schritt: Man unterteile die x-Achse in m Intervalle I1 , L , I m derart, dass in jedem Intervall mindestens 5 Stichprobenwerte liegen. Für jedes Intervall Ik bestimme man die Anzahl bk der Stichprobenwerte, die in Ik liegen. 2. Schritt: Mittels F(x) berechne man pk = p ( X ∈ I k ) für jedes k ∈ {1, L , m} und damit die Anzahl der theoretisch in Ik liegenden Stichprobenwerte ek = npk . m
3. Schritt: Man berechne die Testgröße
t=
∑ k =1
(bk − ek ) 2 . ek
4. Schritt: Mit der gegebenen Signifikanzzahl α bestimme man das (1 – α)-Quantil c der χ 2Verteilung mit m − 1 − r Freiheitsgraden (r ist ggf. 0). 5. Schritt: Ist t ≤ c , so wird H0 auf dem Signifikanzniveau α angenommen, ansonsten verworfen. Bei den folgenden Parametertests, bei denen die angenommenen Parameterwerte jeweils mit 0 indiziert sind, sei vorausgesetzt, dass die Grundgesamtheiten normalverteilt sind; bei den Mittelwerttests kann für hinreichend große Stichproben (n > 0) auf diese Voraussetzung verzichtet werden. Tests über den Mittelwert µ bei bekannter Varianz σ 2
1. Schritt: Aus der Stichprobe berechne man den Wert der Testgröße
t=
x − µ0
σ
⋅ n.
2. Schritt: Mit der Signifikanzzahl α ermittle man aus der Standardnormalverteilung das α 1 − - Quantil λ1 und das (1 − α ) - Quantil λ2 . 2
306
16 Statistik
3. Schritt: Beim zweiseitigen GAUSS-Test, bei dem die Nullhypothese „µ = µ0“ gegen die Alternativhypothese „µ ≠ µ0“ getestet wird, wird H0 auf dem Signifikanzniveau α abgelehnt, wenn | t | > λ1 ist. Beim einseitigen GAUSS-Test, bei dem die Nullhypothese „µ ≤ µ0“ (bzw. „µ ≥ µ0“) gegen die Alternativhypothese „µ > µ0“ (bzw. „µ < µ0“) getestet wird, wird H0 auf dem Signifikanzniveau α abgelehnt, wenn t > λ2 (bzw. t < −λ2 ) ist. Tests über den Mittelwert µ bei unbekannter Varianz σ 2
Die Tests (einseitig und zweiseitig) verlaufen völlig analog zu den GAUSS-Tests, nur wird die unbekannte Varianz σ 2 durch die Stichprobenvarianz s2 ersetzt und die Quantile werden von der STUDENTschen t-Verteilung mit n − 1 Freiheitsgraden statt der Standardnormalverteilung genommen. Tests über die Mittelwerte µX und µY zweier Grundgesamtheiten mit unbekannter, aber gleicher Varianz σ 2
1. Schritt: Aus den Stichproben {x1 , L , xn } und { y1 , L , y m } berechne man den Wert der Testgröße
t=
x−y 2 x
(n − 1) s + (m − 1) s
2 y
⋅
n m ( n + m − 2) . n+m
2. Schritt: Mit der Signifikanzzahl α ermittle man aus der STUDENTschen t-Verteilung mit α n + m − 2 Freiheitsgraden das 1 − - Quantil λ1 und das (1 − α ) -Quantil λ2 . 2 3. Schritt: Beim zweiseitigen Test, bei dem die Nullhypothese „µX = µY“ gegen die Alternativhypothese „µX ≠ µY“ getestet wird, wird H0 auf dem Signifikanzniveau α abgelehnt, wenn | t | > λ1 ist. Beim einseitigen Test, bei dem die Nullhypothese „µX ≤ µY“ gegen die Alternativhypothese „µX > µY“ getestet wird, wird H0 auf dem Signifikanzniveau α abgelehnt, wenn t > λ2 ist. Tests über die Varianz σ 2 bei unbekanntem Mittelwert µ
1. Schritt: Aus der Stichprobe berechne man den Wert der Testgröße
t=
s2
σ 02
⋅ (n − 1) .
2. Schritt: Mit der Signifikanzzahl α ermittle man aus der χ 2-Verteilung mit n − 1 Freiheitsα α graden das -Quantil λ1 und das 1 − -Quantil λ2 (beim zweiseitigen Test) bzw. das α2 2 Quantil λ3 oder das (1 – α)-Quantil λ4 (beim einseitigen Test).
16.3 Testen von Hypothesen
307
3. Schritt: Beim zweiseitigen Test, bei dem die Nullhypothese „ σ 2 = σ 02 “ gegen die Alternativhypothese „ σ 2 ≠ σ 02 “ getestet wird, wird H0 auf dem Signifikanzniveau α abgelehnt, wenn t ∉ [λ1 , λ2 ] ist. Beim einseitigen Test, bei dem die Nullhypothese „ σ 2 ≤ σ 02 “ (bzw. „ σ 2 ≥ σ 02 “) gegen die Alternativhypothese „ σ 2 > σ 02 “ (bzw. „ σ 2 < σ 02 “) getestet wird, wird H0 auf dem Signifikanzniveau α abgelehnt, wenn t > λ4 (bzw. t < λ3 ) ist. Tests über die Varianzen σX 2 und σY 2 zweier Grundgesamtheiten mit unbekannten Mittelwerten
1. Schritt: Aus den Stichproben {x1 , L , xn } und { y1 , L , y m } berechne man die Stichprobenvarianzen s x2 und s 2y sowie den Wert der Testgröße t =
s x2 , wobei s x2 die größere der beis 2y
den Stichprobenvarianzen sei. 2. Schritt: Mit der Signifikanzzahl α ermittle man aus der FISHERschen F-Verteilung mit α (n − 1, m − 1) Freiheitsgraden das 1 − -Quantil λ. 2 3. Schritt: Die Nullhypothese „ σ X2 = σ Y2 “ wird gegen die Alternativhypothese „ σ X2 ≠ σ Y2 “ getestet; H0 wird auf dem Signifikanzniveau α abgelehnt, wenn t > λ ist.
17
Anhang: Tafeln und Tabellen
17.1
Unbestimmte Integrale
Im Folgenden sind häufig vorkommende unbestimmte Integrale (Stammfunktionen) zusammengestellt. Zum Zwecke der Übersichtlichkeit und leichteren Anwendbarkeit wurden viele Ausdrücke nicht in vollster Allgemeinheit dargestellt, sondern einfache Umformungen wie zum Beispiel das Herausziehen eines konstanten Faktors ≠ 0 aus dem Integral oder aus einer Wurzel dem Anwender überlassen. Darüber hinaus sollte sich der Benutzer dieser Integraltafel bei Vorliegen eines komplizierteren Integralausdrucks noch einmal an die in Abschnitt 5.3 beschriebenen Integrationstechniken Substitutionsregel und Partielle Integration erinnern, um damit die Aufgabe auf einfachere hier gelöste Integrale zu reduzieren. Außerdem kann die Umformung des Integranden vor dem Integrieren sehr hilfreich sein. Zum Einen sei hier auf die Partialbruchzerlegung (siehe Abschnitte 3.2 und 5.3) verwiesen, zum Anderen können bei trigonometrischen Funktionen entsprechende Formeln, wie sie etwa in Abschnitt 3.5 zusammengestellt sind, sehr hilfreich sein. Zur Notation: C bezeichnet stets eine aus R beliebig frei wählbare Konstante; wenn nichts anderes vorausgesetzt ist, stehen die Parameter a, b, t für reelle Zahlen, m und n sind für natürliche Zahlen vorgesehen. Falls eine Parametereinschränkung, etwa a ≠ 0, sofort aus der Formel ersichtlich ist, wurde meist auf die entsprechende Angabe verzichtet. Integrale rationaler Funktionen
x t +1
1.
∫ x dx = t +1 + C
2.
∫
3.
∫ (ax + b) d x = (t + 1)a (ax + b)
4.
∫ ax + b = a ln | ax + b | +C
t
für t ≠ −1
dx = ln | x | +C x 1
t
dx
1
https://doi.org/10.1515/9783110537161-319
t +1
+C
310
17 Anhang: Tafeln und Tabellen x dx
x
b
5.
∫ ax + b = a − a
6.
∫ (ax + b)
7.
∫ x(ax + b) d x = (t + 2)a
8.
∫ x (ax + b) d x = t (ax + b)
9.
∫ x(ax + b) = − b ln
10.
∫ x(ax + b)
11.
∫ cx + d d x = c x +
12.
∫ ( x + a)(x + b) = (a − b) ln x + a + C
13.
∫ ( x + a)( x + b) = (a − b) (a ln | x + a | −b ln | x + b |) + C
14.
∫a
2
15.
∫a
2
16.
∫a
2
17.
∫ x(a
xdx
=
2
2
ln | ax + b | +C
b 1 1 + ln | ax + b | +C a 2 ax + b a 2 1
t
1
1
t
dx
1
dx
ax + b
t
=
2
(ax + b) t + 2 − t
+b
b (ax + b) t +1 + C (t + 1)a 2
1
∫ x (ax + b)
t −1
dx
ax + b +C x
1 1 1 dx ⋅ + t −1 (t − 1) b (ax + b) b x(ax + b) t −1
∫
a
mit t > 0
bc − ad ln | cx + d | +C c2
dx
1
xd x
1
x+b
mit t > 0 , t ≠ 1
für
c≠0
für
a≠b
für
a≠b
dx 1 x = arctan + C 2 +x a a dx 1 a+x = ln +C 2 −x 2a a − x
xdx 1 = ± ln | a 2 ± x 2 | +C 2 2 ±x dx 1 |x| = 2 ln +C 2 ±x ) a | a2 ± x2 |
2
In den folgenden Formeln besitze x 2 + ax + b keine reelle Nullstelle, ansonsten forme man den Integranden mittels Partialbruchzerlegung um und benutze die Formeln 1-17: 18.
∫x
2
dx = + ax + b
2 4b − a
2
arctan
2x + a 4b − a 2
+C
17.1 Unbestimmte Integrale
311
( px + q) d x p ap dx = ln | x 2 + ax + b | + (q- ) 2 2 2 + ax + b 2 x + ax + b
19.
∫x
∫
20.
∫ (x
2
dx 1 2x + a dx = + 2(2t − 3) t 2 2 t −1 2 t −1 + ax + b) (t − 1)(4b − a ) ( x + ax + b) ( x + ax + b)
∫
für t > 0, t ≠ 1 21.
( px + q) d x
∫ ( x ax + b) 2
t
=−
p ap dx + (q − ) 2 ( x 2 + ax + b) t 2(t − 1)( x 2 + ax + b)t −1
∫
für t > 0, t ≠ 1 22.
∫
x2 + a 2x + a2 dx 1 = 3 ln 4 a +x 4a 2 x 2 − a 2 x + a 2 4
+ 2
∫
24.
∫a
∫
2a 3
2 2 x + 1 + arctan x − 1 + C arctan a a 2
xd x 1 x = arctan + C a 4 + x 4 2a 2 a
23.
25.
1
+
x2 − a 2x + a2 x 2d x 1 + = ln 4 4 +x 4a 2 x 2 + a 2 x + a 2 2 2 1 + x + 1 + arctan x − 1 + C arctan a a 2a 2
x 3d x 1 = ± ln | a 4 ± x 4 | +C 4 4 4 a ±x
Integrale mit Wurzelausdrücken 26.
∫
27.
∫
28.
∫
dx ax + b xdx ax + b xt d x ax + b
=
2 ax + b + C a
=
2 (ax − 2b) ax + b + C 3a 2
=
2 2tb x t ax + b − (2t + 1) a (2t + 1) a
∫
x t −1 ax + b
dx
312
29.
17 Anhang: Tafeln und Tabellen
∫
dx = x x+a dx
1
x+a − a
ln
a 2
|a|
x+a + a
x+a +C |a|
arctan
1 (t − 1)b
+ C für a > 0 für a < 0
ax + b (2t − 3)a − 2(t − 1)b x t −1
30.
∫x
t
31.
∫
ax + b d x =
32.
∫x
33.
∫x
34.
∫
ax + b dx d x = 2 ax + b + b x x ax + b
35.
∫
ax + b 1 ax + b a dx = − + t t −1 t −1 x 2(t − 1) x
36.
∫
37.
∫
38.
∫
x + a cx + b
39.
∫
ax + b cx + d d x =
ax + b
=−
2 3a
ax + b d x = t
(
∫
ax + b
)
3
(
)
3
ax + b + C
3 2 2tb x t ax + b − x t −1 ax + b d x (2t + 3) a (2t + 3)a
∫
∫
dx x+a x+b
= 2 ln
dx x+a − x+b xd x
(
siehe 29.
∫x
dx t −1
siehe 30.
ax + b
)
x+a + x+b +C
= 2 arctan
x+a +C − x+b
= c x + a cx + b −
1 (bc + a) 2
∫
dx x + a cx + b
bc + ad 1 x + ax + b cx + d x − 2 2ac −
40.
dx t-1
ax + b + C
2 (3ax − 2b) 15 a 2
ax + b d x =
∫x
(bc − ad )2 8ac
ax + b 1 bc − ad dx = ax + b cx + d + cx + d c 2c
∫
∫
dx ax + b cx + d dx
ax + b cx + d
für c = ±1
17.1 Unbestimmte Integrale 41.
42.
∫
43.
∫
44.
45.
dx
∫
2
a +x
x + C = arcsin | a | a −x 2
xdx 2
a ±x
= ± a2 ± x2 + C
2
1 (t − 1)a 2 = ± x t −1 a 2 ± x 2 m t t a2 ± x2 xt d x
∫
dx
∫x ∫x
47.
∫
a2 ± x2 dx a2 ± x2
t
dx 2
x −a
2
xdx
∫
2
x −a
2
=−
=−
1 (t − 1) a 2
50.
∫x
51.
∫x
52. 53.
x −a
a≠0
für
a≠0
x t −2 a2 ± x2
dx
∫x
dx t −2
a2 ± x2
für a ≠ 0
= x2 − a2 + C
für a ≠ 0
2
x2 − a2
=−
=
∫
x t −2 x2 − a2
dx
1 a arcsin + C |a| x
1 (t − 1) a 2
x2 − a2 t −2 + t −1 x (t − 1) a 2
für a ≠ 0
∫x
dx t- 2
x2 − a2
∫
a 2 + x 2 dx =
x a2 a2 + x2 + ln ( x + a 2 + x 2 ) + C 2 2
∫
a 2 − x 2 dx =
x x 2 a2 + C a − x2 + arcsin 2 2 | a |
∫
für a ≠ 0
für a ≠ 0
dx t
für
= ln | x + x 2 − a 2 | +C
dx 2
a≠0
a2 ± x2 t−2 m t −1 x (t − 1) a 2
1 (t − 1) a 2 = x t −1 x 2 − a 2 + t x2 − a2 t
∫
∫
für
1 a + a2 ± x2 ⋅ ln +C a x
xt d x
49.
54.
= ln( x + a 2 + x 2 ) + C
2
dx
2
46.
48.
313
3 1 x a 2 ± x 2 dx = ± a 2 ± x 2 + C 3
für a ≠ 0
für
a≠0
314
55.
17 Anhang: Tafeln und Tabellen
∫
x t a 2 ± x 2 dx =
1 t +1 2 a2 x a ± x2 + t+2 t+2
x t dx
∫
56.
∫
a2 ± x2 a + a2 ± x2 dx = a 2 ± x 2 − a ln +C x x
57.
∫
x 2 − a 2 dx =
58.
∫
x x 2 − a 2 dx =
59.
∫
x t x 2 − a 2 dx =
60.
61.
62.
63.
64.
65.
für a ≠ 0
x a2 x2 − a2 − ln x + x 2 − a 2 + C 2 2 3 1 2 x − a 2 + C 3
1 t +1 2 a2 x x − a2 − t+2 t+2
x t dx
∫
x2 − a2
∫
x2 − a2 a dx = x 2 − a 2 + | a | arcsin + C x x
∫
1 ln 2ax + b + 2 a ax 2 + bx + c dx a = 1 2ax + b ax 2 + bx + c − arcsin b 2 − 4ac | a | xdx
∫
2
∫
∫
=
ax + bx + c x2 d x 2
ax + bx + c
für a ≠ 0
a2 ± x2
=
1 b ax 2 + bx + c − a 2a
∫
für a ≠ 0
+C
für a ≠ 0
für a > 0 für a < 0
dx
für a ≠ 0
2
ax + bx + c
1 3b 2 − 4ac 2 ( 2 ax − 3 b ) ax + bx + c + 4a 2 8a 2
∫
1 bx + 2c + 2 c ax 2 + bx + c − ln x c dx 2 = − x(ax + b ) 2 x ax + bx + c b x 1 bx + 2c arcsin | x | b 2 − 4ac | c |
∫x
dx 2
2
ax + bx + c
=
1 b ax 2 + bx + c − cx 2c
∫x
dx 2
ax + bx + c
dx 2
ax + bx + c
für c > 0 für c = 0 und b ≠ 0 für c < 0
für a ≠ 0
17.1 Unbestimmte Integrale 66.
315
dx
∫(
2
ax + ax + b)
2 t −1
=−
2 2x + a − (2t − 1)(a 2 − 4b) ( x 2 + ax + b) −
67.
68.
∫ ∫
x 2 + ax + b d x =
a a 2 − 4b 1 ( x + ) x 2 + ax + b − 2 2 8
∫
∫
∫
dx 2
( x + ax + b)
2 t −1
dx 2
x + ax + b
3 1 x x 2 + ax + b d x = x 2 + ax + b − 3
−
69.
8(t − 1) (2t − 1)(a 2 − 4b)
x 2 x 2 + ax + b d x =
a (a 2 − 4b) a (2 x + a) x 2 + ax + b + 16 8
3 1 5a 2 − 4b (6 x − 5a ) x 2 + ax + b + 24 16
Integrale mit Exponential- und Logarithmusfunktionen 70.
∫
71.
∫ xe
72.
∫x e
73.
∫
e ax d x = ax
e ax +C a
dx =
2 ax
1 (ax − 1)e ax + C a2
dx =
x n e ax d x =
1 2 2 (a x − 2ax + 2)e ax + C a3 e ax x n n n−1 ax − x e dx a a
∫
x n nx n −1 n(n − 1) x n − 2 (−1) n n! +C = e ax − 2 + − K + a a3 a n +1 a b ax +C a ln b
74.
∫
75.
∫ ln(ax)d x = x(ln(ax) − 1) + C
76.
∫
b ax d x =
x n ln(ax)d x =
x n+1 1 ln(ax) − +C n +1 n +1
∫
∫
dx 2
x + ax + c
x 2 + ax + b d x
316
17 Anhang: Tafeln und Tabellen (ln(ax)) n (ln(ax)) n+1 dx = +C x n +1
77.
∫
78.
∫ log (ax)d x = ln b ( x ln(ax) − x) + C
1
b
Integrale mit trigonometrischen und Arcus-Funktionen
1
79.
∫ sin(ax)d x = − a cos(ax) + C
80.
∫ sin
81.
∫ sin (ax) d x = 3a cos(ax)(cos (ax) − 3) + C
82.
∫ sin
83.
∫ sin( ax) = a ln tan 2 + C
84.
∫ sin
85.
∫ sin (ax) = − 2a sin
86.
∫ sin
87.
∫ cos(ax)d x = a sin( ax) + C
88.
∫ cos (ax)d x = 4a sin(2ax) + 2 + C
89.
∫ cos (ax)d x = − 3a sin( ax)(sin (ax) − 3) + C
90.
∫ cos (ax)d x = na cos
91.
∫ cos(ax) = 2a ln 1 − sin( ax) + C
2
1
3
n
1 x sin( 2ax) + + C 4a 2
(ax) d x = −
(ax) d x = −
dx
2
n− 2 1 n −1 sin n−1 (ax) cos(ax) + sin (ax) dx na n
∫
mit n > 1
ax
1
dx 1 = − cot(ax) + C 2 a (ax) cos(ax) 1 ax + ln tan + C 2 (ax) 2a 2
dx 3
dx cos(ax) n−2 dx =− + +C n n −1 n−2 (ax) (n − 1)a sin (ax) n − 1 sin (ax)
∫
1
1
2
1
3
1
n
dx
x
1
2
n −1
(ax) sin( ax) +
1 + sin( ax)
n− 2 n −1 cos (ax)dx n
∫
mit n > 1
17.1 Unbestimmte Integrale dx
317
1
92.
∫ cos (ax) = a tan(ax) + C
93.
∫ cos (ax) = 2a cos (ax) + 4a ln 1 − sin(ax) + C
94.
∫ cos (ax) = (n − 1)a cos
95.
∫ tan(ax)d x = − a ln | cos(ax) | +C
96.
∫ tan (ax)d x = a tan(ax) − x + C
97.
∫ tan
98.
∫ cot(ax)d x = a ln | sin(ax) | +C
99.
∫ cot (ax)d x = − a cot(ax) − x + C
100.
∫ cot
101.
∫ sin( ax)cos(ax) d x = 2a sin
102.
∫ sin(ax)sin(bx) d x =
103.
∫ cos(ax) cos(bx) d x =
2
dx
sin( ax)
3
dx
sin( ax)
n
1 + sin( ax)
n −1
(ax)
+
n−2 dx +C n − 1 cos n−2 (ax)
∫
mit n > 1
1
1
2
n
(ax)d x =
1 tan n−1 (ax) − tan n−2 (ax)d x + C (n − 1)a
∫
mit n > 1
1
1
2
n
(ax)d x = −
1 cot n−1 (ax) − cot n −2 (ax)d x (n − 1)a
∫
1
2
mit n > 1
(ax) + C
sin((a − b) x) sin(( a + b) x) +C − 2(a − b) 2(a + b) 1 (a cos(ax) sin(bx) − b sin( ax) cos(bx)) + C für | a |≠| b | = 2 b − a2
= 104.
1
2
sin((a − b) x) sin((a + b) x) + +C 2( a − b ) 2( a + b)
1 (− a sin(ax) cos(bx) + b cos(ax) sin(bx) ) + C für | a |≠| b | b − a2 2
∫ sin(ax) cos(bx) d x = − =
cos((a − b) x) cos((a + b) x) − +C 2( a − b) 2( a + b)
1 (a cos(ax) cos(bx) + b sin( ax) sin(bx)) + C für | a |≠| b | b − a2 2
318
17 Anhang: Tafeln und Tabellen 1
105.
∫ xsin(ax) d x = a
106.
1 ∫ x sin(ax) d x = a (2ax sin(ax) + (2 − a x ) cos(ax)) + C
107.
∫ x sin(ax) d x = − a x
108.
∫ xcos(ax) d x = a
109.
1 ∫ x cos(ax)d x = a (2ax cos(ax) − (2 − a x ) sin(ax)) + C
110.
∫ x cos(ax) d x = a x
111.
∫
e ax sin(bx) d x =
112.
∫
e ax sin n (bx) d x =
(sin( ax) − ax cos(ax)) + C
2
2
2
2
3
1
n
1
n
cos(ax) +
n n −1 x cos(ax)d x a
∫
(cos(ax) + ax sin( ax)) + C
2
2
2
2
3
1
n
n
n n−1 x sin( ax) d x a
∫
sin( ax) −
e ax sin n−1 (bx) (a sin(bx) − nb cos(bx)) + a 2 + n 2b 2 n(n − 1)b 2 ax n−2 + 2 e sin (bx) d x a + n 2b 2
∫
e ax cos(bx) d x =
114.
∫
e ax cos n (bx) d x =
2
e ax cos n−1 (bx) (a cos(bx) + nb sin(bx)) + a 2 + n 2b 2 n(n − 1)b 2 ax n−2 + 2 e cos (bx) d x a + n 2b 2
∫
ax
sin(bx) d x =
∫
für n > 1 und b ≠ 0
xe ax (a sin(bx) − b cos(bx)) − a + b2 e ax − 2 (a 2 − b 2 ) sin(bx) − 2ab cos(bx) + C (a + b 2 ) 2 2
(
116.
für n > 1 und b ≠ 0
e ax (a cos(bx) + b sin(bx)) + C a + b2
113.
∫ xe
mit n > 0
e ax (a sin(bx) − b cos(bx) ) + C a 2 + b2
∫
115.
mit n > 0
)
xe ax (a cos(bx) − b sin(bx)) − a2 + b2 e ax − 2 (a 2 − b 2 ) cos(bx) + 2ab sin(bx) + C (a + b 2 ) 2
xe ax cos(bx) d x =
(
)
17.1 Unbestimmte Integrale
319 1
117.
∫ arcsin(ax) d x = x arc sin(ax) + a
118.
∫ arccos(ax) d x = x arccos(ax) − a
119.
∫ arctan(ax) d x = x arctan(ax) − 2a ln(1 + (ax) ) + C
120.
∫ arccot(ax) d x = x arc cot(ax) + 2a ln(1 + (ax) ) + C
1
1 − (ax) 2 + C 1 − (ax) 2 + C
1
2
1
2
Integrale mit hyperbolischen und Area-Funktionen
1
121.
∫ sinh (ax) d x = a cosh (ax) + C
122.
∫ sinh
2
(ax) d x =
1 x sinh (2ax) − + C 4a 2
123.
∫ sinh
n
(ax) d x =
1 n −1 sinh n−1 (ax) cosh (ax) + sinh n−2 (ax) dx na n
124.
∫ sinh (ax) = a ln tanh 2 + C
125.
∫ sinh
126.
∫ sinh
127.
∫ cosh (ax) d x = a sinh (ax) + C
128.
∫ cosh
2
(ax) d x =
1 x sinh (2ax) + + C 4a 2
129.
∫ cosh
n
(ax) d x =
1 n −1 cosh n−1 (ax) sinh (ax) + cosh n−2 (ax) dx na n
130.
∫ cosh (ax) = a arctan (e
131.
∫ cosh
dx
∫
mit n > 1
ax
1
dx 1 = − coth (ax) + C 2 a (ax)
dx cosh (ax) n−2 dx =− − n n −1 n −2 (ax) (n − 1)a sinh (ax) n − 1 sinh (ax)
∫
mit n > 1
1
dx
2
∫
ax
)+C
dx 1 = tanh (ax) + C 2 (ax) a
mit n > 1
320
17 Anhang: Tafeln und Tabellen dx sinh (ax) n−2 dx =− + n (ax) (n − 1) a cosh n−1 (ax) n − 1 cosh n−2 (ax)
132.
∫ cosh
∫
133.
∫ tanh (ax) d x = a ln (cosh (ax)) + C
134.
∫ tanh
2
(ax) d x = −
1 tanh (ax) + x + C a
135.
∫ tanh
n
(ax) d x = −
1 tanh n −1 (ax) + tanh n−2 (ax) dx (n − 1) a
136.
∫ coth (ax) d x = a ln | sinh( ax) | +C
137.
∫ coth
2
138.
∫ coth
n
139.
∫ sinh (ax) cosh (ax) d x = 2a sinh
140.
∫ sinh (ax) sinh (bx) d x = a
141.
∫ cosh (ax) cosh (bx) d x = a
142.
∫ sinh (ax) cosh (bx) d x = a
2
143.
∫ sinh (ax) sin (bx) d x = a
1 (a cosh (ax) sin (bx) − b sinh (ax) cos (bx)) + C + b2
144.
∫ sinh (ax) cos (bx) d x = a
2
145.
∫ cosh (ax) sin (bx) d x = a
2
146.
∫ cosh (ax) cos (bx) d x = a
147.
∫x
mit n > 1
1
∫
mit n > 1
1
1 (ax) d x = − coth (ax) + x + C a (ax) d x = −
1 coth n−1 (ax) + coth n− 2 (ax) dx (n − 1)a
∫
1
n
sinh (ax) d x =
2
(ax) + C
1 (a cosh (ax) sinh (bx) − b sinh (ax) cosh (bx) ) + C − b2
2
2
2
mit n > 1
2
1 (a sinh (ax) cosh (bx) − b cosh (ax) sinh (bx)) + C − b2 1 (a cosh (ax) cosh (bx) − b sinh (ax) sinh (bx)) + C − b2
1 (a cosh (ax) cos (bx) + b sinh (ax) sin (bx)) + C + b2 1 (a sinh (ax) sin (bx) − b cosh (ax) cos (bx)) + C + b2 1 (a sinh (ax) cos (bx) + b cosh (ax) sin (bx)) + C + b2
1 n n n−1 x cosh (ax) − x cosh (ax) dx a a
∫
mit n > 0
17.2 Bestimmte Integrale
321 n n−1 1 n x sinh (ax) − x sinh (ax) dx + C a a
148.
∫x
149.
∫ ar sinh (ax) d x = x ar sinh (ax) − a
150.
∫ ar cosh (ax) d x = x ar cosh (ax) − a
151.
∫ ar tanh (ax) d x = x ar tanh (ax) + 2a ln (1 − (ax) ) + C
152.
∫ ar coth (ax) d x = x ar coth (ax) + 2a ln ((ax)
n
cosh (ax) d x =
∫
1
1 + (ax) 2 + C
1
(ax) 2 − 1 + C
1
1
17.2
2
2
− 1) + C
Bestimmte Integrale
Häufig vorkommende bestimmte Integrale trigonometrischer Funktionen π 2
1.
∫ sin
π 2
2n
0
0
π 2
2.
∫ sin
2 n+1
0 2π
4.
∫
x d x = cos 2 n+1 x d x = 0
π 2
∫ sin
n
∫
x cos x d x = cos n x sin x d x = 0
π
∫ sin(nx) sin( mx) d x = 0
2π
2 ⋅ 4 ⋅ K ⋅ 2n 3 ⋅ 5 ⋅ K ⋅ (2n + 1)
π 2
0
5.
1 ⋅ 3 ⋅ K ⋅ (2n − 1) π ⋅ 2 ⋅ 4 ⋅ K ⋅ 2n 2
π 2
0
3.
∫
x d x = cos 2 n x d x =
π
∫ cos(nx) cos(mx) d x = 0 0
1 1+ n
für n = m für n ≠ m für n = m für n ≠ m
2π
6.
∫ sin(nx) cos(mx) d x = 0 0
Die Gleichungen 4. – 6. heißen Orthogonalitätsrelationen.
mit n > 0
322
17 Anhang: Tafeln und Tabellen
Uneigentliche Integrale
1 d x (n − 1) a n−1 = x n ex. nicht a
∞
7.
∫ a
8.
∫ 0
∫a
2
0
dx π = + x2 2 | a |
∞
10.
∫ (a
2
0
∞
11.
∫ 0 1
12.
∫ 0
∫ 0
dx 1 ⋅ 3 ⋅ K ⋅ (2n − 3) π = ⋅ 2 n 2 ⋅ 4 ⋅ K ⋅ (2n − 2) 2 | a |2 n−1 +x ) dx
x (1 + x) xd x 1 − x2
a
13.
=1
dx 2
a −x
∫
für n ≥ 2 und a ≠ 0
=π
2
=
π
a2 − x2 d x =
0
für a > 0
2
a
14.
für n ≤ 1 und a > 0
a1−n für n < 1 und a ≥ 0 d x 1 − n = n x ex. nicht für n ≥ 1 und a > 0
∞
9.
für n > 1 und a > 0
a 2π 4
für a > 0
∞
15.
sin( ax) π dx = 2 x 0
∫ ∞
16.
∫ 0
tan(ax) π dx = 2 x
für a > 0
n! a n+1
für a > 0
∞
17.
∫x e
n -ax
0
für a > 0
dx =
17.2 Bestimmte Integrale
∞
18.
∫
x 2 n e -ax
2
0
∞
19.
∫x
323
1 ⋅ 3 ⋅ K ⋅ (2n − 1) π a 2 n+1 a n dx = 1 π 2 a
2 n +1 -ax 2
e
dx =
0
für n > 0 und a > 0 für n = 0 und a > 0
n! 2a n+1
für a > 0
Durch Integrale definierte Funktionen x
20.
∫
Φ ( x) =
-
t2
e 2 dt =
−∞
2π + 2
∞
∑ k =0
(−1) k x 2 k +1 k!(2k + 1)2 k
für x ∈ R
Φ (x) ist die Verteilungsfunktion der Standardnormalverteilung (siehe Abschnitt 15.6); sie heißt auch GAUSSsches Fehlerintegral. ∞
21.
∫
Γ( x) = t x−1e −t d t für x > 0 ist die in 5.4 definierte Gammafunktion (EULERsches 0
Integral zweiter Gattung). Dafür gilt die Rekursionsformel
Γ( x + 1) = x ⋅ Γ( x) .
Daraus und aus den Startwerten Γ(1) = 1 und Γ( 12 ) = π erhält man für n ∈ N+:
Γ(n) = (n − 1)! ,
für x = 12 , 32 , L ,
2k + 1 ,L : 2 π 2
1
22.
∫
B ( x, y ) = t
2k + 1 1 ⋅ 3 ⋅ K ⋅ (2k − 1) Γ ⋅ π . = 2k 2
x −1
∫
y -1
(1 − t ) dt = 2 cos 2 x −1 t ⋅ sin 2 y −1t d t =
0
0
Γ( x) ⋅ Γ( y ) Γ( x + y )
mit x, y ∈ R+
heißt EULERsches Integral erster Gattung. ∞
23.
n 1 C = − e − x ln x d x = lim − ln n = 0,577215665K n→∞ k =1 k 0
∑
∫
heißt EULERsche Konstante. x
24.
Ei( x) =
∞ et xk für x ∈ R* heißt Integralexponentialfunktion. d t = C + ln | x | + t k ! k k =1 −∞
∫
∑
324
17 Anhang: Tafeln und Tabellen x
25.
Li( x ) =
∞
dt = C + ln(ln | x |) + ln t 0
∑
∫
k =1
(ln x) k k! k
für x ∈ R+\{1}
heißt Integrallogarithmus. Es ist Li( x ) = Ei(ln x) . x
26.
Si ( x) =
sin t dt = t −∞
∫
∞
∑ k =0
(−1) k x 2 k +1 für x∈ R heißt Integralsinus. (2k + 1)!(2k + 1)
x
27.
Ci ( x) = − x
28.
π S ( x) = sin t 2 d t = 2 0
29.
π C ( x) = cos t 2 d t = 2 0
∫
x
∫
(−1) k x 2 k
∞
cos t d t = C + ln x + t −∞
∑ (2k )!(2k )
∫
für x∈ R heißt Integralkosinus. +
k =0
∞
π k =0 2
∑ ∞
2 k +1
π k =0 2
∑
2k
(−1) k x 4 k +3 (2k + 1)!(4k + 3)
für x ∈ R
(−1) k x 4 k +1 (2k )!(4k + 1)
für x ∈ R
S(x) und C(x) heißen FRESNELsche Integrale. ϕ
30.
F (ϕ , k ) =
∫ 0
sin ϕ
dϑ 2
2
1 − k sin ϑ
=
E (ϕ , k ) =
∫
1− t
0
sin ϕ
ϕ
31.
dt
∫
1 − k 2 sin 2 ϑ dϑ =
0
∫ 0
2
1 − k 2t 2
1 − k 2t 2 1− t2
dt
für | k | < 1 mit t = sin ϑ
für | k | < 1 mit t = sin ϑ
F und E heißen elliptische Normalintegrale 1. bzw. 2. Gattung. Für ϕ =
π 2
erhält man die vollständigen elliptischen Normalintegrale 1. bzw. 2. Gattung als π π F , k = 2 2
bzw.
2 ∞ 1 ⋅ 3 ⋅ K ⋅ (2ν − 1) 2ν 1 + ⋅k ν =1 2 ⋅ 4 ⋅ K ⋅ 2ν
∑
2 ∞ k 2ν π π 1 ⋅ 3 ⋅ K ⋅ (2ν − 1) E , k = 1 − . ⋅ 2 2 ν =1 2 ⋅ 4 ⋅ K ⋅ 2ν 2ν − 1
∑
17.3 Potenzreihen
17.3
325
Potenzreihen
In der folgenden Tabelle sind die wichtigsten Potenzreihenentwicklungen dargestellt. Als Entwicklungspunkt wurde stets x0 = 0 gewählt, in der letzten Spalte ist der jeweilige Konvergenzradius angegeben. Die Formeln gelten sinngemäß auch für die Fortsetzung entsprechender Funktionen ins Komplexe. Durch einfache Substitutionen wie z.B. x = −t , x = t 2 o.Ä. erhält man hieraus weitere Formeln. α Ist in der binomischen Reihe (5. Zeile) α ∈ N, so wird wegen = 0 für alle k > α diese k Reihe zu einer endlichen Summe mit α + 1 Summanden. Es ergibt sich der binomische Satz. In einigen Formeln kommen die BERNOULLI-Zahlen Bk vor. Diese ergeben sich 2 ⋅ (2l )! ∞ (2k + 1) −2l mit l ≥ 1 , für gerade Indizes zu B0 = 1 , B2l = (−1)l +1 2l 2l π (2 − 1) k =0 1 für ungerade Indices zu B1 = − , B2l +1 = 0 mit l ≥ 1 . 2
∑
∞
1 1 − ax
für a ≠ 0
1 1 − ax n
für a ≠ 0
1)
∑a x k
k =0 ∞
1 für a ≠ 0 (1 − ax) 2
∑a x k
= 1 + ax n + a 2 x 2 n + K
kn
k =0 ∞
∑ (k + 1)a x k
k
∞
∑ ka x
(1 + x)α für α ∈ R \ N 2)
∑ k x
k
= ax + 2a 2 x 2 + 3a 3 x 3 + K
k
k =1 ∞
α
k
= 1 + αx +
k =0
∞
1+ x
geometrische Reihe binomische Reihe
12
∑ k x k =0
2)
= 1 + 2ax + 3a 2 x 2 + K
k =0
ax für a ≠ 0 (1 − ax) 2
1)
1 |a|
= 1 + ax + a 2 x 2 + K
k
k
= 1+
α (α − 1) 2!
x2 + K
1 1 x − x2 + K 2 8
n
1 |a| 1 |a| 1 |a| 1
1
326 1 1+ x
17 Anhang: Tafeln und Tabellen − 12 k 1 3 x = 1 − x + x 2 + K 2 8 k =0 k ∞
∑ ∞
ex
∑ k =0 ∞
a x für a > 0
1 k x2 +K x =1+ x + k! 2! 1
∑ k! ( x ln a)
k
= 1 + x ln a +
k =0 ∞
sinh x
∑ k =0
1
∑ (2k )! x
2k
= 1+
k =0 ∞
tanh x
∑ k =0
∞
( x ln a) 2 +K 2!
1 x3 x5 x 2 k +1 = x + + −K (2k + 1)! 3! 5!
∞
cosh x
1
x2 x4 + −K 2! 4!
2 2 k + 2 (2 2 k + 2 − 1) x3 2 x5 B2 k + 2 x 2 k +1 = x − + +K (2k + 2)! 3 15
− 12 x 2 k +1 1 x3 1 ⋅ 3 x5 = x− ⋅ + ⋅ −K 2 3 2⋅4 5 2k + 1 k =0
∞
∞
∞
π 2
∞
ar sinh x
∑ k ∞
ar tanh x
∑ k =0
(−1) k
∞
ln(1 + x)
1 x3 x5 x 2 k +1 = x + + +K 2k + 1 3 5
∑ k +1 x
k +1
= x−
k =0
∞
ln(a + x) für a > 0
ln a +
∑ k =1
∞
x x2 x3 (−1) k +1 k x = ln a + − 2 + 3 − K k a 2a ka 3a
2 x3 x5 x k +1 = 2( x + + + K) 2k + 1 3 5
1+ x ln 1− x
2
sin x
∑ (2k + 1)! x
∑ k =0
∞
(−1) k
2 k +1
= x−
k =0 ∞
cos x
∞
tan x
(−1) k
∑ (2k )! x k =0
∑ k =0
x2 x3 + −K 2 3
2k
=1−
x3 x5 + −K 3! 5!
x2 x4 + −K 2! 4!
(−1) k 2 2 k + 2 (2 2 k + 2 − 1) x3 2x5 B2 k + 2 x 2 k +1 = x + + + .. (2k + 2)! 3 15
1
1
1
a
1
∞
∞
π 2
17.3 Potenzreihen
327 − 1 x 2 k +1 1 x3 1 ⋅ 3 x5 (−1) k 2 = x+ ⋅ + ⋅ +K 2 3 2⋅4 5 k 2k + 1 k =0
∑
1
1 x3 1 ⋅ 3 x5 − x + ⋅ + ⋅ + K 2 2 3 2⋅4 5
1
∞
arcsin x
arccos x =
π 2
− arcsin x
π
∞
arctan x
∑ k =0
(−1) k 2 k +1 x3 x5 = x− + −K x 2k + 1 3 5
1
328
17 Anhang: Tafeln und Tabellen
17.4
FOURIER-Reihen
Die im Folgenden behandelten P-periodischen Funktionen f (x) werden stets auf einem P P Periodenintervall − , oder [0, P [ gegeben und auf ganz R periodisch fortgesetzt. Für 2 2 die FOURIER-Koeffizienten spielen die Funktionswerte an den Intervallgrenzen auch bei unstetigen Funktionen keine Rolle, da alle hier aufgeführten Funktionen die DIRICHLETschen Bedingungen (siehe Abschnitt 7.3) erfüllen. Die FOURIER-Reihen T (x) konvergieren somit auf ganz R. Für x0 ∈ R ist
T ( x0 ) = f ( x0 ) , falls f in x0 stetig ist, 1 T ( x0 ) = lim f ( x) + lim f ( x) , falls f in x0 nicht stetig ist. x → x0 + 2 x→ x0 −
und
1. f ( x) = x
T ( x) =
2. f ( x) = x 2
T ( x) =
3. f ( x) = x 3
T ( x) =
P P für x ∈ − , 2 2 P
π
∞
∑ k =1
(−1) k +1 2π sin k x k P
P P für x ∈ − , 2 2 P2 P2 + 12 π 2
∞
∑ k =1
(−1) k 2π cos k x P k2
P P für x ∈ − , 2 2 P3 4π 3
∞
∑ k =1
(−1) k +1 2 2 2π (k π − 6) sin k x 3 P k
17.4 Fourier-Reihen
329
2U P − U − P x für − 2 ≤ x < 0 4. f ( x) = 2U P U − x für 0 ≤ x < P 2 T ( x) =
2U
π
∞
1
2π x P
∑ k sin k k =1
2U P U + P x für − 2 ≤ x < 0 5. f ( x) = P 2U U − x für 0 ≤ x < P 2
T ( x) =
∞
U 4U + 2 π2
1
∑ (2k − 1)
2
cos(2k − 1)
k =1
2π x P
P P x + x für − ≤ x < 0 2 2 6. f ( x) = P x − x für 0 ≤ x < P 2 2 T ( x) =
2P 2
π
3
∞
8. f ( x) = U sin
T ( x) =
für
P2 P2 − 6 π2
π P
π
sin( 2k − 1)
−
4U
π
2π x P
0≤ x< P ∞
1
∑k
2
cos k
k =1
für
x
2U
3
k =1
7. f ( x) = x ( P − x )
T ( x) =
1
∑ (2k − 1)
2π x P
0≤ x
0
(a > 0)
1 a + iω
1 a − iω
3.
t n−1 − at e σ (t ) (n − 1)!
(n ∈ N+, a > 0)
1 ( a + iω ) n
4.
(−1) n−1 t n−1 −at e σ (t ) (n∈N+, a > 0) (n − 1)!
1 (a − iω ) n
17.5 Fourier-Transformierte
335
5.
e − a|t|
(a > 0)
2a a + ω2
6.
e − a|t|sign t
(a > 0)
−
2iω a +ω2
7.
t e − a|t|
(a > 0)
−
4iaω (a 2 + ω 2 ) 2
8.
| t |e − a|t|
(a > 0)
2(a 2 − ω 2 ) (a 2 + ω 2 ) 2
9.
e − at
1
10.
11.
2
4πa
e
−
t2 4a
1 t 2 + a2
π
(a > 0)
e − aω
(a ≠ 0)
e
a
π
−
ω2 4a
2
e −a|ω|
a
2 sin ωT
ω
13. t ⋅ χ[ −T ,T ] (t )
2i
−
ω2
2
2 14. t ⋅ χ[ −T ,T ] (t )
ω
3
t ⋅ χ [ − T , T ] (t )
ω (n ∈ N+, n gerade)
=
sin ωT −
2T n −1
ω2
2iT n
n
t ⋅ χ [ − T , T ] (t )
ω (n ∈ N+, n ungerade)
=
(sin ωT − ωT cos ωT )
[(ω 2T 2 − 2) sin ωT + 2ωT cos ωT ]
2T n
n
16.
2
(a > 0)
12. χ[ −T , T ] (t )
15.
2
ni
ω
(ωT sin ωT − n cos ωT ) −
cos ωT −
2iT n −1
ω2
F (t n −1 )
ni
ω
n(n − 1)
ω2
F (t n − 2 )
F (t n −1 )
(ωT cos ωT − n sin ωT ) −
n(n − 1)
ω2
F (t n − 2 )
336
17 Anhang: Tafeln und Tabellen
17.6
LAPLACE-Transformierte
In der folgenden Tabelle, die eine – reelle oder komplexe – Zeitfunktion f (t ) mit ihrer LAPLACE-Transformierten F (s ) , s ∈ C, verknüpft, bezeichnet σ (t ) die Einheitssprungfunktion, also 1 für t ≥ 0 . 0 für t < 0
σ (t ) =
Auch für alle anderen Funktionen f (t ) ist wie üblich f (t ) = 0 für t < 0. Die Parameter in der Tabelle, die grundsätzlich auch komplex sein können, sind stets so zu wählen, dass alle vorkommenden Ausdrücke definiert sind. f (t )
F (s )
1.
σ (t )
1 s
2.
t
1 s2
3.
e − at
1 s+a
4.
sin at
a s + a2
5.
cos at
s s + a2
6.
sinh at
a s − a2
7.
cosh at
s s2 − a2
8.
te − at
1 ( s + a) 2
9.
(1 − at )e − at
s ( s + a) 2
10.
e − bt − e − at a −b
2
2
2
1 ( s + a)(s + b)
17.6 Laplace-Transformierte
337
11.
be − bt − ae − at b−a
s ( s + a )(s + b)
12.
1 2 −at t e 2
1 ( s + a) 3
13.
1 (2t − at 2 )e −at 2
s ( s + a )3
14.
1 (2 − 4at + a 2t 2 )e −at 2
s2 ( s + a )3
15.
e − at − e − bt + (a − b)t e − bt ( a − b) 2
1 ( s + a)(s + b) 2
16.
(c − b)e − at + (a − c)e − bt + (b − a)e − ct (a − b)(b − c)(c − a)
1 ( s + a)( s + b)( s + c)
17.
1 (e at − (2at + 1))e − at 2 4a
1 ( s + a)( s 2 − a 2 )
18.
be − at + a sinh bt − b cosh bt b( a 2 − b 2 )
1 ( s + a)(s 2 − b 2 )
19.
be − at + a sin bt − b cos bt b( a 2 + b 2 )
1 ( s + a)(s 2 + b 2 )
20.
t n−1 e − at (n − 1)!
1 ( s + a) n
338 21.
17 Anhang: Tafeln und Tabellen f (t ) = σ (t − T ) für T > 0 F (s) =
22.
f (t ) = 1 − σ (t − T ) für T > 0 F (s) =
23.
e −T1s − e −T2s s
für t < T 0 f (t ) = A ( t − T ) für t ≥ T F (s) =
25.
1 − e −Ts s
f (t ) = σ (t − T1 ) − σ (t − T2 ) für T1, T2 > 0 F ( s) =
24.
e −Ts s
mit A ∈ R
Ae −Ts s2
0 für t < T1 B (t − T1 ) für T1 ≤ t ≤ T2 f (t ) = T2 − T1 B für t > T2
F (s) =
B e −T1s − e −T2s ⋅ T2 − T1 s2
17.6 Laplace-Transformierte
26.
0 f (t ) = −b (t −T ) e F (s) =
27.
für t < T für t ≥ T
mit b ∈ R+
e −Ts s+b
0 f (t ) = −b ( t −T ) 1 − e F (s) =
339
für t < T für t ≥ T
b e −Ts s ( s + b)
mit b ∈ R+
340
17 Anhang: Tafeln und Tabellen
17.7
Statistische Tabellen
Tabelle 1: Quantile uγ der Standardnormalverteilung γ
uγ
γ
uγ
γ
uγ
γ
uγ
0,9999 0,9998 0,9997 0,9996 0,9995
3,7190 3,5401 3,4316 3,3528 3,2905
0,9975 0,9970 0,9965 0,9960 0,9955
2,8070 2,7478 2,6968 2,6521 2,6121
0,965 0,960 0,955 0,950 0,945
1,8119 1,7507 1,6954 1,6449 1,5982
0,83 0,82 0,81 0,80 0,79
0,9542 0,9154 0,8779 0,8416 0,8064
0,9994 0,9993 0,9992 0,9991 0,9990
3,2389 3,1947 3,1559 3,1214 3,0902
0,9950 0,9945 0,9940 0,9935 0,9930
2,5758 2,5427 2,5121 2,4838 2,4573
0,940 0,935 0,930 0,925 0,920
1,5548 1,5141 1,4758 1,4395 1,4051
0,78 0,76 0,74 0,72 0,70
0,7722 0,7063 0,6433 0,5828 0,5244
0,9989 0,9988 0,9987 0,9986 0,9985
3,0618 3,0357 3,0115 2,9889 2,9677
0,9925 0,9920 0,9915 0,9910 0,9905
2,4324 2,4089 2,3867 2,3656 2,3455
0,915 0,910 0,905 0,900 0,890
1,3722 1,3408 1,3106 1,2816 1,2265
0,68 0,66 0,64 0,62 0,60
0,4677 0,4125 0,3585 0,3055 0,2533
0,9984 0,9983 0,9982 0,9981 0,9980
2,9478 2,9290 2,9112 2,8943 2,8782
0,9900 0,9850 0,9800 0,9750 0,9700
2,3263 2,1701 2,0537 1,9600 1,8808
0,880 0,870 0,860 0,850 0,840
1,1750 1,1264 1,0803 1,0364 0,9945
0,58 0,56 0,54 0,52 0,50
0,2019 0,1510 0,1004 0,0502 0,0000
Ablesebeispiel: u0,95 = 1,6449
Erweiterung für kleine γ: u1−γ = −uγ
17.7 Statistische Tabellen
341
Tabelle 2: Verteilungsfunktion Φ (x) der Standardnormalverteilung x
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0 0,1 0,2 0,3 0,4
0,5000 0,5398 0,5793 0,6179 0,6554
0,5040 0,5438 0,5832 0,6217 0,6591
0,5080 0,5478 0,5871 0,6255 0,6628
0,5120 0,5517 0,5910 0,6293 0,6664
0,5160 0,5557 0,5948 0,6331 0,6700
0,5199 0,5596 0,5987 0,6368 0,6736
0,5239 0,5636 0,6026 0,6406 0,6772
0,5279 0,5675 0,6064 0,6443 0,6808
0,5319 0,5714 0,6103 0,6480 0,6844
0,5359 0,5753 0,6141 0,6517 0,6879
0,5 0,6 0,7 0,8 0,9
0,6915 0,7257 0,7580 0,7881 0,8159
0,6950 0,7291 0,7611 0,7910 0,8186
0,6985 0,7324 0,7642 0,7939 0,8212
0,7019 0,7357 0,7673 0,7967 0,8238
0,7054 0,7389 0,7704 0,7995 0,8264
0,7088 0,7422 0,7734 0,8023 0,8289
0,7123 0,7454 0,7764 0,8051 0,8315
0,7157 0,7486 0,7794 0,8078 0,8340
0,7190 0,7517 0,7823 0,8106 0,8365
0,7224 0,7549 0,7852 0,8133 0,8389
1,0 1,1 1,2 1,3 1,4
0,8413 0,8643 0,8849 0,9032 0,9192
0,8438 0,8665 0,8869 0,9049 0,9207
0,8461 0,8686 0,8888 0,9066 0,9222
0,8485 0,8708 0,8907 0,9082 0,9236
0,8508 0,8729 0,8925 0,9099 0,9251
0,8531 0,8749 0,8944 0,9115 0,9265
0,8554 0,8770 0,8962 0,9131 0,9279
0,8577 0,8790 0,8980 0,9147 0,9292
0,8599 0,8810 0,8997 0,9162 0,9306
0,8621 0,8830 0,9015 0,9177 0,9319
1,5 1,6 1,7 1,8 1,9
0,9332 0,9452 0,9554 0,9641 0,9713
0,9345 0,9463 0,9564 0,9649 0,9719
0,9357 0,9474 0,9573 0,9656 0,9726
0,9370 0,9484 0,9582 0,9664 0,9732
0,9382 0,9495 0,9591 0,9671 0,9738
0,9394 0,9505 0,9599 0,9678 0,9744
0,9406 0,9515 0,9608 0,9686 0,9750
0,9418 0,9525 0,9616 0,9693 0,9756
0,9429 0,9535 0,9625 0,9699 0,9761
0,9441 0,9545 0,9633 0,9706 0,9767
2,0 2,1 2,2 2,3 2,4
0,9772 0,9821 0,9861 0,9893 0,9918
0,9778 0,9826 0,9864 0,9896 0,9920
0,9783 0,9830 0,9868 0,9898 0,9922
0,9788 0,9834 0,9871 0,9901 0,9925
0,9793 0,9838 0,9875 0,9904 0,9927
0,9798 0,9842 0,9878 0,9906 0,9929
0,9803 0,9846 0,9881 0,9909 0,9931
0,9808 0,9850 0,9884 0,9911 0,9932
0,9812 0,9854 0,9887 0,9913 0,9934
0,9817 0,9857 0,9890 0,9916 0,9936
2,5 2,6 2,7 2,8 2,9
0,9938 0,9953 0,9965 0,9974 0,9981
0,9940 0,9955 0,9966 0,9975 0,9982
0,9941 0,9956 0,9967 0,9976 0,9982
0,9943 0,9957 0,9968 0,9977 0,9983
0,9945 0,9959 0,9969 0,9977 0,9984
0,9946 0,9960 0,9970 0,9978 0,9984
0,9948 0,9961 0,9971 0,9979 0,9985
0,9949 0,9962 0,9972 0,9979 0,9985
0,9951 0,9963 0,9973 0,9980 0,9986
0,9952 0,9964 0,9974 0,9981 0,9986
3,0 3,1 3,2 3,3
0,9987 0,9990 0,9993 0,9995
0,9987 0,9991 0,9993 0,9995
0,9987 0,9991 0,9994 0,9995
0,9988 0,9991 0,9994 0,9996
0,9988 0,9992 0,9994 0,9996
0,9989 0,9992 0,9994 0,9996
0,9989 0,9992 0,9994 0,9996
0,9989 0,9992 0,9995 0,9996
0,9990 0,9993 0,9995 0,9996
0,9990 0,9993 0,9995 0,9997
Ablesebeispiel: Φ (1,56) = 0,9406
Erweiterung für negative x: Φ(− x) = 1 − Φ ( x)
342
17 Anhang: Tafeln und Tabellen
Tabelle 3: Quantile tn,γ der t-Verteilung n|γ
0,995
0,990
0,975
0,950
0,900
1 2 3 4 5
63,657 9,925 5,841 4,604 4,032
31,821 6,965 4,541 3,747 3,365
12,706 4,303 3,182 2,776 2,571
6,314 2,920 2,353 2,132 2,015
3,078 1,886 1,638 1,533 1,476
6 7 8 9 10
3,707 3,499 3,355 3,250 3,169
3,143 2,998 2,896 2,821 2,764
2,447 2,365 2,306 2,262 2,228
1,943 1,895 1,860 1,833 1,812
1,440 1,415 1,397 1,383 1,372
11 12 13 14 15
3,106 3,055 3,012 2,977 2,947
2,718 2,681 2,650 2,624 2,602
2,201 2,179 2,160 2,145 2,131
1,796 1,782 1,771 1,761 1,753
1,363 1,356 1,350 1,345 1,341
16 17 18 19 20
2,921 2,898 2,878 2,861 2,845
2,583 2,567 2,552 2,539 2,528
2,120 2,110 2,101 2,093 2,086
1,746 1,740 1,734 1,729 1,725
1,337 1,333 1,330 1,328 1,325
21 22 23 24 25
2,831 2,819 2,807 2,797 2,787
2,518 2,508 2,500 2,492 2,485
2,080 2,074 2,069 2,064 2,060
1,721 1,717 1,714 1,711 1,708
1,323 1,321 1,319 1,318 1,316
26 27 28 29 30
2,779 2,771 2,763 2,756 2,750
2,479 2,473 2,467 2,462 2,457
2,056 2,052 2,048 2,045 2,042
1,706 1,703 1,701 1,699 1,697
1,315 1,314 1,313 1,311 1,310
40 50 60 70 80
2,704 2,678 2,660 2,648 2,639
2,423 2,403 2,390 2,381 2,374
2,021 2,009 2,000 1,994 1,990
1,684 1,676 1,671 1,667 1,664
1,303 1,299 1,296 1,294 1,292
90 100 150 200 300
2,632 2,626 2,609 2,601 2,592
2,369 2,364 2,352 2,345 2,339
1,987 1,984 1,976 1,972 1,968
1,662 1,660 1,655 1,653 1,650
1,291 1,290 1,287 1,286 1,284
∞
2,576
2,326
1,960
1,645
1,282
Ablesebeispiel: t15; 0,95 = 1,753
Erweiterung: t n ,1−γ = −t n,γ , t∞ ,γ = uγ
17.7 Statistische Tabellen
343
Tabelle 4: Quantile χ n2,γ der χ 2 -Verteilung n
0,995
0,990
0,975
0,950
0,900
0,750
0,500
0,250
0,100
0,050
0,025
0,010
0,005
–3
γ 1
7,879
6,635
5,024
3,841
2,706
1,323
0,455
0,102
–2
3,93
–4
9,82
–4
1,57
–5
3,93
2
10,60
9,210
7,378
5,991
4,605
2,773
1,386
0,575
0,211
0,103
–2
5,06
–2
2,01
–2
1,00
3
12,84
11,34
9,348
7,815
6,251
4,108
2,366
1,213
0,584
0,352
0,216
0,115
–2
7,17
4
14,86
13,28
11,14
9,488
7,779
5,385
3,357
1,923
1,064
0,711
0,484
0,297
0,207
5
16,75
15,09
12,83
11,07
9,236
6,626
4,351
2,675
1,610
1,145
0,831
0,554
0,412
6
18,55
16,81
14,45
12,59
10,64
7,841
5,348
3,455
2,204
1,635
1,237
0,872
0,676
7
20,28
18,48
16,01
14,07
12,02
9,037
6,346
4,255
2,833
2,167
1,690
1,239
0,989
8
21,96
20,09
17,53
15,51
13,36
10,22
7,344
5,071
3,490
2,733
2,180
1,647
1,344
9
23,59
21,67
19,02
16,92
14,68
11,39
8,343
5,899
4,168
3,325
2,700
2,088
1,735
10
25,19
23,21
20,48
18,31
15,99
12,55
9,342
6,737
4,865
3,940
3,247
2,558
2,156
11
26,76
24,73
21,92
19,68
17,28
13,70
10,34
7,584
5,578
4,575
3,816
3,053
2,603
12
28,30
26,22
23,34
21,03
18,55
14,85
11,34
8,438
6,304
5,226
4,404
3,571
3,074
13
29,82
27,69
24,74
22,36
19,81
15,98
12,34
9,299
7,042
5,892
5,009
4,107
3,565
14
31,32
29,14
26,12
23,68
21,06
17,12
13,34
10,17
7,790
6,571
5,629
4,660
4,075
15
32,80
30,58
27,49
25,00
22,31
18,25
14,34
11,04
8,547
7,261
6,262
5,229
4,601
16
34,27
32,00
28,85
26,30
23,54
19,37
15,34
11,91
9,312
7,962
6,908
5,812
5,142
17
35,72
33,41
30,19
27,59
24,77
20,49
16,34
12,79
10,09
8,672
7,564
6,408
5,697
18
37,16
34,81
31,53
28,87
25,99
21,60
17,34
13,68
10,86
9,390
8,231
7,015
6,265
19
38,58
36,19
32,85
30,14
27,20
22,72
18,34
14,56
11,65
10,12
8,907
7,633
6,844
20
40,00
37,57
34,17
31,41
28,41
23,83
19,34
15,45
12,44
10,85
9,591
8,260
7,434
21
41,40
38,93
35,48
32,67
29,62
24,93
20,34
16,34
13,24
11,59
10,28
8,897
8,034
22
42,80
40,29
36,78
33,92
30,81
26,04
21,34
17,24
14,04
12,34
10,98
9,542
8,643
23
44,18
41,64
38,08
35,17
32,01
27,14
22,34
18,14
14,85
13,09
11,69
10,20
9,260
24
45,56
42,98
39,36
36,42
33,20
28,24
23,34
19,04
15,66
13,85
12,40
10,86
9,886
25
46,93
44,31
40,65
37,65
34,38
29,34
24,34
19,94
16,47
14,61
13,12
11,52
10,52
26
48,29
45,64
41,92
38,89
35,56
30,43
25,34
20,84
17,29
15,38
13,84
12,20
11,16
27
49,64
46,96
43,19
40,11
36,74
31,53
26,34
21,75
18,11
16,15
14,57
12,88
11,81
28
50,99
48,28
44,46
41,34
37,92
32,62
27,34
22,66
19,94
16,93
15,31
13,56
12,46
29
52,34
49,59
45,72
42,56
39,09
33,71
28,34
23,57
19,77
17,71
16,05
14,26
13,12
30
53,67
50,89
46,98
43,77
40,26
34,80
29,34
24,48
20,60
18,49
16,79
14,95
13,79
40
66,77
63,69
59,34
55,76
51,81
45,62
39,34
33,66
29,05
26,51
24,43
22,16
20,71
50
79,49
76,15
71,42
67,50
63,17
56,33
49,33
42,94
37,69
34,76
32,36
29,71
27,99
60
91,95
88,38
83,30
79,08
74,40
66,98
59,33
52,29
46,46
43,19
40,48
37,48
35,53
70
104,2
100,4
95,02
90,53
85,53
77,58
69,33
61,70
55,33
51,74
48,76
45,44
43,28
80
116,3
112,3
106,6
101,9
96,58
88,13
79,33
71,14
64,28
60,39
57,15
53,54
51,17
1,58
344
17 Anhang: Tafeln und Tabellen γ
0,995
0,990
0,975
0,950
0,900
0,750
0,500
0,250
0,100
0,050
0,025
0,010
0,005
n
90
128,3
124,1
118,1
113,1
107,6
98,65
89,33
80,62
73,29
69,13
65,65
61,75
59,20
100
140,2
135,8
129,6
124,3
118,5
109,1
99,33
90,13
82,36
77,93
74,22
70,06
67,33
150
198,4
193,2
185,8
179,6
172,6
161,3
149,3
138,0
128,3
122,7
118,0
112,7
109,1
200
255,3
249,4
241,1
234,0
226,0
213,1
199,3
186,2
174,8
168,3
162,7
156,4
152,2
250
311,3
304,9
295,7
287,9
279,1
264,7
249,3
234,6
221,8
214,4
208,1
200,9
196,2
300
366,8
359,9
349,9
341,4
331,8
316,1
299,3
283,1
269,1
260,9
253,9
246,0
240,7
400
476,6
468,7
457,3
447,6
436,6
418,7
399,3
380,6
364,2
354,6
346,5
337,2
330,9
600
693,0
683,5
669,8
658,1
644,8
623,0
599,3
576,3
556,1
544,2
534,0
522,4
514,5
800
906,8
896,0
880,3
866,9
851,7
826,6
799,3
772,7
749,2
735,4
723,5
709,9
700,7
1000
1119,
1107,
1090,
1075,
1058,
1030,
999,3
969,5
943,1
927,6
914,3
898,9
888,6
Ablesebeispiel: χ1;0,05 = -33,93 = 3,93·10–3 = 0,00393
17.7 Statistische Tabellen
345
Tabelle 5: Quantile Fm,n,γ der F-Verteilung m n γ 1 0,990 0,975 0,950 0,900
1
2
3
4
5
6
7
8
9
10
11
4052, 647,8 161,4 39,86
4999, 799,5 199,5 49,50
5403, 864,2 215,7 53,59
5625, 899,6 224,6 55,83
5764, 921,8 230,2 57,24
5859, 937,1 234,0 58,20
5928, 948,2 236,8 58,91
5981, 956,7 238,9 59,44
6022, 963,3 240,5 59,86
6056, 968,6 241,9 60,20
6083, 973,0 243,0 60,47
2 0,990 0,975 0,950 0,900
98,50 38,51 18,51 8,526
99,00 39,00 19,00 9,000
99,17 39,17 19,16 9,162
99,25 39,25 19,25 9,243
99,30 39,30 19,30 9,293
99,33 39,33 19,33 9,326
99,36 39,36 19,35 9,349
99,37 39,37 19,37 9,367
99,39 39,39 19,38 9,381
99,40 39,40 19,40 9,392
99,41 39,41 19,40 9,401
3 0,990 0,975 0,950 0,900
34,12 17,44 10,13 5,538
30,82 16,04 9,552 5,462
29,46 15,44 9,277 5,391
28,71 15,10 9,117 5,343
28,24 14,88 9,013 5,309
27,91 14,73 8,941 5,285
27,67 14,62 8,887 5,266
27,49 14,54 8,845 5,252
27,35 14,47 8,812 5,240
27,23 14,42 8,786 5,230
27,13 14,37 8,763 5,222
4 0,990 0,975 0,950 0,900
21,20 12,22 7,709 4,545
18,00 10,65 6,944 4,325
16,69 9,979 6,591 4,191
15,98 9,605 6,388 4,107
15,52 9,364 6,256 4,051
15,21 9,197 6,163 4,010
14,98 9,074 6,094 3,979
14,80 8,980 6,041 3,955
14,66 8,905 5,999 3,936
14,55 8,844 5,964 3,920
14,45 8,793 5,936 3,907
5 0,990 0,975 0,950 0,900
16,26 10,01 6,608 4,060
13,27 8,434 5,786 3,780
12,06 7,764 5,409 3,619
11,39 7,388 5,192 3,520
10,97 7,146 5,050 3,453
10,67 6,978 4,950 3,405
10,46 6,853 4,876 3,368
10,29 6,757 4,818 3,339
10,16 6,681 4,772 3,316
10,05 6,619 4,735 3,297
9,962 6,568 4,704 3,282
6 0,990 0,975 0,950 0,900
13,75 8,813 5,987 3,776
10,92 7,260 5,143 3,463
9,780 6,599 4,757 3,289
9,148 6,227 4,534 3,181
8,746 5,988 4,387 3,108
8,466 5,820 4,284 3,055
8,260 5,695 4,207 3,015
8,102 5,600 4,147 2,983
7,976 5,523 4,099 2,958
7,874 5,461 4,060 2,937
7,789 5,409 4,027 2,919
7 0,990 0,975 0,950 0,900
12,25 8,073 5,591 3,589
9,547 6,542 4,737 3,257
8,451 5,890 4,347 3,074
7,847 5,523 4,120 2,961
7,460 5,285 3,972 2,883
7,191 5,119 3,866 2,827
6,993 4,995 3,787 2,785
6,840 4,899 3,726 2,752
6,719 4,823 3,677 2,725
6,620 4,761 3,637 2,703
6,538 4,709 3,603 2,684
8 0,990 0,975 0,950 0,900
11,26 7,571 5,318 3,458
8,649 6,059 4,459 3,113
7,591 5,416 4,066 2,924
7,006 5,053 3,838 2,806
6,632 4,817 3,687 2,726
6,371 4,652 3,581 2,668
6,178 4,529 3,500 2,624
6,029 4,433 3,438 2,589
5,911 4,357 3,388 2,561
5,814 4,295 3,347 2,538
5,734 4,243 3,313 2,518
9 0,990 0,975 0,950 0,900
10,56 7,209 5,117 3,360
8,022 5,715 4,256 3,006
6,992 5,078 3,863 2,813
6,422 4,718 3,633 2,693
2,057 4,484 3,482 2,611
5,802 4,320 3,374 2,551
5,613 4,197 3,293 2,505
5,467 4,102 3,230 2,469
5,351 4,026 3,179 2,440
5,257 3,964 3,137 2,416
5,177 3,912 3,102 2,396
10 0,990 0,975 0,950 0,900
10,04 6,937 4,965 3,285
7,559 5,456 4,103 2,924
6,552 4,826 3,708 2,728
5,994 4,468 3,478 2,605
5,636 4,236 3,326 2,522
5,386 4,072 3,217 2,461
5,200 3,950 3,135 2,414
5,057 3,855 3,072 2,377
4,962 3,779 3,020 2,347
4,849 3,717 2,978 2,323
4,771 3,665 2,943 2,302
Ablesebeispiel: F3;6;0,99 = 27,91
Erweiterung: Fm ,n ,1−γ = ( Fm ,n ,γ ) −1
346
17 Anhang: Tafeln und Tabellen
Tabelle 5: Fortsetzung m n γ 1 0,990 0,975 0,950 0,900
12
13
14
15
20
24
30
40
60
120
∞
6106, 976,7 243,9 60,71
6126, 979,8 244,7 60,90
6143, 982,5 245,4 61,07
6157, 984,9 245,9 61,22
6209, 993,1 248,0 61,74
6235, 997,2 249,1 62,00
6261, 1001, 250,1 62,26
6287, 1006, 251,1 62,53
6313, 1010, 252,2 62,79
6339, 1014, 253,3 63,06
6366, 1018, 254,3 63,33
2 0,990 0,975 0,950 0,900
99,42 39,41 19,41 9,408
99,42 39,42 19,42 9,415
99,43 39,43 19,42 9,420
99,43 39,43 19,43 9,425
99,45 39,45 19,45 9,441
99,46 39,46 19,45 9,450
99,47 39,46 19,46 9,458
99,47 39,47 19,47 9,466
99,48 39,48 19,48 9,475
99,49 39,49 19,49 9,483
99,50 39,50 19,50 9,491
3 0,990 0,975 0,950 0,900
27,05 14,34 8,745 5,216
26,98 14,30 8,729 5,210
26,92 14,28 8,715 5,205
26,87 14,25 8,703 5,200
26,69 14,17 8,660 5,184
26,60 14,12 8,639 5,176
26,50 14,08 8,617 5,168
26,41 14,04 8,594 5,160
26,32 13,99 8,572 5,151
26,22 13,95 8,549 5,143
26,13 13,90 8,526 5,134
4 0,990 0,975 0,950 0,900
14,37 8,751 5,912 3,896
14,31 8,715 5,891 3,885
14,25 8,684 5,873 3,877
14,20 8,657 5,858 3,869
14,02 8,560 5,803 3,844
13,93 8,511 5,774 3,831
13,84 8,461 5,746 3,817
13,75 8,411 5,717 3,804
13,65 8,360 5,688 3,790
13,56 8,309 5,658 3,775
13,46 8,257 5,628 3,761
5 0,990 0,975 0,950 0,900
9,888 6,525 4,678 3,268
9,824 6,487 4,655 3,257
9,770 6,455 4,636 3,247
9,722 6,428 4,619 3,238
9,553 6,329 4,558 3,207
9,466 6,278 4,527 3,191
9,379 6,227 4,496 3,174
9,291 6,175 4,464 3,157
9,202 6,123 4,431 3,140
9,112 6,069 4,398 3,123
9,020 6,015 4,365 3,105
6 0,990 0,975 0,950 0,900
7,718 5,366 4,000 2,905
7,657 5,329 3,976 2,892
7,605 5,297 3,956 2,881
7,559 5,269 3,938 2,871
7,396 5,168 3,874 2,836
7,313 5,117 3,841 2,818
7,229 5,065 3,808 2,800
7,143 5,012 3,774 2,781
7,057 4,959 3,740 2,762
6,969 4,904 3,705 2,742
6,880 4,849 3,669 2,722
7 0,990 0,975 0,950 0,900
6,469 4,666 3,575 2,668
6,410 4,628 3,550 2,654
6,359 4,596 3,529 2,643
6,314 4,568 3,511 2,632
6,155 4,467 3,445 2,595
6,074 4,415 3,410 2,575
5,992 4,362 3,376 2,555
5,908 4,309 3,340 2,535
5,824 4,254 3,304 2,514
5,737 4,199 3,267 2,493
5,650 4,142 3,230 2,471
8 0,990 0,975 0,950 0,900
5,667 4,200 3,284 2,502
5,609 4,162 3,259 2,488
5,558 4,129 3,237 2,475
5,515 4,101 3,218 2,464
5,359 3,999 3,150 2,425
5,279 3,947 3,115 2,404
5,198 3,894 3,079 2,383
5,116 3,840 3,043 2,361
5,032 3,784 3,005 2,339
4,946 3,728 2,967 2,316
4,859 3,670 2,928 2,293
9 0,990 0,975 0,950 0,900
5,111 3,868 3,073 2,379
5,054 3,830 3,047 2,364
5,005 3,798 3,025 2,351
4,962 3,769 3,006 2,340
4,808 3,667 2,936 2,298
4,729 3,614 2,900 2,277
4,649 3,560 2,864 2,255
4,567 3,505 2,826 2,232
4,483 3,449 2,787 2,208
4,398 3,392 2,748 2,184
4,311 3,333 2,707 2,159
10 0,990 0,975 0,950 0,900
4,706 3,621 2,913 2,284
4,649 3,583 2,887 2,269
4,600 3,550 2,864 2,255
4,558 3,522 2,845 2,244
4,405 3,419 2,774 2,201
4,327 3,365 2,737 2,178
4,247 3,311 2,700 2,155
4,165 3,255 2,661 2,132
4,082 3,198 2,621 2,107
3,996 3,140 2,580 2,082
3,909 3,080 2,538 2,055
17.7 Statistische Tabellen
347
Tabelle 5: Fortsetzung m n γ 11 0,990 0,975 0,950 0,900
1
2
3
4
5
6
7
8
9
10
11
9,646 6,724 4,844 3,225
7,206 5,256 3,982 2,860
6,217 4,630 3,587 2,660
5,668 4,275 3,357 2,536
5,316 4,044 3,204 2,451
5,069 3,881 3,095 2,389
4,886 3,759 3,012 2,342
4,744 3,664 2,948 2,304
4,632 3,588 2,896 2,273
4,539 3,526 2,854 2,248
4,462 3,473 2,818 2,227
12 0,990 0,975 0,950 0,900
9,330 6,554 4,747 3,177
6,927 5,096 3,885 2,807
5,953 4,474 3,490 2,605
5,412 4,121 3,259 2,480
5,064 3,891 3,106 2,394
4,821 3,728 2,996 2,331
4,640 3,607 2,913 2,283
4,499 3,512 2,849 2,245
4,388 3,436 2,796 2,214
4,296 3,374 2,753 2,188
4,219 3,321 2,717 2,166
13 0,990 0,975 0,950 0,900
9,074 6,414 4,667 3,136
6,701 4,965 3,806 2,763
5,739 4,347 3,411 2,560
5,205 3,996 3,179 2,434
4,862 3,767 3,025 2,347
4,620 3,604 2,915 2,283
4,441 3,483 2,832 2,234
4,302 3,388 2,767 2,195
4,191 3,312 2,714 2,164
4,100 3,250 2,671 2,138
4,024 3,197 2,634 2,115
14 0,990 0,975 0,950 0,900
8,862 6,298 4,600 3,102
6,515 4,857 3,739 2,726
5,564 4,242 3,344 2,522
5,035 3,892 3,112 2,395
4,695 3,663 2,958 2,307
4,456 3,501 2,848 2,243
4,278 3,380 2,764 2,193
4,140 3,285 2,699 2,154
4,030 3,209 2,646 2,122
3,939 3,147 2,602 2,095
3,863 3,094 2,565 2,073
15 0,990 0,975 0,950 0,900
8,683 6,199 4,543 3,073
6,359 4,765 3,682 2,695
5,417 4,153 3,287 2,490
4,893 3,804 3,056 2,361
4,556 3,576 2,901 2,273
4,318 3,415 2,790 2,208
4,142 3,293 2,707 2,158
4,004 3,199 2,641 2,119
3,895 3,123 2,588 2,086
3,805 3,060 2,544 2,059
3,730 3,007 2,506 2,036
16 0,990 0,975 0,950 0,900
8,531 6,115 4,494 3,048
6,226 4,687 3,634 2,668
5,292 4,077 3,239 2,462
4,773 3,729 3,007 2,333
4,437 3,502 2,852 2,244
4,202 3,341 2,741 2,178
4,026 3,219 2,657 2,128
3,890 3,125 2,591 2,088
3,780 3,049 2,538 2,055
3,691 2,986 2,494 2,028
3,616 2,933 2,456 2,005
17 0,990 0,975 0,950 0,900
8,400 6,042 4,451 3,026
6,112 4,619 3,592 2,645
5,185 4,011 3,197 2,437
4,669 3,665 2,965 2,308
4,336 3,438 2,810 2,218
4,101 3,277 2,699 2,152
3,927 3,156 2,614 2,102
3,791 3,061 2,548 2,061
3,682 2,985 2,494 2,028
3,593 2,922 2,450 2,001
3,518 2,869 2,412 1,977
18 0,990 0,975 0,950 0,900
8,285 5,978 4,414 3,007
6,013 4,560 3,555 2,624
5,092 3,954 3,160 2,416
4,579 3,608 2,928 2,286
4,248 3,382 2,773 2,196
4,015 3,221 2,661 2,130
3,841 3,100 2,577 2,079
3,705 3,005 2,510 2,038
3,597 2,929 2,456 2,005
3,508 2,866 2,412 1,977
3,433 2,813 2,374 1,953
19 0,990 0,975 0,950 0,900
8,185 5,922 4,381 2,990
5,926 4,508 3,522 2,606
5,010 3,903 3,127 2,397
4,500 3,559 2,895 2,266
4,171 3,333 2,740 2,176
3,939 3,172 2,628 2,109
3,765 3,051 2,544 2,058
3,631 2,956 2,477 2,017
3,523 2,880 2,423 1,984
3,434 2,817 2,378 1,956
3,359 2,764 2,340 1,932
20 0,990 0,975 0,950 0,900
8,096 5,871 4,351 2,975
5,849 4,461 3,493 2,589
4,938 3,859 3,098 2,380
4,431 3,515 2,866 2,249
4,103 3,289 2,711 2,158
3,871 3,128 2,599 2,091
3,699 3,007 2,514 2,040
3,564 2,913 2,447 1,999
3,457 2,837 2,393 1,965
3,368 2,774 2,348 1,937
3,293 2,720 2,310 1,913
348
17 Anhang: Tafeln und Tabellen
Tabelle 5: Fortsetzung m n γ 11 0,990 0,975 0,950 0,900
12
13
14
15
20
24
30
40
60
120
∞
4,397 3,430 2,788 2,209
4,341 3,391 2,761 2,193
4,293 3,358 2,738 2,179
4,251 3,330 2,719 2,167
4,099 3,226 2,646 2,123
4,021 3,173 2,609 2,100
3,941 3,118 2,570 2,076
3,860 3,061 2,531 2,052
3,776 3,004 2,490 2,026
3,690 2,944 2,448 2,000
3,602 2,883 2,404 1,972
12 0,990 0,975 0,950 0,900
4,155 3,277 2,687 2,147
4,099 3,239 2,660 2,131
4,051 3,206 2,637 2,117
4,010 3,177 2,617 2,105
3,858 3,073 2,544 2,060
3,780 3,019 2,505 2,036
3,701 2,963 2,466 2,011
3,619 2,906 2,426 1,986
3,535 2,848 2,384 1,960
3,449 2,787 2,341 1,932
3,361 2,725 2,296 1,904
13 0,990 0,975 0,950 0,900
3,960 3,153 2,604 2,097
3,905 3,115 2,577 2,080
3,857 3,081 2,553 2,066
3,815 3,053 2,533 2,053
3,665 2,948 2,459 2,007
3,587 2,893 2,420 1,983
3,507 2,837 2,380 1,958
3,425 2,780 2,339 1,931
3,341 2,720 2,297 1,904
3,255 2,659 2,252 1,876
3,165 2,595 2,206 1,846
14 0,990 0,975 0,950 0,900
3,800 3,050 2,534 2,054
3,745 3,011 2,507 2,037
3,697 2,978 2,483 2,022
3,656 2,949 2,463 2,010
3,505 2,844 2,388 1,962
3,427 2,789 2,349 1,938
3,348 2,732 2,308 1,912
3,266 2,674 2,266 1,885
3,181 2,614 2,223 1,857
3,094 2,552 2,178 1,828
3,004 2,487 2,131 1,797
15 0,990 0,975 0,950 0,900
3,666 2,963 2,475 2,017
3,611 2,924 2,448 2,000
3,563 2,891 2,424 1,985
3,522 2,862 2,403 1,972
3,372 2,756 2,328 1,924
3,294 2,701 2,288 1,899
3,214 2,644 2,247 1,873
3,132 2,585 2,204 1,845
3,047 2,524 2,160 1,817
2,959 2,461 2,114 1,787
2,868 2,395 2,066 1,755
16 0,990 0,975 0,950 0,900
3,553 2,889 2,425 1,985
3,497 2,850 2,397 1,968
3,450 2,817 2,373 1,953
3,409 2,788 2,352 1,940
3,259 2,681 2,276 1,891
3,181 2,625 2,235 1,866
3,101 2,568 2,194 1,839
3,018 2,509 2,151 1,811
2,933 2,447 2,106 1,782
2,845 2,383 2,059 1,751
2,753 2,316 2,010 1,718
17 0,990 0,975 0,950 0,900
3,455 2,825 2,381 1,958
3,400 2,786 2,353 1,940
3,353 2,752 2,329 1,925
3,312 2,723 2,308 1,912
3,162 2,616 2,230 1,862
3,084 2,560 2,190 1,836
3,003 2,502 2,148 1,809
2,920 2,442 2,104 1,781
2,835 2,380 2,058 1,751
2,746 2,315 2,011 1,719
2,653 2,247 1,960 1,686
18 0,990 0,975 0,950 0,900
3,371 2,769 2,342 1,933
3,316 2,730 2,314 1,915
3,268 2,696 2,290 1,900
3,227 2,667 2,269 1,887
3,077 2,559 2,191 1,837
2,999 2,503 2,150 1,810
2,919 2,444 2,107 1,783
2,835 2,384 2,063 1,754
2,749 2,321 2,017 1,723
2,660 2,256 1,968 1,691
2,566 2,187 1,917 1,657
19 0,990 0,975 0,950 0,900
3,297 2,720 2,308 1,912
3,241 2,680 2,280 1,894
3,194 2,646 2,255 1,878
3,153 2,617 2,234 1,865
3,003 2,509 2,155 1,814
2,925 2,452 2,114 1,787
2,844 2,394 2,071 1,759
2,761 2,333 2,026 1,730
2,674 2,270 1,980 1,699
2,584 2,203 1,930 1,666
2,489 2,133 1,878 1,631
20 0,990 0,975 0,950 0,900
3,231 2,676 2,278 1,892
3,176 2,636 2,249 1,874
3,129 2,602 2,225 1,859
3,088 2,573 2,203 1,845
2,938 2,464 2,124 1,794
2,859 2,408 2,082 1,767
2,778 2,349 2,039 1,738
2,695 2,287 1,994 1,708
2,608 2,223 1,946 1,677
2,517 2,156 1,896 1,643
2,421 2,085 1,843 1,607
17.7 Statistische Tabellen
349
Tabelle 5: Fortsetzung m n γ 22 0,990 0,975 0,950 0,900
1
2
3
4
5
6
7
8
9
10
11
7,945 5,786 4,301 2,949
5,719 4,383 3,443 2,561
4,817 3,783 3,049 2,351
4,313 3,440 2,817 2,219
3,988 3,215 2,661 2,128
3,758 3,055 2,549 2,060
3,587 2,934 2,464 2,008
3,453 2,839 2,397 1,967
3,346 2,763 2,342 1,933
3,258 2,700 2,297 1,904
3,183 2,646 2,258 1,880
24 0,990 0,975 0,950 0,900
7,823 5,717 4,260 2,927
5,614 4,319 3,403 2,538
4,718 3,721 3,009 2,327
4,218 3,379 2,776 2,195
3,895 3,155 2,621 2,103
3,667 2,995 2,508 2,035
3,496 2,874 2,423 1,983
3,363 2,779 2,355 1,941
3,256 2,703 2,300 1,906
3,168 2,640 2,255 1,877
3,094 2,586 2,216 1,853
26 0,990 0,975 0,950 0,900
7,721 5,659 4,225 2,909
5,526 4,265 3,369 2,519
4,637 3,670 2,975 2,307
4,140 3,329 2,743 2,174
3,818 3,105 2,587 2,082
3,591 2,945 2,474 2,014
3,421 2,824 2,388 1,961
3,288 2,729 2,321 1,919
3,182 2,653 2,265 1,884
3,094 2,590 2,200 1,855
3,020 2,536 2,181 1,830
28 0,990 0,975 0,950 0,900
7,636 5,610 4,196 2,894
5,453 4,221 3,340 2,503
4,568 3,626 2,947 2,291
4,074 3,286 2,714 2,157
3,754 3,063 2,558 2,064
3,528 2,903 2,445 1,996
3,358 2,782 2,359 1,943
3,226 2,687 2,291 1,900
3,120 2,611 2,236 1,865
3,032 2,547 2,190 1,836
2,958 2,493 2,151 1,811
30 0,990 0,975 0,950 0,900
7,562 5,568 4,171 2,881
5,390 4,182 3,316 2,489
4,510 3,589 2,922 2,276
4,018 3,250 2,690 2,142
3,699 3,026 2,534 2,049
3,473 2,867 2,421 1,980
3,304 2,746 2,334 1,927
3,173 2,651 2,266 1,884
3,067 2,575 2,211 1,849
2,979 2,511 2,165 1,819
2,905 2,457 2,125 1,794
40 0,990 0,975 0,950 0,900
7,314 5,424 4,085 2,835
5,179 4,051 3,232 2,440
4,313 3,463 2,839 2,226
3,828 3,126 2,606 2,091
3,514 2,904 2,449 1,997
3,291 2,744 2,336 1,927
3,124 2,624 2,249 1,873
2,993 2,529 2,180 1,829
2,888 2,452 2,124 1,793
2,801 2,388 2,077 1,763
2,727 2,334 2,037 1,737
60 0,990 0,975 0,950 0,900
7,077 5,286 4,001 2,791
4,977 3,925 3,150 2,393
4,126 3,343 2,758 2,177
3,649 3,008 2,525 2,041
3,339 2,786 2,368 1,946
3,119 2,627 2,254 1,875
2,953 2,507 2,167 1,819
2,823 2,412 2,097 1,775
2,718 2,334 2,040 1,738
2,632 2,270 1,993 1,707
2,558 2,215 1,952 1,680
80 0,990 0,975 0,950 0,900
6,964 5,219 3,961 2,770
4,882 3,865 3,111 2,370
4,036 3,285 2,719 2,154
3,564 2,951 2,486 2,017
3,256 2,730 2,329 1,921
3,037 2,571 2,214 1,849
2,872 2,451 2,127 1,793
2,743 2,356 2,057 1,748
2,639 2,278 1,999 1,711
2,552 2,214 1,952 1,680
2,478 2,158 1,910 1,652
120 0,990 0,975 0,950 0,900
6,851 5,152 3,920 2,748
4,787 3,805 3,072 2,347
3,949 3,227 2,680 2,130
3,480 2,894 2,447 1,992
3,174 2,674 2,290 1,896
2,956 2,515 2,175 1,824
2,792 2,395 2,087 1,767
2,663 2,299 2,016 1,722
2,559 2,222 1,959 1,684
2,472 2,157 1,910 1,652
2,398 2,101 1,869 1,625
∞ 0,990 0,975 0,950 0,900
6,635 5,024 3,841 2,706
4,605 3,689 2,996 2,303
3,782 3,116 2,605 2,084
3,319 2,786 2,372 1,945
3,017 2,567 2,214 1,847
2,802 2,408 2,099 1,774
2,639 2,288 2,010 1,717
2,511 2,192 1,938 1,670
2,407 2,114 1,880 1,632
2,321 2,048 1,831 1,599
2,247 1,992 1,788 1,570
350
17 Anhang: Tafeln und Tabellen
Tabelle 5: Fortsetzung m n γ 22 0,990 0,975 0,950 0,900
12
13
14
15
20
24
30
40
60
120
∞
3,121 2,602 2,226 1,859
3,066 2,562 2,197 1,841
3,019 2,528 2,172 1,825
2,978 2,498 2,151 1,811
2,827 2,389 2,071 1,759
2,749 2,332 2,028 1,731
2,667 2,272 1,984 1,702
2,583 2,210 1,938 1,671
2,495 2,145 1,889 1,639
2,403 2,076 1,838 1,604
2,305 2,003 1,783 1,567
24 0,990 0,975 0,950 0,900
3,032 2,541 2,183 1,832
2,977 2,501 2,154 1,813
2,930 2,467 2,129 1,797
2,889 2,437 2,108 1,783
2,738 2,327 2,027 1,730
2,659 2,269 1,984 1,702
2,577 2,209 1,939 1,672
2,492 2,146 1,892 1,641
2,403 2,080 1,842 1,607
2,310 2,010 1,790 1,571
2,211 1,935 1,733 1,533
26 0,990 0,975 0,950 0,900
2,958 2,491 2,148 1,809
2,903 2,451 2,119 1,790
2,856 2,417 2,093 1,774
2,815 2,387 2,072 1,760
2,664 2,276 1,990 1,706
2,585 2,217 1,946 1,677
2,503 2,157 1,901 1,647
2,417 2,093 1,853 1,615
2,327 2,026 1,803 1,581
2,233 1,954 1,749 1,544
2,131 1,878 1,691 1,504
28 0,990 0,975 0,950 0,900
2,896 2,448 2,118 1,790
2,841 2,408 2,088 1,770
2,794 2,374 2,063 1,754
2,753 2,344 2,041 1,740
2,602 2,232 1,959 1,685
2,522 2,174 1,915 1,656
2,440 2,112 1,869 1,625
2,353 2,048 1,820 1,592
2,263 1,980 1,769 1,558
2,167 1,907 1,714 1,520
2,064 1,829 1,654 1,478
30 0,990 0,975 0,950 0,900
2,843 2,412 2,092 1,773
2,788 2,372 2,062 1,753
2,741 2,337 2,037 1,737
2,700 2,307 2,015 1,722
2,549 2,195 1,932 1,667
2,469 2,136 1,887 1,638
2,386 2,074 1,841 1,606
2,299 2,009 1,792 1,573
2,208 1,940 1,740 1,538
2,111 1,866 1,684 1,499
2,006 1,787 1,622 1,456
40 0,990 0,975 0,950 0,900
2,665 2,288 2,003 1,715
2,610 2,247 1,973 1,695
2,563 2,212 1,947 1,677
2,522 2,182 1,924 1,662
2,369 2,068 1,839 1,605
2,288 2,007 1,793 1,574
2,203 1,943 1,744 1,541
2,114 1,875 1,693 1,506
2,019 1,803 1,637 1,467
1,917 1,724 1,577 1,425
1,805 1,637 1,509 1,377
60 0,990 0,975 0,950 0,900
2,496 2,169 1,917 1,657
2,441 2,128 1,886 1,637
2,393 2,092 1,860 1,619
2,352 2,061 1,836 1,603
2,198 1,944 1,748 1,543
2,115 1,882 1,700 1,511
2,028 1,815 1,649 1,476
1,936 1,744 1,594 1,437
1,836 1,667 1,534 1,395
1,726 1,581 1,467 1,348
1,601 1,482 1,389 1,291
80 0,990 0,975 0,950 0,900
2,416 2,112 1,876 1,629
2,361 2,070 1,844 1,608
2,313 2,034 1,817 1,590
2,272 2,003 1,793 1,574
2,116 1,885 1,703 1,513
2,033 1,821 1,654 1,479
1,944 1,753 1,602 1,443
1,849 1,679 1,545 1,403
1,746 1,598 1,482 1,358
1,630 1,507 1,410 1,306
1,491 1,396 1,322 1,242
120 0,990 0,975 0,950 0,900
2,336 2,055 1,834 1,601
2,281 2,013 1,802 1,580
2,233 1,976 1,774 1,561
2,192 1,945 1,750 1,545
2,035 1,825 1,659 1,482
1,950 1,760 1,608 1,447
1,860 1,690 1,554 1,409
1,763 1,614 1,495 1,368
1,656 1,530 1,429 1,320
1,533 1,433 1,352 1,265
1,381 1,310 1,254 1,193
∞ 0,990 0,975 0,950 0,900
2,185 1,945 1,752 1,546
2,129 1,902 1,719 1,523
2,080 1,865 1,691 1,504
2,039 1,833 1,666 1,487
1,878 1,708 1,571 1,421
1,791 1,640 1,517 1,383
1,696 1,566 1,459 1,342
1,592 1,484 1,394 1,295
1,473 1,388 1,318 1,240
1,325 1,268 1,221 1,169
1,000 1,000 1,000 1,000
18
Literaturhinweise
Es würde den Rahmen dieses Kapitels sprengen, alle Werke zu nennen, die in das vorliegende Taschenbuch, das auf Vorlesungen aus mehr als 30 Jahren basiert, direkt oder indirekt eingegangen sind. Deshalb wird hier nur eine kleine Auswahl solcher Bücher genannt, mit denen die Autoren gearbeitet haben und die gemeint sind, wenn auf weiterführende Literatur verwiesen wird. Von den meisten der hier angegebenen Werke gibt es inzwischen neuere Auflagen.
Lehrbücher zur Ingenieurmathematik
T. Arens et al.: Mathematik, 3. Aufl., Springer Verlag, 2015 J. Erven, D. Schwägerl: Mathematik für Angewandte Wissenschaften, Ein Lehrbuch für Ingenieure und Naturwissenschaftler, 5. Aufl., de Gruyter Verlag, 2018 J. Erven, M. Erven, J. Hörwick: Mathematik für Angewandte Wissenschaften, Ein Vorkurs für Ingenieure, Natur- und Wirtschaftswissenschaftler, 6. Aufl., de Gruyter Verlag, 2018 A. Fetzer, H. Fränkel (Hrsg.): Mathematik, Lehrbuch für Fachhochschulen, Bd. 1-3, VDI-Verlag, 1985 A. Hoffmann, B. Marx, W. Vogt: Mathematik für Ingenieure, Bd. 1+2, Pearson Verlag, 2005/2006 W. Preuß, G. Wenisch (Hrsg.): Lehr- und Übungsbuch Mathematik Bd. 1-3, Fachbuchverlag Leipzig, 1996 P. Stingl: Mathematik für Fachhochschulen, 3. Aufl., Hanser Verlag, 1988 zu Differentialgleichungen und Funktionentheorie
N. H. Asmar: Applied Complex Analysis with Partial Differential Equations, Pearson Education, 2002 L. Collatz: Gewöhnliche Differentialgleichungen, 4. Aufl., Teubner Verlag, 1970 W. Fischer, I. Lieb: Funktionentheorie, 7. Aufl., Vieweg Verlagsgesellschaft, 2002 A. Herz: Repetitorium Funktionentheorie, Vieweg + Teubner Verlag, 2003 H. Heuser: Gewöhnliche Differentialgleichungen, 4. Aufl., Teubner Verlag, 2004
https://doi.org/10.1515/9783110537161-361
352
18 Literaturhinweise zur Numerischen Mathematik
M. Knorrenschild: Numerische Mathematik – eine beispielorientierte Einführung, Fachbuchverlag Leipzig, 2003 W. Preuß, G. Wenisch (Hrsg.): Lehr- und Übungsbuch Numerische Mathematik, Fachbuchverlag Leipzig 2001 H. Schwetlick, H. Kretzschmar: Numerische Verfahren für Naturwissenschaftler und Ingenieure, Fachbuchverlag Leipzig 1991 zu Wahrscheinlichkeitstheorie und Statistik
A.H. Haddad: Probabilistic Systems and Random Signals, Pearson Prentice Hall, 2006 E. Kreyszig: Statistische Methoden und ihre Anwendungen, 3. Aufl., Verlag Vandenhoeck und Rupprecht, 1970 S.M. Ross: Statistik für Ingenieure und Naturwissenschaftler, 3. Aufl., Spektrum Akademischer Verlag, 2006 M. Sachs: Wahrscheinlichkeitsrechnung und Statistik, Für Ingenieurstudenten an Fachhochschulen, Fachbuchverlag Leipzig, 2003 R. Storm: Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitätskontrolle, 10. Aufl., Fachbuchverlag Leipzig, 1995
Nachschlagewerke und Formelsammlungen H.-J. Bartsch: Taschenbuch Mathematischer Formeln für Ingenieure und Naturwissenschaftler, 22. neu bearbeitete Auflage, Fachbuchverlag Leipzig 2011 I.N. Bronstein, K.A. Semendjajew, G. Musiol, H. Mühlig: Taschenbuch der Mathematik, Harri Deutsch Verlag, 1993 L. Rade, B. Westergren: Springers Mathematische Formeln, 3. Aufl., Springer Verlag, 2000 H. Reichardt (Hrsg.): Kleine Enzyklopädie Mathematik, 2. Aufl., Harri Deutsch Verlag, 1980 H. Stöcker (Hrsg.): Taschenbuch mathematischer Formeln und moderner Verfahren, 2. Aufl., Harri Deutsch Verlag, 1993 H. Wörle, H.-J. Rumpf, J. Erven: Taschenbuch der Mathematik, 12. Aufl. Oldenbourg Verlag 1994, Reprint im de Gruyter Verlag 2015
Stichwortverzeichnis Abbildung alternierende ............................................53 antisymmetrische .....................................53 bilineare ...................................................56 konforme................................................228 lineare ......................................................53 multilineare..............................................53 orientierungstreue ..................................228 orthogonale ..............................................58 winkeltreue ............................................228 Abbildung (Funktion).....................................8 Ableitung der Umkehrfunktion.................................94 elementarer Funktionen ...........................94 erste .........................................................92 höhere ................................................92, 96 komplexwertiger Funktionen .................102 logarithmische .......................................111 partielle ..................................................148 Tabelle wichtiger -en ..............................95 vektorwertiger Funktionen.....................101 Ableitungsfunktion.......................................92 Ableitungsregeln ..........................................94 Absolutbetrag...............................................14 Absorptionsgesetz ........................................11 Abstandsfunktion .......................................146 ADAMS-BASHFORTH-Verfahren ..................268 ADAMS-MOULTON-Verfahren.....................268 Additionssatz für Mittelwerte.....................294 Adjunkte.......................................................53 Ähnlichkeitssatz .........................................214 AIRYsche Differentialgleichung .................177 algebraische Struktur......................................9 algebraisches System .....................................9
https://doi.org/10.1515/9783110537161-363
Algorithmus ...............................................233 instabiler ................................................233 stark/schwach stabiler ............................233 All-Quantor ....................................................3 Alternativhypothese ...................................304 Alternativtest..............................................305 AND...............................................................2 Anfangsbedingung(en)...............................167 Anfangswertaufgabe/-problem...................167 Ankathete .....................................................29 Annahmebereich ........................................304 Äquivalenz .....................................................2 Äquivalenzklasse ...........................................8 Äquivalenzrelation .........................................7 Arcusfunktionen...........................................81 Areafunktionen.............................................77 Argument einer komplexen Zahl..................15 Assoziativgesetz...................................6, 9, 49 Asymptote ............................ 99, 120, 123, 125 Ausfallrate..................................................288 Ausgleichsfunktion ....................................156 Ausgleichsgerade ...............................156, 252 Ausgleichspolynom....................................252 Ausgleichsrechnung ...........................156, 251 lineare ....................................................251 nichtlineare ............................................252 Aussage ..........................................................1 Aussageform ..................................................3 aussagenlogisches Gesetz...............................3 Aussageverknüpfung......................................2 äußeres Produkt............................................61 Automorphismengruppe.............................230 Automorphismus ..........................................53 Axiom von ARCHIMEDES ..............................12
354 Basis ............................................................ 46 kanonische............................................... 46 Basiswechselformel ..................................... 18 BAYES, Satz von......................................... 277 Bereichsintegral ......................................... 161 BERNOULLI - de l’HOSPITAL Regeln von ............................................ 100 BERNOULLI-Experiment ............................. 284 BERNOULLIsche Ungleichung ...................... 21 BERNOULLIscheDifferentialgleichung........ 172 BERNOULLI-Zahlen..................................... 325 BESSELsche Differentialgleichung ............. 181 Betrag einer komplexen Zahl.............................. 15 einer reellen Zahl..................................... 14 eines Vektors......................................... 145 bijektiv........................................................... 8 Bild(bereich) einer linearen Abbildung ......................... 54 einer Relation ............................................ 7 BINET-DE MOIVRE, Formel von .................... 86 Binomialkoeffizient ............................... 20, 85 binomischer Satz ......................................... 20 Bisektionsverfahren ................................... 238 Bogenlänge ...........26, 120, 123, 126, 128, 198 Bogenmaß.................................................... 26 BOOLEsche Algebra ..................................... 11 BOOLEscher Verband ................................... 11 Brennpunkt einer Ellipse............................................. 34 einer Hyperbel......................................... 35 einer Parabel............................................ 36 CASORATI-WEIERSTRASS, Satz von ............ 221 CAUCHY -sche Abschätzungsformeln .......... 221, 223 -sche Integralformel .............................. 220 -sche Integralformel für Ableitungen .... 220 -scher Integralsatz ................................. 219 CAUCHY, Anfangswertaufgabe von............ 193 CAUCHY-Folge ............................................. 86 CAUCHY-RIEMANNsche Differentialgleichungen......................... 218 CAUCHY-SCHWARZsche Ungleichung ... 21, 57, 106 CAUCHY-Verteilung ................................... 281 CAVALIERI, Prinzip (Satz) von ..................... 39
Stichwortverzeichnis Charakteristik .............................................. 46 Charakteristiken-Methode ......................... 192 charakteristische Gleichung....................... 174 Chi-Quadrat-Test (χ2-Test) ........................ 305 COULOMB-Feld........................................... 200 CRAMERsche Regel ...................................... 55 Dämpfungssatz .......................................... 214 DE MOIVRE, Satz von.................................... 16 DE MOIVRE-LAPLACE, Grenzwertsatz von .. 290 de MORGAN - Regel ....................................... 3 DE MORGAN-Regel ......................................... 6 Defekt einer linearen Abbildung.................. 54 Definitionsbereich einer Funktion ........................................... 8 einer Relation ............................................ 7 Determinante Definition von LEIBNIZ ............................ 51 Definition von WEIERSTRASS................... 52 Entwicklung nach Zeile/Spalte................ 52 Dezimalbruch .............................................. 13 Dezimalbruchdarstellung endliche ................................................... 13 gemischt-periodische............................... 13 rein-periodische....................................... 13 Diagonalisierung einer Matrix ..................... 60 dicht............................................................. 14 Dichte(funktion) ................................ 280, 292 Differential .................................................. 93 vollständiges bzw. totales...................... 151 Differentialgleichung AIRYsche ............................................... 177 allgemeine Lösung der - ........................ 168 BERNOULLIsche ..................................... 172 BESSELsche............................................ 181 elliptische .............................................. 195 EULERsche ............................................. 181 exakte .................................................... 173 explizite Form einer - ............................ 167 fastlineare partielle ................................ 194 gewöhnliche .......................................... 167 HERMITEsche ......................................... 177 homogene .............................................. 170 homogene/inhomogene lineare.............. 168 hyperbolische ........................................ 195 implizite Form einer -............................ 167 LEGENDREsche....................................... 178
Stichwortverzeichnis lineare ....................................................168 lineare - 1. Ordnung...............................172 lineare - mit konst. Koeff. ..............168, 173 lineare - mit variablen Koeffizienten .....176 lineare partielle ......................................190 Ordnung einer ........................................167 parabolische...........................................195 partielle ..................................................189 quasilineare partielle..............................190 RICCATIsche ...........................................173 separierbare............................................170 spezielle Lösung der -............................168 TSCHEBYSCHEFFsche ..............................179 zweiter Ordnung ....................................181 DifferentialgleichungCAUCHY-RIEMANNsche en ...........................................................218 Differentialgleichungssystem.....................185 mit konstanten Koeffizienten.................186 Differentialoperator....................................181 Differentialquotient......................................92 Differentiation unter dem Integral..............159 Differenzenquotient .....................................91 rückwärtiger...........................................263 vorwärtiger ............................................263 zentraler .................................................263 Differenzenverfahren .................................270 Differenzierbarkeit bei einer Veränderlichen..........................92 partielle ..................................................148 vollständige............................................151 Differenzmenge..............................................5 Dimension ....................................................46 direkter Ansatz (abh. v. Störglied) .............174 DIRICHLETsche Bedingung .........................140 Disjunktion.....................................................2 Diskriminante (bei PDgl) ...........................194 Distributivgesetz .................. 3, 6, 9, 10, 49, 61 Divergenz...................................................202 dividierte Differenzen ................................247 Doppelintegral............................................161 Doppelpunkt (einer Kurve) ........................126 Drehachse.....................................................63 Drehstreckung ..............................................16 Drehung im R3 .............................................63 Drehwinkel...................................................63 Dreieck
355 ähnliche -e................................................23 allgemeines ..............................................22 Flächeninhalt ...........................................23 gleichschenkliges .....................................24 gleichseitiges ...........................................24 kongruente -e ...........................................23 rechtwinkliges..........................................24 Dreiecksungleichung....................................14 Durchschnitt(smenge) ....................................5 Ebene Abstand von einer ....................................62 Gleichung einer........................................62 Normalenvektor einer ..............................62 Parameterdarstellung einer.......................61 Eigenbasis ....................................................59 Eigenfunktion/Eigenlösung........................184 Eigenraum ....................................................58 Eigenvektor ..................................................58 Eigenwert .............................................58, 184 Eigenwertaufgabe, lineare..........................184 einfach zusammenhängend ........................201 Eingangsfehler ...........................................235 Einheitsvektor kanonischer..............................................46 Einschrittverfahren.....................................266 Einselement eines Rings...............................................10 eines Verbands.........................................11 Einsetzungsbereich.........................................3 Einzelschrittverfahren von GAUSS-SEIDEL .244 elektrisches Feld.........................................200 Element (einer Menge)...................................4 elementare Spaltenoperationen.....................49 elementare Zeilenoperationen ......................49 Elementarereignis.......................................275 Elementarmatrix...........................................49 Ellipse ..........................................................33 Ellipsoid .......................................................43 elliptische Bewegung .................................128 elliptisches Normalintegral ........................324 Endomorphismus .........................................53 Epitrochoide...............................................127 Ereignis ......................................................275 sicheres ..................................................275 stochastisch unabhängige -se ................277 unmögliches...........................................275
356 unvereinbare -se ................................... 275 Ereignisbasis.............................................. 277 Ereignisraum.............................................. 275 Erfolgswahrscheinlichkeit ......................... 284 Erwartungswert.......................................... 293 einer Funktion ....................................... 282 einer Verteilung..................................... 281 EUKLID, Divisionsalgorithmus von .............. 12 EUKLID, Kathetensatz des ............................ 24 EUKLIDische Norm..................................... 145 EUKLIDischer (Vektor-)Raum ...................... 56 EULERsche Darstellung komplexer Zahlen .. 15 EULERsche Differentialgleichung .............. 181 EULERsche Konstante ................................ 323 EULERsche Zahl ..................................... 17, 88 EULERscher Polyedersatz........................... 40 EULERsches Integral erster Gattung ........... 323 EULERsches Integral zweiter Gattung ........ 323 EULERsches Polygonzug-Verfahren........... 267 Existenz-Quantor........................................... 4 Exponent.................................................... 234 Exponentialfunktion .................................... 74 komplexe................................................. 83 spezielle................................................... 75 Extremum .................................................... 97 globales ................................................... 99 lokales ..................................................... 99 Extremwerte bei mehreren Veränderlichen ................ 155 mit Nebenbedingungen ......................... 156 Fakultät........................................................ 20 Faltung....................................................... 211 Faltungssatz ............................................... 211 Fehler absoluter................................................ 234 maximaler.............................................. 234 relativer ................................................. 234 wahrer ................................................... 234 Fehler 1. Art............................................... 304 Fehler 2. Art............................................... 304 Fehlerabschätzung ............................. 236, 239 a posteriori- ................................... 236, 239 a priori-.......................................... 236, 239 Fehlerrechnung .......................................... 158 FIBONACCI-Zahlen ....................................... 86 FISHERsche F-Verteilung ........................... 297
Stichwortverzeichnis Fixpunkt............................................. 229, 236 Fixpunkt-Iteration...................................... 236 mehrdimensionale ................................. 239 Flächennormale ......................................... 199 Folge CAUCHY-.................................................. 86 divergente................................................ 86 konvergente ............................................. 86 rekursiv definierte ................................... 85 Folgerung....................................................... 2 FOURIER-Entwicklung komplexe ............................................... 142 FOURIER-Integral........................................ 226 FOURIER-Koeffizienten .............................. 140 FOURIER-Polynome .................................... 140 FOURIER-Reihe........................................... 140 FOURIERsche Integraldarstellung ............... 209 reelle...................................................... 210 FOURIER-Transformation Multiplikationssatz ................................ 212 schnelle (FFT) ....................................... 256 Umkehrung............................................ 212 FOURIER-Transformierte ............................ 210 FRESNELsches Integral ............................... 324 Fundamentalsatz der Algebra .............. 82, 221 Funktion......................................................... 8 (streng) monoton wachsende/fallende ..... 65 analytische............................................. 139 beschränkte.............................................. 65 biholomorphe ........................................ 228 charakteristische .................................... 334 differenzierbare ....................................... 92 echt gebrochen rationale.......................... 70 einer reellen Veränderlichen.................... 65 Einheitssprung- ..................................... 213 ganze ..................................................... 217 ganzrationale ........................................... 67 gebrochen rationale ................................. 70 gerade/ungerade ...................................... 66 Heaviside- ............................................. 213 holomorphe ........................................... 217 hyperbolische .......................................... 76 implizit definierte .................................. 158 komplex differenzierbare ...................... 217 komplexe ................................................. 82 komplexe hyperbolische.......................... 83
Stichwortverzeichnis komplexe trigonometrische......................83 konstante..................................................98 konvexe/konkave .....................................99 linksseitig stetige .....................................90 mehrerer Veränderlicher ........................147 meromorphe...........................................222 periodische...............................................66 quadrat-integrable ..................................253 rechtsseitig stetige....................................90 RIEMANN-integrierbare...........................107 stetige...............................................90, 148 stückweise stetige ..................................108 trigonometrische ......................................78 Gammafunktion .........................................117 Ganghöhe ...................................................129 GAUSS Integralsatz von......................................207 GAUSS-Prinzip der kleinsten Fehlerquadrate ...............................................................251 GAUSSsche Glockenkurve ..........................289 GAUSSsche Integrationsformel ...................261 GAUSSsche Zahlenebene ..............................15 GAUSSsches Eliminationsverfahren......55, 240 GAUSSsches Fehlerintegral.........................323 GAUSS-SEIDEL, Einzelschrittverfahren von 244 GAUSS-SEIDEL-Verfahren ...........................244 GAUSS-Test ................................................306 GAUSS-Verteilung ......................................289 Gebietsintegral ...........................................161 Gegenkathete................................................29 Genauigkeitsgrad (einer Quadraturformel) 257 Gesamtschrittverfahren von JACOBI ...........243 Geschwindigkeit......................... 125, 128, 198 Geschwindigkeitsvektor.............................197 Gesetz der großen Zahlen...........................290 Gewicht......................................................257 Gewichtsfunktion .......................................254 GIBBSsches Phänomen ...............................142 Gleichheit von Mengen ..................................5 Gleichwertigkeit.............................................2 Gleitkommadarstellung ..............................234 GOURSAT, Satz von.....................................218 Gradient .....................................................152 Gradientenfeld............................................200 GRAM-SCHMIDT, Orthonormalisierungsverfahren von ........57
357 Graph ...........................................................66 Graph einer Funktion .....................................8 GREEN, Integralsatz von .............................207 Grenzwert einer Folge ...............................................86 einer Funktion..........................................88 spezielle -e von Funktionen ..................101 wichtige -e von Folgen ...........................88 Grenzwertsätze.............................................87 größter gemeinsamer Teiler .........................12 Grundgesamtheit ........................................299 Grundintegrale ...........................................104 Grundmenge...................................................4 Gruppe ...........................................................9 abelsche .....................................................9 orthogonale ..............................................58 GULDINsche Regeln......................................41 Halbachsen einer Ellipse .............................................33 einer Hyperbel .........................................35 Halbgruppe.....................................................9 Halbordnung ..................................................7 Häufigkeit relative ...................................................276 Hauptdiagonale ............................................48 Hauptnormaleneinheitsvektor ....................198 Hauptsatz der Differential- und Integralrechnung....................................105 HERMITE-Polynome....................................178 HERMITEsche Differentialgleichung ...........177 HERONsche Formel.......................................23 HESSE-Matrix .............................................155 HEUN-Verfahren.........................................267 Höhe eines Dreiecks..........................................22 Höhenlinienskizze ......................................147 Höhensatz.....................................................24 HÖLDERsche Ungleichung..........................106 Hyperbel.......................................................35 Hypotenuse ..................................................29 Hypotrochoide............................................127 Idempotenzgesetz.....................................6, 11 Identitätssatz für Polynome ...........................................69 für Potenzreihen.....................................138 imaginäre Einheit .........................................15
358 Imaginärteil einer komplexen Zahl.............. 15 Implikation .................................................... 2 Index beim Potenzreihenansatz ....................... 180 Infimum ....................................................... 20 injektiv........................................................... 8 Inkreis.......................................................... 22 innerer Punkt ....................................... 97, 155 inneres Produkt............................................ 56 Intaktwahrscheinlichkeit............................ 288 Integrabilitätsbedingungen ................ 173, 200 Integral bestimmtes .................................... 105, 107 unbestimmtes ........................................ 103 uneigentliches........................................ 108 Integralexponentialfunktion....................... 323 Integralkosinus .......................................... 324 Integrallogarithmus.................................... 324 Integralsinus .............................................. 324 Integration durch Substitution ................................. 110 komplexwertiger Funktionen ................ 109 mittels Partialbruchzerlegung................ 112 partielle ................................................. 112 Integritätsbereich ......................................... 10 Interpolation .............................................. 245 direkter Polynomansatz ......................... 245 LAGRANGE-Ansatz................................. 246 NEWTON-Ansatz .................................... 247 Spline- ................................................... 249 stückweise ............................................. 248 Intervall ....................................................... 13 abgeschlossenes....................................... 13 halboffenes .............................................. 13 offenes..................................................... 13 unbeschränktes ........................................ 14 Intervallschätzung...................................... 302 inverses Element............................................ 9 Irrtumswahrscheinlichkeit ......................... 304 Isomorphismus ............................................ 53 JACOBI-Matrix............................ 152, 198, 239 JACOBI-Verfahren ...................................... 243 kanonische Form ....................................... 195 Kardioide ................................................... 127 kartesisches Produkt von Mengen ................. 7 Kegelschnitte ............................................... 32
Stichwortverzeichnis Kern einer linearen Abbildung..................... 54 Kettenregel .......................................... 94, 154 k-Kombination........................................... 274 kleinstes gemeinsames Vielfaches............... 12 KOLMOGOROFF-Axiome............................. 276 Kommutativgesetz ................................. 3, 6, 9 komplexes Wurzelziehen............................. 16 Komponentenfunktion ............................... 101 Komposition (von Funktionen)...................... 8 Konditionszahl absolute ................................................. 235 einer Matrix........................................... 243 relative................................................... 235 Konfidenzintervall ..................................... 302 Konfidenzzahl............................................ 302 Kongruenzrelation ....................................... 13 konjugiert komplexe Zahl............................ 16 Konjunktion................................................... 2 Konklusion .................................................... 2 Konsumentenrisiko.................................... 304 Kontrapositionsregel...................................... 3 Konturintegration....................................... 225 Konvergenz im metrischen Raum.............................. 146 komponentenweise ................................ 146 Konvergenzintervall .................................. 136 Konvergenzkriterien (für Reihen).............. 133 Konvergenzpunktmenge ............................ 136 Konvergenzradius...................................... 136 Körper.......................................................... 10 Korrelationskoeffizient einer Stichprobe .................................... 300 einer Verteilung..................................... 294 Kosinus........................................................ 27 Kosinussatz.................................................. 29 Kotangens .................................................... 28 Kovarianz einer Stichprobe .................................... 300 einer Verteilung..................................... 294 Kreis ............................................................ 26 allgemeine Gleichung eines -es ............... 34 Kreiskegel............................................ 43, 115 Kreissegment ............................................... 26 Kreissektor................................................... 26 Kreisverwandtschaft .................................. 230 Kreiszylinder ............................................... 42
Stichwortverzeichnis Kreuzprodukt ...............................................61 kritischer Punkt ....................................99, 154 Krümmung ................... 99, 120, 123, 125, 128 Krümmungskreis........................................121 Krümmungsradius......................................121 Kugelkoordinaten.........................................32 Kurve .........................................................197 ebene......................................................119 geschlossene ..........................................125 räumliche ...............................................128 Kurvenintegral ...........................................203 komplexes..............................................219 Kürzungsregel ..............................................11 k-Variation .................................................274 LAGRANGE, Multiplikatorenregel von ........156 Länge eines Vektors...................................145 LAPLACE, Determinantenentwicklungssatz von .................................................................52 LAPLACE, Satz von .....................................276 LAPLACE-Operator......................................203 LAPLACE-TransformationUmkehrung ........215 LAPLACE-Transformierte ............................214 LAURENT-Reihe..........................................223 Hauptteil der ..........................................223 Nebenteil der..........................................223 Lebensdauerverteilung ...............................288 LEGENDRE-Polynome .........................178, 254 LEGENDREsche Differentialgleichung.........178 LEIBNIZ, Ableitungsregel von .......................94 LEIBNIZ-Kriterium......................................136 LEIBNIZ-Regel für Differentiation nach einem Parameter ..........................................................159 LEIBNIZsche Sektorformel ..........................125 Lemniskate.................................................122 Likelihood-Funktion ..................................301 linear abhängig.............................................46 linear unabhängig.........................................46 lineare Substitution (bei Dgl-en) ................170 lineares Gleichungssystem (LGS) ................54 homogenes ...............................................54 inhomogenes............................................54 quadratisches ...........................................54 Linearfaktor..................................................68 Linearkombination .......................................46 LIOUVILLE, Satz von...................................221
359 LIPSCHITZ-Bedingung.................................169 LIPSCHITZ-Konstante ..................................169 Logarithmengesetze .....................................18 Logarithmus Definition des ..........................................17 dualer (binärer) ........................................17 natürlicher................................................17 Zehner- ....................................................17 Logarithmusfunktion....................................75 komplexe .................................................84 LR-Zerlegung.............................................241 Magnetfeld .................................................200 Majorantenkriterium ..................................134 Mantellinie ...................................................43 Mantisse .....................................................234 Matrix...........................................................47 adjungierte ...............................................53 ähnliche....................................................59 Diagonal- .................................................48 diagonaldominante.................................244 diagonalisierbare......................................59 einer linearen Abbildung .........................54 Einheits-...................................................48 Elementar- ...............................................49 JACOBI-...................................................152 Koeffizienten- ..........................................54 obere Dreiecks-........................................48 orthogonale ........................................58, 60 positiv definite .......................................245 quadratische .............................................47 Rang einer................................................49 schiefsymmetrische..................................47 Spalten einer ............................................47 Spur einer.................................................59 Staffelform einer......................................50 symmetrische .....................................47, 60 System- ....................................................54 transponierte ............................................47 Tridiagonal- ...........................................271 Unter-.......................................................52 untere Dreiecks-.......................................48 VANDERMONDE- .....................................246 Zeilen einer ..............................................47 Matrizenmultiplikation.................................48 Maximum einer Menge .............................................20
360 globales (absolutes) ................................. 97 lokales (relatives) .................................... 97 Maximum-Likelihood-Methode ................ 301 Maximumsprinzip...................................... 220 MCLAURIN-Polynom.................................. 138 MCLAURIN-Reihe....................................... 138 Median....................................................... 283 (bei Rotationskörpern)........................... 116 Mehrschrittverfahren ................................. 268 Menge............................................................ 4 abgeschlossene ...................................... 146 beschränkte............................................ 146 Darstellung einer ....................................... 5 Differenz- .................................................. 5 einfach zusammenhängende.................. 201 Komplement einer ..................................... 5 leere........................................................... 5 offene .................................................... 146 Paar- .......................................................... 7 Produkt-..................................................... 7 Rest- .......................................................... 5 Schnitt-...................................................... 5 Vereinigungs-............................................ 5 zusammenhängende ................................ 13 Metrik ........................................................ 146 Minimum einer Menge............................................. 20 globales (absolutes) ................................. 97 lokales (relatives) .................................... 97 MINKOWSKIsche Ungleichung ................... 106 Minorantenkriterium.................................. 134 Mittel arithmetisches.......................................... 21 geometrisches.......................................... 21 harmonisches........................................... 21 quadratisches........................................... 21 Mittelpunkt einer Ellipse............................................. 33 einer Hyperbel......................................... 35 Mittelsenkrechte .......................................... 22 Mittelwert einer Funktion ....................................... 114 einer Stichprobe .................................... 299 einer Verteilung..................................... 281 Mittelwertsatz der Differentialrechnung ......................... 98
Stichwortverzeichnis der Integralrechnung ............................. 106 MÖBIUS-Transformation ............................ 228 Moment einer Verteilung........................... 282 Momentenmethode .................................... 300 Monoid .......................................................... 9 MORERA, Satz von ..................................... 219 Multinomialkoeffizient .............................. 273 Multiplikationssatz der FOURIER-Transformation ................. 212 der W-Theorie ....................................... 277 für Mittelwerte ...................................... 294 Nabla-Kalkül ............................................. 202 Nachiteration ............................................. 242 Nebenbedingungen einer PDgl .................. 190 n-Eck regelmäßiges ........................................... 26 Negation ........................................................ 1 Negatives ..................................................... 10 neutrales Element .......................................... 9 Neutralitätsgesetz........................................... 6 NEWTON-COTES-Formeln........................... 257 geschlossene.......................................... 257 offene .................................................... 258 NEWTON-RAPHSON-Verfahren ................... 240 NEWTONsches Iterationsverfahren ............. 236 Niveaufläche.............................................. 147 Norm.......................................................... 145 EUKLIDische .......................................... 145 Maximums- ................................... 145, 242 Spaltensummen- .................................... 242 Summen- ............................................... 242 Zeilensummen-...................................... 242 Normalbereich ................................... 161, 163 bezüglich Polarkoordinaten................... 162 bezüglich Zylinderkoordinaten.............. 164 Normaleneinheitsvektor............................. 199 Normalenvektor ........................................... 62 n-Tupel .......................................................... 7 Nullelement eines Rings .............................................. 10 eines Verbands ........................................ 11 Nullfolge...................................................... 86 Nullhypothese............................................ 304 Nullraum...................................................... 46 Nullteiler...................................................... 10 nullteilerfrei ................................................. 10
Stichwortverzeichnis Nullteilerfreiheit...........................................11 numerische Exzentrizität einer Ellipse .............................................34 einer Hyperbel .........................................35 Oberflächenintegral....................................206 Obermenge.....................................................5 Obersumme ................................................107 Oder-Verknüpfung, nichtausschließende .......2 OR..................................................................2 Ordnung einer Singularität....................................221 lineare ........................................................7 Orthogonalitätsrelationen...........................321 Orthogonalsystem ................................57, 253 Orthonormalbasis .........................................57 Orthonormalsystem ......................................57 Ortsvektor ....................................................60 Parabel .........................................................36 Parallelepiped...............................................40 Parallelogramm ............................................25 Parameterdarstellung einer Ebene ..............................................61 einer Fläche ...........................................198 einer Kurve ............................................124 parameterfreie Darstellung einer Kurve .....124 Parametertest..............................................305 PARSEVAL-Gleichung .................................211 Partialbruchzerlegung ..................................70 Integration mittels -................................112 Partialsumme..............................................131 Periode .........................................................66 Permutation ................................................273 Inversion in -en........................................51 PICARD, Satz von ........................................222 PICARD-LINDELÖF, Satz von .......................169 Pivotelement ................................................50 POISSON-Verteilung....................................286 Pol(stelle) ...................................................221 Polarkoordinaten ..........................................30 einer Ellipse .............................................34 einer Hyperbel .........................................36 einer Parabel ............................................37 Polstellenordnung.......................................222 Polyeder .......................................................39 Polynom .......................................................67 charakteristisches.....................................59
361 Grad eines ................................................67 Koeffizienten eines ..................................67 komplexes................................................82 LEGENDRE- .............................................254 Nullstellen eines.......................................68 orthogonale -e ........................................254 reduzibles.................................................69 trigonometrisches...................................139 TSCHEBYSCHEFF-....................................255 Potential .....................................................200 zueinander konjugierte -e.......................218 Potentialfeld ...............................................200 Potentialgleichung......................................190 Potenz im Reellen................................................17 mit komplexem Exponenten ....................84 Potenzfunktion .............................................72 Potenzgesetze ...............................................17 Potenzmenge ..................................................5 Potenzreihe.................................................136 Differentiation einer...............................137 Integration einer.....................................137 Potenzreihenansatz.....................................176 Prädiktor-Korrektor-Verfahren von HEUN .267 Prämisse .........................................................2 Primzahl .......................................................12 Prisma ..........................................................40 gerades .....................................................40 reguläres ..................................................40 Produktregel .................................................94 Produktzeichen.............................................18 Produzentenrisiko.......................................304 Punktschätzung ..........................................301 Pyramide ..............................................41, 115 Pyramidenstumpf .................................41, 115 PYTHAGORAS, Satz des .................................24 Quadraturformel.........................................257 summierte ..............................................259 Quantil .......................................................283 Quantisierung.................................................3 Quotientenkriterium ...................................134 Quotientenregel............................................94 Randpunktrestriktion..................................250 Randverteilung...........................................292 Randwertaufgabe .......................................169 Randwertaufgabe, lineare...........................183
362 Rang einer linearen Abbildung .................... 54 Rang einer Matrix........................................ 49 Rang-Defekt-Satz ........................................ 54 Raum metrischer.............................................. 146 normierter.............................................. 145 Raute............................................................ 25 Realteil einer komplexen Zahl..................... 15 Rechnungsfehler ........................................ 235 Rechteck ...................................................... 25 achsenparalleles..................................... 162 Rechteckregel ............................................ 257 Rechtsschraubenregel .................................. 61 Regel von BERNOULLI - de l’HOSPITAL ...... 100 Regressionsgerade ............................. 156, 294 einer Stichprobe .................................... 300 Regressionskoeffizient einer Stichprobe .................................... 300 einer Verteilung..................................... 294 Regula falsi................................................ 237 regulärer Punkt .......................................... 176 Reihe.......................................................... 131 absolut konvergente............................... 133 alternierende.......................................... 135 alternierende harmonische..................... 132 arithmetische ......................................... 132 divergente.............................................. 131 endliche geometrische ............................. 19 geometrische ......................................... 132 harmonische .......................................... 132 konvergente ........................................... 131 trigonometrische.................................... 139 Relation ......................................................... 7 antisymmetrische....................................... 7 asymmetrische........................................... 7 reflexive .................................................... 7 symmetrische ............................................ 7 transitive.................................................... 7 Residuenkalkül .......................................... 224 Residuensatz .............................................. 224 Residuum........................................... 224, 242 Restglied der TAYLOR-Reihe ..................... 139 Restklasse modulo n .................................... 12 Restmenge ..................................................... 5 Reziprokes ................................................... 10 Rhombus...................................................... 25
Stichwortverzeichnis RICCATIsche Differentialgleichung ............ 173 RICHARDSON-Extrapolation ....................... 260 Richtungsableitung .................................... 153 RIEMANN -sche Zahlenkugel ................................. 227 -scher Abbildungssatz ........................... 231 -scher Hebbarkeitssatz........................... 222 Ring ............................................................. 10 Ringintegral ............................................... 203 Ringschluss-Regel ......................................... 3 ROLLE, Satz von........................................... 97 ROMBERG-Integration ................................ 261 Rotation ..................................................... 202 Rotationskörper ......................................... 116 Volumen eines -s................................... 116 Rückwärtselimination .......................... 55, 240 RUNGE-KUTTA-Verfahren .......................... 267 Sägezahnkurve........................................... 141 SARRUS, Regel von....................................... 52 Schätzfunktion........................................... 301 effiziente................................................ 301 erwartungstreue ..................................... 301 konsistente............................................. 301 Scheitelpunkt einer Parabel ......................... 36 Schiefe einer Verteilung ............................ 282 Schießverfahren ......................................... 269 SCHMIDT-V.MISES, Kriterium von .............. 244 Schnitt senkrechter ............................................ 147 waagerechter ......................................... 147 Schranke obere........................................................ 20 untere....................................................... 20 Schraubenlinie ........................................... 129 schwach singulärer Punkt .......................... 179 SCHWARZ, Satz von.................................... 150 SCHWARZscher Funktionenraum................ 212 Schwerpunkt einer ebenen Fläche ............. 114 Schwerpunkt eines Dreiecks ........................ 22 Schwerpunkt eines Kurvenstücks .............. 116 Sehnenlänge................................................. 26 Sehnentrapezregel...................................... 257 summierte.............................................. 259 Seitenhalbierende......................................... 22 Sektorflächeninhalt.................................... 123 Selbstdualität ............................................. 211
Stichwortverzeichnis Separationsmethode ...........................191, 195 Sicherheitswahrscheinlichkeit....................304 Sigma-Algebra (σ-Algebra) .......................275 Signifikanzniveau.......................................304 Signifikanztest............................................304 Signumfunktion............................................70 SIMPSON-Regel ...........................................257 summierte ..............................................260 Singularität hebbare ..................................................221 isolierte ..................................................221 wesentliche ............................................221 Sinus ............................................................27 Sinussatz ......................................................29 Skalar ...........................................................45 Skalarfeld ...................................................199 Skalarprodukt...............................................56 mit Gewichtsfunktion ............................254 Spaltenpivotisierung...................................241 Spaltenraum .................................................49 Spaltensummenkriterium ...........................244 Spaltenvektor ...............................................47 Spat ..............................................................40 Spatprodukt ..................................................40 Spektralfunktion.................................209, 210 Spektralsatz ..................................................60 Spektrum....................................................209 Amplituden-...........................................210 diskretes.................................................209 kontinuierliches .....................................210 Phasen- ..................................................210 Spirale Archimedische .......................................122 hyperbolische.........................................122 logarithmische .......................................122 Spitzpunkt (einer Kurve)............................126 Spur einer Matrix .............................................59 eines Weges ...........................................197 Stabilität einer Lösung ..........................................233 eines Algorithmus..................................233 Staffelform ...................................................50 Stammfunktion...........................................103 Standardabweichung einer Stichprobe.....................................300
363 einer Verteilung .....................................282 Standardnormalverteilung ..........................290 Standardskalarprodukt..................................56 stationärer Punkt ..........................................99 Statistik deskriptive .............................................299 induktive ................................................299 statistische Sicherheit .................................304 statistisches Standardmodell ......................299 Steigung .............................................122, 124 stereographische Projektion .......................227 Stereometrie .................................................39 Stichprobenraum ........................................275 STOKES, Integralsatz von ............................207 Störfunktion/Störglied................................168 Störvektor.....................................................54 Strahlensätze ................................................22 Strömungsfeld ............................................200 STUDENTsche t-Verteilung..........................296 Stützstelle...................................................245 Stützstellen.................................................156 Stützwert ....................................................245 Substitutionsregel.......................................110 Summenformeln...........................................19 Summenzeichen ...........................................18 Superpositionsprinzip.................................192 Supremum ....................................................20 surjektiv..........................................................8 Tangens ........................................................28 Tangente...............................................93, 120 Tangenteneinheitsvektor ............................198 Tangentenvektor.........................124, 128, 197 Tangentialebene .........................................151 Tautologie ......................................................3 TAYLOR, Satz von.......................................139 TAYLOR-Polynom.......................................138 TAYLOR-Reihe............................................138 komplexer Funktionen ...........................220 Restglied der ..........................................139 Teilbarkeit ....................................................12 Teiler ............................................................12 teilerfremd....................................................12 Teilmenge ......................................................5 echte...........................................................5 triviale........................................................5 Teilung mit Rest...........................................68
364 Telegraphengleichung ............................... 190 Torsion....................................................... 129 Torus............................................................ 42 Träger(menge) eines Weges ...................... 197 Transformation gebrochen lineare .................................. 228 MÖBIUS- ................................................ 228 Transformationssatz................................... 164 Trapez.......................................................... 25 Trennung der Variablen............................. 170 Treppenfunktion ........................................ 279 trigonometrische Darstellung in C............... 15 triviale Lösung (eines LGS)......................... 55 Trochoide................................................... 126 TSCHEBYSCHEFF-Polynome................ 179, 255 TSCHEBYSCHEFFsche Differentialgleichung179 TSCHEBYSCHEFFsche Ungleichung....... 21, 283 Umgebung ................................................. 146 Umkehrfunktion ............................................ 8 Ableitung der........................................... 94 Umkehrrelation.............................................. 7 Umkehrung der FOURIER-Transformation ................. 212 der LAPLACE-Transformation ................ 215 Umkreis ....................................................... 23 Umordnung (bei Reihen) ........................... 133 Umparametrisierung .................................. 204 Und-Verknüpfung.......................................... 2 Ungleichung BERNOULLIsche ....................................... 21 CAUCHY-SCHWARZsche ............. 21, 57, 106 HÖLDERsche .......................................... 106 MINKOWSKIsche .................................... 106 TSCHEBYSCHEFFsche................................ 21 Untergruppe................................................... 9 Unterraum.................................................... 46 Untersumme .............................................. 107 VANDERMONDE-Matrix .............................. 246 Variable stochastische.......................................... 278 Varianz einer Stichprobe .................................... 300 einer Verteilung..................................... 282 Variation der Konstanten........................... 172 Vektor.......................................................... 45 orthogonale -en........................................ 57
Stichwortverzeichnis Vektorfeld.................................................. 199 konservatives......................................... 205 quellenfreies .......................................... 202 wirbelfreies............................................ 202 Vektorpotential .......................................... 203 Vektorprodukt.............................................. 61 Vektorraum.................................................. 45 VENN-Diagramm ........................................... 5 Verband ....................................................... 11 BOOLEscher ............................................. 11 komplementärer....................................... 11 Vereinigung(smenge) .................................... 5 Verfahrensfehler ........................................ 235 globaler.................................................. 266 lokaler.................................................... 266 Verknüpfung assoziative ................................................. 9 äußere ...................................................... 45 innere......................................................... 9 kommutative.............................................. 9 positiv definite......................................... 56 symmetrische........................................... 56 Verneinung einer Aussage ............................. 1 Verschiebungssatz ..................................... 214 Verteilung χ² -......................................................... 295 Binomial- .............................................. 285 CAUCHY-................................................ 281 diskrete .................................................. 279 Exponential- .......................................... 288 FISHERsche F-........................................ 297 GAUSS- .................................................. 289 geometrische ......................................... 286 Gleich-........................................... 284, 287 hypergeometrische ................................ 285 logarithmische Normal-......................... 291 mehrdimensionale ................................. 291 Normal- ................................................. 289 POISSON-................................................ 286 stetige .................................................... 280 STUDENTsche t-...................................... 296 WEIBULL-............................................... 288 Verteilungsfunktion ................................... 278 Vielfachheit algebraische............................................. 59 geometrische ........................................... 58
Stichwortverzeichnis Viereck.........................................................25 Vollständigkeit der reellen Zahlen .........14, 87 Volumenberechnung mittels Integration ....115 Vorwärtselimination...................................241 Wahrheitstafel ................................................1 Wahrheitswert ................................................1 Wahrscheinlichkeit bedingte .................................................277 empirische..............................................276 klassische ...............................................277 totale ......................................................277 Wahrscheinlichkeitsdichte .................280, 292 Wahrscheinlichkeitsfunktion..............279, 292 Wahrscheinlichkeitsmaß ............................276 Wahrscheinlichkeitsraum ...........................276 Wärmeleitungsgleichung............................190 Weg............................................................197 geschlossener .........................................197 Wegintegral................................................203 Wegunabhängigkeit des Kurvenintegrals...205 WEIBULL-Verteilung ..................................288 WEIERSTRASS, Satz von..............................220 Wellengleichung ........................................190 Wendepunkt .................................................99 Wertebereich einer Funktion............................................8 einer Relation.............................................7 Winkel gerichteter ................................................27 im EUKLIDischen Raum ...........................61 Winkelhalbierende .......................................22 Wirbelfeld ..................................................203 Wurzelfunktion ............................................72 Wurzelkriterium .........................................135 Zahldarstellung
365 d-adisch..................................................233 Zahlen (rein-)imaginäre .......................................15 algebraische .............................................13 ganze........................................................12 irrationale.................................................13 komplexe .................................................14 natürliche .................................................12 rationale ...................................................13 reelle ........................................................13 transzendente ...........................................13 Zahlengerade................................................13 Zeilenäquilibrierung...................................241 Zeilenraum ...................................................49 Zeilenstufenform..........................................50 Zeilensummenkriterium .............................244 Zeilenvektor .................................................47 zentraler Grenzwertsatz..............................295 Zentralwert einer Verteilung ......................283 Zerlegungssatz für reelle Polynome..................................69 Zielbereich .....................................................8 Zufallsexperiment ......................................275 Zufallsgröße ...............................................278 Zufallsstichprobe........................................299 Zufallsvariable ...........................................278 diskrete ..................................................279 in Standardform .....................................283 stetige.....................................................280 unabhängige...........................................293 zweidimensionale ..................................292 Zufallsvektor ..............................................291 Zweiwertigkeit der Logik...............................1 Zykloide .....................................................126 Zylinderkoordinaten.....................................32