162 69 148MB
German Pages 849 [856] Year 1967
Handbuch der Mathematik
Handbuch der Mathematik Unter Mitarbeit von zahlreichen Fachgelehrten herausgegeben von
L. Kuipers und R. Timman
Walter de Gruyter & Co · Berlin 1968 vormals G. J . Gösohen'sohe Verlagshandlung · J. Guttentag, Verlagsbuchhandlung · Georg Reimer · Earl J. Trübner · Veit & Comp.
Titel der holländischen Originalausgabe: Handbook der Wiekunde, Soheltema & Holkema Ν. V., Amsterdam Deutsche Übersetzung: Dr. Anneliese Oberschelp
Copyright 1968 by Walter de Gruyter & Co., vormals G. J . Göschen'sche Verlagehandlung — J . Guttentag, Verlagsbuchhandlung — Georg Reimer — Karl J . Trübner — Veit & Comp., Berlin 30. — Alle Rechte, einschl. der Rechte der Herstellung von Photokoplen und Mikrofilmen, vom Verlag vorbehalten. — Archiv-Nr.: 12 40 67 1 — Satz nnd Drnok Walter de Gruyter & Co., Berlin. — Printed in Germany.
Vorwort
Das Handbuch der Mathematik, das in der holländischen Originalausgabe bereits mit großem Erfolg verbreitet ist, wurde vor allem für Ingenieure und Naturwissenschaftler geschrieben. Es enthält eine moderne und verständliche Einführung in die höhere Mathematik für Ingenieure und geht doch an vielen Stellen über das hinaus, was an deutschen Technischen Hochschulen an mathematischem Stoff für Ingenieurstudenten obligatorisch ist ; daher kann es auch von Studenten mit dem Hauptfach Mathematik mit Vorteil benutzt werden. Dargestellt werden zahlreiche Gebiete der reinen und angewandten Mathematik, die entweder unmittelbar auf Probleme der Praxis angewandt werden können oder die zum theoretischen Verständnis von Anwendungsmethoden notwendig sind. Das Buch gewinnt durch zahlreiche ausführliche Beispiele. Es wird also als Lehrbuch und als umfassendes Nachschlagewerk für alle diejenigen wertvoll sein, die in Technik und Naturwissenschaften mit mathematischen Methoden arbeiten, und auch dem Mathematiker wird diese zusammenfassende Darstellung zum Nachschlagen und zur Information nützlich sein. Entstanden ist das Buch aus den mathematischen Vorlesungen für Ingenieurstudenten an der Technischen Hochschule Delft. Die verschiedenen Teilgebiete der Mathematik werden in der Reihenfolge ihrer logischen Abhängigkeit dargestellt. Die Mitarbeit mehrerer Autoren ermöglichte es, daß Spezialgebiete von hierfür besonders interessierten Autoren geschrieben wurden, während man zugleich die einzelnen Kapitel gut aufeinander abstimmte. Möge das Werk auch in der deutschen Ausgabe den Lernenden und Praktikern der Mathematik dienen.
Hannover, im September 1967
Dr. Anneliese Oberschelp
Inhalt
Vorwort I. Aus der Geschichte der Mathematik Dr. C. H. van Os 1. Die ersten Zahlen 2. Fortsetzung der Zahlenfolge 3. Das Unendliohe 4. Das Irrationale 5. Das tmendlioh Kleine β. Die Entwicklung der Analysis 7. Die moderne Zeit
II. Zahlensysteme Dr. F. Loonstra 1. Die natürlichen Zahlen . . 2. Die ganzen Zahlen 3. Die rationalen Zahlen 4. Die reellen Zahlen 5. Die komplexen Zahlen
III. Lineare Algebra Dr. F. Loonstra 1. Vektoren, Vektorräume 2. Lineare Abhängigkeit, Dimension, Basis 3. Teilräume oder Untervektorräume 4. Das Skalarprodukt 6. lineare Transformationen, Matrizen 6. Verknüpfung linearer Transformationen 7. Multiplikation von Matrizen 8. Spalten- und Zeilenmatrizen 9. Bang einer Matrix 10. Determinanten 11. Lösungen nicht-homogener Gleichungssysteme 12. Lösungen homogener Gleichungssysteme 13. Eigenwerte 14. Eigenwerte und Eigenvektoren symmetrischer (reeller) Matrizen 15. Hauptachsentransformation symmetrischer Matrizen
IV. Analytische Geometrie Dr. F. Loonstra 1. Koordinaten 1.1. Koordinaten auf einer Geraden
1 1 3 4 7 9 12 14
19 19 20 21 22 29
34 34 36 38 39 40 43 44 46 47 47 49 51 53 54 58
60 60 60
Vin
Inhalt
2.
3.
4.
5.
6. 7. 8. 9.
10.
1.2. Koordinaten für Halbgeraden durch einen Punkt 0 1.3. PolaTkoordinaten 1.4. Rechtwinklige Koordinaten in der Ebene 1.5. Rechtwinklige Koordinaten im Raum 1.6. Polarkoordinaten im Raum 1.7. Zylinderkoordinaten 1.8. Parameter 1.9. Die Vektormethode Analytische Geometrie der Geraden und der Ebene 2.1. Gleichung der Ebene 2.2. Parameterdarstellung einer Ebene 2.3. Gleichung einer Geraden im Raum 2.4. Gleichung einer Geraden in der Ebene 2.5. Hessesche Normalfonn der Geraden in der Ebene 2.6. Achsenabschnittsgleichung einer Geraden 2.7. Allgemeine Geradengleichung 2.8. Die Schnittgerade zweier Ebenen 2.9. Schnittpunkt einer Geraden mit einer Ebene 2.10. Lotgerade auf eine Ebene V von einem Punkt Ρ aus 2.11. Gemeinsames Lot zweier Geraden l und m, Homogene Koordinaten 3.1. Teilung sVerhältnis; harmonische Lage 3.2. Homogene Koordinaten in der Ebene 3.3. Homogene Koordinaten im Raum Kreis und Kugel 4.1. Die Gleichungen des Kreises und der Kugel 4.2. Büschel und Bündel Kegelschnitte 5.1. Die Gleichungen der Ellipse, der Hyperbel und der Parabel 5.2. Tangenten, Normalen und Winkelhalbierende Kurven zweiter Ordnung ' Pol und Polare Mächen zweiter Ordnung Diskussion der allgemeinen Gleichung einer Fläche 2. Ordnung 9.1. Herleitung der Normalformen der Gleichung 9.2. Bestimmung eines eventuellen Mittelpunktes Polarentheorie für Mächen 2. Ordnung
V. Analysis
. . . .
60 61 61 61 62 62 62 63 63 63 63 64 65 65 66 66 67 67 67 67 68 68 70 72 72 72 75 79 79 82 84 86 88 92 92 94 96 97
Dr. B. Meuknbeld DIFFERENTIAL- UND INTEGRALRECHNUNG E I N E R VERÄNDERLICHEN 1. 2. 3. 4. 5. 6.
97
Funktion — Intervall — Umgebung 97 Der Grenzwertbegriff 99 Das Rechnen mit Limiten 102 Stetigkeit ! 104 Rechenregeln für stetige Funktionen — Beispiele stetiger Funktionen. . . 105 Der Differentialquotient 105
IX
Inhalt
7. Die abgeleitete Funktion — Zusammenhang zwischen Stetigkeit und Diffeienzierbarkeit — Höhere Ableitungen 107 8. Differentationsregeln 108 9. Der Begriff der Bogenlänge auf einem Kreis - - Stetigkeit der trigonometrischen Funktionen — Goniometrische Ungleichungen 110 10. Die Ableitungen der trigonometrischen Funktionen 113 11. Grenzwerteigenschaften ineinandergesetzter Funktionen 113 12. Differentiation einer ineinandergesetzten Funktion — Kettenregel . . . . 1 1 5 13. Der Satz von Bolle und der Mittelwertsatz 116 14. Der erweiterte oder zweite Mittelwertsatz 119 16. Extremwerte 120 16. Wendepunkte 124 17. Stammfunktionen 126 18. Einführung neuer Veränderlicher — Differentiale — Partielle Integration . 126 19. Flächeninhalt 128 20. Der Hauptsatz der Differential- und Integralrechnung 130 21. Eigenschaften des bestimmten Integrals 132 22. Bestimmtes Integral und Stammfunktion 133 23. Der Zwischenwertsatz 135 24. Die Logarithmusfunktion 135 25. Umkehrfunktionen 138 26. Die Exponentialfunktion 139 27. Allgemeine Potenz- und Exponentialfunktionen 141 28. Einige logarithmische und exponentielle Limiten 142 29. Die allgemeine Logarithmusfunktion 144 30. Die zyklometrischen Funktionen 145 31. Die Kegel von Leibniz 147 32. Die hyperbolischen Funktionen 148 33. Die Stammfunktionen rationaler Funktionen — Partialbruchentwicklung . 150 34. Die Stammfunktionen von cos n x und sin n x (n ganz) 153 35. Die Stammfunktionen einer rationalen Funktion in sin χ und cos χ . . . 155 36. Die Stammfunktionen irrationaler algebraischer Funktionen 156 37. Uneigentliche Integrale 159 FUNKTIONEN VON ZWEI VERÄNDERLICHEN — PARTIELLE DIFFERENTIATION 38. Der Funktionsbegriff 39. Der Grenzwertbegriff 40. Stetigkeit 41. Partielle Differentiation 42. Partielle Ableitungen zweiter Ordnung 43. Ineinandergesetzte Funktionen — Totales Differential 44. Einführung neuer Veränderlicher 45. Funktionen von mehr als zwei Veränderlichen 46. Extrema von Funktionen zweier Veränderlicher 47. Die Taylorentwicklung für eine Funktion von zwei Veränderlichen —. . . Mittelwertsatz 48. Hinreichende Bedingungen für lokale Extrema von Funktionen zweier Veränderlicher
162 163 164 165 166 167 169 170 171 172 173
X
Inhalt MEHRFACHE INTEGRALE 49. 50. 61. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61.
Inhaltsbegriff—Integral Eigenschaften der Integrale Iterierte Integrale mit konstanten Grenzen Krummlinig begrenztes Integrationsgebiet Krmnmlinige Koordinaten Traneformationsformel für Doppelintegrale Zylinderkoordinaten Dreifache Integrale Kugelkoordinaten Der Flächeninhalt einer ebenen Figur in Polarkoordinaten Der Inhalt von Rotationskörpern Flächeninhalt einer gekrümmten Fläche in rechtwinkligen Koordinaten . Flächeninhalt einer gekrümmten Fläche in Zylinder- und Kugelkoordinaten 62. Flächeninhalt der Oberfläche von Rotationskörpern 63. Masse und Dichte von Fläohen und Körpern 64. Statisches Moment, Schwerpunkt, Trägheitsmoment
176 177 178 179 181 182 185 186 188 189 190 192 192 194 196 198
VI. Zahlenfolgen und Reihen Dr. L. Kuipers 1. 2. 3. 4. 5. 6. 7.
Zahlenfolgen Konvergenz Divergenz Berechnung von Grenzwerten Monotone Folgen Das Cauchy'sche Konvergenzkriterium Unendliche Reihen
203 203 206 207 209 211 212
7.1. Konvergenz und Divergenz von Reihen 7.2. Vergleichsreihen 7.3. Konvergenzkriterien
212 215 216
7.3.1. 7.3.2. 7.3.3. 7.3.4. 7.4. 7.5. 7.6. 7.7.
Integralkriterium Das Kriterium von Cauchy (Wurzelkriterium) Das Kriterium von d'Alembert (Quotientenkriterium) Das Kriterium von Raabe
Reihen mit positiven und negativen Gliedern Alternierende Reihen Potenzieihen Taylorreihen
8. Gleichmäßige Konvergenz 9. Fourierreihen 9.1. Entwicklung einer Funktion in eine Fourierreihe 9.2. Integration von Fourierreihen 9.3. Das Fourierintegral
. . . .
216 217 217 219 220 222 223 225 227 232 232 238 239
Inhalt.
XI
V I I . Funktionentheorie Dr. Β. J. Α. Duparo 1. Komplexe Zahlen 241 1.1. Grandeigenschaften 241 1.2. Geometrisohe Interpretation 242 1.3. Grenzwerteigensehaften 245 1.4. Punktmengen in der komplexen Ebene 248 2. Funktionen 249 2.1. Grundeigensohaften; Stetigkeit 249 2.2. Differenzierbarkeit 250 2.3. Integrierbarkeit 253 3. Integralsätze 256 3.1. Der Canohy'eohe Integralsatz 256 3.2. Der Residuensatz 258 3.3. Cauohy'sche Integraldarstellung für / und für die Ableitungen. . . . 260 3.4. Anwendungen des Residuensatzee 263 4. Reihen 266 4.1. Grundeigensehaften 266 4.2. Reihen von Funktionen 269 4.3. Potenzreihen 271 4.4. Analytische Fortsetzung 276 4.5. Das Maximumprinzip 279 5. Singularitäten 280 6.1. Laurent-Reihen 280 5.2. Klassifikation holomorpher Funktionen 283 5.3. Isolierte Singularitäten 285 5.4. Der unendlich ferne Punkt 287 5.5. Weitere Anwendungen des Residuensatzes 288 5.6. Die Umkehrung einer holomorphen Funktion 297 6. Konforme Abbildungen 299 6.1. Grondeigensohaften 299 6.2. Anwendungen konformer Abbildungen 301 6.3. Die linearen Transformationen 303 6.4. Einige weitere Transformationen 309 7. Unendliche Produkte 311 V I I I . Gewöhnliche Differentialgleichungen Dr S. C. van Veen 1. Einleitung 316 1.1. Definition 316 1.2. Klassifikation 316 2. Differentialgleichungen erster Ordnung 317 2.1. Elementare Integrationsmethoden 317 2.2. Trennung der Veränderlichen 318 2.3 Homogene Gleichungen 318 3. Lineare Differentialgleichungen erster Ordnung 319 3.1. Beigliele elektrischer Stromkreise mit induktivem Widerstand . . . 320 3.2. Verallgemeinerung — Differentialgleichung von Bernoulli 322
ΧΠ
Inhalt 3.3. Einführung neuer Veränderlicher — Jacobi'sohe Gleiohung 4. Einige Bemerkungen zur Theorie 4.1. Allgemeine Bemerkungen 4.2. Richtungsfeld— Integralkurven — Isoklinen 4.3. Existenzbeweis der Lösungen von y' = f (x,y) 5. Lineare Differentialgleichungen höherer Ordnung 6.1. Allgemeine Form 5.2. Homogene Gleichungen—allgemeine Eigenschaften des Operators Ln(y) 6.3. Lineare Unabhängigkeit von Funktionen 5.4. Kriterium für die lineare Unabhängigkeit eines Funktionensystems — Wronski'sche Determinante 5.5. Linear unabhängige Lösungen einer homogenen Differentialgleichung — Hauptlösungen —· Allgemeine Lösung 6. Homogene Gleichungen mit konstanten Koeffizienten 6.1. Charakteristische Gleiohung 6.2. Der Fall, daß die charakteristische Gleichung lauter verschiedene Lösungen hat 6.3. Konjugiert komplexe Lösungen der charakteristischen Gleichung . . 6.4. Beispiel einer gedämpften harmonischen Schwingung 6.5. Mehrfache Lösungen der charakteristischen Gleichung 6.6. Eulersche Differentialgleichungen 7. Nicht-homogene Differentialgleichungen 7.1. Lösung nicht-homogener Differentialgleichungen 7.2. Einfache Bestimmung einer partikulären Lösung spezieller nicht-homogener linearer Differentialgleichungen mit konstanten Koeffizienten . 7.3. Die Methode der Variation der Konstanten 7.4. Beispiel der erzwungenen gedämpften elastischen Schwingungen . . 8. Nicht-lineare Differentialgleichungen 8.1. Vorbemerkungen 8.2. Lösung durch Transformation — Spezialfall der Riccati'schen Gleichung 8.3. Wichtige Beispiele nicht-linearer Differentialgleichungen 9. Systeme simultaner Differentialgleichungen 9.1. Vorbemerkungen 9.2. Simultane Differentialgleichungen mit konstanten Koeffizienten. . . 9.3. Simultane Differentialgleichungen mit veränderlichen Koeffizienten . 9.4. Nicht-lineare Systeme
323 324 324 324 326 328 328 328 329 330 331 332 332 333 334 335 336 338 339 339 340 342 344 346 346 346 347 353 353 354 356 358
I X . Spezielle Funktionen Dr. S. C. van Veen 1. Gamma-Funktion und Beta-Funktion 362 1.1. Die Gamma-Funktion (Γ-Funktion) 362 1.2. Analytische Fortsetzimg der Gamma-Funktion 363 1.3. Die B-Funktion oder Beta-Funktion B(z, w) 364 1.4. Die Funktionalgleichung der Gamma-Funktion 365 1.5. Die Legendre'sche Relation 366 2. Gewöhnliche lineare Differentialgleichungen zweiter Ordnung mit veränderlichen Koeffizienten 366
ΧΙΠ
Inhalt 2.1. 2.2. 2.3. 2.4. 2.5.
Vorbemerkungen 366 Stellen der Bestimmtheit 367 Formale Lösung von (2.1 ;1) in der Form einer Potenzreihe 368 Bestimmung des Konvergenzkreises der gefundenen Potenzreihe . . 370 Diskussion des bisher ausgeschlossenen Falles ρχ—ρ2 = m (m ganz, einschließlich 0) — Methode von Frobenius 372 2.6. Der Punkt ζ = oo 374 2.7. Nachträgliche Betrachtung 375 2.8. Lösungen in einer Umgebung eines gewöhnlichen Punktes 375 3. Hypergeometrische Funktionen 377 3.1. Die Gauß'sche Differentialgleichung 377 3.2. Allgemeine Lösung der GauB'schen Differentialgleichung in einer Umgebung von a = 0 — Hypeigeometrieche Reihen 378 3.3. Spezialfälle der hypergeometrischen Reihe 380 3.4. Integraldarstellung der hypergeometrischen Reihe 380 3.5. Die Summe der hypergeometrischen Reihe an der Stelle ζ = 1 . . . 381 3.6. Fundamentalsystem in einer Umgebung von 2 = 1 382 3.7. Fundamentalsystem in einer Umgebung von ζ = oo 383 3.8. Die Riemann'sche P-Funktion 383 3.9. Weitere Darstellungen hypergeometrischer Reihen 384 3.10. Analytische Fortsetzung von F(a,b,;c;z) 385 3.11. Lineare Beziehungen zwischen den verschiedenen Lösungen der hyper- 387 geometrischen Differentialgleichung 387 3.12. Schlußbemerkung 390 4. Legendre'sche Funktionen 390 4.1. Die Legrendre'sche Differentialgleichung 390 4.2. Lösungen der Legendre'schen Differentialgleichung in einer Umgebung von u = oo 391 4.3. Legendre'sche Polynome (Kugelfunktionen erster Art) 392 4.4. Einfache Darstellung von Rodrigues für Pn(u) 393 4.5. Integraldarstellungen von Schläfli und Laplace 393 4.6. Orthogonalitätseigenschaften der Pn(u) 394 4.7. Die erzeugende Funktion der Pn(u) 395 4.8. Rekursive Beziehungen für die P„{u) und Ρ' η (ω) 396 4.9. Weitere Eigenschaften der P„(v) 396 4.10. Die zweite Hauptlösung der Legendre'schen Differentialgleichung in einer Umgebung von w = oo 396 4.11. Das Neumann'sche Integral für Qn(u) 397 4.12. Endliche Entwicklung von QJz) für ganze nicht-negative η . . . . 398 4.13. Zugeordnete Legendre'sche Funktionen 399 5. Beeselfunktionen 399 5.1. Die Bessel'sche Differentialgleichung 399 6.2. Lösungen in einer Umgebung von ζ = 0 — Beeselfunktionen . . . . 400 5.3. Betrachtung der bisher ausgeschlossenen Fälle (2 p = ganz) . . . . 401 5.4. Die Wronski'sohe Determinante 402 5.5. Die erzeugende Funktion für Jn(z) (n ganz) 403 5.6. Rekursionsformel für Jn(z) 404 5.7. Integraldarstellungen der Besseischen Funktionen 405
XIV
Inhalt 5.8. Die zweite Lösung der Beseel'sehen Gleichung für den Fall, daß die Ordnung eine ganze Zahl ist 5.9. Hankel'sche Funktionen (Bes seifunktionen dritter Art) 5.10. Lösung der Bessel'sohen Gleichung mit Hilfe von Laplace-Transformationen 5.11. Erstes Hankel'sohes Sohleifenintegral 5.12. Zweites Hankel'sohes Sohleifenintegral 5.13. Natürliche Entstehungsweise der Hankel'schen Funktionen 5.14. Asymptotische Entwicklung der Hankel'schen und Bessel'schen Funktionen 5.15. Eine Bemerkung über die Nullstellen von Jp(z) 5.16. Die Lommel'schen Transformationen 5.17. Praktische Anwendung — Schrödingergleichung (eindimensional) . . 6. Kugelfunktionen 6.1. Entwicklung naoh Kugelfunktionen 6.2. Übergang zu räumlichen Polarkoordinaten 6.3. Herleitung von Hilfsgleiohungen 6.4. Lösung mit Hilfe von Legendre'schen Funktionen 6.5. Vereinfachungen, die in der Praxis auftreten 6.6. Bestimmung der Konstanten aus den Randbedingungen — Inneres und äußeres Problem 6.7. Die noch verbleibende Rechnung zum inneren Problem 6.8. Beispiel eines inneren Probleme
407 408 409 409 411 412 415 418 418 420 421 421 421 422 423 423 424 425 425
X . Vektoranalysis Dr. B. Timman VEKTOREN IM RAUM 1. Vektoren im dreidimensionalen Raum 1.1. Einleitung 1.2. Eigenschaften des Vektorprodukts 1.3. Das Spatprodukt und das dreifache Vektorprodukt 1.4. Einige Anwendungen auf die räumliche Geometrie 2. Anwendungen auf die Differentialgeometrie 2.1. Raumkurven 2.2. Darstellung einer Rotationsbewegung durch einen Vektor 2.3. Flächentheorie 2.3.1. Die erste Grundform einer Fläche 2.3.2. Die zweite Grundform 2.3.3. Kriimmungseigensohaften 2.3.4. Spezielle Kurven auf Flächen
427 427 429 429 431 432 432 438 441 441 444 445 448
THEORIE DER VORFELDER 3. Der Differentialoperator V 3.1. Der Gradient einer skalaren Funktion 3.2. Die Divergenz eines Vektorfeldes 3.3. Die Rotation eines Vektorfeldes 3.4. Der Operator V 3.5. Gradient, Divergenz und Rotation in krummlinigen Koordinaten . .
451 451 452 455 458 459
Inhalt
XV 4. Integralsatze 4.1. Der Satz von Gauß 4.2. Der Satz von Stokee 4.3. Die Sätze von Green 4.4. Rotationsfreie Vektorfelder 4.6. Die Bewegungegleichungen der Hydrodynamik
462 462 464 466 466 467
POTENTIALE VON MASSENBELEGUNGEN 6. Pole und Dipole 6. Linien- und Fl&ohenbelegungen 7. Räumliche Belegungen
470 472 478
DYADEN UND TENSOREN 8. Dyaden 9. Der Deformationstensor 10. Der Satz von Gauß für eine Dyade 11. Der Spannungstensor
479 481 482 483
XI. Partielle Differentialgleichungen Dr. S. Timman 1. Gleichungen erster Ordnung 486 1.1. Einleitung 485 1.2. Quasilineare partielle Differentialgleichungen erster Ordnung . . . . 486 1.3. Die allgemeine partielle Differentialgleichung erster Ordnung . . . . 487 1.4. Die Theorie von Hamilton—Jacobi 489 2. Systeme quasilinearer hyperbolischer Gleichungen erster Ordnung 493 2.1. Definition der Charakteristiken 493 2.2. Die Gleiohung der sohwingenden Seite 496 2.3. Das Cauchy'sche Problem für ein hyperbolisches System 498 2.4. Anwendungen auf die Strömungslehre 600 3. Lineare Gleichungen mit konstanten Koeffizienten 603 3.1. Die Potentialgleiohung 603 3.2. Der Satz von Green 504 3.3. Green'sche Funktionen 508 3.4. Die Helmholtz'sche Gleiohung 513 3.5. Der allgemeine Satz von Green 516 3.6. Die Riemann'sche Integrationsmethode für lineare hyperbolisohe Differentialgleichungen in zwei Variablen 518 3.7. Die Poisson'sche Formel für die Wellengleichung in drei Dimensionen 524 3.8. Die Methode von Hadamard-Riees für die Lösung des Anfangsproblems 527 4. Appropri m ationsmethoden bei elliptischen Differentialgleichungen 531 4.1. Zusammenhang zwisohen Lösungen elliptischer Differentialgleichungen und Lösungen von Variationsproblemen 531 4.2. Die N&herungsmethode von Ritz-Galerkin 535 4.3. Eigenwertprobleme 538
Inhalt
XVI
XII. Numerische Anal/sis Dr. Ir. L. Kosten 1. Einleitung 1.1. Die Aufgabe der numerischen Analysis 1.2. Hilfsmittel beim praktischen Rechnen 1.3. Fehlerquellen 1.4. Fehlerfortpflanzmig 1.5. Einiges über den Umgang mit Reihen
543 543 544 547 549 551
2. Interpolation 552 2.1. Lineare Interpolation 552 2.2. Interpolation mit geteilten Differenzen 555 2.3. Interpolation mit Differenzen; allgemeine Betrachtungen 559 2.4. Die Newton'schen Formeln mit Differenzen 561 2.5. Gauß'sche Interpolationeformeln mit Zentraldifferenzen 564 2.6. Die Bedeutung der Interpolationsformeln von Newton und Gauß . . 566 2.7. Interpolation mit der Everett'schen Formel 566 2.8. Der Einfluß fehlerhafter Funktionswerte auf die Differenzen . . . . 567 2.9. Lagrange'sche Polynome 570 2.10. Numerische Differentiation in Tabellenform gegebener Funktionen. . 574 2.11. Numerische Integration in Tabellenform gegebener Funktionen . . . 576 2.12. Orthogonale Polynome 579 2.13. Integration nach Gauß 585 3. Numerische Integration von Differentialgleichungen 3.1. Differentialgleichungen erster Ordnung 3.2. DM Anfangsverfahren 3.3. Fehler und Stabilität 3.4. Allgemeine Bemerkungen zu Differentialgleichungen von zweiter und höherer Ordnung 3.5. Ein Sonderfall der Gleichungen zweiter Ordnung: y " = F(x,y) . . . 3.6. Differentialgleichungen zweiter Ordnung mit Integrationsbedingungen in zwei verschiedenen Punkten
590 590 590 595
4. Die Bestimmung der Wurzeln einer Gleichung 4.1. Beeile Wurzeln; allgemeine Überlegungen 4.2. Die Regula falsi und die Methode von Newton-Raphson 4.3. Zur Frage der Konvergenz von Iterationeverfahren 4.4. Erhöhung der Ordnung eines Iterationsprozesses 4.5. Die Bestimmung komplexer Wurzeln von Gleichungen 4.6. Wurzeln algebraischer Gleichungen höherer Ordnung 4.7. Die Methode von Bernoulli zur Lösung von Gleichungen höherer Ordnung 4.8. Die Methode von Graeffe zur Lösung von Gleichungen höherer Ordnung
601 601 603 604 607 608 609
598 599 600
611 616
5. Rechnen mit linearen Systemen 617 5.1. Einleitung 617 5.2. Die Lösung linearer Gleichungssysteme mit Hilfe des Gauß'schen Eliminationsverfahrens 619 5.3. Die Crout'sche Modifikation des Gauß'schen Verfahrens 620
XVII
Inhalt
5.4. Lösung eines Syetems linearer Gleichungen mit Hilfe der inversen Matrix 624 5.5. Die Genauigkeit der Lösung eines linearen Gleichungssystems . . . 625 5.6. Allgemeine Bemerkungen zu den Eigenwerten einer Matrix . . . . 626 5.7. Bestimmung der dominanten Eigenwerte mit Hilfe eines Iterationsverfahrens 627 5.8. Die Bestimmung der Eigenwerte in der Reihenfolge abnehmender Absolutbeträge 629 5.9. Funktionen von Matrizen und Eigenwerten 632 6. Approximationen durch Polynome (Fortsetzung) 635 6.1. Rechenautomaten und Funktionentafeln -—- Approximationen durch Polynome 635 6.2. Anpassung unter der Bedingung der kleinsten mittleren quadratischen Abweichung 637 6.3. Herabdrücken des Grades 639 7. Numerische Integration partieller Differentialgleichungen 641 7.1. Einleitung 641 7.2. Der parabolische Typ: die Wärmegleichung 641 7.3. Der hyperbolische Typ: die Wellengleichung 646 7.4. Der elliptische Typ: die Potentialgleichung 648 8. Algol 60 651 8.1. Einleitung 651 8.2. Rechnungsschema: Flußdiagramm 652 8.3. Beispiel eines Algol-Programmes 653 8.4. Weitere Beschreibung von Algol 658 X I I I . Laplace — Transformationen Dr. Ir. J. W. Cohen 1. Die Theorie der Laplace — Transformation 1.1. Einleitung 1.2. Existenz und Eigenschaften von Bildfunktionen 1.3. Beziehungen zwischen Original und Bildfunktion 1.4. Der Fourier'sche Integralsatz 1.5. Das Inversionstheorem für die Laplace-Transformation 2. Anwendungen der Laplace-Transformation 2.1. Lineare Differentialgleichungen 2.2. Lineare Differenzengleichungen 2.3. Integralgleichungen 2.4. Die δ-Funktion 2.5. Partielle Differentialgleichungen 2.6. Asymptotische Gleiohungen und Entwicklungen 3. Fourier-Transformationen 3.1. Die Fourier-Transformation 3.2. Die Sinus- und Kosinustransformation von Fourier 4. Tabellen 4.1. Allgemeine Formeln 4.2. Einige bekannte Transformationen 5. Anhang
662 662 665 671 679 682 690 690 699 703 705 710 716 721 721 722 723 723 724 725
xvm
Inhalt
XIV.Wahrscheinlichkeitsrechnung und Statistik Dr. J. Hemelrijk 1. Einleitung 2. Grundbegriffe und Axiome der Wahrscheinlichkeitsrechnung 2.1. Ereignisraum — Ereignisse 2.2. Logisohe Operationen und Identitäten 2.3. Relative Häufigkeiten 2.4. Die Axiome der Wahrsoheinliohkeitsreehnung 2.6. Symmetrische Wahrsoheinliohkeitsfelder — zufällige Ziehung . . . . 2.6. Bedingte Wahrscheinlichkeiten — stochastiache Unabhängigkeit . . 3. Wahrscheinlichkeitsverteilungen 3.1. Zufallsgrößen 3.2. Beispiele diskreter Wahrscheinlichkeitsverteilungen 3.3. Beispiele kontinuierlicher Wahrscheinlichkeitsverteilungen 3.4. Gemeinsame Wahrscheinlichkeitsverteilungen 3.5. Population und Stichprobe 3.6. Die zweidimensionale Normalverteilung 3.7. Funktionen von Zufallsgrößen 4. Erwartimgewerte und Momente 4.1. Der eindimensionale Fall 4.2. Der mehrdimensionale Fall 4.3. Marginale und bedingte Erwartungswerte 4.4. Eigenschaften von Erwartungewerten 4.5. Momente 4.6. Anwendungen und Beispiele 5. Charakteristische Funktionen und Grenzwertsätze 5.1. Charakteristische Funktionen 5.2. Eigenschaften der charakteristischen Funktionen 5.3. Anwendungen — asymptotische Normalität 5.4. Stochastisohe Konvergenz 6. Die Normalverteilung 6.1. Approximation der Binomialverteilung durch eine Normalverteilung. 6.2. Die Normalverteilung als Modell für praktische Aufgaben 6.3. Verteilungen, die man aus der Normalverteilung herleiten kann . . . 7. Schätzung unbekannter Parameter 7.1. Problemstellung — Grundbegriffe 7.2. Die Methode der Maximum Likelihood von R. A. Fisher 7.3. Schätzen eines Erwartungswerts 7.4. Schätzen von Varianzwerten 7.5. Die Varianz von Schätzwerten 8. Das Testen von Hypothesen 8.1. Problemstellung — Grundbegriffe 8.2. Normale oder asymptotisch normale Testgrößen 8.3. Binomiale Tests 8.4. Hypergeometrische Tests 8.5. Normale Tests 8.6. Verteilungsfreie Tests 9. Vertrauensgrenzen 9.1. Einleitung
727 728 728 728 729 730 732 733 736 735 737 742 746 749 761 752 754 754 755 766 757 768 761 768 768 768 770 773 774 774 777 779 781 781 781 782 786 788 788 788 791 794 796 796 797 801 801
Inhalt 9.2. Problemstellung — Grundbegriffe 9.3. Vertrauensgrenzen, die aus Tests hergeleitet werden 9.4. Vertrauensgrenzen, die aus Schätzwerten hergeleitet werden . . . . 9.5. Theorie der großen Stichproben 10. Theorie der linearen Hypothesen 10.1. Einleitung 10.2. Lineare Modelle 10.3. Das Problem der Schätzungen 10.4. Das Problem der Tests 10.5. Voraussetzungen 11. Nicht behandelte Themen
XIX 801 802 805 805 806 806 806 808 809 809 810
Literaturverzeichnis
811
Sachwortverzeichnis
816
I. Aus der Geschichte der Mathematik Dr. C. H. Van Os
1. Die ersten Zahlen Die Anfänge der Mathematik liegen im Dunkel der Zeiten verborgen. Ihre Geschichte beginnt in jenem geheimnisvollen Abschnitt, in dem der Mensch in den Besitz seiner Geisteskräfte gelangte und zu geistigen Leistungen fähig wurde. Über die besonderen Umstände dieses Prozesses wissen wir nichts ; wir sind auf Vermutungen angewiesen. Jedenfalls entwickelte sich in dieser Periode das Denken in Begriffen und die Sprache. Das Denken in Begriffen beruht offensichtlich darauf, daß der Mensch solchen Gegenständen, die sich in einer gewissen Hinsicht gleichen, ein und dasselbe Wort zuordnet, daß er sie also zu einer Klasse oder, wie wir Mathematiker heute zu sagen pflegen, zu einer Menge zusammenfaßt. Solche Dinge können die unterschiedlichsten Merkmale gemein haben: Gestalt, Farbe, Nutzen für den Menschen usw. Eines der wichtigsten Merkmale, in dem zwei Gegenstände übereinstimmen können, ist, daß sie aus gleichvielen Binzelteilen aufgebaut sind, daß sie also in der Anzahl dieser Einzelteile übereinstimmen. Wir, die wir eine Entwicklung von vielen tausend Jahren hinter uns haben und die wir an all dies so gewöhnt sind, können uns kaum vorstellen, welchen Eindruck dieses neue Können auf den damaligen Menschen gemacht hat. Es mag ihm so gewesen sein, als täte eine neue Welt sich vor ihm auf, als hätte er die Dinge noch einmal neu erschaffen, nun da er ihnen einen Namen geben konnte. Der Name war für ihn nicht, wie für uns, etwas Zufälliges ; nein, der Name drückte das Wissen um das benannte Ding aus. Das Wort war eine Zauberformel; wer den Namen eines Dinges oder eines Menschen kannte, hatte Macht darüber. ,Zufällige' Übereinstimmungen, wie wir sie kennen, gab es für ihn nicht. Zwischen Dingen, die in irgendeiner Hinsicht übereinstimmten, bestand ein geheimnisvoller Zusammenhang. Ein ganz besonderer Fall lag vor, wenn man Übereinstimmung der Anzahlen feststellen konnte. Wenn ein Mensch aufrechtstehend seine Umgebung überblickt, kann er vier Richtungen linterscheiden: links, rechts, vorn und hinten. Hat er erst einmal gelernt, sich nach dem Stand der Himmelskörper zu orientieren, dann kommt er ganz von selbst darauf, die vier Himmelsrichtungen zu unterscheiden: Osten, Westen, Norden und Süden. Das machte einen tiefen Eindruck auf ihn. Allerlei Vierzähliges, das in seiner Umgebung ihm mehr oder weniger 1
Kuipers-TImman, Mathematik
2
I. Aus der Geschichte der Mathematik
offen entgegentrat, wurde ihm bewußt. Hatten nicht die meisten Tiere, die ihn umgaben, vier Beine ? Kann man nicht vier Altersstufen im Leben eines Menschen unterscheiden: Kindheit, Jugend, Erwachsensein und Alter ? Kann man die Stunden eines Tages nicht verteilen auf den Morgen, den Mittag, den Abend und die Nacht ? Die Zahl Vier schien für den Aufbau der ganzen Welt, die den Menschen umgab, von fundamentaler Bedeutung zu sein, und auch später noch, als der Denkprozeß weitere Fortschritte gemacht hatte, machte man Gebrauch von Einteilungen in vier Klassen. So unterschied man im Altertum die wohlbekannten vier Elemente: Erde, Wasser, Luft und Feuer. So sehr beherrschte dieses Schema eine Zeitlang das Denken, daß man es auch in solchen Fällen anwandte, in denen es eigentlich nicht paßte. So entdeckte man im menschlichen Körper drei ,Flüssigkeiten' oder ,Säfte': das Blut, die Körperflüssigkeit oder das ,Phlegma' (die Lymphe, wie wir heute sagen) und die Galle. Da aber die heilige Zahl Vier alles beherrschte, mußte es noch eine vierte Flüssigkeit geben, und so erfand man die sogenannte ,schwarze Galle'. Je nachdem, welche Flüssigkeit in einem Menschen die Oberhand hat, hat er einen entsprechenden Charakter oder ein entsprechendes Temperament. So kam man zu der Lehre von den vier Temperamenten: dem sanguinischen, dem phlegmatischen, dem cholerischen und dem melancholischen Temperament — eine Lehre, die im Sprachgebrauch noch weiterlebt. So wurde die Zahl Vier eine der heiligsten Zahlen. Die Jünger von PYTHAGORAS, der etwa um 650 v. Chr. lebte, schworen ihre Eide bei der heiligen Zahl Vier. Christliche Schriftsteller haben häufig allerlei Betrachtungen an die vier Arme des Kreuzes angeknüpft. Eine weitere sehr heilige Zahl war die Zahl Sieben. Die Bedeutimg dieser Zahl entstammte wohl in erster Linie der Tatsache, daß der Mond sieben Tage braucht, um von einer Phase in die andere zu gelangen. Die abwechselnden Erscheinungsformen des Mondes waren wohl das älteste Hilfsmittel des Menschen, die Zeit zu messen. Das Wort ,Mond' hängt etymologisch mit dem Wort ,messen' zusammen. Als erst einmal die Aufmerksamkeit auf die Zahl Sieben gerichtet war, fand man sie überall wieder. Am Kopf des Menschen finden sich sieben Öffnungen : die beiden Augen, die beiden Ohren, die beiden Nasenlöcher und der Mund. Als die Astronomie sich entwickelte, lernte man sieben .Planeten' kennen : den Mond, Merkur, Venus, die Sonne, Mars, Jupiter und Saturn. Ferner kannte man sieben Metalle: Silber, Quecksilber, Kupfer, Gold, Eisen, Zinn und Blei; und diese wurden natürlich mit den Planeten in einen Zusammenhang gebracht. Bekannt sind ferner die sieben Farben des Regenbogens : Rot, Orange, Gelb, Grün, Blau, Indigo und Violett. Das letzte Beispiel zeigt wieder, in welch starkem Maße durch die heiligen Zahlen Vorschriften für Einteilungen entstanden. Wenn die Zahl Sieben nicht unter allen
2. Fortsetzung der Zahlenfolge
3
Umständen hätte erfüllt werden müssen, so wäre man wohl kaum auf den Gedanken gekommen, ,Indigo' als eigene Farbe anzusehen! Die Zahlen Vier und Sieben haben demnach ihre Bedeutung dem Umstand zu verdanken, daß sie sich dem Menschen bei seinen Versuchen, sich in Baum und Zeit zu orientieren, aufdrangen. Noch deutlicher und unmittelbarer war das bei den Zahlen Zwei und Drei der Fall. Das Wort, zwei' hängt etymologisch mit dem persönlichen Fürwort ,du' im Deutschen zusammen. Es bedeutet also die Gegenüberstellung des ,ich' und des ,du', des ,ich' und des ,anderen'. Das Auffinden dieses und anderer Gegensatzpaare wie z. B. Licht—Finsternis, Wärme—Kälte, Mann—Frau war sicher eine der ersten und grundlegendsten Tätigkeiten des Denkens. Die Schüler von Pythagoras haben eine Tabelle aufgestellt mit zehn Gegensatzpaaren, die ihnen besonders bedeutungsvoll erschienen. Auch die Zahl Drei hatte im Altertum große symbolische Bedeutung. Diese Zahl drückte die Gemeinschaft von Vater, Mutter und Kind aus. Bei einigen Feierlichkeiten mußten gewisse Riten und gewisse Worte dreimal wiederholt werden.
2. Fortsetzung der Zahlenfolge Wir sahen in dem vorangegangenen Abschnitt, wie sich die kleineren Zahlen Zwi, Drei, Vier und Sieben dem Menschen in den ganz konkreten Situationen, in denen er sich befand, bei ganz konkreten Wahrnehmungen aufdrängten. Man sagt, daß es noch heute Volksstämme gibt — oder bis vor kurzem gegeben hat — die dieses Stadium noch nicht überwunden haben und keine Zahlen kennen, die über Zwanzig hinausgehen. Aber für die großen Kulturvölker des Altertums gehörte dieser Zustand seit langem zur Vergangenheit. Verschiedene Umstände waren es, die eine Fortsetzung der Folge der natürlichen Zahlen erforderlich machten. Da waren in erster Linie die Bedürfnisse der Praxis. Die Herden vermehrten sich, und die Eigentümer wollten doch wissen, wieviele Tiere sie besaßen. Und da mächtige Staaten entstanden, die über große Armeen befehligten, mußte man die Anzahl der Soldaten kennen, um bestimmen zu können, wieviel Nahrung für ihren Unterhalt nötig sein würde. Die Berechnung der für die Soldaten erforderlichen Vorräte war eine der vordringlichsten Aufgaben der ägyptischen Bechenmeister. Anfangs hat man anscheinend eine gewisse Scheu davor gehabt, mit so großen Zahlen umzugehen. Der Mensch hatte dabei das Gefühl, als überschritte er damit Grenzen, die ihm gestellt seien, und als wagte er sich auf ein Gebiet, das über ihm thronende Mächte für sich selbst reserviert hätten. Als erst einmal die anfängliche Scheu überwunden war, ergab sich die Frage, wie man solch große Zahlen darstellen könnte. Nicht gleich fand man für dieses Problem eine zufriedenstellende Antwort. Im Griechischen ist das 1·
4
I. Aus der Geschichte der Mathematik
größte Zahlwort das für die Zahl Zehntausend. Noch in den Tagen des ABCHIMEDES(287—212 v. Chr.) bezweifelte man, ob z.B. die Anzahl der Sandkörner im Meer durch eine bestimmte Zahl ausgedrückt werden könnte. Um diese Frage zu klären, schrieb Archimedes ein Werk, die Sandrechnung genannt. Hierin entwickelte er eine Methode, mit deren Hilfe man immer noch größere Zahlen bilden kann. Sie besagt etwa, daß jedesmal zehntausend mal zehntausend Einheiten einer bestimmten Klasse zu einer Einheit einer höheren Klasse zusammengefaßt werden; ungefähr dasselbe tun wir, wenn wir mit Millionen, Billionen, Trillionen usw. arbeiten. Archimedes berechnete nun die Anzahl Sandkörner, die nötig sind, um eine Kugel zu füllen, die — wie er es sich vorstellte — das ganze Weltall umfassen sollte; und er kam zu dem Schluß, daß diese Anzahl durch eine von seinen Zahlen ausgedrückt werden könnte. Die Anzahl der Sandkörner im Meer müßte dann aber bestimmt viel kleiner sein als diese Zahl! Als man erst einmal mit dem Gedanken an sehr große Zahlen vertraut war, begannen einige, in solchen Zahlen geradezu zu schwelgen. Vor allem die Hindus gehörten dazu. Ihnen zufolge wurde diese Welt zu Beginn einer Weltperiode von Brahma ausgeatmet, und an ihrem Ende wird sie wieder eingeatmet werden. Dieser Abschnitt, währenddessen die Welt bestehen wird, dauert 4 Milliarden und 320 Millionen Jahre und nennt sich ein ,Tag Brahmas'. Hierüber kann man in der Schrift Sanatana — Dharma lesen. 3. Das Unendliche
Hat man erst einmal gelernt, mit solchen ungeheuerlichen Zahlen umzugehen, dann entstehen neue Fragen. Läßt sich die Folge der natürlichen Zahlen tatsächlich immer weiter fortsetzen ? Ist diese Folge mit anderen Worten unendlich ? Soll dahinter schließlich noch irgendetwas kommen ? Wir begegnen hier jenem Begriff, der die Entwicklung der Mathematik in wesentlichem Maße beherrscht hat und auch heute noch beherrscht: dem Begriff des Unendlichen. Wir werden die Geschichte der Mathematik weitgehend charakterisieren können als die Geschichte vom Ringen des menschlichen Geistes mit dem Begriff des Unendlichen. Wir wollen die von Archimedes gestellte Frage folgendermaßen ergänzen. Die Anzahl der Sandkörner im Meer mag endlich und durch eine ganz bestimmte Zahl ausdrückbar sein. Aber gibt es nun im ganzen Weltall keine einzige Menge, für die dies nicht der Fall ist ? Eine Menge, die wir dann unendlich nennen müßten ? Wie steht es zum Beispiel mit der Anzahl der Himmelskörper ? Ist sie endlich oder unendlich ? In dieser Form stellte sich dies Problem den Griechen nicht dar. Von einzelnen Ausnahmen abgesehen betrachteten sie das Weltall als endlich. Ursprünglich
3. Dae Unendliche
5
dachte man sich die Erde als eine flache Scheibe, υ τη ringt von den Strömen des Okeanos. Dieser Ozean und das, was dahinter lag, war das Reich der Titanen, der düsteren Mächte des Chaos. Der Versuch, dahinein vorzudringen— selbst in Gedanken — schien sündhafte Anmaßung zu sein, ein Überschreiten der Grenzen, die dem Menschen von den Göttern gesetzt waren. Als man später zu der Einsicht kam, daß die Erde eine Kugel ist, dachte man sich die Kugel umgeben von kristallenen ,Sphären'. An diesen Sphären waren die Sonne, der Mond und die Planeten befestigt. Die äußerste Sphäre war die der Fixsterne. Dahinter befand sich nichts mehr, auch kein Baum. Uns ist die Idee von der Unendlichkeit des Baumes so vertraut, daß wir große Schwierigkeiten haben, uns andere Möglichkeiten vorzustellen. Für die Griechen war das anders. In Wirklichkeit kannten sie unseren Begriff ,Baum' noch nicht einmal; für sie gab es höchstens die Begriffe ,Platz' und ,Leere'. Nach A b i s t o t e l b s (384—322 v. Chr.) hat jedes Ding seinen ,Platz'. Dieser ,Platz' wird definiert als die Gesamtheit aller umgebenden Gegenstände. Außerhalb der Sphäre der Fixsterne befinden sich überhaupt keine Gegenstände; es ist dort also auch kein ,Platz', und es kann sich kein Ding dort befinden. Dieser Gedankengang erscheint uns vielleicht merkwürdig. Er steht aber in Übereinstimmung mit dem ganzen System des Aristoteles, das sich ausschließlich mit konkreten, existierenden Dingen befaßt. Selbst nicht-existierende, aber .mögliche' Gegenstände wurden von Aristoteles als ,potentiell-existierend' aufgefaßt. In dem griechischen Standardwerk der Geometrie, den Elementen des E u k l i d (geboren etwa 365 v. Chr.) treten diese Auffassungen auch deutlich zutage. In der modernen Mathematik sind wir daran gewöhnt, eine Gerade als eine Figur zu betrachten, die sich ins Unendliche erstreckt. Euklid dagegen kennt nur begrenzte Geraden. Er formuliert ausdrücklich das Axiom, daß man eine (begrenzte) Gerade stets um ein gewisses Stück verlängern kann. Damit bleibt man aber stets im Endlichen, und das Axiom soll seine Gültigkeit verlieren, wenn man in solche Gegenden des Weltalls eindringt, in denen nichts mehr existiert. Über derlei spricht Euklid aber nicht; stillschweigend unterstellt er, daß alle Figuren in solchen Gebieten des Kosmos liegen, in die wir auf jeden Fall mit unseren Gedanken vordringen können. Das Problem des Unendlichen stellt sich den griechischen Denkern also nicht im Zusammenhang mit der Unendlichkeit des Baumes. In einer anderen Überlegung drängte es sich ihnen aber auf und wurde geradezu zu einer Qual; und zwar geschah das anläßlich der Frage : Sind die Dinge bis ins Unendliche teilbar ? Diese Frage wurde vermutlich zum erstenmal in der Schule des P y t h a g o b a s (569—500 v. Chr.) gestellt. Diese Mathematiker, die gleichzeitig Philosophen und Gründer einer religiösen Sekte waren, gingen aus von der alten Vor-
6
I. Aus der Geschichte der Mathematik
Stellung, nach der die Zahlen nicht bloß abstrakte Begriffe sind, sondern Kräfte, ja Geschöpfe, die sich in den Dingen offenbaren. Jedes Ding ist die Verkörperung einer bestimmten Zahl. Wenn man diese Vorstellung näher präzisieren mil, liegt die Vermutung auf der Hand, daß jedes Ding aus Teilen aufgebaut ist, und daß die Anzahl dieser Teile gerade die bewußte Zahl ist. Für jedes dieser Teile gilt dann wieder dasselbe, und so kann man fortfahren. Aber so wie die Folge der natürlichen Zahlen, wenigstens soweit sie stofflich realisiert wurde, eigentlich als begrenzt gedacht wurde, so fand auch die Teilbarkeit der Dinge ein sicheres Ende. D E M O K B I T (geboren etwa 475 v. Chr.) präzisierte dieses Denkbild durch seine Lehre von den Atomen, unteilbaren, kleinsten Teilchen, aus denen alle Dinge aufgebaut sind. Gegen diese Atomlehre erheben sich ernsthafte Bedenken. Was befindet sich zwischen den Atomen? Demokrit antwortet: leerer Kaum. Aber der Begriff ,leerer Raum' war für die Griechen eine Quelle von Schwierigkeiten. Existiert der leere Raum oder existiert er nicht ? Der Begriff .Leere', also Abwesenheit von jeglichem Ding, scheint ein Nicht-existieren zu implizieren. Andererseits ist diese Leere notwendig, wenn die Atome sich bewegen sollen. Aber wenn der leere Raum nun existiert, dann kann man wieder fragen, ob er nun ins Unendliche teilbar ist oder nicht. Besteht der Raum aus Atomen, dann muß also wieder etwas zwischen den Atomen sein, und die Schwierigkeit ist nur an eine andere Stelle gerückt. Ist der Raum dagegen bis ins Unendliche teilbar, dann muß man wohl zu dem Schluß kommen, daß ein beweglicher Körper, um vom Ort A zum Punkt Β zu gelangen, unendlich viele dazwischenliegende Stellungen passieren muß. Wie kann man sich vorstellen, daß so etwas in endlicher Zeit geschieht? Diese Schwierigkeit ist der Kern der berühmten Paradoxic .Achilles und die Schildkröte' des Z E N O VON E L B A (495—436 v. Chr.). Und wie soll man sich überhaupt die Atome vorstellen? Sind sie Körper von bestimmter Gestalt ? In diesem Fall kann man, auch wenn ein Atom sich vielleicht mit materiellen Hilfsmitteln nicht spalten läßt, Einzelteile an ihm erkennen; solch ein Teil kann man in Gedanken weiterteilen usw. Aber dann liegt das Problem der unendlichen Teilbarkeit wieder vor uns genau wie zu Beginn. Mit diesen Schwierigkeiten hat die Lehre von den Atomen jahrtausendelang gerungen. Erst die Naturwissenschaft unserer Zeit hat darüber Klarheit gewonnen. Der Grund der Schwierigkeiten lag augenscheinlich darin, daß man sich die Atome vorstellte als kleine Teilchen, ähnlich den uns umgebenden Körpern, während sie doch wegen ihrer Unteilbarkeit davon wesentlich verschieden sein mußten. Das mußte notgedrungen zu Widersprüchen führen. Die moderne Physik vermeidet diese nun, indem sie auf dem Gebiet der Atome radikal auf alle Anschaulichkeit und Vorstellbarkeit verzichtet. Nichts
4. Dae Irrationale
7
ist ,selbstverständlich' oder ,auf der Hand liegend', sobald es sich um Atome handelt. Jede Aussage über sie hat allein dann Sinn, wenn diese Aussage direkt oder indirekt durch ein Experiment verifiziert werden kann und so in letzter Instanz Beziehung zu Wahrnehmungen hat. Die Fragen, mit denen die alten Denker rangen, sind so zu ,Scheinproblemen' erklärt worden, die prinzipiell keine Lösung haben, da sie falsch gestellt worden sind. 4. Das Irrationale Auf den ersten Blick möchte man meinen, daß die oben behandelten Fragen für die Mathematik nur wenig Bedeutimg haben könnten. Schließlich befaßte sich doch die Mathematik bei den alten Griechen ausschließlich mit bestimmten Zahlen und bestimmten Figuren. Sicher war, daß man zu jeder Zahl eine größere Zahl, zu jeder Figur eine größere Figur finden konnte. Überlegungen jedoch, die die ganze Folge der natürlichen Zahlen oder die Gesamtheit des Raumes einschlossen, wurden von den griechischen Mathematikern sorgfältig vermieden; wahrscheinlich hatte ihnen das Zenosche Paradoxon einen heilsamen Schrecken vor solchen Gedankengängen versetzt. Es war aber leider nicht möglich, eine derart vorsichtige Haltung auch im Hinblick auf solche Fragen anzunehmen, die mit der Teilbarkeit des Raumes zusammenhängen. Die ersten Rechenaufgaben, vor die sich der Mensch gestellt sah, werden wohl Addition und Subtraktion gewesen sein. Aber auch Multiplikation und Division werden frühzeitig notwendig gewesen sein. Oft genug kam es doch vor, daß eine gewisse Menge Nahrung, ein gewisser Geldbetrag oder ein Stück Land unter mehrere Menschen aufgeteilt werden mußten. So entstand zwangsläufig nach dem Rechnen mit natürlichen Zahlen das Rechnen mit Brüchen. Die ersten Versuche hierzu scheinen uns, die wir solch eine lange Entwicklung hinter uns haben, reichlich ungeschickt gewesen zu sein. So kannten die Ägypter nur Stammbrüche.. Aber mit solchen Einzelheiten wollen wir uns hier nicht aufhalten. Wenn erst einmal eine Längeneinheit ausgezeichnet worden ist, dann liegt die Vermutung nahe, daß jede Länge, die nicht gleich einem ganzzahligen Vielfachen dieser Einheit ist, immerhin durch eine Bruchzahl dargestellt werden kann. Groß war daher die Bestürzung unter den griechischen Denkern, als sich herausstellte, daß dies nicht immer der Fall ist. Nimmt man ζ. B. als Längeneinheit die Seite eines Quadrats, dann ist die Diagonale weder ein ganzzahliges noch ein rationales (bruchzahliges) Vielfaches davon. Das Verhältnis von Seite und Diagonale eines Quadrates nennt man daher inkommensurabel oder irrational. Daß derartige Verhältnisse existieren, ist der Überlieferung nach eine Entdeckung der pythagoreischen Schule.
8
I. Aus der Geschichte der Mathematik
Als sich das erste Entsetzen über diese unerwartete Situation gelegt hatte, standen die Mathematiker vor der Frage, wie man mit solchen irrationalen Verhältnissen arbeiten sollte. Dieses Problem wurde durch Eudoxos (408 bis 355 v. Chr.) meisterhaft gelöst. Seine Lösung läuft darauf hinaus, daß streng geschieden wird zwischen Zahlen und Verhältnissen von Strecken. Zahlen sind stets kommensurabel, Verhältnisse können inkommensurabel sein. liegen nun zwei inkommensurable Verhältnisse vor, dann erhebt sich die Frage, wann sie gleich sind oder, wenn sie nicht gleich sind, welches der beiden das größere ist. Mit sorgfältig gewählten Definitionen und scharfsinnigen Überlegungen konnte Eudoxos alle diese Fragen beantworten und eine vollständige Theorie der irrationalen Verhältnisse entwickeln. Aber wie sehr des Eudoxos' Ruhm auch leuchtete, seine Verdienste erwiesen sich auf die Dauer als verhängnisvoll für die griechische Mathematik. Um dies einzusehen, brauchen wir nur das folgende zu bedenken. Die Formel für die Lösung einer quadratischen Gleichung ist, wie man weiß, ein Wurzelausdruck, und folglich ist die Lösung im allgemeinen irrational. Für einen griechischen Mathematiker hatte nun ein Problem mit derartiger Lösung nur dann einen Sinn, wenn die darin auftretenden Größen Verhältnisse von Strecken waren. Die Algebra war infolgedessen notwendig verknüpft mit dem Lösen geometrischer Probleme; geometrische Überlegungen und geometrische Beweise wurden der Algebra aufgepfropft, so daß sie sich nicht frei entfalten konnte. An Stelle einer Technik, die jeder lernen kann, wurde die Algebra zu einer Kunst, die nur begabte Mathematiker beherrschen konnten. Dazu kam die Angst vor dem Unendlichen, die seit Zenos Tagen die Griechen verfolgte. Wozu dies alles führte, sieht man am besten am Beispiel des Archimedes (287—212 ν. Chr.), des großen Mathematikers des Altertums. Archimedes stellte sich u. a. die Aufgabe der Flächen- bzw. Inhaltsberechnung von krummlinig begrenzten Figuren bzw. von Körpern mit gekrümmter Oberfläche. Hierzu entwickelte er eine Methode, die als Exhaustionsmethode bekannt ist. Auf den ersten Blick scheint sie im Kern unsere Integralrechnung zu enthalten, aber bei näherem Hinsehen entdeckt man doch wesentliche Unterschiede, die wir im folgenden beleuchten wollen. Wir betrachten ein Parabelsegment, begrenzt von einer Strecke senkrecht zur Parabelachse. Der Flächeninhalt dieser Figur beträgt fmal Produkt aus Sehnenlänge und Abstand dieser Sehne vom Scheitelpunkt der Parabel. Wir finden dieses Ergebnis, indem wir die Figur auffassen als Grenzwert einer Folge in- und umbeschriebener, nur von Strecken begrenzter Vielecke. Auch Archimedes arbeitet mit derartigen Figuren. Um aber einen Qrenzubergang vollziehen zu können, muß man eine unendliche Folge in- und umbeschriebener Vielecke betrachten, und gerade davor wurden die griechischen Mathematiker von ihrer Angst vor dem Unendlichen zurückgehalten. Archimedes macht
5. Das unendlich Kleine
9
das folgende. Unterstellen wir, daß das genannte Ergebnis bekannt, aber noch nicht bewiesen ist. Archimedes argumentiert nun, daß jede einbeschriebene Figur kleiner und jede umbeschriebene Figur größer ist als die genannte und daß also der Flächeninhalt der betrachteten Figur gleich dem genannten Betrag ist. Damit ist der Beweis beendet. Um diese Methode anwenden zu können, muß man das gesuchte Ergebnis von vornherein kennen. Um dies herauszubekommen, geht Archimedes sehr geschickt vor. Er denkt sich einen materiellen Körper, dessen Gestalt mit der betreffenden Figur übereinstimmt und zieht dann mit diesem Körper mechanische Experimente in Erwägung. Auf diese Weise gelingt es ihm, den Inhalt des Körpers zu finden. Diese Methode hat aber in seinen Augen keine Beweiskraft; das gewünschte Resultat muß mit der Exhaustionsmethode streng bewiesen werden. Vergleicht man diese umständliche Prozedur mit unseren modernen Methoden, die jeder normale Student sich in wenigen Monaten aneignen kann, dann wird der Unterschied deutlich. Wir können getrost sagen, daß die griechische Mathematik sich festgefahren hat in einem wirren Knäuel von Komplikationen. 5. Das unendlich Kleine Wir wenden uns nun der Renaissance zu, jener Zeit, in der Wissenschaft und Philosophie zu neuem Leben erwachten. In der Zwischenzeit, im Mittelalter, war das Denken aber nicht so sehr zum Stillstand gekommen, wie man es eine Zeitlang geglaubt hatte. Insbesondere hatte sich, hauptsächlich bei den Arabern, die Algebra zu einer selbständigen Wissenschaft entwickelt. Die Bezeichnungssysteme und Methoden waren anfänglich vielleicht noch ein bißchen unhandlich, aber durch die Arbeiten von DESCARTES (1596—1650) und seinen Zeitgenossen bekam die Algebra schließlich das Aussehen, das sie heute noch hat. In dieser Algebra wurde nun auch mit Wurzelausdrücken gearbeitet, als ob gar nichts dabei wäre. Vielleicht bestand noch ein gewisses Unbehagen, ein unbewußtes Eingeständnis, daß das Rechnen mit irrationalen Größen nicht hinreichend begründet war, doch glücklicherweise war dies Gefühl nicht so stark, daß es die Mathematiker von neuem dazu geführt hätte, den Weg des Eudoxos einzuschlagen. Im Gegenteil, das Werk des Eudoxos, das in einem der Bücher der Elemente des Euklid uns überliefert ist, wurde kaum verstanden. Man sah in ihm bestenfalls ein merkwürdiges Beispiel griechischer Denktätigkeit. In dieser Weise hatte sich also die Algebra von der Geometrie gelöst; durch Descartes entstand jedoch eine neue und viel innigere Verbindung zwischen diesen beiden Disziplinen durch die Entdeckung der analytischen Geometrie.
10
I. Aus der Geschichte der Mathematik
Wir wollen die Grundprinzipien dieser Wissenschaft hier nicht darlegen. Der Leser weiß, wie in der analytischen Geometrie (der Ebene) ein Punkt dargestellt wird durch ein Paar von Koordinaten, eine Figur durch eine oder mehrere Gleichungen zwischen diesen Koordinaten. Hinter diesem steckte aber mehr, als daß nur eine neue Methode zur Lösung geometrischer Fragestellungen gefunden worden war. Schon die alten Griechen hatten verschiedene Kurven studiert. Die wichtigsten waren die Kegelschnitte, die — wie der Name bereits sagt — als Schnittfiguren eines Kegels mit verschiedenen Ebenen entstehen. Dann gab es noch andere Kurven, ζ. B. die Zissoide und die Konchoide, die als Bahnen eines sich in bestimmterWeise bewegenden Massenpunktes entstehen. Diese letzteren wurden aber wegen ihres mechanischen Ursprungs nicht als vollwertig zum Reich der Geometrie gehörig betrachtet. Jetzt lächelte man über diesen Unterschied. Alle diese Kurven konnten nun durch Gleichungen dargestellt werden. Ja, es wurden neue Kurven entdeckt, die einfach durch Gleichungen definiert wurden. Eine der ersten davon war das bekannte Kartesische Blatt. Und so konnte jede Relation zwischen veränderlichen Größen durch eine Figur, insbesondere eine Kurve, dargestellt werden. Der Ausdruck ,veränderliche Größe' ist kennzeichnend für den Geist der neuen Zeit. Die griechischen Denker hatten mit dem Problem der Veränderung gerungen, mit dem Werden und Vergehen in dieser Welt. Fast alle waren davon überzeugt, daß das wahre Sein ewig und unveränderlich sein müßte; und auf unterschiedliche Weise hatten sie versucht, alle Veränderung als Schein zu erklären. Nur einzelne, wie HEBAKLIT, hatten es gewagt, die Veränderung als fundamentales Prinzip der Welt aufzufassen. Jetzt aber wurde das anders. In der Mechanik studierte GALILEI (1564—1642) die Gesetze der Bewegung, also der Veränderung. Und man betrachtete jetzt eine Kurve vorzugsweise als Bahn eines sich bewegenden Massenpunktes. Das brachte neue Probleme mit sich. Stellen wir uns einen Punkt vor, der sich entlang einer Kurve bewegt. Wir ,sehen' dann anschaulich, daß die Bewegung in jedem Augenblick eine bestimmte Richtung hat. Diese Richtung ist offenbar keine andere als die der Tangerde, die man in dem Punkte an die Kurve legt, in dem sich das Massenteilchen gerade befindet. Durch diese Überlegung gelangte das Problem, an eine Kurve in einem behebigen Punkte eine Tangerde zu legen, zu fundamentaler Bedeutung. Die größten Mathematiker des siebzehnten Jahrhunderts, wie FERMÂT (1601—1665), der sich mit Descartes die Ehre teilt, Entdecker der analytischen Geometrie zu sein, und CHRISTIAN HTTYGHENS (1629—1695) haben sich mit Tangentenkonstruktionen beschäftigt. Und schließlich führten diese Untersuchungen NEWTON (1642—1727) und LEIBNIZ (1646—1716) zur Entwicklung der Differential- und Integralrechnung.
5. Das unendlich Kleine
11
Um die Bewegung eines Massenpunktes zu studieren, schlugen Newton und Leibniz denselben Weg ein, den im Altertum Zeno gegangen war: sie teilten die Bewegung in eine Anzahl aufeinanderfolgender Stadien auf. Wo aber Zeno meinte, zu unlösbaren Widersprüchen gekommen zu sein, fanden sie den Ausgangspunkt zu äußerst wichtigen und fruchtbaren Entwicklungen. Sei Ρ ein beweglicher Massenpunkt und χ der Weg, den Ρ in t Sekunden seit Beginn der Bewegimg zurückgelegt hat. Wir betrachten nun ein sehr kurzes Zeitintervall dt oder, wir man sagt, einen Zuwachs der Zeit t. In diesem Intervall di legt Ρ einen Weg dz zurück, einen ,Zuwachs' des Weges x. Der Quotient der Größen dx und dt, der Differentialquotient, ist nun die Geschwindigkeit von Ρ in dem betrachteten Augenblick. Was ist durch diese Betrachtungsweise nun gewonnen ? Zeno hat wie folgt argumentiert. Betrachten wir einen unteilbaren Augenblick, ein ,Zeitatom'. In diesem Augenblick hat Ρ eine bestimmte Stellung. Und da während solch eines unteilbaren Augenblicks Ρ keine Zeit hat, sich zu bewegen, besteht dann auch kein Unterschied zwischen einem ruhenden und einem sich bewegenden Punkt. Das gilt für jeden Augenblick. Und da somit in keinem einzigen Augenblick ein Unterschied zwischen Ruhe und Bewegung besteht, wie kann dann von einem solchen Unterschied die Rede sein ? Zeno glaubte hier einen unlösbaren Widerspruch gefunden zu haben. Newton und Leibniz antworteten aber folgendermaßen. Ein sich bewegender Punkt hat in jedem Augenblick nicht nur einen bestimmten Ort, sondern auch eine bestimmte Geschwindigkeit. Und diese Geschwindigkeit ist gleich Null an einem Ruhepunkt, während sie für einen sich bewegenden Punkt von Null verschieden ist. Hiermit haben wir einen deutlichen Unterschied zwischen einem ruhenden und einem sich bewegenden Massenpunkt. Auf den ersten Blick scheint diese Überlegung einfach und klar zu sein. Aber wenn man weiter darüber nachdenkt, tauchen alsbald heikle Fragen auf. Wie klein muß man denn die Zuwächse dx und dt wählen ? Wenn sich die Bewegung sehr stark verändert, dann lehrt uns schon die Anschauung, daß die Geschwindigkeit auch in einem sehr kurzen Moment sich merklich vergrößern oder verkleinern kann. Der Quotient von dx und dt ist dann höchstens die mittlere Geschwindigkeit während des Intervalls dt, nicht aber die Geschwindigkeit in einem bestimmten Augenblick; und um letzteres geht es doch. Die Mathematiker des achtzehnten Jahrhunderts antworteten darauf, daß man dx und dt unendlich klein wählen müßte. Sieht man den Begriff .unendlich kleine Größe' als anschaulich klar an, wie man es in jener Zeit tat, dann ist damit tatsächlich eine Antwort gegeben. Aber kann man sie aufrechterhalten? Betrachten wir einmal den Begriff .Beschleunigung'. Um ihn auf die angegebene Weise zu definieren, muß man den Unterschied zwischen den Zuwächsen dx in zwei aufeinanderfolgenden unendlich kleinen Zeitintervallen dt betrachten. Man muß also mit unendlich kleinen Zuwächsen von unendlich kleinen Zu-
12
I. Aus der Geschichte der Mathematik
wachsen arbeiten. Der Philosoph BERKELEY (1685—1753), der das Amt eines Bischofs bekleidete, bemerkte, daß jemand, der derartige Dinge schluckt, nicht das Recht hat, die Theologen zu tadeln, daß sie mit unklaren Begriffen arbeiteten. ,Sind die unendlich kleinen nun Größen oder nicht ?' fragt er. ,Sind sie nicht vielmehr die Schatten gestorbener Größen?' Daß auch die Mathematiker mit diesen Begriffen rangen, erhellt aus den Diskussionen, die über die Frage geführt wurden, ob ein Differential dx nun den Wert Null hat oder nicht. Der Leser weiß natürlich, wie wir heute dieser Schwierigkeit begegnen. Wir bezeichnen bei den oben angeführten Überlegungen die Zuwächse von χ und t nicht mit dx und dt, sondern durch die Symbole Ax und At. Dann lassen wir die Zuwächse gegen Null streben und betrachten den Grenzwert des Quotienten. Dieser Grenzwert heißt Differentialquotient. Über die Frage, ob man den Ausdruck .unendlich klein' noch verwenden soll, ist man sich nicht einig. Einige wollen ihn ganz verbannen. Andere finden ihn nicht so verwerflich, da man ja, wenn man ihn benutzt, wohl weiß, was man damit eigentlich meint. Darauf wollen wir aber nicht näher eingehen. 6. Die Entwicklung der Analysis Newton und Leibniz haben beide keine ausführliche und systematische Darstellung ihrer Gedanken erscheinen lassen. Ihre älteren Zeitgenossen, wie ζ. B. Huyghens, konnten daher nicht damit vertraut werden. Die jüngeren aber übernahmen diese Lehre mit Begeisterung. Alsbald erschienen Lehrbücher der Analysis, und während des ganzen achtzehnten Jahrhunderts wurde an der Entwicklung der Analysis und ihrer Anwendungen, vor allem auf Fragen der Mechanik und Astronomie, gearbeitet. Namen wie DE L'HOSPITAL (1661—1704), TATLOB (1685—1731) und MACLAUBIN (1698—1746) sind jedem bekannt, der sich mit Analysis befaßt hat. Die Familie BEBNOÎTLLI brachte in drei Generationen acht große Mathematiker hervor. Die Veröffentlichungen von ETJLEB (1703—1783) sind nicht zu zählen. Gegen Ende des achtzehnten Jahrhunderts tauchten die großen französischen Mathematiker LAGRANGE (1736—1813), LAPLACE (1749—1827), LEGENDBE (1752—1834) u n d FOURIER (1768—1830) auf. Doch wollen wir nicht ausführlich auf die einzelnen Ver-
dienste all dieser Männer eingehen. Eine allgemeine Bemerkung möge genügen. Abgesehen von den .unendlich kleinen Größen* — über die wir schon sprachen — kam das Unendliche noch an einer anderen Stelle in der Analysis vor, nämlich in der Theorie der unendlichen Reihen. Der Leser weiß natürlich, welche Rolle diese in der Analysis spielen. Sowohl in der reinen als auch in der angewandten Mathematik begegnen wir allerlei Beziehungen zwischen
13
6. Die Entwicklung der Analysis
veränderlichen Größen, allerlei Funktionen, wie wir sagen. Eines der gebräuchlichsten Verfahren, solch eine Funktion zu berechnen und ihre Eigenschaften zu studieren, besteht nun darin, diese Funktion in eine unendliche Reihe zu entwickeln. Die bekanntesten Reihenentwicklungen sind die von Taylor, die schon bald ihren Einzug in die Mathematik hielten, und die von Fourier. Bei den letzteren sind die einzelnen Reihenglieder trigonometrische Funktionen der unabhängigen Veränderlichen. Da diese periodisch sind, sind Fourierentwicklungen besonders angebracht bei periodischen Funktionen, die ja in den Naturwissenschaften oft vorkommen. Die Mathematiker des achtzehnten Jahrhunderts arbeiteten ganz unbekümmert mit allerlei Reihenentwicklungen und kamen gelegentlich zu den merkwürdigsten Ergebnissen. In den Lehrbüchern dieser Zeit findet man ζ. B. Formeln wie 1 + 2 + 22 + 23 + 24 H
— 1.
Diese Formel erhält man offensichtlich dadurch, daß man in der Entwicklung der Funktion 1/(1 — x) in eine geometrische Reihe den Wert 2 an die Stelle von χ einsetzt. Es ging ein seltsamer Reiz von solchen Formeln aus. Es war, als hätte die Mathematik den Zugang zu einem metaphysischen Reich jenseits menschlichen Begreifens erschlossen. Selbst der große Euler verwandte gelegentlich Überlegungen, die einem modernen Mathematiker die Haare zu Berge stehen lassen. Er vertraute offenbar der inneren Folgerichtigkeit der Analysis und seiner eigenen Intuition. Und in seinem Fall wurde dieses Vertrauen dann auch selten getäuscht. Wenn überhaupt, dann gilt hier das Wort von Goethe: Der gute Mensch in seinem dunklen Drange ist sich des rechten Weges wohl bewußt. Doch je höher das Gebäude der Analysis emporwuchs, um so peinlicher wurde allmählich der Umstand, daß die Grundlagen doch recht unvollkommen waren. Lagrange hat in etlichen Lehrbüchern versucht, die Analysis von den Taylorreihen her streng aufzubauen. Wir können ihm nicht zugestehen, daß sein Versuch geglückt ist; sein großes Verdienst besteht jedoch darin, daß er die allgemeine Aufmerksamkeit auf dieses Problem gelenkt hat. GAUSS (1755 bis 1855), der ,princeps mathematicorum', war in seiner Studie über die hypergeometrischen Reihen einer der ersten, die in gehöriger Weise Konvergenz und Divergenz von Reihen untersuchten. Schließlich ist es dem Werk von CAXJCHY (1789—1857) zu verdanken, daß die Analysis wirklich streng aufgebaut wurde. Die Begriffe und Überlegungen von Cauchy finden wir noch in unseren heutigen Lehrbüchern. Jeder, der sich mit Analysis befaßt, kennt das Cauchysche Konvergenzkriterium.
14
I. Aus der Geschiohte der Mathematik
Fragt man sich, wie man zu solch einem strengen Aufbau der Analysis gelangt, so lautet die Antwort, sich im Prinzip wieder auf den Standpunkt der alten Griechen zu stellen. Bei ihnen stand das Unendliche höchstens undeutlich im Hintergrund, während sich alle konkreten Überlegungen im Endlichen abspielten. Um dies einzusehen, brauchen wir uns nur die moderne Definition des Grenzwerts einer unendlichen Zahlenfolge ins Gedächtnis zu rufen. Zunächst: was bedeutet hier .unendlich' ? Nichts anderes als: sind die ersten reGlieder der Folge bekannt, dann gibt es eine Vorschrift, mit deren Hilfe man das (n + l)te Glied berechnen kann. Was bedeutet es nun, daß eine Zahl a Grenzwert der Folge ist ? Nun, einfach folgendes: wenn eine beliebige positive Zahl ε gegeben ist, dann gibt es einen Index, so daß alle Folgenglieder mit größerem Index sich von a um weniger als ε unterscheiden. Wie man sieht, wird bei diesen Definitionen das Wort .unendlich' überhaupt nicht gebraucht. Die Verwendung dieses Wortes wurde, wie Gauss es ausdrückte, zu einer,façon de parier'; einer Ausdrucksweise, die man wegen ihrer suggestiven Kraft verwenden kann, die man aber auch entbehren kann und vermeiden soll, wenn durch falsche Assoziationen Schwierigkeiten entstehen könnten. Wenn man sich aber nun wieder auf den griechischen Standpunkt stellt, erhebt sich unweigerlich das Problem, in das sich die griechische Mathematik verrannt hatte : das Problem des Irrationalen. Wir wollen jetzt sehen, wie dieses Problem gelöst wurde. 7. Die moderne Zeit
Wir haben im vorangehenden verfolgt, wie man in der Mathematik nacheinander den ganzen, den gebrochenen und den irrationalen Zahlen begegnet ist. Sie alle hatten eine konkrete, anschauliche Bedeutung. Zwar brachten die irrationalen einige Schwierigkeiten mit sich, aber man hatte sie doch — mag man sie nun als Zahlen auffassen oder nicht — als Streckenverhältnisse kennengelernt und konnte sie somit anschaulich deuten. Da machten die negativen Zahlen mehr Mühe. Anfangs betrachtete man negative Lösungen von Gleichungen als .unmöglich'. Diese Auffassung verschwand aber, sobald man auf die uns vertraute Interpretation der negativen Zahlen kam. Bewegt sich ζ. B. ein Massenpunkt längs einer Geraden, so versieht man die zurückgelegte Strecke und die Geschwindigkeit mit dem positiven oder negativen Vorzeichen, je nachdem in welche Richtung der Geraden diese weisen. So verschwand ziemlich bald alles Geheimnisvolle, das den negativen Zahlen anfangs anhaftete. Eine andere Sorte von Zahlen hat dagegen den Mathematikern mehr Kopfzerbrechen gemacht, und zwar waren das die imaginären, oder wie wir heute lieber sagen, die komplexen Zahlen. Nach den Rechenregeln der Algebra ist
7. Die moderne Zeit
15
das Quadrat einer negativen Zahl positiv, das einer positiven Zahl natürlich ebenfalls. Es gab demnach keine Zahlen, deren Quadrat negativ sein könnte. Dessenungeachtet kam man in der Algebra auf Ausdrücke, bei denen eine negative Zahl unter einem Quadratwurzelzeichen steht. Von der Art sind ζ. B. die Formeln, die zu den reellen Lösungen einer Gleichung dritten Grades führen. Solche .unmöglichen' Ausdrücke konnten also eine ganz reelle Bedeutung haben. Als Euler und seine Zeitgenossen erst einmal ihre Scheu verloren hatten, mit derartigen ,unmöglichen' Ausdrücken zu rechnen, wurden diese ein Hilfsmittel, mit dem man zu wesentlichen Ergebnissen gelangte. Dennoch blieben die komplexen Zahlen unbegreiflich. Leibniz nannte sie ,Amphibien, die an der Grenze von Sein und Nichtsein leben'. Die Schwierigkeit verschwand schließlich auf ähnliche Weise wie bei den negativen Zahlen: durch eine konkrete Interpretation der komplexen Zahlen. Um 1800 fanden GAUSS, ABGAHD und andere die wohlbekannte Deutung der komplexen Zahlen als Vektoren in einer Ebene. Real- und Imaginärteil einer komplexen Zahl waren die Komponenten eines Vektors bezüglich der x- und «/-Achse. Das Rechnen mit komplexen Zahlen wurde dann als einfaches Operieren mit den entsprechenden Vektoren gedeutet. Alles .Unmögliche' ist damit verschwunden. Gauss und Cauchy haben noch andere Interpretationen der komplexen Zahlen angegeben, doch darauf wollen wir hier nicht eingehen. Aus dem allen ergaben sich wichtige Konsequenzen, auf die wir jetzt unser Augenmerk richten wollen. Die Operationen der Arithmetik: Addition, Subtraktion, Multiplikation und Division haben in ihren Anfängen eine ganz klare anschauliche Bedeutung. Insbesondere ist die Multiplikation nichts anderes als eine wiederholte Addition. Diese Bedeutung tritt aber immer mehr zurück, wenn man Brüche, irrationale, negative und schließlich auch komplexe Zahlen miteinander multipliziert. Schließlich bleiben von den genannten Operationen nur noch ihre formalen Eigenschaften und ihre gegenseitigen Beziehungen übrig. In der Theorie der komplexen Zahlen und in der Vektoralgebra werden gewisse Operationen .Addition' und .Multiplikation' genannt allein deshalb, weil sie, was ihre formalen Eigenschaften anbetrifft, mit den gleichnamigen Operationen der Arithmetik übereinstimmen. Auf diese Weise ergibt sich die Vorstellung, ganz allgemein die verschiedensten Operationen rein abstrakt durch ihre formalen Eigenschaften zu definieren und dann auf Grund dieser Definition zu studieren. Cauchy war einer der ersten, der das getan hat. Er hat somit den Grund zu einem der wichtigsten Gebiete der Mathematiker gelegt, nämlich zur Gruppentheorie, in der man Eigenschaften von Operationen rein abstrakt untersucht. An all dies anschließend gelang es D E D E K I X D (1831—1916) schließlich, für das jahrtausendealte Problem des Irrationalen eine Lösung zu finden, und zwar —
16
I. Aus der Geschichte der Mathematik
genau wie im Fall der komplexen Zahlen — dadurch, daß er eine Interpretation der irrationalen Zahlen angab. Wie wir gesehen haben, betrachteten die Griechen irrationale Verhältnisse als Äirecfcewverhältnisse. Dies führte aber zu einer scharfen Trennung von Algebra und Geometrie, wodurch schließlich die Mathematik in ihrer Entwicklung gehemmt wurde. Dedekind gab eine ganz andere Interpretation, und zwar eine rein algebraische. Er deutete die irrationalen Zahlen als Schnitte im System der rationalen Zahlen, wodurch dieses jeweils in zwei Klassen aufgeteilt wird. Sei A die Klasse aller rationalen Zahlen, die kleiner sind als 2, und Β die Klasse aller rationalen Zahlen, die nicht kleiner sind als 2. Offensichtlich ist jede Zahl aus A Meiner als jede Zahl aus B. An Stelle von 2 kann man jede andere rationale Zahl wählen, man erhält immer eine analoge Aufteilung des Systems der rationalen Zahlen. Sei jetzt aber A die Klasse aller rationalen Zahlen, deren Quadrat kleiner ist als 2, und Β die Klasse aller rationalen Zahlen, deren Quadrat größer ist als 2. Wieder ist jede Zahl aus A kleiner als jede Zahl aus B, aber es gibt kein größtes Element von A und kein kleinstes Element von B. Hat man aber die irrationalen Zahlen zur Verfügung, dann kann man natürlich sagen, daß die Zahl für den letzteren .Schnitt' dasselbe bedeutet wie die Zahl 2 für den ersten. Daher sieht Dedekind in dem beschriebenen Schnitt ein ,Bild' oder eine ,Interpretation* der irrationalen Zahl In gleicher Weise kann man andere irrationale Zahlen durch .Schnitte' deuten. Natürlich muß man nun auch das Rechnen mit irrationalen Zahlen irgendwie deuten. Das geht aber verhältnismäßig einfach. Seien A und Β jeweils .Unter'und .Ober'klasse eines bestimmten Schnittes, G und D das entsprechende eines anderen Schnittes. Addiert man jede Zahl aus A zu jeder Zahl aus C und jede Zahl aus Β zu jeder Zahl aus D, so zeigt man leicht, daß man auf diese Weise wieder einen Schnitt erhält; und die durch ihn dargestellte Zahl kann man in sinnvoller Weise als Summe der beiden durch die anderen Schnitte dargestellten Zahlen deuten. In analoger Weise definiert man die anderen Operationen. Wie im Fall der komplexen Zahlen, sind auch noch andere Interpretationen der irrationalen Zahlen möglich. CANTOR (1845—1918), WEIEBSTEASS (1815 —1897) und BAUDET (1891—1921) haben solche angegeben. Wie wir gesehen haben, arbeiteten und rangen die Mathematiker des siebzehnten und achtzehnten Jahrhunderts mit den Begriffen .unendlich klein' und .unendlich groß'. Durch die Arbeiten Cauchys und seiner geistigen Anhänger werden diese Begriffe im neunzehnten Jahrhundert aus der Mathematik verbannt oder zumindest zu einer ,façon de parier' reduziert. Wer aber meint, daß damit das Unendliche endgültig aus der Mathematik entfernt sei,
7. Die moderne Zeit
17
irrt sich sehr. Um uns hiervon zu überzeugen, brauchen wir uns nur aufmerksam die Definition der irrationalen Zahlen anzusehen, so wie sie durch Dedekind gegeben wurde. Wir sehen, daß dabei die Rede ist von dem System aller rationaler Zahlen und von Klassen, in die dieses System aufgeteilt wird. Offensichtlich enthält dieses System unendlich viele rationale Zahlen, und dasselbe gilt für jede der genannten Klassen. Die ganzen Überlegungen beruhen somit auf dem Umgang mit unendlichen Systemen, oder unendlichen Mengen, wie wir heute sagen. CANTOR (1845—1918) war es, der die Aufmerksamkeit der Mathematiker auf diesen Umstand richtete und versuchte, eine allgemeine Theorie dieser unendlichen Mengen zu geben. Er kam zu dem Ergebnis, daß eine Menge keineswegs durch die Feststellung, daß sie unendlich viele Elemente hat, vollständig charakterisiert werden kann. Die Menge der rationalen Zahlen, die der irrationalen Zahlen und die der Punktionen einer Veränderlichen z. B. unterscheiden sich ganz wesentlich voneinander. Man kann sagen, daß sie einen verschiedenen Grad von Unendlichkeit oder — nach Cantor — verschiedene unendliche Mächtigkeit haben. Zwischen den Elementen einer unendlichen Menge können verschiedene Relationen bestehen, d. h. die Menge kann eine unterschiedliche Struktur aufweisen. Was die Untersuchungen dieser Strukturen anbetrifft, bildet die Mengenlehre Cantors eine Fortsetzung und Verallgemeinerung der Betrachtungen einiger früherer Mathematiker. RIEMAITN (1826—1866) hatte schon festgestellt, daß es Mengen gibt, bei denen man von einem wohldefinierten Abstand zwischen je zweien ihrer Elemente sprechen kann. Solch eine Menge wird z. B. von den Punkten einer Ebene, einer gekrümmten Fläche oder des dreidimensionalen Raumes gebildet. Um dies einzusehen, erinnern wir uns an die Entdeckung der analytischen Geometrie durch DESCARTES. Dabei werden Algebra und Geometrie zu einem gewissen Grade miteinander identifiziert. Relationen zwischen zwei oder drei Veränderlichen konnten durch geometrische Piguren in der Ebene oder im Raum gedeutet werden, und umgekehrt. I n der Algebra kann man nun aber auch ebensogut Relationen zwischen vier oder mehr Veränderlichen untersuchen. Um hier nun in analoger Weise ans Werk gehen zu können, führte man eine der Geometrie entlehnte Terminologie ein. Ein Tupel von vier oder mehr Zahlen nennt man einen ,Punkt eines vier- oder mehrdimensionalen Raumes', eine Relation zwischen vier oder mehr Veränderlichen nennt man eine Figur usw. Die Mengen aller solcher Punkte nennt man .Räume', und solch ein Raum besitzt eine bestimmte'Struktur, die durch Axiome, die mehr oder weniger denen der Geometrie ähneln, beschrieben wird. Ja, heute werden sogar Räume von unendlicher Dimension betrachtet, und die Untersuchung dieser Räume ist für viele Fragestellungen von großer Bedeutung. 2 Knipers-Tlmman, Mathematik
18
I. Aus der Geschichte dei Mathematik
Durch das Werk Dedekinds, Cantora und anderer scheinen die letzten Nebel über dem Reich der Mathematik verflogen zu sein; täglich wurden neue, fruchtbare Provinzen entdeckt und dem Reich hinzugefügt. Aber immer noch verbergen sich Fußangeln im Gras! Gerade durch die Untersuchungen der unendlichen Mengen entstanden heikle Fragen, über deren Beantwortung die Meinungen der Mathematiker weit auseinandergingen. Wir können auf diese Dinge hier nicht eingehen; einige Bemerkungen mögen genügen. Hierzu kehren wir noch einmal zurück zur Theorie der irrationalen Zahlen. a und b seien irrational, durch zwei ,Schnitte' definiert. Wann soll a kleiner als b sein ? Natürlich dann, wenn es eine rationale Zahl gibt, die zur ,Oberklasse' von a, aber zur .Unterklasse' von b gehört. Um solch eine Zahl zu finden, liegt es nahe, a und b als unendlichen Dezimalbruch zu schreiben. Es kann sein, daß die ersten Dezimalen dieser Entwicklungen übereinstimmen, wenn aber nicht a = b ist, muß schließlich in der Entwicklung von a eine Ziffer auftreten, die von der entsprechenden Ziffer in der Entwicklung von b verschieden ist. Je nachdem ob nun diese erstmals auftretende Ziffer bei a kleiner oder größer als die bei b ist, ist a selbst kleiner oder größer als b. Wir wollen nun annehmen, daß a und b unabhängig voneinander definiert sind, z. B. als Summe gewisser unendlicher Reihen oder als Wert gewisser bestimmter Integrale. Weiter wollen wir annehmen, daß wir sowohl von a als auch von b soviele Dezimalstellen berechnet haben, wie es uns möglich ist, und daß sie alle übereinstimmen. Folgt daraus nun a = δ ? Sicher nicht. Soviel Dezimalen wir auch berechnet haben mögen, immer besteht die Möglichkeit, daß bei einer weiteren Rechnving eine abweichende Ziffer auftritt. Um hierüber Aufschluß zu gewinnen, ist ein Beweis nötig, der die Gleichheit oder Ungleichheit von a und b ergibt. Es gibt aber keine allgemeinen Regeln, um solch einen Beweis zu finden; hier kommt unser Erfindergeist zum Zuge. Wollen wir mm darauf vertrauen, daß dieser Erfindergeist uns immer in den Stand setzt, für jedes Problem eine Lösung zu finden? Aus bestimmten Gründen wird dies gegenwärtig von vielen bezweifelt. Solche Fragen sind heute nicht mehr ausschließlich von philosophischer Bedeutimg. Wie man weiß, werden heutzutage umfangreiche Berechnungen mehr und mehr von Bechenmaschinen durchgeführt. Dazu ist es aber notwendig, solch eine Rechnung in ihre einfachsten Bestandteile aufzuspalten, die dann mechanisch nacheinander ausgeführt werden. Je komplizierter nun solch eine Rechnung, ist, die man einer Maschine überlassen will, desto sorgfältiger muß man die mechanischen Elemente unseres Denkens von den nichtmechanischen trennen und desto klarer müssen uns die nicht-mechanischen Elemente ins Bewußtsein treten. Mit dieser Bemerkung wollen wir unsere Betrachtungen abschließen.
II. Zahlensysteme Dr. F. Loonstra
1. Die natürlichen Zahlen Die Menge Ν der natürlichen'Zahlen 1, 2, 3,. . . besitzt die folgenden Eigenschaften. I o . Ν ist eine unendliche, total geordnete Menge, d. h. es besteht eine Ordnungsrelation a S b, die («) reflexiv ist — folglich gilt a ^ a für alle a — die (ß) transitiv ist — aus a ^ b und b ^ e folgt somit α ¿ c — die (γ) antisymmetrisch ist — d. h. aus a ¿ b und b ^ a folgt a — b — und diese Ordnung heißt (δ) total, weil für je zwei natürliche Zahlen α und b mindestens eine der Beziehungen a b oder 6 ^ a gilt. 2°. Jede Menge von natürlichen Zahlen hat ein kleinstes Element. 3°. Jede Menge von natürlichen Zahlen, die ein größtes Element hat, ist endlich. Aus 2° folgt, daß somit auch die Menge Ν aller natürlichen Zahlen ein kleinstes Element hat; entfernt man dieses kleinste Element — die 1 — so hat die verbleibende Menge wieder ein kleinstes Element — nämlich die 2 — usw. Ist a eine natürliche Zahl, so hat die Menge der natürlichen Zahlen, die größer als a sind, wieder ein kleinstes Element, das wir den Nachfolger a+ von α nennen wollen. Umgekehrt: ist a eine natürliche Zahl, so ist nach 3° die Menge der natürlichen Zahlen η ^ a endlich oder leer; läßt man a weg, dann ist auch die verbleibende Menge endlich oder leer; ist sie endlich, dann hat sie ein größtes Element b, und es gilt b+ = a. Ist sie leer, dann war α die kleinste natürliche Zahl 1. Die Zahl b mit b+ = a nennt man den Vorgänger von a. Eine wichtige Beweismethode ist in der Mathematik die vollständige Induktion. Nehmen wir an, wir wollten die Gültigkeit einer Aussage An, die für jede natürliche Zahl definiert ist, beweisen. Gilt die Aussage für η = 1 und folgt aus der Richtigkeit für η die Richtigkeit für η + 1, dann ist die Aussage An für jedes natürliche η gültig. Denn angenommen, sie gelte nicht für alle n, dann gibt es nach 2° eine kleinste natürliche Zahl m, für die sie nicht richtig ist. m kann aber nicht 1 sein, denn A1 ist gültig; wenn aber Am_1 gilt, dann muß auch Am gelten, und wir haben einen Widerspruch zur Annahme. An gilt somit für alle natürlichen Zahlen. 2*
20
Π. Zahlensysteme
Addition. Per definitionem setzen wir fest α + 1 = α+, α + δ + = (α + 6)+,
(1;1)
und wir nennen die Operation, die auf Grund von (1; 1) jedem Paar natürlicher Zahlen a und b eine weitere natürliche Zahl a + 6 zuordnet, Addition; a + b heißt Summe von a und b. Man kann nun folgende Bechenregeln beweisen: (») a + b = b + α (kommutatives Gesetz) ; (β) a + {b + c) = (a + 6) + c (assoziatives Gesetz) ; (γ) aus a + χ = a + y folgt χ = y. Multiplikation. Per definitionem sei α· \ — a, a-b+
= a-b
a
(1 ; 2)
und wir nennen die Operation, die auf Grund von (1 ; 2) jedem Paar natürlicher Zahlen a und b eine weitere natürliche Zahl a · b zuordnet, Multiplikation. α - b (manchmal auch αχ b oder ab geschrieben) heißt Produkt von α und b. Man kann beweisen, daß («') (β') (γ') (ô')
a · b = b · a (kommutatives Gesetz) ; a · (b · c) — (a · b) · c (assoziatives Gesetz) ; aus α · χ = a· y folgt x — y\ α·(δ + ο) = α · 6 + α·ο (distributives Gesetz).
2. Die ganzen Zahlen In der Menge Ν der natürlichen Zahlen sind die beiden eingeführten Operationen nicht umkehrbar, d. h. die Gleichungen α + χ = 6 und α · χ = b sind in der Menge der natürlichen Zahlen nicht immer lösbar. Wir gehen nun zuerst an die Aufgabe, mit Hilfe der natürlichen Zahlen eine neue Menge G (der ganzen Zahlen) zu konstruieren, in der die Gleichung a + x = b stets eine Lösung haben wird. Dazu definieren wir eine ganze Zahl als ein Paar (a, b) von natürlichen Zahlen, wobei 1. (α, 6) = (c, d) genau dann, wenn a + d = 6 + c; 2. (a, b) + (c, d) = (a + c,b + d);
3. (a, b) · (c, d) = (ac + bd, ad + bc);
4. (a, b) positiv heißt, wenn es eine natürliche Zahl c gibt mit b + c =
a.
Ans diesen Definitionen folgt, daß die ganze Zahl (α, α) für jedes Paar (6, c) die Gleichung
(α, α) + (6, c) = (a + b, a + c) = (6, c) erfüllt; wir setzen daher alle Paare (α, α) gleich 0 (Null). Ferner gilt (α + 1, a) · (b, c) = (b, e) für alle (6, c); wir identifizieren daher alle Paare (α + 1, a) mit der natürlichen Zahl 1.
3. Die rationalen Zahlen
21
Man kann jedes Paar (α, 6) in einer der Formen (α, α), (α + e, a), (a, a + e) schreiben. Alle Paare (α, a) werden mit 0 identifiziert; alle Zahlen (α + e, α) sind bei festem o gleich (per definitionem). Wir identifizieren sie daher mit der natürlichen Zahl c und nennen sie positive ganze Zahlen. Die Zahlen (α, α + c) sind bei festem e auch untereinander gleich. Wir schreiben sie als ,— c' (minus c) und nennen sie negative ganze Zahlen. Auf diese Weise erhält man die Menge der ganzen Zahlen, und jede ganze Zahl kann in der Form 0, c oder — c geschrieben werden, wobei c eine natürliche Zahl ist. Man kann nun alle wichtigen Eigenschaften der ganzen Zahlen beweisen, ζ. B. unseren Ausgangspunkt, daß die Gleichung a + % = b für alle ganzen Zahlen a und b genau eine Lösung hat. Definiert man für die ganzen Zahlen (a, b) ίΞ (c, d) genau dann, wenn a + d ^ 6 + c, dann erkennt man, daß die positiven ganzen Zahlen alle Eigenschaften der natürlichen Zahlen aufweisen, was Addition, Multiplikation und Ordnungsrelation angeht. Wir identifizieren daher positive ganze und natürliche Zahlen miteinander. Das System G der ganzen Zahlen ist somit eine Erweiterung der Menge Ν der natürlichen Zahlen. 3. Die rationalen Zahlen In der Menge C der ganzen Zahlen ist die Multiplikation nicht umkehrbar, d. h. die Gleichung ax = b (in der a und b ganze Zahlen sind) hat im allgemeinen keine ganzzahlige Lösung. Man sagt auch: die Division ist nicht immer möglich. Auf ähnliche Weise wie im vorangehenden Abschnitt werden wir nun die Menge C der ganzen Zahlen erweitern zur Menge B0 der rationalen Zahlen, die also C umfaßt und in der neben der Addition auch die Multiplikation umkehrbar ist. Man geht dazu von Paaren ganzer Zahlen (a, b) aus, in denen 6 ^ 0 ist, und definiert (α, b) = (a't b') genau dann, wenn ab' = a'b. Ein solches Paar nennt man einen Bruch a oder eine rationale Zahl, und an Stelle von (α, b) schreibt man lieber -y (,a geteilt durch &') und nennt a den Zähler und b den Nenner des Bruches. Das Produkt zweier rationaler Zahlen wird definiert durch a c _ ae T"d~Td und man zeigt leicht, daB aus
y r folgt
Die Summe zweier rationaler Zahlen wird definiert durch α c _ ad + be T + ~d~ bd (auch diese Summendefinition ist unabhängig von der Darstellung der Brüche).
22
II. Zahlensysteme
Ordnet man nun einer ganzen Zahl α diejenige rationale Zahl zu, die duroh alle Ausdrücke ab der Art - y (6 Φ 0 und 6 ganz) dargestellt wird, so erhält man eine eindeutige Abbildung der Menge der ganzen Zahlen auf eine gewisse Teilmenge der Menge der rationalen Zahlen, derart daß Summe und Produkt je zweier ganzer Zahlen α und a' abgebildet werden auf
ab
Summe und Produkt der Bilder
a'b
und — . Darum identifizieren wir die jeweils durch
die Ausdrücke ab dargestellte rationale Zahl mit der ganzen Zahl a. Wir haben somit die ganzen Zahlen in die Menge der rationalen Zahlen eingebettet. Wir wollen jetzt in der Menge der rationalen Zahlen eine Ordnung definieren. Dazu wollen wir die rationalen Zahlen mit positivem Nenner schreiben. Seien also Zahlen mit 6 > 0 und d > 0, dann ist
o
und -χ zwei rationale
a
-ir á - r genau dann, wenn ad 5Í be.
ο
α
Die Menge R0 ist damit eine total geordnete Zahlenmenge, in der Addition und Multiplikation dieselben Eigenschaften haben wie in der Menge der ganzen Zahlen und in der die Gleichung txx = β für rationale Zahlen α und β (α Φ 0) stets eine Lösung hat. Absolutbeträge. Sei α eine rationale Zahl; unter dem Absolutbetrag von α verstehen wir wenn e ^ O \a\ ={ a' Wei l — a, wenn a < 0. Man erhält demnach | a \ = | — α |. Die Absolutbeträge haben die folgenden Eigenschaften: 1. I a I Sì 0, mid | a | = 0 ist gleichbedeutend mit a = 0; 2. I o6 I = I α I · I 6 I; 3. \a + b\ ^ | β | + I 6 I; 4. I« —61 è Hal —1611. 4. Die reellen Zahlen Ausgehend von der Menge Ν der natürlichen Zahlen haben wir zunächst durch Erweiterung die Menge G der ganzen Zahlen gewonnen. Letztere haben wir dann erweitert zur Menge R0 der rationalen Zahlen. In C ist die Subtraktion immer möglich — was in Ν nicht der Fall war — aber in C ist die Division nicht stets durchführbar. Durch die Konstruktion von jß0 erhielten wir eine Menge, in der Addition und Multiplikation stets umkehrbar sind. Wir wollen nun R0 zu einer noch umfassenderen Menge R erweitern. Um die Eigenschaften, die R im Gegensatz zu R0 besitzt, beschreiben zu können, müssen wir den Begriff ,Folge rationaler Zahlen' einführen. Der unten be-
4. Die reellen Zahlen
23
schriebenen Erweiterung der Menge der rationalen Zahlen liegt folgender Gedankengang zugrunde : wir wollen die reellen Zahlen einführen als gewisse rationale Zahlenfolgen. Folgen rationaler Zahlen, die gegen rationale Zahlen konvergieren. Eine Folge (r„) r
l> r2> r3> · • ·> rn> · · ·
von rationalen Zahlen ist eine Funktion, die definiert ist auf der Menge der natürlichen Zahlen und deren Werte r(n) oder rfl rationale Zahlen sind. Weiter definieren wir: Eine Folge (r„) rationaler Zahlen konvergiert gegen 0, lim r„ = 0,
η->oo
wenn es zu jeder rationalen Zahl ε > 0 eine natürliche Zahl Ν = Ν (ε) gibt, so daß für η ¡a Ν gilt: | r„ | < e. Fine Folge (r„) rationaler Zahlen konvergiert gegen die rationale Zahl r, oder lim r„ = r »->•00 wenn Um (r„ — r ) = 0. »-»•00 In diesem Fall nennt man r den Grenzwert oder Limes der Folge (rfl); man schreibt auch häufig: rn-*-r. Eine Folge, die gegen 0 konvergiert, heißt Nullfolge. Eine Folge (rn), die nicht konvergiert, heißt divergent. Man beachte, daß wir die Existenz eines rationalen Grenzwerte fordern; unter Konvergenz verstehen wir also im Augenblick nur Konvergenz in der Menge der rationalen Zahlen. Man sieht ohne weiteres, daß aus lim r„ = r folgt lim | r„ | = | r |.
η->·οο
η ->oo
Ferner: Wenn eine Folge konvergiert, dann ist ihr Grenzwert eindeutig bestimmt1. Die Menge R0 der rationalen Zahlen nennen wir die rationale Zahlengerade·, eine rationale Zahl nennt man daher oft einen Punkt der Zahlengeraden. Unter einem offenen Intervall (a, b) der rationalen Zahlengeraden wollen wir die Menge der rationalen Zahlen χ mit α < χ < b (α < δ !) verstehen, unter einem abgeschlossenen Interwdl [α, 6] die Menge der rationalen Zahlen χ mit α ^ χ ^ b. Wir können dann die Konvergenz einer Folge noch anders definieren: Die Folge (r») konvergiert gegen r, wenn jedes offene Intervall (r — ε, r + ε) fast aüe Glieder der Folge enthält, d. h. wenn es eine natürliche Zahl Ν = Ν (ε) gibt, so daß | r„ — r | < ε für η ^ Ν. 1
Weitere Eigenschaften konvergenter Folgen werden auf S. 203 ff. behandelt.
Π. Zahlensysteme
24
Cauchy-Folgen. Wenn eine Folge (r») gegen die rationale Zahl r konvergiert, dann gibt es zu jedem ε > 0 eine natürliche Zahl Ν = Ν (ε), so daß \rm
r
n I < e>
(4; 1)
falls m, η ^ Ν (ε). Die Umkehrung gilt aber nicht! Eine Folge (rB) kann die Bedingung (4; 1) erfüllen, ohne daß sie zu konvergieren braucht. Eine F(Âge (rB) rationaler Zahlen heißt Cauchy-Folge, wenn es zu jedem, ε > 0 eine natürliche Zahl Ν = Ν (ε) gibt, so daß I rm — rn I < ε, wenn m, η
Ν.
Die Menge aller Cauchy-Folgen umfaßt also die Menge aller (in R0) konvergenten Folgen. Wir wollen im folgenden Cauchy-Folgen mit einem einzigen Buchstaben bezeichnen: ·
Mit η, klk2 haben wir die Entwicklung von a bis auf zwei Dezimalstellen. Wir wiederholen den Prozeß und finden nach r Schritten ~ ,ι ki1 ι k*»2. . . . ' 10 10 '
1
kr ^ α a auch eine obere Schranke. So hat z. B. die Menge F aller positiven reellen Zahlen keine obere Schranke, während 0 untere Schranke ist (man beachte, daß 0 $ F). Cauchy-Folgen dagegen sind wichtige Beispiele für beschränkte Mengen. SATZ 4. 2. Die Glieder einer Gauchy-Folge (an) reeller Zahlen bilden eine beschränkte Menge. BEWEIS. Zu jedem ε > 0 gibt es einen Index Ν = Ν {ε), so daß \a p —a q \ < ε , falls ρ > Ν, q > Ν. Ist also n0 > N, dann gilt also | αη< — ap | < ε für alle p>N, so daß also \ a p ] = I ®», I +
ε
' xt V bedeutet: die Zahl χ 1st Element von V; χ $ V bedeutet: χ let nicht Element von F.
3)
δ. Die komplexen Zahlen
29
for fast alle natürlichen Zahlen ρ gilt (d. h. für alle bis auf endlich viele Ausnahmen). Ist nun e der größte der absoluten Beträge derjenigen ap, für die (4; 3) nicht gilt, und a = max (c, | αη# | + ε), dann gilt \ap\ ί= a für alle natürlichen Zahlen p. SATZ 4. 3. Die Menge der oberen Schranken einer nach eben beschränkten Menge V hat ein kleinstes Element. Man nennt es die obere Grenze von F und schreibt sup F. BEWEIS. Ist F endlich, dann ist die Behauptung klar. Gibt es in F ein Element, das gleichzeitig obere Schranke aller Zahlen aus F ist, dann ist dieses die obere Grenze, a sei nun eine obere Schranke von F und gehöre selbst nicht zu F; χ sei ein Element aus F. χ soll keine obere Schranke sein, und wir setzen fest ax = £ (a; + α). Wenn a1 ί F und wenn a1 obere Schranke von F ist, dann ist der Satz wiederum bewiesen. Wenn nicht beides zugleich erfüllt ist, dann gibt es sicher Elemente von F in einem der beiden Intervalle (x, «j], [α χ ,α). Wir betrachten das am weitesten rechts gelegene der beiden Intervalle, das Elemente von F enthält, wählen daraus ein Element y € F und wiederholen den beschriebenen Prozeß ausgehend von y und ax bzw. y und a, usw. Auf diese Weise erhalten wir entweder nach endlich vielen Schritten ein Element an € F, das obere Schranke und damit obere Grenze ist, oder wir konstruieren eine Cauchy-Folge (an), die gegen eine reelle Zahl b konvergiert. Es ist unmittelbar einsichtig, daß für kein ζ € F ζ > b gelten kann, ebensowenig kann es eine obere Schranke b' < b geben. Also ist b die kleinste obere Schranke von F. SATZ 4. 4. Die Menge der unteren Schranken einer nach unten beschränkten Menge F hat ein größtes Element. Es ist die untere Grenze von F, und man schreibt inf F. Beispiel. Die Folge (an), » = 1, 2, 3 , . . . mit a n = (— 1)B[1 — (-j)"] ist beschränkt und sup • a n = 1, inf » a n = — 1. 5. Die komplexen Zahlen Definitionen und Bechenregeln. Die Gleichung χ* + 1 = 0 besitzt keine reellen Lösungen, da ja für jede reelle Zahl a gilt α 2 ^ 0, so daß die Bedingung χ 2 = —1 durch keine reelle Zahl erfüllt werden kann. Wir werden nun die Menge der reellen Zahlen erweitern zur sogenannten Menge der komplexen Zahlen, in der man das Polynom χ 2 + 1 zerlegen kann in ein Produkt zweier Linearfaktoren mit komplexen Koeffizienten.
Π. Zahlensysteme
30
DEFINITION. Unter einer komplexen Zahl ζ verstehen wir ein Paar (a, b) redler Zahlen a und b, wobei (α, b) = (a', b') genau dann gilt, wenn a — a' und b = b'; Addition und Multiplikation werden durch folgende Gleichungen definiert z + z' = (a, b) + (a', b') = (a + a',b + b'), ζ · ζ' = (a, b) · (a', b') = (aa' — bb', ab' +
a'b).
Addition und Multiplikation erfüllen das kommutative, das assoziative und das distributive Gesetz. Nullelement ist die komplexe Zahl 0 = (0,0). Setzen wir (1,0) = 1, dann sieht man, daß 1 · ζ = (1,0) (a, b) — (a,b) = ζ · \ = ζ. Die Division ist durchführbar: aus (a, b) · (x, y) — (c, d) mit (a, b) Φ 0 folgt y
'
=
(c, d) "(MÖ
=
(ac + bd ad — be\ \ α2 + δ2 ' a2 + b2 )'
Identifizieren wir die komplexe Zahl (a, 0) mit der reellen Zahl a, dann entspricht der Summe von a und b die komplexe Zahl (a, 0) + (b, 0) = (o + b, 0) und dem Produkt α · 6 die komplexe Zahl (α, 0) · (6,0) = (ab, 0). Die Menge A der komplexen Zählen enthält also die Menge der reellen Zahlen als Teilmenge, die bzgl. der vier Grundrechenarten abgeschlossen ist. Wir können schreiben: z = (a, b)=(a, z
= (a, b)=
0) + (0, 6), (a, 0) + (6, 0) · ( 0 , 1 ) ,
also nach der obigen Verabredung ζ = (α, 6) = α + b · (0,1); man nennt a den Realteil von (a, b) und b. (0,1) den reinen Imaginärteil (α, b). Kürzen wir die komplexe Zahl (0,1) mit i ab, dann ist 2 = (a, b) = a +
von
bi.
Auf Grund der Definition gilt nun i2 = (0,1) · (0,1) = (—1,0) = — 1 . Jede komplexe Zahl kann also in der Form ζ = a + 6 i geschrieben werden, wobei a und b reelle Zahlen sind und i2 — —1 gilt. Damit erhalten wir (a + bi) + (c + di) = (a + c) + (b + d) i (a + bi) · (c + di) — (ac — bd) + (ad + bc) i a + bi
ac 4- bd
+
, bc — ad.
w e n n
c +
, ,. d
^
,
0
Λ
·
Unter der konjugiert komplexen Zahl ζ von ζ = a + 6 i verstehen wir die komplexe Zahl z = a — bi.
31
5. Die komplexen Zahlen
Absolutbetrag. Unter dem Absolutbetrag (auch Modul oder einfach Betrag genannt) I ζ I der komplexen Zahl ζ — a -\-bi versteht man \ ζ + b . Man hat also | ζ | 0, und | ζ | = 0 dann und nur dann, wenn ζ = 0. Für die Absolutbeträge gelten folgende Regeln: 1. I z1 z2 I = I z1 I · I z2 I; 2. I Zj + z21 = I ζ ι I + I 2z I ! 3- II z i I — I II = I 2 i + z21; 4. ζ • £ = I ζ I2. Die lcom/plexe Ebene. Man kann die komplexen Zahlen eineindeutig den Punkten einer Ebene zuordnen. Man bildet nämlich die komplexe Zahl a + bi auf den Punkt Ρ mit den Koordinaten (a, b) in einem rechtwinkligen Koordinatensystem ab (Fig. 1). Dem Absolutbetrag | ζ | entspricht dann der Abstand r des Punktes Ρ vom Ursprung. Schreibt man für ζ Φ 0 ζ = α +Ι Αοι" = r \r
dann ist
b
·\ r 1),
7 + f man kann also einen Winkel φ bestimmen, so daß a . b cos φ = —, sin φ = — τ r r
(ö; 1)
und man nennt φ das Argument von z, kurz arg (z). Wenn φ gemäß (5; 1) der Ungleichung — π < φ ^ π, genügt, dann nennt man diesen Wert von φ den Hauptwert des Argumentes von ζ, wenn ζ — r (cos φ + i sin φ). »Z,+Z2
Fig. 1
Kg. 2
32
Π. Zahlensysteme
Die Ebene, die auf diese Weise als Bildmenge der komplexen Zahlen aufgefaßt wird, heißt komplexe (ZaMen-)Ebene. Den Bildpunkt der Summe z1 + z2 zweier komplexer Zahlen z1 und z2 findet man als vierten Eckpunkt eines Parallelogramms, in dem Oz1 und Oz2 zwei aufeinanderfolgende Seiten sind (vgl. Fig. 2). Da der Bildpunkt von —z 1 spiegelbildlich zum Bildpunkt von z1 bzgl. des Ursprungs liegt, kann man analog die Bildpunkte der komplexen Zahlen z1 — z2 und z2 — z1 finden. Man erkennt auch unmittelbar folgende wichtige Eigenschaft: | z1 —z 2 | wird in der komplexen Ebene dargestellt als Abstand der Bildpunkte von z1 und z 2 . Argument des Produktes und des Quotienten. Da ja ζ = a + bi = r (cos φ + * sin φ), ζ' = a' + b'i = r' (cos φ' + i sin φ') die Darstellungen zweier komplexer Zahlen sind, gilt zz' = rr' (cos (φ + φ') + i sin (φ + φ')), so daß das Argument des Produktes zweier komplexer Zahlen gleich der Summe der Argumente der beiden Faktoren ist: arg (zz') = arg (z) + arg (z'); (man beachte, daß die Summe der beiden Argumente aber nicht immer gleich dem Hauptwert des Argumentes des Produktes ist!). Wir erhalten jetzt auch sofort arg
= arg (z) — arg (z').
SATZ 5. 1. ( Satz von De Moivre). ζ sei eine komplexe Zahl vom Betrag 1, dann gilt für jedes natürliche n: zn = (cos φ + t sin 0; dann nennt man die Menge M linear abhängig, wenn es Elemente C j , . . . , cr aus R gibt, die nicht alle gleich Null sind, so daß c ^ + Cj^H
b c r a r = 0.
(2; 1)
Die nicht-leere Menge M heißt linear unabhängig, wenn aus (2; 1) folgt, daß Cj = c2 = · · · = cr = 0. Ist M linear unabhängig, dann ist auch jede Teil-
2. Lineare Abhängigkeit, Dimension, Basis
37
menge von M linear unabhängig. Sei nun M eine nicht-leere (endliche oder unendliche) Menge von Vektoren eines Vektorraumes. Ein Vektor α heißt dann linear abhängig von der Menge M, wenn es in M endlich viele Vektoren « j , . .., a r gibt und ein r-Tupel von Zahlen (die nicht alle verschwinden) aus B, so daß « = «j«^ + · · · + Wir sagen dann: a ist eine Linearkombination der ax,..., ar. Ist M überdies ein linear unabhängiges System von Vektoren, dann ist die Schreibweise von a als Linearkombination der etj,. .., ar sogar eindeutig bestimmt. Ist ferner M eine linear unabhängige Menge von Vektoren und ist der Vektor a linear unabhängig von M, dann ist auch die Menge M', die als Elemente die Vektoren aus M und den Vektor « hat, linear unabhängig. Ist M = {ÖJ, . .., « r } eine linear unabhängige Menge von Vektoren und Ν = {/îj, . . ., ßs} eine endliche Menge, derart daß M linear von Ν abhängt (d. h. jeder Vektor aus M ist linear abhängig von N), dann ist r ^ s; den Beweis führt man durch Induktion. Hieraus folgt ein wichtiger Satz über lineare Gleichungen: ein System homogener linearer Gleichungen hat stets dann eine nicht-triviale Lösung, wenn die Anzahl der Unbekannten größer ist als die Anzahl der Gleichungen. Besteht ein Vektorraum V nur aus dem Nullvektor, dann sagen wir : V hat die Dimension Null, dim V = 0. V bestehe nun nicht nur aus dem Nullvektor; enthält V eine linear unabhängige Menge von η Vektoren, während jede Menge, die mehr als η Vektoren enthält, linear abhängig ist, dann sagt man: V hat die Dimension n, oder dim V = η. Ist die Anzahl linear unabhängiger Vektoren in V unbeschränkt, dann sagt man, daß V die Dimension unendlich hat. Man nennt eine Vektormenge M Basis des Vektorraumes V, wenn I o . M linear unabhängig ist und 2°. V linear von M abhängt. So ist die Menge M, bestehend aus den Vektoren (1, 0, 0), (0,1, 0) und (0,0, 1) eine Basis von F 3 (i2), da aus ®i(l> 0, 0) + α 2 (0,1,0) + a 3 (0,0, 1) = (alt a2, a3)
(2; 2)
folgt, daß die rechte Seite nur dann Null sein kann, wenn % = a2 = a3 = 0 , während jeder Vektor (a1,a2, aa) aus F 3 (.B) sich in der Form (2; 2) schreiben lassen kann. Der Vektorraum Vn(B) hat die Dimension n. Hat ein Vektorraum die endliche Dimension n, dann ist jedes linear unabhängige System von η Vektoren eine Basis, und umgekehrt muß jede Basis aus η Vektoren bestehen. Ist ferner M = { a 1 , . . a f } ein linear unabhängiges System von Vektoren aus V und r < η, dann gibt es Vektoren ar+1,..., an, so ist die Menge M' = {alt. . ., ar, ar+1,..., an} eine Basis von V ist.
IH. Lineare Álgebra
38 3. Teilräume oder Untervektorräume
V sei ein Vektorraum ; dann nennt man eine Teilmenge W von V, die Vj—V 8 erfüllt, Untervektorraum oder Teilraum von V. So ist die Menge aller Vektoren (a1, a2,..oH_1, 0) ein Untervektorraum von F n ( i ? ) . Ebenso ist die Menge aller Lösungen eines Systems linearer homogener Gleichungen in η Unbekannten mit komplexen Koeffizienten ein Untervektorraum von Vn(A). Die Menge, die nur aus dem Nullvektor besteht, heißt Nullraum. Offensichtlich braucht man bei der Untersuchung eines Teilraums nicht die Gültigkeit aller acht Vektorraumaxiome nachzuprüfen; es gilt: eine nicht-leere Teilmenge W des Vektorraumes V ist ein Untervektorraum, wenn mit α und β aus W auch α β und c · a (für alle reellen c) zu W gehören. Ist M eine Teilmenge des Vektorraumes V, dann ist die Menge W aller Vektoren, die linear von M abhängen, ein Untervektorraum von V. Man sagt, daß W durch M aufgespannt oder auch erzeugt wird und schreibt W = \M~\. Ist W ein Untervektorraum eines w-dimensionalen Vektorraumes V, dann gilt W — V dann u n d n u r dann, wenn dim W = dim V. Ist dim W = r, dann gibt es zu jeder Basis von W eine Basis von V, deren erste r Vektoren mit der Basis von W übereinstimmen. Daraus folgt r ^ n . V sei ein Vektorraum und Wlt W2 Untervektorräume von V. Unter der Summe W1 + W2 von W1 und W2 verstehen wir den Untervektorraum aller Summen α + β mit « € Wlt β € W2; unter dem Durchschnitt Wt r\ W2 von W1 und W2 verstehen wir die Menge aller Vektoren, die sowohl zu W1 als auch zu W2 gehören (der Durchschnitt enthält sicher den Nullvektor und ist somit nicht leer). Dann gilt stets: dim ( W 1
W2) + dim [W1 + W2) = dim W1 + dim W2,
d. h. die Summe der Dimensionen zweier Vektorräume ist gleich der Summe der Dimensionen von Durchschnitt und Summe der Vektorräume. Ist V der Vektorraum V3 (R) über der Menge der reellen Zahlen, dann hat V Teilräume der Dimension 0 , 1 , 2 und 3. Wir weisen hier schon darauf hin, daß eine Ebene W durch den Ursprung dargestellt werden kann als Menge der Vektoren α = (at,a2, a3), deren Komponenten eine einzige lineare homogene Gleichung c1x1 + c2x2 + c3x,ö = 0 erfüllen. Eine Gerade l durch den Ursprung wird durch die Gleichungen zweier Ebenen gegeben, deren Durchschnitt gerade die Gerade Ζ ist; Ζ ist also die Menge der Vektoren, deren Komponenten beiden Gleichungen genügen. Eine solche Ebene W ist andererseits auch bestimmt durch zwei Vektoren, die eine Basis des Teilraums bilden. Ist W allgemein ein Teilraum von Vn(R), dann h a t W eine endliche Dimension und somit eine endliche Basis, die W aufspannt: ein Teilraum von Vn{R) ist also die Menge aller Vektoren, die linear abhängig sind von einer gewissen endlichen Anzahl von Vektoren.
4. Das Skalarprodukt
39
4. Das Skalarprodukt Für die Vektoren des F 3 (R) gibt es ein Produkt, daß wir auch allgemein für Vektoren aus F„(Ä) definieren können, nämlich das Skalarprodukt (auch inneres Produkt genannt). Seien α — ( α χ , . . . , α η ), β = (blt..., bn) zwei Vektoren aus F n (Ä), dann verstehen wir unter dem Skalarprodukt α ο β von a und β α οβ = a^ + a2b.¿ + · · · + a„b„, d. h. das Skalarprodukt a ο β zweier Vektoren aus F B (i?) ist eine reelle Zahl. Wenn α ο β — 0, dann sagen wir, daß a und β orthogonale Vektoren sind. Unter dem Betrag (oder der Länge) eines Vektors a = (alt.. ., an) aus V„(R) verstehen wir die nicht-negative Zahl II « II =
γ(α* + αΙ +
···+α*η).
Auf Grund der Definitionen gelten für Skalarprodukt und Betrag die folgenden Eigenschaften: (1) α ο β ^ 0 für alle a € Vn(R), wenn a = 0; (2) aoß = ßoct;ao(kß)
während α o a = 0 dann und nur dann,
= k(a ο β ), k € Β; α ° (β + γ) = α ο β + α o γ;
(3) \\α + β\\ ^ II α H + 11 011; || ka || = | k \ · || α ||, k € Β; (4) Sind ß j , . . . , « η Vektoren, die paarweise zueinander orthogonal sind (aber ai # 0 ; i = 1, 2 , . . . , η) 2, dann sind die Vektoren linear unabhängig, denn aus ο 1 α 1 + · · · + ο η α„ = 0 folgt nach skalarer Multiplikation mit ai\ci(al o a() = 0, also muß ct — 0 sein, da ja a{ Φ 0 (» = 1 , . . . , n ) ; (5) Ist F ein r-dimensionaler Vektorraum und W ein Teilraum von F der Dimension r' < r, 'dann gibt es in F einen Vektor α ( Φ 0), der orthogonal ist zu W, d. h. « ο β = 0 für alle β € W; (6) I n einem Vektorraum F (der Dimension r > 0) gibt es r paarweise orthogonale Vektoren ( Φ 0). In F kann man daher eine Basis { « x , . . . , a r } finden, derart daß das System { « 1 ( . . . , a r } ein Orthogonalsystem ist. Die Vektoren ßlt..., ßr mit ß{ = «{/|| a ( || (i = 1 , . . . , r) bilden dann natürlich auch eine Basis, und obendrein gilt || ß{ || = 1 (i = 1 η), mit andern Worten: die Vektoren ß1 ßn sind Einheitsvektoren (nämlich vom Betrag 1). Eine solche Basis {ß1,..., ß„} nennen wir eine orthonormale Basis des Vektorraumes. Jeder reelle Vektorraum der Dimension r hat somit eine orthonormale Basis. Wir weisen noch einmal darauf hin, daß das Skalarprodukt für zwei Vektoren aus V„(R) definiert wurde; die beiden letzten Sätze gelten daher für Untervektorräume eines F n (Ä). 1
Ein solches System yon Vektoren nennen vir ein
OrthogonaisysUm.
40
ΠΙ. Lineare Algebra
5. Lineare Transformationen, Matrizen DEFINITION. F und W seien Vektorräume, dann verstehen wir unter einer linearen Transformation Τ von V in W eine Abbildung, die jedem Vektor a €V eindeutig einen Vektor β € W, den Bildvektor von a, zuordnet·. T-.a
β — α Τ,
während folgende Bedingungen erfüllt sind: (Lj) für alle alf a2€ V gilt (αχ + α 2 )Τ = α 1 Τ + a2T, (L2) Für alle c € Β und alle a € F gilt (ca)T = c(aT). Beide Forderungen zusammen sind der folgenden äquivalent: (L3) Für alle clt c2 Ç R und alle a1, « 2 Ç F gilt (c^
+ c2a2)T = c ^ T ) +
c2(a2T).
cr € Β und alle alt...,
ar € F gilt
Hieraus folgt: I o . Für alle c x , c2
Μχ + · · · + crar)T = c ^ T ) + · · · +
cr(arT).
2°. Sind die Vektoren « j a H linear abhängig, dann sind auch die Bilder a t T , . . . , a „ Τ linear abhängig. 3°. Die Menge aller Bildvektoren einer linearen Transformation von F in W bildet einen Untervektorraum V' von W, und es gilt stets dim V' S dim F. Matrix einer linearen Transformation. Sind Fund IF Vektorräume, { e ^ , . . a m } eine Basis von F, {ßlt..., ß„} eine Basis von TF, während Τ eine lineare Transformation von F in W ist, dann wird jeder Basisvektor «, vermöge Τ übergeführt in einen Vektor at Τ € W, so daß durch atT = e n f t + · · · + a{nßn (i = 1, 2 , . . . , m) zum Ausdruck gebracht wird, wie die Bildvektoren a i Τ von der Basis {jSx abhängen. Wir erhalten auf diese Weise m · η Konstanten atj € A, die wir im folgenden Schema A zusammenfassen: «11 «12 · ' · «Ii ' • · am «21 «22 · ' ' «2Í - '• · a2n a{1 ®ca wird somit durch eine skalare Matrix beschrieben. Für c = 1 erhalten wir die Matrix 0 0
0 0· - · 0 \ 1 Ο- • · 0 1 (» Zeilen) 0 Ι- • ·0
0 0
Ο·
und nennen sie Einheitsmatrix vom Grad n. Sei I die zu En gehörende Transformation, dann gilt al = a für jedes a e F; man nennt daher I die identische Abbildung, da I jeden Vektor et e F auf sich selbst abbildet. Beispiel 8. Sei F = V3(R) und W— V2(R), während Τ ·. a = (x, y, z) aT = (x, y). Eine solche lineare Transformation heißt eine Projektion. Wählen wir als Basis in F : csj = (1, 0, 0), a 2 = (0,1, 0) und a„ = (0, 0, 1) und in W : ß1 = (1, 0) und ß2 = (0,1), dann gehört zu Τ die Matrix
(:;)
Beispiel 4. Sei F = W= F 3 (Ä) und Τ : a = (x,y,z)-+aT = (χ — ζ, y, 0) und wählen wir «ι = ßi = (1, 0, 0), α2 = ßt = (0, 1, 0), «s = β, = (0, 0,1),
6. Verknüpfung linearer Transformationen
43
dann ist A =
' 1 0 0 0 1 0 —1 0 0
6. Verknüpfung linearer Transformationen F, W und X seien drei Vektorräume, während S eine lineare Transformation von F in W und Τ eine lineare Transformation von W in X darstellt, S-.a ->aS,a
tV,aStW-,
Τ:β
ßT, β ZW, βΤ ζ Χ.
Vermöge der Transformation S wird zunächst der Vektor a Ç. V auf β = a 8 abgebildet, und dann wird vermöge Τ β = a S in β Τ = (a S) Τ übergeführt: a -+aS -» (a S)T. Das Resultat der Hintereinanderschaltung der beiden linearen Transformationen 8 und Τ nennen wir das Produkt 8 Τ der linearen Transformationen 8 und T, also ST: oc -+a(ST) = (aS)T. 8 Τ ist wiederum eine lineare Transformation, denn (c1a1 + c2a2) ST = { e ^ f l ) + c 2 (« 2 Ä)} Τ = ( c ^ ) ST + (c2a2) ST. Ist S eine lineare Transformation von F in Wj^, Τ eine lineare Transformation von W2 in X, so ist das Produkt ST dann und nur dann definiert, wenn das Bild (d. h. das Bild von V vermöge S) ein Untervektorraum von W2 ist, auf den man also die Transformation Τ anwenden kann. Im Fall V = W = X ist das Produkt zweier linearer Transformationen S und Τ stets ausführbar und es ist dann wieder eine lineare Transformation von F in sich. Aus der Definition des Produktes von Transformationen folgt: sind 8, Τ und R drei lineare Transformationen, für die die Produkte ST und TR definiert sind, dann sind auch (ST) R und S (TR) wohldefiniert, und es gilt (ST) R = S (TR), d. h. für die Verknüpfung linearer Transformationen gilt das assoziative Gesetz. Sei nun S eine lineare Transformation von V in W und Τ eine lineare Transformation von W in V und sei das Produkt ST gerade die identische Abbildung J von F : « - > « / = « für jeden Vektor a € F, dann schreiben wir ST = I. Man nennt dann S Linksinverees von Τ und Τ Rechtsinverses von S. Hat die lineare Transformation S ein Linksinverses Τ und ein Rechtsinverses T', dann folgt aus (TS) Τ' = Τ (ST') die Gleichheit Τ = Τ'. Wir nennen die lineare Transformation S von F in W nichlsingulär, wenn es eine lineare Transformation Τ von W in F gibt, so daß ST = I = TS, und wir nennen in diesem Fall T Inverses von S und schreiben Τ = S-1. Dann bildet die lineare Transformation 8 V auf W ab, und außerdem ist die Zuordnung zwischen
44
III. Lineare Algebra
den Vektoren α ζ V und den Bildvektoren β ζ S eineindeutig, d. h. jeder Vektor β € W tritt genau einmal als Bild a 8 eines Vektors α ζ V auf. 7. Multiplikation von Matrizen V, W und X seien Vektorräume, 8 eine lineare Transformation von F in W, Τ eine lineare Transformation von W in X. Ferner seien Bm= {a j , . .., am}, Bn — {ß1,..., ßn} und Bp = { γ χ , . . . , γ ρ } jeweils eine Basis von F, W und X, und zur Transformation 8 gehöre die Matrix A, zu Τ die Matrix B. Betrachten wir nun die Matrix C = (c^), die zu R = ST bzgl. der gegebenen Basen von F und X gehört. Wegen = J » « . Α . ßiT = Σ \ μ Ί μ finden wir dann, wenn wir Τ auf a t 8 anwenden: α,Β^α,
(ST) = (a 4 Ä) Τ = ( J airß\ Τ = J alv(ßv T) v=l / »=i η ρ ρ = Σ aiv Σ Κμγμ = Σ ο{μγμ (i = 1, . .., m) ν = 1 μ™1 μ=1
mit Cij
—
Σ i-1
(i = 1 , . . . , m; / = ! , . . . , ρ).
Wir sagen daß die Matrix C = (ctj) mit c^ = das Produkt der Matrizen .4 - (α1?·) und 5 = (btj) ist, und wir schreiben G = AB. Auf Grund dieser Definition erhalten wir das folgende Resultat : die Matrix des Produktes zweier linearer Transformationen ist das Produkt ihrer Matrizen. Unsere Definition des Matrizenproduktes ist aber noch nicht vollständig, bevor wir erklärt haben, in welchen Fällen es überhaupt definiert sein soll. Matrizenprodukt. Das Produkt zweier Matrizen A = (ai}) und Β = (b{j) ist genau dann definiert, wenn die SpaltenzaM von A gleich der Zeilenzahl von Β ist ; das Produkt quadratischer Matrizen gleichen Grades ist somit immer definiert.
G =
AB
η ctj = Σ aikbkj (i = 1 , . . . , m; j = 1 , . . . , p). 4= 1
Die Gleichung ctj = anb1} + ai2b2j + · · · + atnbnj können wir folgendermaßen interpretieren: cy ist das (skalare) Produkt der i-ten Zeile von A und der 7-ten Spalte von Β (wenn wir nämlich die Reihen und Spalten als Vek-
45
8. Spalten- und Zeilenmatrizen
toren auffassen !). Aus dem assoziativen Gesetz der Verknüpfung von linearen Transformationen folgt dann das assoziative Gesetz für die Matrizenmultiplikation (falls sie ausführbar ist). Wenn AB = E für zwei Matrizen A und Β gilt, sagen wir, daß Β die Rechtsinverse zu A und A die Linksinverse zu Β ist. Eine quadratische Matrix heißt nicht-singulär, wenn es eine Matrix Β (die wir die Inverse A-1 von A nennen) gibt, so daß AB = BA = E. Eine Matrix, die keine Inverse hat, heißt singular; jede nicht-quadratische Matrix ist somit singular. Es gelten die folgenden Sätze: Wenn eine Matrix eine Linksinverse Β und eine Rechtsinverse B ' hat, dann sind diese beiden gleich, und A ist nicht-singulär. Eine quadratische Matrix ist nicht-singulär, wenn sie entweder eine Rechts- oder eine Linksinverse hat. Sind A und Β nicht-singuläre Matrizen vom Grad n, dann ist auch C = AB nicht-singulär, und es gilt C - 1 = B ^ A ' 1 . 8. Spalten- und Zeilenmatrizen Eine Matrix mit nur einer Zeile heißt Zeilenmatrix — geschrieben Β = (b() = (blt..bn); Β hat die Spaltenzahl n. Die Menge aller Vektoren β aus Vn(A) kann man also auf Grund der Abbildung T:ß=(b1,...,bn)->ßT
= B = (b1,..., bn)
eineindeutig auf die Menge aller (1, rc)-Matrizen Β mit b{ € A abbilden. Sind Β und C (1, «)-Matrizen und k € Α, dann gilt nach Definition der Matrizenoperationen Β + C = (6, +
Cl
, . . . , b„ + c„), kB = (kbly..., kbn).
Die Menge der (1, w)-Matrizen ist somit ein Vektorraum (von Zeilenvektoren), der als Basisvektoren êx = (1, 0,.. ., 0), ea = ( 0 , 1 , 0
0 ) , . . . , en = (0, 0 , . . ., 0 , 1 )
hat. Für jede (1, n)-Matrix Β gilt B = {bl,...,bn) = b1e1 +
---bnen.
Eine Spaltenmatrix Β ist eine (n, 1)-Matrix, d. h. eine Matrix, die nur eine Spalte hat
ΙΠ. Lineare Algebra
46
Auch hier bilden die (n, 1)-Matrizen einen Vektorraum (von Spatienmatrizen) mit einer Basis aus den (n, 1)-Matrizen 1 0
0 1 >
0
,..
0 0 1
0
V sei der Vektorraum der (m, 1)-Matrizen, W der Vektorraum der (re, 1)Matrizen, , . . a m } eine Basis von V, {ßlt..., ß„} eine Basis von W und Τ eine lineare Transformation von V in W, dargestellt durch die Matrix A = (a{¡), dann gilt atT = 2a{jß, i-1
(»'=
1,...,/»).
Das Bild Y = XT des Vektors Χ = x1a1 + · · · + xmam, dargestellt als Spaitenvektor
ί ν Λ
ist dann der Vektor Y = I · I mit yi — ¿Sf^i
x a
j ji
\ y j
(» = 1 , . . . , n). Wir fragen uns nun, ob sich die Matrix Y auch als Matrizenprodukt Y = KX einer Matrix Κ = {k{j) mit X schreibt. Das würde bedeuten Vi = hix\
Η
l·
kimxm (t = 1,. . r e ) .
Aus Vi = alixl
+
Η am\xm (» = 1, · . ·, n)
und dem Vorangegangenen folgt dann hü = aj( (i = 1,...,
w; j = 1,.. ., m),
so daß Y = XT =
KX.
Hieraus folgt, daß man die Matrix Κ aus der Matrix A = (ai}) erhält, indem man Spalten und Zeilen vertauscht, d. h. die i-te Zeile von A wird die i'-te Spalte von Κ und die ;-te Spalte von A wird die j-te Zeile von Κ. Man nennt Κ die transponierte Matrix Ar von Α, also Κ = A7, so daß (4 T ) T = A. Man kann sofort nachprüfen, daß für das Produkt zweier Matrizen A und Β (AB)T = BJAJ gilt und allgemein (A^ · · · Ak)J = Al-'-Á¡. Ist A nicht-singulär mit der Inversen B, dann ist auch AT nicht-singulär mit der Inversen BT, m. a. W. die Inverse der Transponierten ist die Transponierte der Inversen. Das Produkt eines Zeilenvektors a und eines Spaltenvektors β ist nach der Produktdefinition für Matrizen wohldefiniert, wenn a und β gleichviele Kom-
47
10. Determinanten
ponenten haben. Das Produkt ist in diesem Fall eine skalare Größe, und das Matrizenprodukt stimmt dann mit dem Skalarprodukt überein:
aß = (au at,..
= aib1 + α2δ2
.,an)
+ anbn.
Sind a und β als Spaltenvektoren gegeben, dann muß man, um das Matrizenprodukt ausführen zu können, a durch den Transponierten « T ersetzen (oder die Reihenfolge der Faktoren vertauschen und dann β durch ßT ersetzen): aTß = ßTa = a^
+ · · · + anbn,
oder auch b
i.
(«i, · · ·, a„)
= (&i> ···>&„)(
: ) = α1δ1+
h aHbn.
9. Rang einer Matrix
(
a
u · · · «1» \
•
·
1 und seien R l t . .., Bm die m Zeilen-
a
· * · mn ) vektoren von A und K1,..Kn die η Spaltenvektoren. Den Vektorraum R = [Äj,..., aufgespannt von den Zeilenvektoren von Α , nennen wir den ,Zeilenraum' von A und den Baum Κ = [Klt.. ., Ìl„] , aufgespannt von den Spaltenvektoren, den ,Spaltenraum' von A. Die Dimension r von R nennen wir den Zeilenrang von A und die Dimension k von Κ den Spaltenrang; r ist also die Maximalzahl linear unabhängiger Zeilenvektoren unter den R1,..., Rm, und k ist die Maximalzahl linear unabhängiger Spaltenvektoren unter den Kl,..., Kn. Nun gilt der Satz : der Zeilenrang einer Matrix ist gleich ihrem Spaltenrang ; darum sprechen wir nur von dem Rang schlechthin einer Matrix.
10. Determinanten
Man kann für die Zahlen 1 , 2 , . . . , « . I x 2 x · · · Xn = n\ verschiedene Reihenfolgen (t'j, i 2 , . .., i n ) angeben. Man nennt eine solche Reihenfolge eine Permutation der Zahlen 1, 2 , . . n. Man kann auch eine Permutation als eine Abbildung auffassen, nämlich als diejenige, die 1 auf ilt 2 auf i2,..., η auf »n abbildet. Für uns ist jedoch die erste Deutung zweckmäßiger.
ΠΙ. Lineare Algebra
48
Man erhält eine Permutation [ilt..., i„) der Ziffern 1 , . . . , η aus der natürlichen Reihenfolge, indem man nacheinander endlich viele Transpositionen vornimmt, d. h. Vertauschungen zweier Ziffern. Für η = 2 ist diese Behauptung klar, allgemein beweist man sie durch Induktion. Eine Permutation läßt sich auf verschiedene Weisen aus Transpositionen aufbauen, auch die Anzahl der benutzten Transpositionen kann verschieden sein, man kann aber beweisen, daß man für eine bestimmte Permutation entweder immer eine gerade oder immer eine ungerade Anzahl von Transpositionen braucht. Man nennt daher — je nachdem welcher Fall vorliegt — eine Permutation gerade oder ungerade. Unter dem Signum a(ilt..., in) der Permutation ( i j , . . . , in) verstehen wir 1, wenn (ilt..., ^—1, wenn (i1,...,
in) gerade ist, in) ungerade ist.
Man beachte, daß i„)· A sei eine ra-reihige quadratische Matrix: «τι α ι A =
il i 2
lie
"ih
*in
nk Unter der Determinante der Matrix A wollen wir den folgenden Ausdruck verstehen: A I = det A =
• ·. K)aHlai,l ·
(10; 1)
dabei wird über die nl Permutationen (i1,..., in) der Zahlen 1 , . . . , η summiert. I n jedem Summanden unter dem Summenzeichen in (10; 1) kommt aus jeder Zeile und aus jeder Spalte genau ein Element vor. Enthält ζ. B. ein Summand den Faktor α 12 , dann stammen die übrigen η — 1 Faktoren dieses Summanden nicht mehr aus der ersten Zeile oder der 2. Spalte. Klammern wir den Faktor a12 aus allen Summanden, in denen er vorkommt, aus, dann schreibt sich diese Teilsumme a12A12, wobei in dem Ausdruck An nur solche a lf vorkommen, die nicht in der ersten Zeile oder der zweiten Spalte von A auftreten. Analog definiert man Al} für beliebiges atj. Lassen wir nun ζ. B. die atj die erste Zeile durchlaufen, dann spalten wir die Summe in (10; 1) derart in Summanden α^Α1} (j = 1,. . ., n) auf, daß det A = anAxx
+ a12A12 +
+
alnAln.
49
11. Lösungen nicht-homogener Gleichungssysteme
(Man nennt diese Aufspaltung die Entwicklung von det A nach der ersten Zeile.) Analog erhalten wir die Entwicklung nach der ¿-ten Zeile bzw. nach der 7-ten Spalte det Λ = anAn
+ ai2A(2 +
det A = a^Ay + a2jA2j -\
h ' χ cos φ + y sin φ — χ0 cos φ + y0 sin φ = d, wobei d den Abstand des Punktes O von l darstellt. Man nennt die Gleichung χ cos φ
y sin φ — d
(2.5; 1)
Hessesche Normalform·, darin ist φ der Winkel zwisohen η und der positiven X-Achse. Zu jeder Geraden gibt es zwei Hessesche Normalformen, die sich durch die Richtung des Normalenvektors η unterscheiden. Zeichnet man eine Richtung aus, dann ist dadurch die Gleichung (2.5; 1) eindeutig bestimmt. 2.6. Achsenabschnittegleichung einer Oeraden. Schneidet die Gerade l auf den Koordinatenachsen die Stücke a und b ab (α, b Φ 0), dann sieht man unmittelbar, daß die rechtwinkligen Koordinaten der Geradenpunkte die Gleichung a
b
erfüllen; das ist die sog. AchsenabschniUsgleichung. 2.7. Allgemeine Geradengleichung. Alle bisher hergeleiteten gleichungen (in der Ebene) können wir in der Form schreiben: Ax+
Geraden-
By + C = 0,
(2.7; 1)
d. h. in der Form einer Gleichung ersten Grades in χ und y. Man zeigt leicht, daß auch jede Gleichung der Form (2.7 ; 1) eine Gerade darstellt und daß über dies die Gleichung (2.7 ; 1) I o . in die Form y = mx + η gebracht werden kann, wenn Β Φ 0, 2°. in die Normalform (2.5; 1) gebracht werden kann: Ax + By + C = 0, J/A* + B2 worin Β tg φ = J ,
d
C = — 4 cos 0-
bzw. — . .r = -——
^
4A¡¡
>0
ist. Falls r = 0, sprechen wir von einem Nullkreis (bzw. von einer Nullkugel). An Stelle der Gleichung eines Nullkreises: (x — x0)2 + (y — y0)2 = 0 kann man schreiben {{y—y0) — % {χ—x0)} {(y — Vo) + ί(χ — χο)} = 0; der reelle Punkt (x0, y0) erfüllt diese Gleichung, ferner genügen aber auch alle Punkte zweier .Geraden' durch (a;0, y0) mit den Richtungskoeffizienten + * und —i dieser Gleichung. (Als Koordinaten eines .Punktes' lassen wir jetzt also auch komplexe Koordinaten zu.) Nennt man diese beiden ,Geraden' isotrope Geraden, dann können wir den Satz aussprechen: Ein Nulikreis ist ein Kreis, der in zwei isotrope Geraden durch seinen Mittelpunkt entartet ist. Drückt man die Gleichung eines Kreises in homogenen Koordinaten aus: »2 + y2 + Axz + Byz + Gz2 = 0, dann erhält man die Schnittpunkte des Kreises mit der unendlich fernen Geraden, indem man ζ = 0 setzt, also die Gleichungen χ2 + y2 = 0 oder
(y — ix) (y + ix) = 0,
IV. Analytische Geometrie
74
m. a. W.: Jeder Kreis geht durch die Punkte mit den homogenen Koordinaten (1, i, 0) und ( 1 , — i , 0), durch die sog. isotropen Punkte. Man zeigt leicht, daß umgekehrt jede Kurve, die durch eine Gleichung 2. Grades mit reellen Koeffizienten gegeben ist und die durch einen isotropen Punkt geht, ein Kreis ist. Als Durchschnitt einer Kugel mit einer Ebene findet man einen reellen oder komplexen Kreis, der durch die beiden Gleichungen X2 + y2 + Ζ2 + Ax + By + Gz + D = 0, ax + by + cz + d = 0 gegeben ist. Gibt man die Gleichung einer Kugel in homogenen Koordinaten x2 + y2 + z2 + Axt + Byt + Czt + Dt2 = 0, dann findet man die Schnittpunkte der Kugel mit der unendlich fernen Ebene, indem man t = 0 setzt: ** + y2 + z2 = 0, t = 0; diese Gleichungen sind unabhängig von der Wahl der speziellen Kugel. Man nennt diesen komplexen Kreis den Kugelkreis. Da jeder Kreis im Baum auch auf einer Kugel hegt, ist die Menge aller Punkte des Kugelkreises der geometrische Ort aller isotropen Punkte. Für r < 0 gibt es keine Punkte mit reellen Koordinaten, die auf einem Kreis (einer Kugel) hegen, wohl aber Punkte mit komplexen Koordinaten; man spricht dann von einem komplexen Kreis (Kugel). Wenn wir — eventuell nach einer Division — in 1' (bzw. 2') erreicht haben, daß A = 1, dann sprechen wir von der Normalform des Kreises (der Kugel). Für Kreis und Kugel können wir dann schreiben: (r— a)2 — r 2 = 0. (4.1; 3) Ist OP = r, dann hegt Ρ also auf dem Kreise (der Kugel), wenn r (4.1; 3) erfüllt. liegt aber Ρ nicht auf dem Kreise (der Kugel), und ist O P = r , dann gilt (r—af
— r2 # 0.
Setzt man die linke Seite gleich L(r), dann ist somit L(r) = 0 dann und nur dann, wenn Ρ auf dem Kreise (der Kugel) hegt, sonst ist L(r) φ 0. Man nennt L(r) die Potenz des Punktes Ρ (mit OP = r) bezüglich des Kreises (der Kugel). Die Potenz von Ρ ist positiv, wenn Ρ außerhalb, und negativ, wenn Ρ innerhalb des Kreises (der Kugel) Hegt. Wir wollen nun eine geometrische Bedeutung der Potenz eines Punktes finden. Dazu ziehen wir durch Ρ eine Gerade l, die die Kugel in Sx und S2 schneidet
75
4. Kreis und Kugel
(für den Kreis gelten analoge Überlegungen). Auf l zeichnen wir einen Einheitsvektor e aus und erhalten dann in ρ = r + λ ί die Gleichung von l (wenn OP — r). Wir wollen nun diejenigen Werte von λ bestimmen, die zu 81 und S2 gehören. Im Falle
und S2 muß L(q) = 0 sein: (r + Ae — af — r2 = 0 λ2 + 2Xe o (r — a) + (r — af — r2 = 0.
Nach den ViETAschen Regeln erhalten wir für die beiden Wurzeln λ1 und λ2 Xl-X2 =
{r-a)*-r*·,
andererseits gibt λ wegen λ = | ρ — r \ den Abstand eines Punktes auf l von Ρ an; daher erhalten wir: Das Produkt der Abstände PSt und PS2 zwischen Ρ und den Schnittpunkten /Sj und S2 einer Geraden l durch Ρ mit einer Kugel {einem Kreis) ist konstant und gleich der Potenz von Ρ bzgl. der Kugel (des Kreises). Zwei Kreise mit den Normalformgleichungen £7X = 0 und C2 = 0 bestimmen eine Potenzlinie l durch die Gleichung (?! — C 2 = 0; l ist der geometrische Ort aller Punkte, die bzgl. beider Kreise dieselbe Potenz haben; l geht ggfs. durch die Schnittpunkte der beiden Kreise. Zwei Kugeln mit den Normalformgleichungen Bt = 0 und B2 = 0 bestimmen eine Ebene V durch die Gleichung B1 — B2 = 0. V ist der geometrische Ort aller Punkte P, die bzgl. beider Kugeln dieselbe Potenz haben, und man nennt V die Potenzebene der Kugeln. Die Potenzebene F geht durch eventuelle gemeinsame Punkte beider Kugeln hindurch. 4.2. Büschel undBfindeL Die Gleichungen atx + bty + ciz + d{ = 0 (¿ = 1,2) mögen zwei Ebenen in rechtwinkligen Koordinaten darstellen. Wir kürzen diese Gleichungen durch L x = 0 und Z2 = 0 ab. Diese beiden Gleichungen bestimmen nun einen Vektorraum von Gleichungen, nämlich den durch L1 und L2 aufgespannten Vektorraum. Hat ein Vektorraum die Dimension r, dann gibt es eine Basis aus r Vektoren, so daß jeder andere Vektor des Vektorraumes als Linearkombination der Basisvektoren dargestellt werden kann. In unserem Fall sind die Vektoren des Vektorraumes Gleichungen der Form L = ax + by + cz + d = 0.
IV. Analytische Geometrie
76
Wenn der Vektorraum die Dimension 2 hat, muß es eine Basis L x = 0, L 2 — 0 geben, so daß L = AjLj + k2L2. (4.2; 1) Jeden eindimensionalen Unterraum eines solchen Vektorraumes aus Gleichungen können wir mit einer Ebene identifizieren, denn alle Gleichungen der Form λ(αχ + by + cz + d) = 0 bestimmen dieselbe Ebene (λ Φ 0). Die einem zweidimensionalen Vektorraum aus Gleichungen zugeordnete Menge von Ebenen nennt man ein Ebenenbüschel, die einem dreidimensionalen Vektorraum zugeordnete Menge ein Ebenenbündel. Im letzten Fall besteht der Vektorraum aus Gleichungen, die man mittels einer Basis = 0, L2 = 0, La = 0 in der Form L = λ ^ + λ2Σ2 + X3La.
(4.2; 2)
schreiben kann. Ein Vektorraum, der aus den beschriebenen Gleichungen besteht, kann höchstens die Dimension vier haben, denn mehr als vier Gleichungen L{ -— afz + biy + c{z + d{ — 0 sind stets linear abhängig. Ist er aber tatsächlich vierdimensional, dann besteht die zugeordnete Ebenenmenge aus der Menge aller Ebenen des Baumes. Die Ebenenbüschel und Ebenenbündel, die einem Vektorraum, der aus Elementen der Gestalt (4.2; 1) und (4.2; 2) besteht, zugeordnet sind, enthalten genau diejenigen Ebenen, zu denen auch alle Punkte gehören, die gleichzeitig den Gleichungen Lx = 0, L2 = 0 (bzw. Lt = 0, L2 = 0, La = 0); genügen; m. a. W. Der Durchschnitt der Ebenen eines Ebenenbüschels ist eine Gerade (evtl. eine unendlich ferne Gerade!), der Durchschnitt eines Ebenenbündels ein Punkt (evtl. ein unendlich ferner Punkt 1). Diesen Durchschnitt nennen wir auch den Träger des Büschels bzw. des Bündels. Ist der Gleichungsvektorraum vierdimensional, dann ist der Träger der zugehörigen Ebenenmenge die leere Menge. Analoge Betrachtungen gelten in einem Vektorraum, der aus Gleichungen der Form L Έ= ax + by c= 0 besteht. Hat der Vektorraum die Dimension zwei, dann gibt es eine Basis aus Gleichungen i ! s axx + bxy + Cj = 0, L2 = a2x + b2y + c2 = 0,
77
4. Kreis und Kugel
so daß man jedes Element L = 0 in der Form + λ212 = 0 mit passenden λ1, λ2 schreiben kann. Die zugehörige Menge von Geraden nennt man ein Geradenbüschel (oder auch eine Oeradenschar). Ist der Vektorraum dreidimensional, dann umfaßt die zugehörige Geradenmenge alle Geraden der Ebene. Im ersten Fall ist der Träger der Schnittpunkt Ρ der durch Lx = 0 und L2 = 0 bestimmten Geraden. Die Geraden des Geradenbüschels sind dann genau die Gieraden durch P . Im zweiten Fall ist die Trägermenge leer. Aus dem Vorangegangenen ergibt sich ein einfaches Kriterium für die Koeffizienten der Gleichungen dreier Ebenen, die eine Gerade gemeinsam haben. Werden diese Ebenen nämlich durch die Gleichungen Lt = atx + bty + ciz + di = 0 (i = 1, 2, 3), dargestellt, dann muß L3 = 0 eine Linearkombination von L1 = 0 und L2 =[0 sein, damit die zugehörigen Ebenen zu demselben Büschel gehören, d. h. die Matrix A
α1 δχ Cj dt a2 b c2 d2 a 9 b. e,8
=
muß den Bang zwei haben. Wenn Tier Ebenen, dargestellt durch L( = atx + bty + c(z + d, = 0 (i = 1, 2, 3, 4), einen gemeinsamen Punkt haben, dann muß £ 4 = 0 eine Ldnearkombination der drei anderen Gleichungen sein (d. h. die vier Gleichungen a¿e-\-b¿/-\-c¿¡-\-d{=0 müssen eine gemeinsame Lösung haben), m. a. W. ai
h
a.
d, C2 dt
3 d3 α4 δ4 c4 di c
a
°3
c
= 0.
:
Wenn drei Geraden — mit den Gleichungen atx + bty + c{ = 0 — einer Ebene durch denselben Punkt gehen, dann heißt das, daß diese Geraden zu einem Geradenbüschel gehören, und aus dem vorhergehenden erhalten wir als Bedingung hierfür ai
bi
ci
a, b, c, = 0.
IV. Analytisohe Geometrie
78
So wie wir Geraden- und Ebenenbüschel daxgestellt haben, können wir auch Kreis- und Kugelbüschel bilden. Wir wollen hier nur Kreisbüschel betrachten. Lt = x2 + y2 — 2a{x — 2b{y + c{ = 0 (i = 1,2) seien die Normalformgleichungen zweier verschiedener Kreise mit den Mittelpunkten Mi(ai, bt). Das Kreisbüschel soll nun aus allen Kreisen bestehen, die durch Gleichungen der Gestalt L' = Äjij + X2L2 = 0. dargestellt werden. Ist Aj + λ2 φ 0 dann können wir durch λ1 + λ2 dividieren und erhalten mit a α r = -y——Τ-_ =_2Χι -ή-..2 y — η ¿i L· Δ •i + ^2 2 ^2 ^2 1 1 + ^2^2 Ί a y -)-ι 2 Uh.
11
+ ¿2C2
-
o
wieder die Gleichung eines Kreises in Normalform. Der Mittelpunkt M des Kreises liegt auf der Geraden durch Mt und M2 und teilt die Strecke im Verhältnis — λ1 : λ2. SATZ: Die von zwei Kreisen im oben definierten Sinne erzeugte Kurve ist im allgemeinen weder ein Kreis. Die Mittelpunkte aller Kreise des Büschels liegen auf einer Geraden, der sog. Zentralen des Büschels. Jeder Punkt Ρ der Zentrale ist Mittelpunkt eines Kreises des Büschels; das folgt aus der Tatsache, daß durch Ρ das Verhältnis — λ1 : λ2 eindeutig bestimmt ist. λ1 + λ2 = 0 bedeutet L1 — L2 = 0, und das ist gerade die Gleichung der Potenzlinie der beiden Kreise L1 = 0 und Lt = 0. Die Potenzlinie gehört als entarteter Kreis mit zu unserem Büschel (außer ihr enthält es keine weitere Gerade). Daß je zwei Kreise des Büschels dieselbe Potenzlinie haben, folgt aus der Tatsache, daß wir je zwei verschiedene Kreise des Büschels in der oben beschriebenen Weise als Erzeugende des Büschels auffassen können. Ferner folgt daraus, daß der Durchschnitt aller Kreise des Büschels entweder aus 0, 1 oder 2 Elementen besteht, je nachdem ob zwei beliebige Erzeugende 0, 1 oder 2 Punkte gemeinsam haben. Umgekehrt gilt: jede Menge von Kreisen mit der Eigenschaft, daß ein und dieselbe Gerade Potenzlinie je zweier Kreise der Menge ist, ist Kreisbüschel im oben definierten Sinne. Sei nämlich M = 0 eine Gleichung der Potenzgeraden, L1 = 0 eine Gleichung eines Kreises der Menge, dann muß für die Darstellung L = 0 eines jeden anderen Kreises der Menge gelten L — IjEe λΜ, also L = Lj + λΜ; der durch L = 0 bestimmte Kreis gehört also zu dem von L1 und M aufgespannten Büschel.
5. Kegels ohnitte
79
In einem Kreisbüschel treten im allgemeinen zwei Nullkreise auf: aus der allgemeinen Gleichung für einen beliebigen Kreis des Büschels braucht man nur r 2 zu berechnen und gleich Null zu setzen: (Aa + V2)2 + + W = ( V i + V 2 ) (¿1 + ¿2). hieraus ergeben sich zwei Werte für das Verhältnis λ1: λ2, die reell (verschieden oder gleich) oder komplex sein können. Von drei Kreisen mit den Gleichungen L1 = 0, L2 = 0, Lz — 0, die nicht zu einem Büschel gehören, wird ein Kreisbündel erzeugt, zu dem alle Kreise gehören, die durch Gleichungen der Form + A2L2 +
= 0,
bestimmt werden. Die drei Potenzgeraden mit den Gleichungen Lx — L2 = 0, L2 — L a = 0 und Lx — ¿3 = 0 gehen durch den Potenzpunkt des Bündels. Dieser Punkt hat bzgl. aller Kreise des Bündels dieselbe Potenz. Έίη Kreisbündel enthält unendlich viele Kreisbüschel: je zwei verschiedene Kreise des Bündels erzeugen ein Büschel, dessen Potenzgerade durch den Potenzpunkt des Bündels geht, und jede Gerade durch den Potenzpunkt ist Potenzgerade eines Teilbüschels des Bündels. 5. Kegelschnitte 5.1. Die Gleichungen der Ellipse, der Hyperbel und der Parabel Eine Ellipse ist der geometrische Ort aüer Punkte einer Ebene V, deren Abstände rx und r 2 von zwei fest in V vorgegebenen Punkten F1 und F2 die konstante
F1 und F2 werden Brennpunkte der Ellipse genannt. Die Gerade durch die Brennpunkte heißt Hauptachse, die Mittelsenkrechte von F1F2 Nebenachse der Ellipse. Setzt man OF^ = OF2 = c, dann liegen auf der Haupt-
80
IV. Analytisohe Geometrìe
achse zwei Ellipsenpunkte A1 und A2 mit 0A1 = OA2 = a. Weil a > c sein muß, liegen die beiden Scheitelpunkte Ax und A2 außerhalb der Strecke F±F2. Auf der Nebenachee liegen ebenfalls zwei Ellipsenpunkte B1 und B2 mit B1F1
= B2F2
= a.
A1A2
nennt man die große, B1B2
die Meine
Achse der Ellipse. Nimmt man als Koordinatenachsen Haupt- und Nebenachse, dann lautet die Gleichung der Ellipse (auf Grund der Definition) χ*
υ*
oder
wenn wir b 2 = a 2 — c2 setzen; b ist also die halbe Länge der kleinen Achse. Haupt- und Nebenachse sind Symmetrieachsen der Ellipse. Falls χ = c, erhält man y = ± b 2¡a = ± p: man nennt ρ den Parameter der Ellipse. Eine Hyperbel ist der geometrische Ort aller Punkte einer Ebene V, deren Abstände r1 und r2 von zwei fest in V gegebenen Punkten F1 und F2 die konstante Differenz \ r, — r2 | = 2a ergeben (Fig. 15).
Fig. 15
F1 und F2 heißen wieder Brennpunkte, die Gerade durch F1 und F2 Hauptachse, die Mittelsenkrechte zu F 1 F 2 Nebenachse. Auf der Hauptachse hegen zwei Punkte A1 und A2 (die Scheitel) der Hyperbel. Es gilt OAl = OA2 = a < OF i = c. Mit Haupt- und Nebenachse als X- und Y- Achse erhält man als Gleichung der Hyperbel
oder
81
5. Kegelschnitte
wenn δ2 = c2 — α2. Man nennt auch hier δ2/α den Parameter ρ der Hyperbel. Die beiden Geraden b y = — χ und y = • — χ a a nennt man die Asymptoten der Hyperbel (in Fig. 15 die beiden Geraden, die 0 mit Cv bzw. 0 mit C2 verbinden). Der Übergang zu homogenen Koordinaten zeigt, daß die unendlich fernen Punkte (a, i b, 0) der Asymptoten die Schnittpunkte der Hyperbel mit der unendlich fernen Geraden darstellen. Eine Parabel ist der geometrische Ort edler Punkte einer Ebene V, deren Abstand von einem fest vorgegebenen Punkt F aus V (dem Brennpunkt) gleich dem Abstand von einer fest vorgegebenen Geraden r aus F (der Leitlinie) ist (Kg. 16). Setzt man den Abstand FC des Brennpunktes F von der Leitlinie r gleich p, wählt man Fig. 16 die Mittelsenkrechte von FC als ¥-Achse und die Gerade senkrecht dazu durch F als X-Achse, dann lautet die Gleichung der Parabel auf Grund der Definition y2 = 2 px. Man nennt ρ den Parameter der Parabel. Der gemeinsame Name Kegelschnitt für Ellipse, Hyperbel und Parabel rührt daher, daß diese Kurven als Durchschnitt eines Doppelkegels mit einer Ebene F auftreten können. Geht F durch die Spitze Τ des Kegels, dann besteht der Durchschnitt aus zwei sich in Τ schneidenden Geraden oder nur aus T. Geht F nicht durch die Spitze des Kegels, dann ergeben sich drei Möglichkeiten, die mit der Lage von F zusammenhängen. F' sei eine Ebene parallel zu F durch T, dann kann man beweisen: (1) Der Durchschnitt des Kegels mit V ist genau dann eine Ellipse, wenn F' nur die Spitze Τ mit dem Kegel gemein hat. (2) Der Durchschnitt ist eine Hyperbel genau dann, wenn V zwei verschiedene Mantellinien mit dem Kegel gemein hat. (3) Der Durchschnitt ist eine Parabel genau dann, wenn V' nur eine Mantellinie mit dem Kegel gemein hat. Man kann noch auf eine andere Weise zu den Kegelschnitten gelangen. Nehmen wir einmal an, in der Ebene F seien uns ein Punkt F (Brennpunkt) und eine Gerade r (Leitlinie) gegeben und F liege nicht auf r. Jeder der drei β Kaipera-Tlmman, Uathem&tik
IV. Analytische Geometrie
82
genannten Kegelschnitte ist der geometrische Ort derjenigen Punkte von V, deren Abstände zu F und r ein konstantes Verhältnis haben (die Exzentrizität e). Ist die Exzentrizität < 1, dann ist der geometrische Ort eine Ellipse; ist e > 1, dann ist er eine Hyperbel, und im Fall e = 1 erhalten wir die Parabel. Aus dieser Herleitung folgen die Polargleichungen der Kegelschnitte. Polargleichung eines Kegelschnittes. In bezug auf F als Ursprung und in bezug auf die Halbgerade FX lautet die Gleichung eines Kegelschnittes in Polarkoordinaten Ρ 1 + e cos φ ' darin ist ρ — e • FS und FS der Abstand des Brennpunktes von der Leitlinie r des Kegelschnittes (siehe Kg. 17). Für e < 1, also im Fall der Ellipse, gibt es zu jedem Wert von φ einen Wert von ρ, also einen Punkt der Kurve: ist aber e ^ 1, dann kann r ~ 1 + e cos φ = 0 sein, nämlich bei der R Parabel (e = 1), wenn φ = π und bei der Hyperbel (e > 1), wenn cos ψ = — 1/e S χ = — a / c ; dies deutet man folgendermaßen: die Parabel enthält einen unendlich fernen Punkt (den sie mit der Achse gemein hat) ; die Hyperbel dagegen Fig. i7 hat zwei unendlich ferne Punkte, und zwar diejenigen, die durch die Bichtungen φ mit cos φ — — a/c bestimmt sind, m. a. W. die Hyperbel schneidet ihre Asymptoten in den unendlich fernen Punkten, denn aus cos φ = — aje folgt tg φ = ± bja. 5.2. Tangenten, Normalen und Winkelhalbierende. Jeder Kegelschnitt definiert in der Ebene zwei Gebiete, die wir sinngemäß Inneres und Äußeres des Kegelschnitts nennen können; im Fall der Ellipse sind es diejenigen Punktmengen, für deren Elemente rx + r 2 < 2a bzw. > 2a gilt (mit den obigen Bezeichnungen), im Fall der Hyperbel gilt für die Punkte dieser Mengen I r1 — r 2 1 > 2a bzw. < 2a, im Fall der Parabel r < d bzw. r >d (wenn r der Abstand eines Punktes vom Brennpunkt, d der Abstand von der Leitlinie ist). Wir wollen nun an eine Ellipse in einem Punkte Ρ eine Tangente anlegen. Dazu verlängern wir ζ. B. die Strecke F2 Ρ (siehe Fig. 18) über Ρ hinaus um ein Stück PQ = PF1. Dann ist die Mittelsenkrechte l der Strecke F^Q Tangente an die
5. Kegelschnitte
83
Ellipse im Funkte P. Wählt man nämlich auf l einen beliebigen Punkt Β Φ Ρ, dann gilt
0
BFX + BF2 = BQ + BF2 > F2Q = 2a, also kann ein Punkt Β von l, der nicht mit \\ \ Ρ zusammenfällt, kein Punkt der Ellipse g — sein, also hat l mit der Ellipse nur einen jg Punkt gemein. Um an eine Hyperbel in einem ihrer Punkte Ρ eine Tangente zu legen, vermindern wir die Strecke PF2 um die Strecke PFlt usw. (Fig. 19). Will man in einem Parabelpunkt Ρ die Tangente an die Kurve zeichnen, dann verbindet man Ρ mit dem Brennpunkt F und fällt daa Lot PQ auf die Leitlinie. Die Mittelsenkrechte von QF ist dann die gesuchte Tangente (Fig. 20).
Fig. 19
Fig. 20
Daß l Tangente ist, folgt aus der Tatsache, daß BF — BQ > BS für einen beliebigen Punkt Β auf l, der nicht mit Ρ zusammenfällt; Β ist also kein Parabelpunkt, und l ist Tangente. Wir wollen noch die Gleichungen der Tangente an einen Kegelschnitt im Punkte (z0, yQ) herleiten (siehe dazu auch IV, 7): χ2 ifl (a) — + — = 1 sei die Gleichung der Ellipse und y = mx + χ sei et 0 eine Tangente, dann gilt für den Berührungspunkt a a mn a m® + 6a 2
(und umgekehrt); daraus folgt m β*
Vo'
IV. Analytisohe Geometrie
84
so daß die Gleichung der Tangenten im Punkte (x0, y0) lautet: χ χ
ο ι yo y ... ι a» "t" δ2 (b) Auf analoge Weise findet man für die Tangente an eine Hyperbel die Gleichung — — = 1 im Punkte (x0, a? o* XnX VoV 1. α2 δ2 (c) Für die Tangente an die Parabel y2 = 2 p x im Punkte (x0, y0) findet man (am einfachsten, wenn man die obige Konstruktion der Tangenten rechnerisch nachvollzieht) y0y = P(x + xo)· 6. Kurven zweiter Ordnung
Wir wollen annehmen, die Gleichung einer Kurve zweiter Ordnung sei uns in rechtwinkligen Koordinaten gegeben: anx2 + 2 anxy
+ a22y2 + 2 alsx + 2 a2Sy + a3S = 0
(6; 1)
oder XTAX + 2{a13x + a23y) + αΜ = 0, wenn \«12 «22/ \y) (vgl. ΙΠ, 7 usw.). Alle Koeffizienten sollen reell sein. Durch Hauptachsentransformation können wir erreichen, daß der Term in xy verschwindet. Die charakteristische Gleichung zur Bestimmung der Eigenvektoren von A lautet: «11— λ «12 «Μ 12
λ
— 0 oder λ2 — (o u + β22) λ +
und man nennt an + a22 = J j und
= 0, 12
22
= 12 die erste bzw. zweite
Invariante der quadratischen Form. Die Lage der seiden (orthogonalen) Eigenvektoren im Koordinatensystem erhalten wir durch Berechnung des Winkels φ, den einer der beiden Eigenvektoren mit der X-Achse bildet. Es gilt: y qu— λ tgç> = • — — o dγ evuoi r tV& g u2ψç—, = — ( 6 ; 2) Una λ Ort ι ' O/aa «22 '· ®11 ' Berechnen wir nun die Gleichung unserer Kurve in bezug auf ein Koordinatensystem, das gegenüber dem bisherigen um den Winkel φ (bestimmt durch 6 ; 2) gedreht ist und dessen Achsen wir wiederum als X- bzw. Y-Achse be-
85
6. Kurven zweiter Ordnung
zeichnen, dann verschwindet der Koeffizient des gemischten Gliedes xy. Wir schreiben also die Gleichung der Kurve in der neuen Form + KV2 + 2biaz + 2bi3y + 633 = 0. Wegen der einfacheren Bezeichnungen wählen wir wieder die Schreibweise ®ii®2 + «22Î/2 +
2
«13« + 2«232/ + «33 =
(6; 3)
die ait haben in dieser Gleichung andere Werte als in (6; 1). Es können sich nun folgende Möglichkeiten ergeben (die von den Eigenwerten der Matrix A abhängen) : Io.
α η φ 0, α22 φ 0 und a u a 2 2 > 0. Dann läßt sich (6; 3) schreiben als
Setzen wir zur Abkürzving die rechte Seite gleich a, dann erhalten wir für α Φ 0 die Gleichung {x + Κ3/αιι)}2
I {y + (a23Ka)}2
, ι
( > ) \ alani I «/«. I ~ ' und zwar steht rechts + 1 , wenn a u · a > 0 und sonst — 1 . Im ersten Fall ist die Kurve eine Ellipse, deren Mittelpunkt und deren Halbachsen man aus (6 ; 5) entnehmen kann. Im zweiten Fall hat die Kurve zweiter Ordnung keine reellen Punkte. Falls a = 0, enthält sie nur den einen (reellen) Punkt +
±
2°. an Φ 0, α22 Φ 0, α π α 22 < 0. Wenn α Φ 0 ist, kann man (6; 4) in die folgende Form bringen fo + («is/gii)}2 {y + (aJa>ti)Y _ . , - ± ( ' } f «/«ix I IW« 22 I In beiden Fällen ist die Kurve eine Hyperbel, deren Mittelpunkt und deren Achsen man aus (6; 6) ablesen kann. Ist a n = — a 2 2 , dann stehen die Asymptoten der Hyperbel senkrecht aufeinander, und man spricht dann von einer gleichseitigen (oder orthogonalen) Hyperbel. Ist a = 0, dann besteht die Kurve aus zwei sich schneidenden Geraden, und man sagt, daß die Hyperbel entartet ist. 3°. au = 0, a22 Φ 0. Die Gleichung kann man dann folgendermaßen schreiben: '
y
_
\2
— ®22 /
2
Ο " " X α22α8» α23 «22 ®22 α3 α α _ £ ' (χ -)- 22 88 α23 \ 2 «13 «22 «22 \ / = _ 2 ρ ( χ + α0).
(6; 7)
86
IV. Analytische Geometrie
Ist a 13 = 0, dann ist auch ρ — 0, and die Kurve besteht aus zwei parallelen Geraden,
0
.
Verschwindet außer a 13 auch dieser letzte Ausdruck, dann stellt die Kurve zwei zusammenfallende Geraden dar. Falls dieser Bruch negativ ist, hat die Kurve keine reellen Punkte. Ist aber a 13 Φ 0, dann kann man (6; 7) umformen in: y2, =
—2px,
nämlich durch eine Verschiebung des Koordinatenkreuzes. Die Kurve ist dann eine Parabel. 7. Pol und Polare Die Gleichung einer Kurve zweiten Grades sei in homogenen Koordinaten gegeben anx2
+ 2anxy
- f aity2
+ 2alaxz
+ 2aiayz
+ α 3 ,ζ 2 = 0 ,
(7; 1)
und P{xx, yv zx) sei ein Punkt der Ebene, in der der Kegelschnitt liegt. Zieht man durch Ρ eine Gerade l, die die Kurve in Αχ und A2 schneidet, dann kann man auf l einen Punkt Q so bestimmen, daß (AXA%PQ)
= — 1.
Sei f(x, y,z) = 0 die Gleichung des Kegelschnitte (in homogenen Koordinaten) und sei (x2, y2, z2) die Koordinatendarstellung des Punktes Q, dann findet man die Schnittpunkte der Geraden l (durch Ρ und Q) mit dem Kegelschnitt, indem man λ aus der folgenden Gleichung berechnet: f{x1 + λχ2,
ft + Xyt,
+ Az2) = 0,
(7; 2)
oder aus der Gleichung f(xi>
Vi' Z1) +
{ ιι ι 2
2 α χ χ
+ «12(»12/2 +
ìV\)
X
+ ^VlVì + «13 («l ^ + 1 Ù + «23(2/iZ2 + V*«l) + «33Z1Z2} λ + /(«I, Vi. Zi)]*·2 = 0. 2
X Z
Aus (AtA2PQ) = — 1 folgt λχ + λ2 = 0 für die Lösungen λ1, λ2 dieser quadratischen Gleichung, d. h. λ1 = — λ2. Also muß der Koeffizient von λ verschwinden, und wir erhalten somit eine Bedingung für die Koordinaten von Q. Bezeichnen wir diese wieder mit (χ, y, ζ), dann haben wir die Gleichung gewonnen: anxxx
+ a12(xy1
+ xty) + a^yy^ + a13(xz1
+
χjs)
+ »23(2/21 + 2/iz) + «3333Ι· =
( 7 ; 3)
7. Fol und Polare
87
Das ist aber wieder die Gleichung einer Gieraden! Wir erhalten also den Satz: Der geometrische Ort derjenigen Punkte Q, die harmonisch konjugiert sind zu einem Punkt Ρ bezüglich der Schnittpunkte einer beliebigen Oeraden durch Ρ mit einem Kegelschnitt, ist eine Gerade, die vAr Polare des Poles Ρ in beziig auf den Kegelschnitt nennen. Entartet der Kegelschnitt zu einem Geradenpaar und ist Ρ der Schnittpunkt dieser Geraden, dann ist keine Polare definiert. Aus der Tatsache, daß sich die Gleichung (7; 3) nicht verändert, wenn man gleichzeitig χ und xlt y und ylt ζ und z1 vertauscht, folgt für einen beliebigen Punkt Q der Polaren von P, daß die Polare q von Q bezüglich des Kegelschnitts durch Ρ geht. Es besteht also zwischen Ρ und Q eine gewisse Dualität. Man nennt Ρ und Q konjugierte Punkte bzgl. des Kegelschnitts, wenn jeder Punkt auf der Polaren des anderen liegt. Die Polaren ρ und q zweier konjugierter Punkte nennt man konjugierte Oeraden. Unsere formale Herleitung der Polarengleichung liefert uns auch für den Fall eine Polare, wenn der Pol ein Punkt des Kegelschnitts ist. Offenbar geht dann die Polare durch den Pol hindurch. Denken wir uns die Gleichung des Kegelschnittes auf Hauptachsen transformiert, so sehen wir, daß in diesem Fall die Polare zu Ρ die Tangente an den Kegelschnitt im Punkte Ρ ist. Als Polare zu einem unendlich fernen Punkt P ( l , m, 0) erhalten wir die Gerade aux + a12y + au + m(a12χ + any + «aa) =
0
•
(7 '» 4)
Nach Definition der Polaren muß diese Gerade alle von einer parallelen Geradenschar aus dem Kegelschnitt herausgeschnittenen Sehnen halbieren. Hat der Kegelschnitt einen Mittelpunkt, so heißt das, daß es einen Punkt (x, y) gibt, der duroh das folgende Gleichungssystem bestimmt werden kann: anx + any + a13 = 0Ì a12x + any + o23 = OJ ' Eine Gerade mit der Gleichung (7 ; 4) nennt man einen Durchmesser des Kegelschnitts. Man sagt, daß die Richtung des Durchmessers (7 ; 4) konjugiert ist zur Richtung m, die alle Geraden durch den unendlich fernen Punkt (1, m, 0) haben. Nennen wir den Richtungskoeffizienten des Durchmessers (7; 4) TO', dann gilt offenbar aì2mm' + an(m + to') + an = 0. Aus dieser allgemeinen Gleichung erhalten wir die Beziehungen zwischen konjugierten Richtungen für die verschiedenen Kegelschnittypen, wenn wir ihre Gleichungen in einfachster Form zugrunde legen:
IV. Analytische Geometrie a)
Ellipse
y? m2 - + f = l,
δ2 — (Kg. 21)
mm' =
y=m χ
b) Hyperbel %
x
ν2
δ2
(Kg. 22)
c) Parabel y2 = 2px,
m' = 0
(Kg. 23).
Fig. 21
ly^mx
/y-m'x
\
/ l·^ Fig. 23
Pig. 22
Zwei konjugierte Richtungen m und m' stehen senkrecht zueinander, wenn mm' = — 1, d. h. (wenn wir m = tg a vertikal (parallel zur Z-Achse). Im Fall x0 = | a | zerfällt die Hyperbel in das Geradenpaar V b
2 « , y 2 = 0 und -j- -\—- = 0, c b c
das in den Ebenen χ — a (bzw. χ = —a) liegt. Für α = b erhält man ein Rotationshyperboloid mit der Z-Achse als Rotationsachse. FALL 3. ( + : — ; — ) ,
— ~ 2 — 2 = 1, der Name dieser Fläche ist aa o c zweischaliges Hyperboloid. Die Schnittkurven mit Ebenen ζ = z0 sind Hyperbeln a?
y2 6«
z% + c2 c2 '
(Dasselbe gilt für die Schnitte mit den Ebenen y = y0.) Die Schnittfiguren mit den Ebenen χ = x0 genügen den Gleichungen y2 . ζ2 ¿2 "Γ C2
=
4 — °2 gl ·
90
IV. Analytische Geometrie
d. h. diese Kurven sind dann und nur dann reelle Ellipsen, wenn | x0 | ^ α; falls I x0 I < a gibt es keinen reellen Durchschnitt. FALL 4. (— ; — ; —),
—z -y· = 1. In diesem Fall erfüllt kein er b¿ ca reeller Punkt (x, y, z) die Gleichung. In Analogie zur Gleichung y2 — 2p χ der Parabel müssen wir noch die beiden folgenden Fälle unterscheiden: FALL 5. —- + -|r- = 2 z (elliptisches Paraboloid). Für z0 > 0 ergibt der CL 0 Durchschnitt mit der Ebene ζ = z0 eine reelle Ellipse, im Fall z0 = 0 enthält er nur den Punkt (0,0). Für χ = x0 erhält man b« -
ZZ
e« '
d. h. als Schnittfiguren erhält man eine Schar kongruenter Parabeln mit dem Parameter δ2 und dem Scheitel Τ
0, i ^ j ·
Eine ähnliche Situation findet man für Schnitte mit Ebenen y = y0. yt 2
FALL 6. —
2
= 2ζ (hyperbolisches Paraboloid). Die Schnitte mit Ebenen
ζ = Zq sind Hyperbeln; für z0 > 0 ist die X-Achse Hauptachse, für z0 < 0 die F-Achse. Falls z0 = 0, erhält man als Schnittfigur das Geradenpaar x
V
% . V a b
a b
Ebenen χ — x0 (und ebenso Ebenen y = y0) ergeben kongruente Parabeln als Schnittfiguren. Im Fall des einschaligen Hyperboloids (Fall 2) und im Fall des hyperbolischen Paraboloids (Fall β) gibt es Geraden, die ganz in diesen Flächen liegen; in allen anderen Fällen ist das ausgeschlossen. Ad Fall 2. Aus
χ2 ar
z8 c
j
y2
folgt
oder {x/a) — (z/c) 1 -(y/b)
1 + (slb) (ζ/α) + (z/c) '
8. Flâohen zweiter Ordnung
91
Betrachten wir non diejenigen Punkte, für die diese Verhältnisse einen festen Wert λ annehmen, dann erhalten wir
Diejenigen Punkte, die — für ein gewisses λ — beiden Gleichungen genügen, sind genau die Punkte einer Geraden. Zu jedem Wert von λ gehört somit genau eine Gerade L x , die ganz in der Mäche liegt (denn durch Multiplikation der beiden rechten und der beiden linken Seiten obiger Gleichungen miteinander erhält man wieder die Gleichung der Fläche). Es gibt somit auf dem einschaligen Hyperboloid eine Schar von Geraden derart, daß durch jeden Punkt der Fläche genau eine der Geraden hindurchgeht (denn nach Wahl eines Punktes (z0, y0, z0) läßt sich durch Hinsetzen λ berechnen). Hieraus folgt, daß zwei verschiedene Geraden dieser Schar keinen Punkt gemeinsam haben. Sie können aber auch nicht parallel sein, denn dann mößten auch ihre Projektionen auf die ΧΓ-Ebene parallel sein. Die Gleichung der Projektion einer Geraden des Systems auf die ««/-Ebene lautet
für verschiedene Werte von λ sind entsprechende Koeffizienten dieser Gleichung offenbar nicht gleich. Zwei verschiedene Geraden dieses Systems sind somit windschief zueinander. Wir können aus der Gleichung des einsohaligen Hyperboloids noch eine andere Proportion gewinnen (durch Vertausohung der Faktoren) und erhalten dann eine zweite Geradenschar:
Diese zweite Schar hat dieselben Eigenschaften wie die erste. Überdies gilt: je zwei Geraden aus verschiedenen Scharen schneiden sich. Man kann die Koordinaten dieses Schnittpunkte berechnen:
92
IV. Analytische Geometrie
Ad Fail 6. Analog gewinnt man die beiden Geradenscharen auf dem hyperbolischen Paraboloid aus der Gleichung
Die Gleichungen der Geraden der beiden Scharen lauten also -
a
b
—
-
' a
+
^
b
=
λ-
und a b
α
ο
μ
Diese beiden Geradenscharen haben dieselben Eigenschaften wie die entsprechenden auf dem einschaligen Hyperboloid. 9. Diskussion der allgemeinen Gleichung einer Fläche 2. Ordnung 9.1. Herleitang der Normalformen der Gleichung. Die allgemeine Gleichung einer Fläche 2. Ordnung in bezug auf ein rechtwinkliges Koordinatensystem lautet : anx2
+ 2 anxy
+ 2 a13xz + a2ty2 + 2 a23yz + ®33z2 + 2aux
+ 2 aMy + 2 aMz + α44 = 0
(9.1 ; 1)
oder XTAX
+ 2 (altx + a^y + auz) + au = 0,
(9.1 ; 2)
wenn
Durch Hauptachsentransformation können wir erreichen, daß die Koeffizienten der gemischten Glieder xy, xz und yz verschwinden. Dazu bestimmt man die Eigenwerte der Matrix A aus «12
«13
«12
«22
^ «23
«13
«23
«33
«n —
λ
= 0^
Zu einer einfachen Wurzel λ1 gehört genau eine Hauptachse, die man durch Lösen des Gleichungssystems ΑΧ = findet. Falls eine Doppelwurzel vorliegt, spannen die zugehörigen Eigenvektoren eine ganze Ebene auf, und wir können uns in dieser Ebene ein beliebiges Paar aufeinander senkrecht stehender Achsen als Hauptachsen aussuchen. Entsprechendes gilt für den Fall einer dreifachen Wurzel; drei beliebige, paarweise aufeinander senkrechte Achsen bilden ein Hauptachsensystem. In jedem Fall können wir erreichen,
93
9. Diskussion der allgemeinen Gleiohung einer Fliehe 2. Ordnung
daß in der Gleichung keine gemischten Glieder mehr auftreten, und wir können uns auf die Diskussion der Gleichung anx2
+ a22y2 + a33z2 + 2 a l t x + 2 a M y + 2 a M z + au = 0
(9.1 ; 3)
beschränken. Wir geben noch eine Übersicht über die verschiedenen Möglichkeiten. FALL 1.
au Φ 0, α22 Φ 0, α33 φ 0.
Aus (9.1 ; 3) erhalten wir nach einer Verschiebung des Koordinatensysteme axxx'2 + a22y'2 + a33z'2 =
k.
Für k Φ 0 erhalten wir die Fälle 1, 2, 3 und 4 aus IV, 8. Für k = 0 erhält man einen Kegel mit der Spitze 0, der nur den Nullpunkt enthält, wenn alle ait > 0 (oder alle att < 0) sind, und der ein Doppelkegel mit reellen Geraden als Mantellinien ist, wenn eines der ati negativ und die beiden anderen positiv sind. FALL 2.
aia = 0.
Dann kann man die Gleichung in der Form schreiben au(x — «)2 + a2i(y — ßf = 2pz + q. (a) ρ Φ 0 ; nach einer Translation (Verschiebung) des Koordinatensystems erhalten wir eine Gleichung der Form ** J.
- 9
y2
Z
d. h. ein elliptisches oder hyperbolisches Paraboloid (vgl. IV, 8, Fall 5 und 6). (b) ρ = 0; ist dann q φ 0, dann erhält man eine Fläche mit einer Gleichung der Art α
2 ±
2
±A>
b
der Fall ( + ; + ) ergibt einen elliptischen Zylinder·, der Fall ( + ; —) ergibt genau einen reellen Funkt; der Fall (—; ergibt beide Male einen hyperbolischen
Zylinder.
Wenn ρ = 0, q = 0, erhält man eine Gleichung der Art α*
±
6»
ü
'
d. h. zwei sich schneidende Ebenen, wenn das Minuszeichen auftritt, und eine Gerade (nämlich die Achse) wenn das Pluszeichen gilt. FALL 3.
α
ιι = ®m =
Dann kann man die Gleichung in die Form bringen 22 ( y — « ) 2 =
a
2
νχ +
2
Ϊζ + r ·
IV. Analytische Geometrìe
94
d. h. man erhält zwei parallele Ebenen, wenn das Pluszeichen gilt. (c) ρ = q = r = 0 ergibt y2 — 0, also zwei zusammenfallende Ebenen. (d) ρ Φ 0, q Φ 0; in diesem Fall kann man durch eine Achsentransformation erreichen, daß einer der linearen Terme in der Gleichung verschwindet, und man erhält wieder Fall 3(a), d. h. einen parabolischen Zylinder. 9.2. Bestimmung eines eventuellen Mittelpunkts Für Untersuchungen von Flächen 2. Ordnung ist es wichtig, daß man den Mittelpunkt einer solchen Fläche — falls einer existiert — auch effektiv berechnen kann. Unter einem Mittelpunkt M einer Fläche versteht man einen Funkt mit folgender Eigenschaft : liegt auf einer Geraden l durch M ein Punkt Ρ der Fläche, dann enthält sie auch noch einen weiteren Flächenpunkt P', so daß M Mittelpunkt der Strecke P P ' ist. M muß m. a. W. ein Symmetriepunkt der Fläche sein. Hat eine Fläche F zweiter Ordnung einen Mittelpunkt M und ist M der Ursprung des Koordinatensystems, so treten in der Gleichung der Fläche F keine linearen Glieder auf. Kommen umgekehrt in der Gleichung von F noch lineare Glieder vor, dann bleibt noch zu untersuchen, ob F außerhalb des Ursprungs einen Mittelpunkt besitzt. (ξ1, ξ2, f s ) seien die Koordinaten des eventuellen Mittelpunkts, dann muß eine Verschiebung des Koordinatenursprungs in diesen Punkt zur Folge haben, daß in der neuen Gleichung die linearen Glieder fehlen. Durch die Substitution =
"I" fl> x2 = ®2 "f"
geht eine Gleichung L ( x
1
X
3 ~ ^3 ~t~
3
, x 2 , xs) =
über in
Σ
4,1-1
3 a
i t
z
t
z
t
+
2
2
a
n
x
k
+
s Σ
a
»,i = 1
i t
x
{
x
k
+
2 Σ
ä0kxk
+
â
M
=
mit «01 = °u£l +
a
l i h
+
+ °001
a
und
α
02 «02 = 12%l + «22^2 + ®23^S + ® C a «03 = 13^1 + ®23^2 + «33^3 + «I03
«00 = Mh>
Sa)·
0
Μ
=
0
(9.2;
1)
95
9. Diskussion der allgemeinen Gleichung einer Fliehe 2. Ordnung
Ist (Ij, ξ2, ξ3) Mittelpunkt, dann haben wir a
0
01 = «02 = «03 =
und diese Bedingung ist offenbar auch hinreichend. Einen eventuellen Mittelpunkt der Fläche 2. Ordnung mit Gleichung (9.2; 1) findet man also als Lösung des Gleichungssystems + «12*2 + «13*3 + «Ol = «12*1 + «22*2 + 023*3 + «02 = «13*1 + «23*2 + «33*3 + «03 = a\l Xl
0 0
(9.2; 2)
0
(9.2 ; 2) sind also die Bedingungen für den Mittel/pwnkt einer Fläche 2. Ordnung mit der Gleichung (9.2; 1). Dieses System wird von genau einem Punkt erfüllt, wenn «11 «12 «13 D = «12 «22 «23 Φ0. «13 «23 «33
(9.2; 3)
Durch Verschiebung des Achsenkreuzes in den gefundenen Mittelpunkt und durch Hauptachsentransformation kann man also die Gleichung der Fläche 2. Ordnung in die Gestalt + h * \ + ¿8*s = c ·
bringen. Verstehen wir unter Η die Determinante «00 Η = «10 «20 «80
(9-2; 4)
«01 «02 «03 «11 «12 «18 «21 «22 «28 «31 «82 «38
die aus D entsteht, indem wir eine Spalte und eine Reihe aus den Koeffizienten aa0, a01, am und am hinzufügen (ait = ati\), dann erhalten wir für die Konstante c in (9.2; 4) H — cD = 0 oder c = — . Ist c = 0, dann auch Η = 0, und wir erhalten als Gleichung der Fläche d. h. einen Kegel.
^1*1 "I" ^2*2 + ^3*8
(
=
«11 «12 «18 \
«12 «23 «22 «28 «13 «83/) den Rang 2, dann hat die Fläche eine ganze Gerade von Mittelpunkten; die Fläche ist dann ein ellip-
IV. Analytische Geometrie
96
tischer Zylinder, ein hyperbolischer Zylinder oder ein Paar sich schneidende Ebenen. Der Fall, daß die Fläche eine ganze Ebene aus Mittelpunkten besitzt, tritt auf, wenn es sich um ein Paar paralleler Ebenen handelt. 10. Polorentheorie für Flächen 2. Ordnung Die Gleichung einer Fläche 2. Ordnung sei in homogenen Koordinaten gegeben: anx* + 2a12xy + 2alsxz + 2a 14 xt + · · · + aut2 = 0.
(10; 1)
und P(x1, ylt zlt tt) sei ein Punkt im Baum. Zieht man durch Ρ eine Gerade l, die die Fläche in At und A2 schneidet, dann kann man auf l denjenigen Punkt Q bestimmen, so daß (A1AiPQ)= — 1. Der geometrische Ort aller Punkte Q, die harmonisch konjugiert sind zu einem, Punkt Ρ bzgl. der Schnittpunkte einer Oeraden durch Ρ mit einer Fläche 2. Ordnung, ist eine Ebene π, die man die Polarenebene von Ρ bzgl. der Fläche 2. Ordnung nennt, und Ρ heißt Pol dieser Ebene. Die Herleitung der Gleichung dieser Polarenebene π erfolgt auf dieselbe Weise wie die der Gleichung einer Polaren bzgl. eines Kegelschnitts, und zwar lautet die Gleichung der Polarenebenen π eines Punktes P(xv yv zv 0 ein δ gibt, so daß I f(x) — L I < ε, wenn 0 < χ — α < δ. Hierbei liegt χ in dem offenen Intervall (α, α + δ), das wir eine rechtsseitige Umgebung von a nennen. Abkürzung: f(x) ->L, wenn x^a, oder lim /(x) = L. x\a
Wir nehmen nun an, eine Funktion sei definiert über einer Zahlenmenge {x}, die nach oben hin nicht beschränkt ist; es kann dann vorkommen, daß die Funktion einem Grenzwert zustrebt, wenn χ über alle Grenzen wächst.
101
2. Der Grenzwertbegriff
Dieses .Über alle Grenzen wachsen' kürzt man ab durch χ -> oo (lies : χ strebt nach Unendlich). In diesem Fall lautet die Definition des Grenzwerts: DEFINITION. Die Funktion f(x) hat für χ zu jedem ε > 0 eine ZaM Ν (ε) gibt, so daß
oo den Grenzwert L, wenn es
I f(x) — L I < ε, wenn χ > Ν (ε). Bezeichnung: f(x) -> L für χ -> oo oder lim f(x) = L. Wenn der Definitionsbereich {a;} der Funktion nun nach unten hin unbeschränkt ist, dann kann es ebenfalls vorkommen, daß f(x) einem Limes zustrebt, wenn χ immer kleiner wird (Abkürzung χ — oo ; lies : χ strebt nach Minus Unendlich). DEFINITION. Die Funktion f(x) hat für χ -> — oo den Limes L, wenn es zu jedem ε > 0 ein Ν (ε) gibt, so daß I f(x) — L I < ε, wenn χ < Ν (ε). Bezeichnung : / (χ) -> L, wenn χ
— oo, oder lim f(x) = L. X-*> QO
Weiterhin kann es vorkommen, daß für χ α, χ -> oo oder χ -> — oo die Funktionswerte über alle Grenzen wachsen, d . h . f(x) -> oo oder — falls die Werte negativ sind — die Beträge über alle Grenzen wachsen, d. h. f(x) -> — oo. Man sagt dann, daß in diesen Fällen die Funktionswerte einem uneigentlichen Limes zustreben (oo bzw. —oo). Bezeichnung: lim f{x) = oo bzw. lim f(x) = — oo. x-*a x-+a Beispiel 1. lim — = 0. Für alle e > 0 ist nämlich —
Ο < ε, wenn χ > — =
lim — χ = 0. Für alle ε > 0 ist nämlich l - o
< ε, wenn χ
Α, wenn χ
- χ .
«tO
χ
A
Beispiels. lima? = oo. Für jedes beliebige positive A ist nämlich x2 > A, wenn χ > ΫΑ.
102
V. Analysis — Differential-, Integralrechnung
3. Das Rechnen mit Limiten Das Rechnen mit Limiten beruht auf den folgenden Bechenregeln: lim {/(») + »(*)} = lim /(») + l i m 0 ( s ) . x-*a x-*a x-ya lim{/(x) — ?(&)} = lim/ {x)~ lim g{x). e->o x-*a x-+a lim f(x) -g(x) =lim Χ—HÏ
f(x) -lim g(x).
%-+a
(3; 1) (3; 2) (3; 3)
x-+a
lim f(x) ™ , falls lim g(x) φ 0. (3; 4) «-MI Einschränkung. Die limiten, für die diese Regeln gelten, müssen eigentlich sein, mit den Symbolen oo und — oo wird also nicht gerechnet. Die Regeln gelten jedoch auch, wenn χ oo oder χ -> — oo . Wir wollen diese Regeln nicht alle beweisen. Als Beispiel f ü r die Art der Beweisführung leiten wir die Regel (3; 3) her. BEWEIS von (3; 3). Sei lim f(x) = F und lim g{x) = G. χ~+α ζ-Hl f(x) · g(x) — F · G — f(x) · g{») — f(x) • G + f(x) •G-F-G = f(x){g(x)-€f}+G{f(x)-F}. Hieraus folgt \f(x)-g(x)-F-G\
£ |/(z)|
| g(x) -
G|+ |G| |f(x)-F\.
Da lim einer χ-*" f(x) existiert, gibt es eine Zahl M, so daß | f(x) | < Μ, wenn χ in ε punktierten ¿^Umgebung von α liegt. Zu den positiven Zahlen ^ • und G gibt es eine punktierte ¿¡¡-Umgebung von a, so daß für χ aus dieser ' ' ε ε Umgebung sowohl | f(x) — F | < g als auch | g(x) — G \ < gilt. Sei δ der kleinere der beiden Werte — oo Gültigkeit. Belepiell. Gesucht: lim — »->00 X
>
0, m ganz).
LÖSUNG. Nach (3; 3) gilt 1 1 1 1 1 1 1 r lim —— = i-lim — · — . . . — = r lim — r· lim — . . ν. lim — =η 0. »->00 * »->00 ? * * »->00 X »->00 * »->00 x n-mal
Beispiel 2. Gesucht: lim »->00
3a-» + 4a; — 5 —2z + 4 ·
LÖSUNG. Hegel (3; 4) ist nicht unmittelbar anwendbar, denn dann erhielten wir als Grenzwert den nicht definierten Ausdruck oo
Wir dividieren zunächst Zähler und
Nenner durch x* und erhalten dann ..
Za? + 4a: — 5
i™
Xa — 2 a: + 4 τ
.. =
x^co
3 + ——4x a? 2 Γ l _ - _ + JL Χ xr
3 + l i m — — lim 4 x »->00^ =
"
2 1—lim — + lim »->00 % »—>co
Γ
3 + 0— 0 =
1-0 + 0
„ = 3
"
Beispiel 8. Gesucht: lim — χ + Ya? + 4a;. »->00 LÖSUNG. Regel (3; 1) kann ebenfalls nicht unmittelbar angewandt werden, da wir es dann mit uneigentlichen Limiten zu tun hätten. Aber für χ > 0 gilt χ I 1 7 Π 7 -
l - * + V* + ü)(¡, + )/* + 4¿i X + Y& + 4a; — a* + x* + 4a; • + V+ + "
4 1 + 1/1 + i .
104
V. Analysis —• Differential-, Integralrechnung
Also erhalten wir lim — χ + Y3? + 4a;
Γ 1 + 1/1 +lim _
1+ 1
2
'
4. Stetigkeit DEFINITION. Die Funktion f(x) heißt stetig an der Stelle χ = a, wenn lim / ( * ) = / ( « ) . Ersetzt man in den Limesdefinitionen I und I I überall L durch /(α), dann erhält man andere Formulierungen der Stetigkeitsdefinition. Eine Funktion heißt rechtsseitig stetig an der Stelle χ — a, wenn lim f(x) = f(a), x\a
und linksseitig stetig, wenn lim f(x) — f{a). xfa
DEFINITION. Eine Funktion heißt stetig in dem offenen Intervall (a, b), wenn die Funktion in jedem Punkt χ aus (a, b) stetig ist. DEFINITION. Eine Funktion heißt stetig in dem abgeschlossenen Intervall [α, δ], wenn die Funktion in dem offenen Intervall (α, b) stetig und in den Randpunkten a bzw. b rechts- bzw. linksseitig stetig ist. Der Name Stetigkeit rührt daher, daß der Graph einer in einem Intervall (a, b) stetigen Funktion eine zusammenhängende Kurve über diesem Intervall ist. Eine Funktion, die an der Stelle χ = a nicht stetig ist, heißt an dieser Stelle unstetig. Ein bekanntes Beispiel ist die Funktion y = tg χ, die an jeder Stelle, 7t
die ein ungerades Vielfaches von — ist, unstetig ist. Ein anderes Beispiel ist Zi die in V, 1 dargestellte Funktion. Diese ist unstetig für χ = — 2. Wir geben noch eine weitere Definition der Stetigkeit in einem Intervall (α, δ) an: DEFINITION. Eine Funktion f(x) mit dem Definitionsbereich (a,b) heißt stetig in (a, b), wenn es zu jedem, c € (α, b) und zu jedem ε > 0 eine Zahl δ gibt, so daß folgendes gilt: I f(x) —/(c) I < ε, wenn \x — c | < δ. Die Zahl δ hängt im allgemeinen sowohl von ε als auch von c ab, ist also eine Funktion von ε und c. Gibt es aber zu jedem s > 0 eine Zahl δ, die nur von ε abhängig ist, demnach unabhängig ist von der speziellen Wahl der Stelle c aus (a, b), dann nennt man die Funktion in (a, b) gleichmäßig stetig. Man kann den wichtigen Satz beweisen, daß eine Funktion, die in einem abgeschlossenen Intervall stetig ist, dort auch gleichmäßig stetig ist.
105
5. Eechenregeln — Beispiele (stetige Funktionen)
5. Rechenregeln für stetige Funktionen — Beispiele stetiger Funktionen Aus den Rechenregeln (V, 3) für Grenzwerte folgen unmittelbar einige Rechenregeln für stetige Funktionen. Sind f(x) und g(x) an der Stelle χ = a stetige Funktionen, dann sind auch die Funktionen f(x) + g(x), f(x)—g(%), f{x) ' g(x) und f{x)/g (x) stetig, letztere nur dann, wenn g(a) φ 0. Die Funktion f(x) = χ ist für alle χ stetig; das folgt unmittelbar aus der Definition der Stetigkeit, ebenso wie die Tatsache, daß f(x) = c (c konstant) stetig ist. Folglich ist auch / (χ) = χ" (η > 0, η ganz) für alle χ stetig, und damit ist auch jedes Polynom in χ (eine sog. ganze rationale Funktion) für alle χ stetig. Ferner sind die gebrochen-rationalen Funktionen a 0 x n + «χ«:""1 Η b0xm + biX™-1
+ α„-ιχ + a n h bm-ix + 6 m
als Quotient zweier ganzer rationaler Funktionen stetig außer in den Nullsteilen des Nenners. 6. Der Differentialquotient Die Differenz χ — a kürzt man ab durch Δχ (lies: delta χ), die Differenz f(x) — /(α) der Funktionswerte durch Ay. Den Quotienten Δχ
χ—a
nennt man Differenzenquotient von f(x) an der Stelle a. Ist f(x) stetig an der Stelle χ = a, dann gilt f(x) ->/(a) für χ ->a. Hat der Differenzenquotient an der Stelle x = a einen Limes, dann nennen wir diesen den Differentialquotienten an der Stelle χ = a . Diesen Differentialquotienten bezeichnet man durch die Symbole /'(a),
)
\dx/χ=α
(lies: dé y nach dé χ für χ = a).
«HïL-s^·
Wenn Mißverständnisse ausgeschlossen sind, läßt man den Index auch weg und schreibt einfach
oder y' oder Du. ax Setzt man χ = a + h, dann kann man den Differenzenquotienten auch in der Form schreiben f{a + h) — f(a) h '
0der
f(a + Ax) — f(a) Δχ *
106
Y. Analysis — Differential-, Integralrechnung
F A
Â
f(x)
f(a) ^
0
c
X
Die anschauliche Bedeutung des Differentialquotienten für den Graphen einer Funktion y = f(z) in einem rechtwinkligen Koordinatensystem ersieht man aus Fig. 4. Die Punkte A und Ρ mögen die Koordinaten (a,f(a)) und (x, f(x)) haben. Aus der Figur ersieht man dann, daß
/(*)-/(«)
Fig. 4
der Tangens des Winkels β ist, den die Sehne AP mit der positiven Richtung der x-Achse bildet. Existiert der Differentialquotient an der Stelle χ = a, dann nähert sich die Sehne AP ebenfalls einer Grenzlage, wenn χ a. Der Graph von / (x) hat in diesem Fall eine Tangente im Punkte A, und der Tangens des Winkels oc, den die Tangente mit der positiven Richtung der x-Achse bildet, ist der Differentialquotient an der Stelle χ = a. tg OÍ = lim tg β — lim
f(x)-f(a)
Als Wert des Winkels oc, der durch tg α = f'(a) bestimmt ist, wollen wir stets den zwischen — f π und + \ π gelegenen Wert nehmen. Anmerkung. Existiert der Differentialquotient einer Funktion an der Stelle χ = a, dann nennen wir die Funktion in χ — a differenzierbar. Existiert für eine Funktion }(x) der linksseitige Grenzwert lim
M
—
M
χ] a dann nennt man ihn den linksseitigen Differentialquotienten an der Stelle χ = a. Die Funktion heißt dann an dieser Stelle linksseitig differenzierbar. Ebenso nennt man eine Funktion rechtsseitig differenzierbar an der Stelle χ = a, wenn der rechtsseitige Differentialquotient lim
m—m
x{a
existiert. Eine Funktion heißt differenzierbar in dem offenen Intervall (a, b), wenn die Funktion an jeder Stelle χ aus (a, b) differenzierbar ist. Eine Funktion heißt differenzierbar in dem abgeschlossenen Intervall [α, δ], wenn die Funktion in {a, b) differenzierbar und in den Randpunkten rechts- bzw. linksseitig differenzierbar ist.
107
7. Abgeleitete Funktion
7. Die abgeleitete Funktion — Zusammenhang zwischen Stetigkeit und Differenzierbarkeit — Höhere Ableitungen Ist eine Funktion in jedem Punkte eines Intervalls (a, b) differenzierbar, dann wird durch den Grenzübergang
/(« + *) — /(»)
lim -
Λ-*0 jedem χ aus (α, 6) eine Zahl f'(x) zugeordnet. Wir erhalten also auf diese Weise eine weitere Funktion über den Intervall (a, b) und nennen diese Funktion die abgeleitete Funktion oder kurz die Ableitung. SATZ. Ist f(x) an der Stelle χ = a differenzierbar, dann ist f(x) an dieser Stelle auch stetig. BEWEIS. f(x) — f(a) = [x — a)
f(x) — f(a)
lim {/(*) — f(a)} = lim (ζ — α) · l i m - ^
{χ Φα).
tM. = o · f'(a) = 0.
Hieraus folgt lim {f(x) — f(a)} x-*a
-- 0, oder lim /(x) = x-*a
f(a),
und dies ist die Definition der Stetigkeit an der Stelle χ = a. Anmerkung. Die Umkehrung dieses Satzes gilt nicht; die Differenzierbarkeit einer Funktion ist Fig. 5 eine schärfere Eigenschaft als die Stetigkeit. So ist die Funktion y — \ χ | überall stetig, aber im Nullpunkt nicht differenzierbar (siehe Fig. 5). Zwar existieren die links- und rechtsseitigen Differentialquotienten lim ' M - W - ü m Ü L U - l , xfO *to
lim/(a;)-'(0)=limi£l=l, x xiO xlO x
aber die Limiten stimmen nicht überein, also existiert der Limes lim t^ï. X-+0 * —0 nicht. Ist f(x) an der Stelle χ = a differenzierbar, dann ist die Funktion 0, ganz).
110
V. Analysis — Differential-, Integralrechnung
Mittels der hier gewonnenen Ergebnisse können wir die Ableitung jeder rationalen algebraischen Funktion berechnen. Beispiel.
2 = = 3 z — 2x + 5 ' v(x) χ2 + χ + 1 ' Du — 3 · 2a; — 2 + 0 = 6z — 2; Dv= 2a: + 1. ν Du — uDv _ (a? + χ + 1) (6s — 2) — (3z2 — 2a; + 5) (2a: + 1) _ e2 {3? + χ + ψ 5a-8 — 4x — 7 (a? + χ + l)2 ' n
9. Der Begriff der Bogenlänge auf einem Kreis — Stetigkeit der trigonometrischen Funktionen — Goniometrische Ungleichungen Um den Begriff der Bogenlänge auf einem Kreis definieren zu können, benötigen wir Eigenschaften der Menge der reellen Zahlen, die für viele Begriffe der Analysis von grundlegender Bedeutung sind. Eine Zahlenmenge mit der Eigenschaft, daß jedes ihrer Elemente kleiner ist als eine gewisse Zahl M, heißt nach oben beschränkt. Hat die Menge die Eigenschaft, daß jedes Element größer ist als eine feste Zahl M, dann ist sie nach unten beschränkt. Eine nach oben beschränkte Menge hat unendlich viele obere Schranken, denn wenn M eine obere Schranke ist, dann ist auch jede Zahl M 1 > M eine obere Schranke. Der für uns wichtige Satz lautet nun: Jede nach oben beschränkte Menge reeller Zahlen besitzt eine kleinste obere Schranke (auch obere Grenze oder Sufremum (sup) genannt). Entsprechend gilt: Jede nach unten beschränkte Menge reeller Zahlen besitzt eine größte untere Schranke (auch untere Grenze oder Infimum (inf) genannt). Eine Menge, die sowohl nach oben als auch nach unten beschränkt ist, nennen wir kurz beschränkt. Eine beschränkte Menge besitzt sowohl ein Supremum als auch ein Tn-firmim, Β I n Fig. 6 ist AP1P2P3B ein einbeschriebener Streckenzug des Kreisbogens AB, jig g während AQ1Q2B einen umbeschriebenen Streckenzug mit denselben Endpunkten darstellt. Aus der Dreiecksungleichung (jede Seite eines Dreiecks ist kleiner als die Summe der beiden anderen Seiten) beweist man leicht die folgende Eigenschaft.
111
9. Bogenlänge auf einem Kreis
EIGENSCHAFT. Die Länge jedes einbeschriebenen Streckenzugs ist kleiner als die Länge eines beliebigen umbeschriebenen Streckenzugs mit denselben Endpunkten. Die Menge {L} aller Längen einbeschriebener Streckenzüge ist somit eine unendliche Zahlenmenge mit der Eigenschaft, daß jedes Element kleiner ist als eine gewisse Zahl M. Die Menge {L} ist daher nach oben beschränkt und besitzt eine obere Grenze. Wir definieren als Bogenlänge s eines Kreisbogens die obere Grenze der Menge {Ζ}, deren Elemente Längen von einbeschriebenen Streckenzügen sind: s = sup {L}. Als Einheit für das Maß eines Winkels benutzt man in der Mathematik ein ,Radiant' (Abkürzung: rad). DEFINITION. Ein Radiant ist das Maß desjenigen Winkels, zu dem — wenn man ihn als Mittdsfunktswinkel eines Kreises auffaßt — ein Bogen gehört, dessen Länge gleich der Länge des Kreisradius ist. 360° Einem Winkel von 360° entsprechen also 2 π rad und 1 rad = 2π « 57°17'45". Um eine einfache Darstellung der Punktion y = sin χ (χ im .Bogenmaß', d. h. in rad gemessen) zu bekommen, stellen wir die reellen Zahlen auf der Peripherie eines Kreises vom Radius 1 dar, wobei wir einen behebigen Punkt O auf der Peripherie als Nullpunkt auszeichnen und denjenigen Punkt E als Einheitspunkt wählen, für den der Bogen OE die Länge 1 hat (Fig. 7). EOO hat dann gerade das Maß 1 rad. Der ganzen Kreisperipherie entspricht dann das Intervall [0, 2π). Den Wertebereich der Sinusfunktion stellen wir auf dem Radius O'E' (parallel zu Tangente in 0) dar. Als Einheitspunkt auf der i/-Geraden wählen wir den Schnittpunkt E ' mit dem Kreis. Die Punkte E und E ' sollen dabei auf derselben Seite der Geraden durch O und 0 ' hegen. Die Fig. 7 Projektion der Peripheriepunkte auf die Gerade O'E' ergibt dann die Zuordnung y = sin χ . Der Wertebereich ist das Intervall [—1, 1], Auf Grund dieser Darstellung sieht man unmittelbar ein, daß die Funktion sin χ für alle χ aus [0, 2 π) stetig ist. Zu einer Umgebung Qy von sin χ findet man sofort durch Projektion die zugehörige Umgebung Ωχ von x. In Fig. 7 erhält man ζ = cos χ durch Projektion auf den Durchmesser ΟΌ X O'E'.
112
V. Analysis — Differential-, Integralrechnung
Die Zuordnung einer UmgebungΩ χ zu einer U m g e b u n g ^ von cos χ geschieht wie beim Sinus durch Projektion. Es ist klar, daß auch der Kosinus stetig in [0, 2 π) ist. Da sin χ und cos χ periodische Funktionen sind, sin 2 π = sin 0, cos 2 π — cos 0, sind diese Punktionen für alle χ stetig. Aus der Stetigkeit von sin χ und cos χ folgt die Stetigkeit von y — tg χ = sin z/cos x,{x Φ {η -f y = sec χ = 1/cos χ, {χ φ {η
π), y = cotg χ = cos »/sin χ, (χ φ
ηπ),
π), y = cosec χ = 1/sinχ, (χ Φ ηπ).
Aus dem Bisherigen leiten wir einen Grenzwert ab, der das wesentliche Hilfsmittel zur Berechnung der Ableitungen der trigonometrischen Funktionen ist, nämlich sin« hm Λ = 1. «-»•ο Herleitung. Nach dem Bisherigen ist in Fig. 8 die Sehne AB kleiner als der Bogen AB, und letzterer ist als obere Grenze kleiner als AC + GB. Ist 2« der Zentriwinkel AOB, dann gilt 2r sina < 2 r « < 2r tg α (0 < α < £
(9; 1)
Nach Division durch 2 r sin α erhalten wir 1
sui «
cos α
oder Fi
S· 8
c o s « < - ^ < l
( 0 < « g J»).
(9; 2)
Die Ungleichung (9; 2) gilt auch für 0 < | « | á \ π wegen sin (— α) «
sin « «
Die Funktion cos χ ist stetig in χ = 0, also lim cos α = cos 0 = 1 . Hieraus Λ->0 und aus (9 ; 2) folgt unter Benutzung des Satzes aus V, 3 „sin« lim = 1. «-»•o Oí. Dividiert man (9; 1) durch 2 r tg α, dann folgt cos χ
0 X " •• c
(13; 2)
Für s > c gilt f(x) < /(c) ^
/W
Da / auf (α, 6) differenzierbar ist, existiert /'(c). Nach (13; 1) ist /'(c) < 0, nach (13; 2) ^ 0. Also muß f'(c) = 0 sein. Fall 2 wird analog zu Fall 1 behandelt. Die geometrische Bedeutung des Satzes von Rolle liegt darin, daß es mindestens einen Punkt c aus (α, 6) " __ gibt, in dem die Tangente an den Graphen der Funktion parallel zur X-Achse verläuft. υ α c Die Voraussetzung, daß f'(x) im offenen Intervall Fig. 9 existiert, ist wichtig. Man betrachte ζ. B. Fig. 9. Im Punkte C des Graphen liegt eine sog. Spitze vor; der Grenzwert der Differenzenquotienten strebt gegen 00, die Funktion ist also nicht differenzierbar, und es gibt in keinem Punkte eine waagerechte Tangente. Eine Verallgemeinerung des Satzes von Bolle ist der Mittelwertsatz. A
1. MITTELWERTSATZ. Ist f{x) stetig auf [α, ό] und differenzierbar in (α, b), dann gibt es mindestens einen Punkt c aus (a, b), für den
m-m=M0
—
a
BEWEIS. Die Funktion
ist stetig in [α, 6], differenzierbar in (a, b) und ferner gilt φ(α) = f(a) und χ ist, also auch f(X + h ) - f ( x ) ä 0. h
14. Der erweiterte oder zweite Mittelwerteatz
119
Hieraus folgt für A -> 0 m
* o.
Anmerkung 1. Auch wenn f(x) echt monoton steigend ist in [α, δ], folgt nur, fix + h) fix) daß /'(χ) ^ 0. Zwar sind die Differenzenquotienten > 0, tl aber der Grenzwert kann 0 sein. Anmerkung 2. Ist / monoton fallend in [α, 6] und differenzierbar in (α, 6), dann erhält man auf dieselbe Weise f'(x) ^ 0 in (α, b). Mit Hilfe des Mittelwertsatzes erhält man umgekehrt den wichtigen Satz: SATZ. Ist f(x) stetig in [α, 6] und gilt in jedem Punkt von (a,b) f'(x) > 0 , dann ist f(x) echt monoton steigend in [a, 6], BEWEIS. Sind xt und x2 Punkte aus [α, 6], dann gilt f{^2) — f(xi) = (z2 — xi) /'(£) (£ zwischen xx und x2). Da /'(I) > 0 ist, folgt f(x2)—ί(Χχ) > 0 , wenn (x2 — x¡) > 0 ist, und das bedeutet, daß f(x) echt monoton steigt. Analog beweist man: SATZ. Ist f(x) stetig in [α, 6] und ist in jedem Punkt aus (a, b) f'(x) < 0, dann ist f(x) echt monoton faMend auf [α, 6]. 14. Der erweiterte oder zweite Mittelwertsatz Eine Verallgemeinerung des 1. Mittelwertsatzes ist der folgende Satz. 2. MITTELWERTSATZ. f{x) und g(x) seien stetig in [α, 6], differenzierbar in (a, b) und es gelte g'(x) Φ 0 in (a, b). Dann gibt es einen Punkt c aus (a, b), so daß f'(c) f(b)-f(a) i, { a < c < h ) · T ü ~ m - m BEWEIS. Die Punktion 9i*) = {¡7 W - g («)} {fix) -f{a)} - {/(δ) - / ( < * ) } {g (χ) — g (a)} ist Btetig in [ο, δ], differenzierbar in (a, b) und ferner gilt φ(α) = 0.
Hieraus folgt: lim -L^—l xfa
x
!±± g 0, lim a
x\a
t±-L ä o. x
a
Da der Limes an der Stelle χ = a existiert, ist also f'(a) = 0. Weiß man umgekehrt nur, daß f'(a) — 0, dann kann man daraus noch nicht schließen, daß an der Stelle χ = a ein lokales Extremum vorliegt. Ist ζ. B. f'(a) = 0, f'(x) > 0 in (α — h, a) und /'(χ) > 0 in (a, a + h), dann ist die Funktion echt monoton steigend in (α — h, a + A). Der Graph der Funktion hat dann an der Stelle χ = a einen Wendepunkt mit horizontaler Tangente, wie wir in V, 16 sehen werden. Von lokalen oder inneren Extrema unterscheidet man Bandextrema. Diese treten nur auf, wenn die Funktion über einem abgeschlossenen Intervall definiert ist. Beispiel. Man bestimme alle Extrema der Funktion
f(x)=±xi-\x*
in
[-1,4].
RECHNUNG. /'(*)= $(*· — 3 ^ ) = \x*(x — 3), /'(0)= 0, /'(3)= 0. Für χ > 3 ist f'(x) > 0, für χ < 0 und 0 < χ < 3 ist f{x) < 0. An der Stelle χ = 0 tritt kein Vorzeichenwechsel von f(x) auf wegen des quadratischen Faktors o 2 . Es liegt also an der Stelle χ = 3 ein lokales Minimiim vor, /(3) = — Ferner hat die Funktion in x = — 1 ein Bandmaximum / ( — 1 ) = ebenso bei x = 4, /(4)= 0. Der Graph von / hat an der Stelle χ = 0 einen Wendepunkt. Der Vorzeichenverlauf von f (x) und der Graph von / sind in Fig. 10 skizziert.
Wir sagten bereits, daß eine Funktion / an einer Stelle χ = a ein lokales Extremum haben kann, wenn f'(a) — 0 ist. Manchmal bietet die Untersuchung des Vorzeichenverlaufes von /' Schwierigkeiten, während f" dagegen einfacher zu studieren ist. Bei Untersuchungen auf Extrema kann man von folgendem Hilfssatz Gebrauch machen.
V. Analysis — Differential-, Integralrechnung
122
HILFSSATZ. Sei f{a) = 0, f'(a) = 0, f'(x) stetig in x = a. Existiert ferner f" in einer punktierten Umgebung (a — A | α + A) und ist f" von konstantem Vorzeichen in (a — A, a) und (α, a + A), dann hat f in (a — A | a + A) denselben Vorzeichenverlauf wie f". BEWEIS. Wir beschränken uns auf die Diskussion desjenigen Falles, in dem f"(x) > 0 in (α — Α | α + A). Dann ist /' echt monoton steigend in (α — A, a + A). Da /'(o) = 0 und /' an der Stelle χ = a stetig ist, ist f'{x) < 0 in (a — A, a) und f'{x) > 0 in {α, a + A). Hieraus folgt wiederum, daß / echt monoton fällt in (a — A, a) und steigt in (a, a + A). Da f(a) = 0 ist, muß f(x) > 0 sein in (α — A | a + h). Zur Veranschaulichung ist in Fig. 11 der Vorzeichenverlauf von /", f und / wiedergegeben. Die übrigen Fälle werden analog behandelt. Der nächste Satz ist eine unmittelbare Folge der obigen Überlegung.
f(x) Ζ Í^lM- 1 2 ¡3 ψ f(x) (-fa-M» fa M^stn κ min Fig. 10
f'(x) f"(x)
-f(x)>o—f(x)>o -f(x)fa-
-f(x)st—
-f'(x)st—i—f'(x)stFig. 11
SATZ 1. Ist f'{a) — 0, /' stetig in χ = a und existiert f" in einer punktierten Umgebung (a — A | a + A), dann hat f in χ = a ein lokales Minimum, wenn f"(x) > 0 ist in (a — A | a + h), und ein lokales Maximum, wenn f"(x) < 0 in diesem punktierten Intervall. BEWEIS. Für die Funktion g mit g(x) = f(x) — f{a) gilt g(a)= 0, g'(x) = f'(x) und g"{x) = f"(x). Im Intervall (a — A | a + A) gilt dann g"{x) = f"{x) ^ 0; das bedeutet auf Grund des Hilfssatzes g(x) = f(x) — f(a) ^ 0 , d.h. f(x) ^/(α). (Das Zeichen bedeutet hierbei: entweder in allen Punkten größer, oder in allen kleiner!). Über f"(a) haben wir dabei nichts vorausgesetzt; f"(a) braucht noch nicht einmal zu existieren. Es gilt aber andererseits:
123
15. Extremwerte
SATZ 2. Ist f'(a) = 0 und existiert f"(a), dann ist f(a) ein lokales Extremum, falle f"(a) Φ 0, und zwar ist es ein Minimum, wenn f"(a) >0, und ein Maximum, wenn f"(a) < 0 ist. BEWEIS. Wir betrachten den Fall /"(α) > 0 . /"(α) =
l i r n m ^ m . s-*, x— a
Da f"(a) > 0 ist, gibt es eine punktierte Umgebung (α — A | a + A), in der der Differentialquotient (f'(x)— /'(o))/(x — a) größer als Null ist. Da f'(a) — 0, gilt in dieser Umgebung f'(x) < 0, wenn χ — α < 0, also χ 0 für χ Φ 0 (und χ φ 2ηπ, η ganz). Dasselbe gilt nach dem Hilfssatz für f'(x). Also ist / echt monoton steigend, und da /(0) = 0 ist, ist j(x) < 0 für χ < 0 und f(x) > 0 für χ > 0. Der Vorzeichenverlauf der verschiedenen Ableitungen ist in Pig. 12 dargestellt.
fW-
is
f'(x)-
r
V 1
f"(x)
0
f"'(x)
1
i—
Ν¿
Fig. 12
16. Wendepunkte Sei oc derjenige Winkel, den die Tangente in einem Punkte des Graphen von / mit der positiven Richtung der X-Achse bildet (Fig. 13), dann gilt y' = /'(a) = tg 0 im Intervall (α, b), dann ist auch
ax
> 0, also ist 0 für χ > 3, f"(x) < 0 für χ < 0 und 0 < χ < 3, /"(0) = 0. Die Kurve ist konvex für χ > 3, konkav für χ < 3 und hat einen Wendepunkt an der Stelle x— 3. Obwohl /"(0) = 0 ist, hat die Kurve keinen Wendepunkt in χ = 0. Der Vorzeichenverlauf von /" und /' und der Graph von f sind in Fig. 16 dargestellt. z
V. Analysis — Differential-, Integralrechnung
126 17. Stammfunktionen
DEFINITION. Die Funktion F(x) ist Stammfunktion von f(x), wenn F'(x) = f(x). Ist z.B. f (x) = cos χ, dann ist F (χ) = sin a; eine Stammfunktion, da ja F'(x) = cos x. Ebenso ist sin χ + C für beliebiges reelles G eine Stammfunktion, da bei der Differentiation konstante Summanden verschwinden. In V, 13 wurde mit Hilfe des Mittelwertsatzes gezeigt, daß sich zwei Stammfunktionen einer Funktion nur um einen konstanten Summanden unterscheiden können. Hat f(x) eine Stammfunktion, dann ist diese nur bis auf eine additive Konstante bestimmt. In V, 20 wird gezeigt, daß jede stetige Funktion eine Stammfunktion hat. Für einige einfache Funktionen geben wir hier die Stammfunktionen an. /(*) = 1;
F(x) = C. χη+1 f(x) = *" (» ganz φ — 1); F (χ) = —— + C. η + 1 f(x) = sin χ;
F (χ) = — cos a ; + £7.
f(x) — cos χ; f{x) = cos -2 χ; f(x) — sin - 2 χ;
F (χ) = sin χ + C. F {χ) — tgx+C. F (χ) = — cotg χ + C.
Das Bestimmen einer Stammfunktion nennt man Integrieren. Manchmal nennt man eine Stammfunktion auch ein unbestimmtes Integral. 18. Einführung neuer Veränderlicher — Differentiale — Partielle Integration Bei der Berechnung der Stammfunktionen ineinandergesetzter Funktionen ist es oft angebracht, eine neue Veränderliche einzuführen. Ist F Stammfunktion der Funktion /, dann gilt
Ist χ eine differenzierbare Funktion φ(ί) von t, dann ist F eine ineinander gesetzte Funktion von t, und nach der Kettenregel gilt dF
dF
dx
dx
Sei Prx(f) eine Stammfunktion von f(x) und Prt(f) eine Stammfunktion bzgl. der Variablen t von f(x) mit χ = ç?(f), dann folgt aus (18; 1): F = Prx(f), dx\ „ „ l,dx\ und aus (18; 2): F = P r t ( / ~ l , also Prx(f) = PrAf ^
18. Einführung neuer Veränderlicher
127
Beispiel 1. f(x)= (2 χ + 3)a, gesucht ist F{x). dx LÖSUNG. Man setze 2a;+ 3 = t, dann ist x = \(t — 3) und-^- = f . Also F = Prx(2x + 3)» = Prt(t> · £) = + C = \(2x + 3)< + G. Wenn man in f(x) für χ die Substitution χ — φ{ί) vornimmt, so erhält man eine ineinandergesetzte Funktion des Parameters t. Wenn man diese nach dem Parameter ableitet — und zwar für alle derartigen Substitutionen — so erhält man das sogenannte Differential von f, abgekürzt d f . Das Differential ist keine Ableitung, aber nach Festlegung einer solchen Substitution hat es als Wert die Ableitung nach dem betreffenden Parameter. Aus (18; 2) lesen wir ab, daß die Ableitung von F nach dem Parameter t gleich ist f(x) mal der Ableitung von χ nach dem Parameter i. Da der Parameter t beliebig gewählt war, können wir das mit Differentialen schreiben als dF = f(x) dx.
(18; 3)
Nimmt man χ selbst als Parameter und führt man die Differentiation nach χ aus, dann erhält man dF/dx = f(x), da die Ableitung von χ nach χ Eins ist; also (18; 1). Aus den Differentiationsregeln von V, 8 lassen sich entsprechende Regeln für Differentiale gewinnen: d(u + v) = du + dv,
(18; 4)
d(u — v) — du — dv,
(18; 5)
d(cu) = cdu (c konstant),
(18; 6)
d(uv) = vdu + udv,
(18; 7)
udv
(18; 8)
Ist U eine Stammfunktion von u(x), also dU = udx, V eine Stammfunktion von v{x), also dV = vdx, und F eine Stammfunktion von u(x) + v{x), also dF = (u + v) dx, dann ist dF = (u + v) dx = udx + vdx = dü + dV = d{U + V), wobei wir (18; 4) benutzt haben. Für F gilt also F=U+V Das bedeutet:
+ c(c konstant).
Eine Stammfunktion einer Summe von zwei Funktionen ist die Summe zweier Stammfunktionen dieser Funktionen. Aus (18; 5) folgt analog: Eine Stammfunktion der Differenz zweier Funktionen ist gleich einer Differenz von Stammfunktionen dieser Funktionen.
128
V. Analysis — Differential-, Integralrechnung
Aus (18; 6) folgt: Multipliziert man eine Funktion mit einer Konstanten, dann erhält man eine Stammfunktion des Produktes, indem man eine Stammfunlction der ursprünglichen Funktion mit dieser Konstanten multipliziert. Aus (18; 7) folgt: udv = d(uv) — vdu. Sind u und ν Funktionen von x, dann kann man dafür auch schreiben: uv'dx = d(uv) —vu'dx. Ist nun F Stammfunktion von uv', also dF = uv'dx, und G Stammfunktion von vu', also dO = vu'dx, dann ist dF = d(uv) — dO, und ferner F = uv—
0.
Eine Stammfunktion von uv' ist also gleich der Differenz aus dem Produkt uv und einer Stammfunktion von vu'. Manchmal kann man eine Stammfunktion von vu' einfacher berechnen als eine Stammfunktion von uv'. Bei der Durchführung der Rechnung hat man, da v' gegeben ist, zunächst ν zu berechnen. Das erfordert eine Integration. Da man nicht sofort die ganze Funktion uv' integriert, sondern nur den Teil (Faktor) v', nennt man dieses Verfahren partidle Integration. Beispiels. /(*)= sin8¡r. Gesucht ist F(x). LÖSUNG. dF = sin8 xdx = sin2 χ · sin xdx. Nun ist sin xdx = — ¿(cob χ), und sin2 χ = 1 — cos2 x, also dF ' sin2 χ · sin xdx = — (1 — cos2 a;) á(cos χ) = (f2 — 1) dt = α, sind / und g integrierter über [α, ό] und gilt g(x) jg f(x) für alle χ aus [α, 6], dann gilt 0 á \b{g{x) — f(x)}dx Ja
= \Íg(x)dx Je
— \bf(x)dx, Ja
(vgl. V, 22)
woraus dann folgt (3)
£ / ( * ) dx g ^g{x)
dx, (f(x) á g(x), a < b).
22. Bestimmtes Integral und Stammfunktion Gewisse Eigenschaften des bestimmten Integrals folgen unmittelbar aus den entsprechenden Eigenschaften der Stammfunktionen. So gilt ζ. B . £/(*)
dx ±
dx =
± g(x)} dx.
B E W E I S . Ist F eine Stammfunktion von / und G eine Stammfunktion von g, dann gilt j6 f(x) dx
g(x)dx = F(b) — F{a) ± (0(6) — G(a)} = F(b) ± ö(6) -
{ * » ± G (α)}.
134
V. Analysis — Differential-, Integralrechnung
Da {J7 (χ) ± Ο (χ)} eine Stammfunktion von {f(x) ± g (a;)} ist, erhalten wir F(b) ± G(b) — {F(a) ± 0(a)) = £{/(*)
±
dx.
Entsprechend beweist man ^ cf(x)dx = c^ f(x) dx (c konstant). In V, 18 haben wir bewiesen, daß aus der Gleichung zwischen Differentialen uv'dx — d(uv) — vu'dx,
falls f(x) = uv', g(x) = vu' und u und ν Funktionen in χ sind, F = uv — θ
folgt; dabei ist F eine Stammfunktion von uv' und θ eine Stammfunktion von vu'. f i uv'dx ist der Zuwachs von F zwischen a und b, f* vu'dx der Zuwachs von G zwischen a und b, und daher ist F(b) — F (α) = u (6) ν (b) :—u{a) ν (a) — {G (δ) — G (α)},
also ^ uv'dx = [uv]ba — ^ vu'dx.
(22; 1)
In V, 18 haben wir gezeigt, daß ^ { ^ ( i ) } eine Stammfunktion von /{ç>(f)}-d(p¡dt ist, falls F(x) eine Stammfunktion von f(x) ist. Ist jedem χ des Integrationsintervalls [a, ò] genau ein t zugeordnet (m. a. W. ist die Funktion φ eindeutig), dann kann man auch t als Funktion von χ auffassen. Dieser Fall liegt ζ. B. dann vor, wenn φ eine echt monotone Funktion von t ist. Gilt nun φ(α^) = α und = b, dann erhalten wir das Ergebnis, daß das bestimmte Integral von / zwischen den Grenzen a und b gleich dem Integral von f{ 0 und /(6) < 0. Wir wollen diesen Satz nicht beweisen, aber zeigen, daß aus ihm ein anderer Satz unmittelbar folgt, den man häufig ebenso als Zwischenwertsatz bezeichnet. SATZ. f sei stetig im abgeschlossenen Intervall [α, 6], ferner sei f(a) = A, f(b) — Β und G liege in (A, B). Dann gibt es mindestens einen Punkt c aus (a, b), für den f(c) — G giU. BEWEIS. Wir nehmen Β > A an. Die Funktion (6) — Β — G > 0, φ (a) = A — G < 0. Nach dem Zwischenwertsatz gibt es also ein c aus (a, b), für das q>(c) = 0. Folglich ist f(c) — G = 0, d.h. /(c) = G. Anmerkung. Falls Β < Α, verläuft der Beweis entsprechend. Die Bedeutung des Zwischenwertsatzes liegt darin, daß eine stetige Funktion, die zwei Werte A und Β annimmt, auch alle dazwischenliegenden Werte annimmt. Der Wertebereich ist also ebenfalls ein Intervall, wenn der Definitionsbereich ein Intervall ist. 24. Die Logarithmusfunktion Wir kennen noch keine Stammfunktion der Funktion f(x) = aT 1 . Wir definieren nun den natürlichen Logarithmus In χ (logarithmue naturalis) als das unbestimmte Integral
Die Funktion In χ ist hierdurch für alle χ > 0 definiert.
136
V. Analysis — Differential-, Integralrechnung
1 di ist dann der Flächeninhalt der Figur Für x > \ ist Ina; > 0, denn ABQP in Fig. 20. Für 0 < χ < 1 ist In® < 0, denn /fr 1 «» = — und flucti ist der Flächeninhalt der Figur BAPQ in Fig. 21. Ferner ist lnl = 0 .
Fig. 21
Fig. 20
HAUPTEIGENSCHAFT. Ist a > 0 und b > 0, dann gilt (24; 1)
In (ab) = In α + In 6. BEWEIS.
In αδ = jfr1dt
= /;«-*«
+
fft^dt.
Nimmt man im letzten Integral die Substitution t = au vor, dann erhält man t~1dt = (au)~1d(au) = (au)~1adu = u~xdu. Für t = α ist u — 1, für t = ab ist u = b, also ab r» so daß
S
r1dt = \ α"1«*« = ln&, In (ab) = In a -f- In 6.
Durch wiederholte Anwendung dieser Haupteigenschaft erhält man η η In J7 «i = lnat ( a t > 0 ) , 1-1 t-i und daraus folgt In a n = » In α (α > 0, η ganz > 0). Falls ab = 1, also b = aerhalten
wir aus (24; 1), daß
l n l = 0 = In α + In α - 1 , also In— = — Ina. a
24. Die Logarithmusfunktion
137
Für z2 > x 1 > 0 folgt weiterhin aus (24; 1): In χ2 — In x1 = In — . xi Wegen — > 1 ist In— > 0, also ist In x2 > In xlt falls z2> xx> 0. x1 x1 Der natürliche Logarithmus ist aleo eine echt monoton steigende Funktion. Um herauszufinden, wie sich In χ für x-*-oo verhält, schließen wir χ zunächst in zwei aufeinanderfolgende Potenzen von 2 ein: 2" ^ ι g 2" +1 .
(24; 2)
Aus der rechten Ungleichung in (24; 2) folgt, daß η -*• oo, wenn χ -> oo. Aus der linken Ungleichung und aus der Monotonie von In χ folgt η In 2 ¿ Ina;, so daß In χ mit χ unbeschränkt wächst, d. h. lim In a; = oo. «-»•00
(24; 3)
Mittels der Substitution χ — i - 1 folgt aus (24; 3): lim In χ = lim In oo also lim Ina; = — oo. «JO Der Wertebereich von In χ ist demnach (— oo, oo). Da für t > 1 stets t~1 < 1 ist, gilt für χ > 1 : ^ f - 1 di < J dt = x — 1, also In χ < χ (χ £ 1), und es ist In χ < 1 (a;>l). χ Der Quotient In x/x ist also beschränkt. Aus der Beschränktheit folgt weiterhin 0
X
m
y « 7 ) = hm y-+C
y —
= lim β-Μ X '
C )
^
.
C
= limali.
°
v+cV
—
G
Also ist ... m
.
y · φ'(0
=
lim
—
C
,. ·^
χ — e — ~ r =
..
y—C
^
h — 7
.. ·11111
χ I
—c T
=
1
·
Der Übergang von y C zu χ c ist erlaubt, da χ = φ (y) stetig ist. Es ist üblich, die Umkehrfunktion (oder auch die Inverse) der Funktion y — f(x) nicht durch χ = φ (y), sondern — nach Umbenennung der Variablen — durch y = φ (χ) zu benennen. Da χ = φ (y) denselben Graphen hat wie y = f(x), findet man den Graphen von y = φ {χ) durch Spiegelung des Graphen von f(x) an der Geraden y — x. 26. Die^Exponentialfunktion
Die Funktion y = In χ ist für χ > 0 echt monoton steigend und differenzierbar, der Wertebereich ist (— 00, 00). Die Logarithmusfunktion hat also eine
140
V. Analysis — Differential-, Integralrechnung
Umkehrung, die für jede reelle Zahl definiert, ebenfalls echt monoton steigend und differenzierbar ist, und die nur positive Werte annimmt. Diese Punktion heißt Exponentialfunktion und wird dargestellt durch ;y - exp χ. Die Eigenschaften der Funktion y = exp χ folgen aus denen von y = In χ. HAUPTEIGENSCHAFT. exp α · exp b = exp (α + b).
(26; 1)
BEWEIS. Sei exp a — A und exp b = B, dann ist a — In A und b — in B. Nun i s t a + & = ln.4-f-l n -B = ln AB, also AB = exp (a + b), woraus die Behauptung folgt. Aus In 1 = 0 folgt 1 = exp 0 . Für b = — a erhält man aus (26; 1) exp a · exp (—a) = exp 0 = 1, also exp(— e ) = — J — . exp a
(26; 2)
Ferner folgt aus (26; 1) durch vollständige Induktion: η η exp Σ at = II exp β*, i =l
i-1
und im Spezialfall, wenn ak = a für alle k: exp na — (exp o) n (n ganz und positiv).
(26 ; 3)
Setzt man in (26; 3) na = b, dann folgt
(
b\n b exp — ) , also exp—=(exp6) 1 '". η] η
(26; 4)
Ist b eine natürliche Zahl m, dann bekommt man aus (26; 4) und (26; 3) vn = (exp m)1"1 = {(exp l) m } 1 / n = (exp l) m / B . exp —
(26; δ)
Aus In e = 1 folgt: e = exp 1, so daß man (26; 5) auch schreiben kann als τη _ exp — = e m/n . η Aus (26; 2) und (26; 5) folgt eX
p /_
\
η)
=
1
exp mjn
so daß exp ρ = ep
=
- 0 definieren wir die allgemeine durch
= exp (a In x)
xa
(oder allgemeine·
Potenzfunktion
Potenz)
> 0).
(x
Für die allgemeine Potenzfunktion gelten dieselben drei Potenzeigenschaften, die bereits für Potenzen mit rationalen Exponenten gelten, nämlich Xa · Xb = a b
(a; >
Xtt+b a0
(x )
= X
0),
(x>0),
= x\x% (Zj > 0, z 2 > 0 ) .
(x^)"
Als Beispiel für die Art der Beweisführung beweisen wir die letzte Eigenschaft. BEWEIS.
(x^n)" = exp {α In (x^)}
Die Ableitung von x
a
f ( x ) — xa
= exp (a In x1 + a In x2) = exp (a In x¡) · exp (a In x2)
= x\
•
.
findet man folgendermaßen:
— e x p (aIn
x);
f'(x) =
f(x) =
Xa;
e x p (aIn f'(x) =
x) ·— = χ α χ -
1
— • χ" χ
=
ax"
- 1
.
.
Für a > 0 ist a In χ eine echt monoton steigende Funktion von x, und dasselbe gilt für exp (a In x) = xa. Für a < 0 ist a In χ echt fallend und damit auch xa. Die allgemeine Exponentialfunktion ax (a > 0) wird wie folgt definiert: ax
= exp
(x
In α) (α > 0).
142
V. Analysis — Differential-, Integralrechnung
Die allgemeine Exponentialfunktion hat die Eigenschaften: a* · cP =
a**+t·,
(α*1)*· = α*1*·, (0,b>0).
Sie werden, ausgehend von der Definition, bewiesen unter Berücksichtigung der Eigenschaften der logarithmischen und der exponentiellen Funktion. Die Ableitung von ax berechnet man folgendermaßen: f(x) = ax = exp (x In a) ; f'(x) = {exp (x In o)} In a = ax In a. fix) = αχ; f'(x)
=axina.
Für a > l i s t l n a > 0 , und χ In a ist eine echt monoton steigende Funktion von x\ dasselbe gilt auch für exp (a: In α), d. h. ax. Für 0 < a < 1 erhält man entsprechend, daß ax eine echt monoton fallende Funktion ist. Um eine Funktion der Gestalt { f ( x ) } g ^ zu differenzieren, muß man von der Definition { m y ( s ) = exp {g(x) In /(*)}, (f(x) > 0). Gebrauch machen. Man kann die Ableitung von y = {/(«)}' ( χ ) auch folgendermaßen finden: In y =
In {/(*)}.
Differenziert man beide Seiten nach x, dann erhält man: ~y'
= g'(x)\n{f(x)}
+
'/'(*)>
Diese Methode nennt man logarithmischee Differenzieren. Beispiele für Differentiationen
(1) f(x) = Vx* — oa = (3» — o»)t; /' (*) = A (χ» — α8)"* · 2x = * J/¡r1 —o 1
.
(2) f(x) = (x + 3) 3 " ; f'(x) = 3 ω + (χ + 3) 2 · 3«* · In 3 = 3 " { 1 + (2χ + 6) In 3}. (3) / ( * ) = ** = βχρ(χΐηζ); /'(*) = exp (zln*) (in* +
= «»(1 + Ina;).
28. Einige logarithmische und exponentielle Limiten (I)
lim i l ü f l ! . _ o (p und a konstant, a > 0.
(28; 1)
143
28. Einige logarithmische und exponentielle Limiten
BEWEIS. Die Zahl ρ haben wir keinerlei einschränkenden Voraussetzungen unterworfen. Für ρ ^ 0 ist der Zähler beschränkt, und lim x" = oo, so daß «->•00
in diesem Fall die Behauptung trivial ist. Für ρ > 0 gilt (Ina;)* Xa
Setzt man x"¡p = y,
/ In ¡e\p _ /lna;\P
(/ pΡ
\xflP/
\ä
~
lI nnX°Ip\p x^y )
_
(fp\P p\P
~[~ä)
'P ({InIn xaapi* \
x*l*
Γ J
'
dann geht y -*• oo, wenn χ -»· oo, also ist
(Π) Setzen wir in (28; 1) lnx = y, dann folgt, da y
oo, wenn χ -»· oo:
lim — = 0 v(o > 0). pay ' Setzen wir weiterhin ea = b, dann ist b > 1, da a > 0 ist, also yP
lim - — = 0 (p und b konstant, b > 1), oder in gebräuchlicherer Form χ*
lim — = 0 (® und a konstant, a > 1). s-*® a * (ΠΙ)
lim^ll±^=l. h A-*oo
BEWEIS. Dieser Grenzwert ist nichts anderes als die Ableitung von In χ an der Stelle χ = 1. Denn per definitionem ist /'(l) =
lim/(l
A->0
+ *
fe)-/(D=Iimln(l+ft)-lnl= A->0 ^
^ > d + λ) h-*0 ^
und f(i) = (IV)
I = i .
lim (1 +A)1/A = e. A-to
BEWEIS.
(28; 2)
lim In (l+A) 1/ft = lim * * ( 1 + k ) = 1 • Α-K) A-+0 * Da In χ eine stetige Funktion von χ ist, folgt hieraus unter Anwendung von (11; 1):
lim In (1 + Ä)1/A = ln{lim(l + Α)1'*} = 1 = l n e , A->0
A-»0
und daraus folgt (28; 2) wegen der Monotonie von In x.
144
V. Analysis — Differential-, Integralrechnung
Für h = — geht (28; 2) über in ν lim i l + - V = lim ( l + —V = e.
\
v)
ν)
Im Gegensatz zu unserer Herleitung definiert man manchmal die Zahl e als folgenden Grenzwert: lim ( 1 Η
η->oo \
n)
— = e {η ganz, > 0).
29. Die allgemeine Logarithmusfunktion Die allgemeine Exponentialfunktion f(x) = ax (a > 0) ist für alle χ definiert, differenzierbar für alle x, echt monoton steigend, falls a > 1, echt monoton fallend, falls a < 1, und der Wertebereich ist die Menge (0, oo). Diese Funktion hat eine Umkehrfunktion die allgemeine Logarithmuefunktion "loga;, welche für χ > 0 definiert ist. Sie ist differenzierbar für χ > 0, echt monoton steigend, falls a > 1, und echt monoton fallend, falls 0 < a < 1. Aus y = ax folgt χ = ®log y (a > 0, α Φ 1). Wegen y = exp (χ In α) ist χ In α = In y, so daß "log y =
( « > 0 , α φ 1).
Für a = e ist 111 x «1 log χ = -r = 1In χ ι . In e In χ 1 Ist/(a;) = "log χ = , dann ist f'{x) = — . In α χ In a
Insbesondere gilt für a = 10: =
(29;1)
Natürliche Logarithmen (auch Nepersche Logarithmen genannt) werden mit Hilfe von unendlichen Beihen berechnet. Aus (29; 1) berechnet man dann die gewöhnlichen (Briggschen) Logarithmen. Den Faktor 1/ln 10 nennt man den Modul M des Briggschen Systems. ^ÏFÏÏÏ*0'4343· Für die Umrechnung von gewöhnlichen Logarithmen in natürliche gilt nach (29; 1) In χ = In 10 · 10log χ « 2,303 10log x. 1
In spateren Kapiteln dieses Baches wird oft log χ an Stelle von In χ geschrieben.
30. Die zyklometrisohen Funktionen
145
30. Die zyklometrisohen Funktionen Die Punktion sin a; steigt echt monoton in dem Intervall [ — \ π , \ π]; der Wertebereich ist [ — 1 , 1 ] . Die Funktion tg χ steigt echt monoton in dem Intervall ( — \ π, | π), Wertebereich ist (—oo, oo). Die Punktion cos» fällt echt monoton im Intervall [0, π], der Wertebereich ist [— 1 , 1 ] . Cotg χ fällt echt monoton im Intervall (0, π), Wertebereich ist (— oo, oo). Diese Punktionen besitzen Umkehrfunktionen, die arcus sinus (aresin), bzw. arcus tangens (arctg), arcus cosinus (arccos), arcus cotangens (arccotg) genannt werden. Nach obigen Ausführungen gilt für diese Punktionen: Definitionsbereich
Wertebereich
[ - 1 , i] (— oo, oo)
[— £π] (—\π, \π) [0, π] (0, π)
aresin χ arctg χ arccos χ arccotg χ
[ - 1 , 1] (— oo, oo)
Wir wollen hier noch einige spezielle Werte angeben: aresin (— 1) = — lim arctg χ = — \π, «-+—0O
aresin 0 = 0, aresin 1 = arctg 0 = 0, lim arctg χ = ®->00
arccos (— 1) = π, arccos 0 = \π, lim arccotg χ = π, arccotg 0 = »-•—oo
\π\
arccos 1 = 0 ; lim arccotg χ = 0. £->oo
In Pig. 25 sind die Graphen der zyklometrischen Funktionen dargestellt. Man erhält sie, indem man die Graphen der entsprechenden trigonometrischen Funktionen an der Geraden y = χ spiegelt. Die Eigenschaften der zyklometrischen Punktionen lassen sich leicht aus denen der trigonometrischen Funktionen herleiten. Setzt man sin (—«) = — s i n v.
Den Beweis dieser Formel führt man durch vollständige Induktion. Definiert man D (0) u = u und Ζ)*0)ν = ν, dann kann man die Formel abgekürzt in der Form schreiben: uv) = J (ΐ)ΰ ( - 1) «Ζ) (1) ΐ). »-o 10·
V. Analysis — Differential-, Integralrechnung
148
Wir wenden diese Formel an auf y = arctg x, y' = (1 + a;2)"1, also y'(l + x2) = 1. Die linke Seite der letzten Gleichung ist ein Produkt zweier Funktionen. Um 2/(n) zu finden, bestimmen wir die (ra — l)-te Ableitung des Produktes y'( 1 + x2). Auf Grund der Regel von Leibniz erhalten wir 0;
B)a>0, gdt. LÖSUNG.
Γ t-1dt= lim Γ* t^dt + lim Γ t^dt = lim In | ζ | — lim In | y |. »t o J—1 «to vio
J- 1
Die rechte Seite hat keinen Grenzwert, wenn χ und y unabhängig voneinander gegen 0 gehen. Das Integral ist also divergent.
Anmerkung. Hätten wir im letzten Beispiel χ = — y gewählt, dann hätten wir das Ergebnis 0 gehabt. Gelegentlich führt man diese Einschränkung für χ und y durch und nennt dann das gefundene Resultat den Hauptwert des divergenten Integrals. 11 Kuipera-Timman, Mathematik
162
Y. Analysis — Funktionen von zwei Veränderlichen
Funktionen von zwei Veränderlichen Partielle Differentiation 38. Der FunktionsbegrifT In den Abschnitten V, 1 bis V, 37 haben wir uns mit Funktionen von einer Veränderlichen beschäftigt. In den meisten Anwendungen aber begegnet man Funktionen von mehreren Veränderlichen. Wir definieren eine Funktion von zwei Veränderlichen in analoger Weise wie eine Funktion von einer Veränderlichen. DEFINITION. Eine (reelle) Funktion von zwei (redien) Veränderlichen ist eine Vorschrift, die jedem Element einer Menge von (reellen) Zahlenpaaren (χ, y) genau ein Element ζ einer Menge vcm (reellen) Zahlen zuordnet. Als Symbol für eine Funktion wählt man häufig die Buchstaben /, F, φ usw. Oft benutzt man auch die Ausdrücke f(x,y), F(x,y), φ (χ, y) als Bezeichnungen für eine Funktion. Historisch bedingt sind die Namen unabhängige Veränderliche für χ und y, bzw. abhängige Veränderliche für z. Die Menge der Paare (x, y), denen durch die Funktion ein Element ζ zugeordnet wird, heißt Definitionsbereich, die Menge der als Funktionswerte auftretenden Zahlen ζ Wertebereich der Funktion. Sieht man das Zahlenpaar (x, y) als Punkt in einer Koordinatenebene mit den rechtwinkligen Koordinaten χ und y an, dann stellt die Menge {(a;, y)} eine Punktmenge in dieser Ebene dar. Wir werden daher häufig statt Zahlenpaar das Wort Punkt benutzen. Betrachtet man in der Ebene einen Kreis oder ein Rechteck, dann spricht man, je nachdem ob man die Punkte des Randes mit zur Menge zählt oder nicht, von einem abgeschlossenen bzw. offenen Kreis bzw. Rechteck. Eine beliebige Punktmenge in der Ebene wird offen genannt, wenn man jeden Punkt der Menge als Mittelpunkt einer offenen Kreisscheibe ansehen kann, die noch ganz zu der betreffenden Punktmenge gehört. Unter einem Gebiet wollen wir, wenn nicht ausdrücklich etwas anderes festgelegt wird, eine offene Punktmenge verstehen. Eine einfache Vorstellung von einer Funktion ζ = f(x, y) erhält man in einem räumlichen rechtwinkligen Koordinatensystem Oxyz, wenn man die Menge aller Punkte P(x, y, z) betrachtet, für die ζ = f(x,y), wobei (x, y) aus dem Definitionsbereich der Funktion stammt. In vielen Fällen bildet diese Punktmenge eine Fläche, die man die Bildflâche der Funktion / nennt. Beispiel. 0(x, y) sei ein Rechteck mit Rand, definiert durch 0 g x g 1, Die Funktion sei gegeben durch die Vorschrift z — a? + y 2 . Wertebereich ist dann das Intervall [0, 5]. Die Bildfläche dieser Funktion ist in Fig. 27 dargestellt.
163
39. Der Grenzwertbegriff
Häufig verzichtet man darauf, bei der Angabe einer Funktion auch das Definitionsgebiet zu nennen. Man unterstellt dann, daß letzteres alle Punkte enthält, für die die Funktionsvorschrift sinnvoll ist. Beispiel. f(x,y) = /¡r* + y2— 1 + In (4 — 3? — y1). Die rechte Seite ergibt nur dann einen reellen Wert, wenn a? + ys — 1 ^ 0 und 4 — 3? — yi ^ 0 , Der Definitionsbereich von / ist also der Bing zwischen den Kreisrändern a? + y2 = 1 und 3? + y2 = 4. Der innere Band gehört mit zum Definitionebereich, der äußere nicht. (Vgl. Fig. 28)
39. Der Grenzwertbegriff DEFINITION. Eine Umgebung Gebiet, das (x0, y0) enthält.
eines Punktes (x0, yQ) ist ein offenes
Das Innere eines Kreises vom Radius ε und Mittelpunkt {x0, y0) nennt man ε-Umgebung von (x 0 , y0). Manchmal benutzt man als ε-Umgebung auch das Innere eines Quadrates mit der Seitenlänge 2 ε und (x0, y0) als Mittelpunkt, wobei die Seiten des Quadrats parallel zu den Koordinatenachsen sind. Nimmt man aus einer Umgebung den Punkt (x 0 , y0) heraus, dann spricht man von einer punktierten Umgebung Ω'^^ von (x0, y0). DEFINITION I. Eine Funktion z = f{x,y) hat an der Stelle {x0, y0) den Grenzwert (oder Limes) L, wenn es zu jeder Umgebung Ωί von L eine punktierte Umgebung Ω'χ Vx von (xQ, y0) gibt, so daß f(x, y) zu Ωζ gehört, wenn (x, y) in Bezeichnung : lim
f(x> y) = L oder f(x, y)
L für (x, y)
(x0, y0).
L braucht nicht gleich f(x0, y0) zu sein, f(x0, y0) braucht noch nicht einmal definiert zu sein.
Y. Analysis — Funktionen von zwei Veränderlichen
164
Ωχ, ist ein Intervall (L — ε, L + ε), wobei e irgendeine positive Zahl ist. Liegt f(x, y) in Ωι, dann ist also | f(x, y) — L \ < ε. Nehmen wir als die Quadratumgebung von (%0, y0) mit Seiten der Länge 2 Vo) oy0 von f(x, y) nach y: ( / Λ
= um /(*o. ν . + * ) - / ( * . . y . ) . k-*0 *
partielle Ableitung
166
V. Analysis — Funktionen von zwei Veränderlichen
Die Berechnung solcher Ableitungen nennt man partielle Differentiation. In df 3f der Bezeichnung
oder
benutzt man das runde 3 an Stelle des gewöhn-
lichen d, um anzudeuten, daß man es mit einer Funktion von zwei Veränderlichen zu tun hat und daß man nach einer dieser Veränderlichen differenziert, während man die andere festläßt. Die partiellen Ableitungen fx(x, y) und fy(x,y) als Funktionen von χ und y auffassen. Beispiel.
kann man ihrerseits wieder
* = (* + l ) » ; zx = y[x + l ) " - 1 ; z f = ( « + l ) » l n ( * + 1). U m zeigen zu können, was die partiellen Ableitungen geometrisch bedeuten, setzen wir voraus, daß in jedem Punkte eines Gebietes G der (x, y)-Ebene die partiellen Ableitungen existieren. !z Die graphische Darstellung der Funktion ζ — f(x, y) ist die Fläche 8, die in Fig. 29 skizziert ist. Iet-á^a^, y0, 0) ein Punkt von G und z0 = f(x0, y0), dann ist Α (x 0 , y0, z0) ein Punkt von 8. Um fx(xo> Vo) z u finden, müssen wir y = y0 = konstant setzen. Die Gleichungen z = f(x, y0) und y = y0 stellen die Kurve K1 dar, die als Schnittfigur der Bildfläche mit der Ebene y = y0 entsteht. Die partielle Ableitung fx(x0, y0) stellt also den Tangens desjenigen Winkels « x dar, der von der Tangente an K 1 in A mit der ßichtung der positiven ¡r-Achse gebildet wird. Ebenso schneidet die Ebene χ = x0 die Fläche 8 in einer Kurve K2 mit den Gleichungen 2 = /(«o> y)> x = xo· H i e r güt dann fy{xa, y0) = tg a 2 . 42. Partielle Ableitungen zweiter O r d n u n g Existieren an einer Stelle (x 0 , y0) die partiellen Ableitungen fx und fy einer Funktion /, dann lassen sich diese gelegentlich wiederum nach χ und y differenzieren. Die Ableitungen von fx nach χ und y an der Stelle (a;0, y0) bezeichnet 32/ man durch fxx(x0, y0) oder durch bzw. durch fxy{x0, yQ) oder durch ox¡¡ 32/ S2f gXoSyo ' ^ v o n U n a c l 1 » und i/ mit fyx{x0, y0) oder 3 3 . bzw. fyy{x0, y0) a°2/ oder 3yl
43. Ineinandergesetzte Funktionen — Totales Differential
167
Diese vier Zahlen nennt man die partiellen, Ableitungen zweiter Ordnung von f(x, y) an der Stelle (as 0 , y0), oder kurz die zweiten partiellen Ableitungen von f(x,y) in (x0, y0). Entsprechend definiert man die partiellen Ableitungen dritter und höherer Ordnung. Es gibt, wie man leicht einsieht, 2" Ableitungen der n-ten Ordnung. Beispiel 1. f(x,y)= 6 ^ + 7 ^ — 4 ^ + 8y*; fx= 18^ +14a*/—V;/¡r= 7^—8^ + 24^; / x x = 36a: + 14y; /x„ = 14® —8y, /„x = Ux — 8y; fyy = — 8z + 48y. Beispiel 2. j(x,y) = e~ix cos 2y\fx = —3e-81 cos2y; /„ = —2e"aisiii2y; fxx = 9e~M oos2y, fxy = 6e~9x sin 2y; fyx = 6e- M ein2y; fyy= —4e"»* cos 2y. In diesen Beispielen ist stets f^ — fyx. Das ist eine Folgerung aus dem folgenden Satz, den wir nicht beweisen wollen. Sata. Wenn in einem, Gebiet G die partiellen Ableitungen erster und zweiter Ordnung einer Funktion f existieren und wenn die 2. Ableitungen in einem Punkte (x0, y0) stetig sind, dann gilt in diesem, Punkt íxt = fyx· Eine Folge dieses Satzes ist, daß die Anzahl paarweise verschiedener Ableitungen zweiter und höherer Ordnung im allgemeinen bedeutend kleiner als die oben angegebene ist. Wenn wir annehmen, daß alle partiellen Ableitungen, die wir bilden, in dem betrachteten Punkt stetig sind und wir den oben genannten Satz auf die Funktionen fx, fy und fxy anwenden, dann erhalten wir: txxy = fxyx ~ fyxx > fxyy ~ fyxy fyyx> fxxyy /xyxy fxyyx /yxxy /yxyx fyyxx' So kann man allgemein zeigen: die Reihenfolge der Differentiationen einer Funktion zweier Veränderlichen ist bdiébig, wenn die betreffenden Ableitungen stetig sind. 43. Ineinandergesetzte Funktionen — Totales Differential χ = x(t) und y = y(t) seien zwei über einem í-Intervall I definierte Funktionen. Die Menge aller Punkte mit den Koordinaten (x(t), y(t)) bildet im allgemeinen eine Kurve in der (χ, í/)-Ebene. f(x, y) sei nun über einem Gebiet G definiert, das diese Kurve enthält, dann nennt man f{x(t), y(t)} = 95(f) eine ineinandergesetzte Funktion über 1. Hier gilt der entsprechende Satz über Stetigkeit einer ineinandergesetzten Funktion wie bei einer Veränderlichen. Wenn χ und y in I stetig sind und / (x, y) in G, dann ist auch
so daß (43; 1) übergeht in +
+
+ t u · * . * - ' * - *
Wenn At -*• 0, dann geht auch Ax Stetigkeit von /„ in (a;, y) —
(43;2)
0 und Ay -> 0 , während — wegen der
fy{x + Ax,y + eAy)-y fy(x, y) und nach Definition von fx f{(x +
Ax,y)—f(x,y)}
Ax
—/.(*.»)·
(43 ; 2) geht dann über in IT-/.tefi IT+ oder, anders geschrieben
d^__dz_dx^ di dx dt
/.(*.*>£. 3z dy_ dy dt '
Beispiel, ζ = sin (z2 + ya), wobei χ = In f, y = e1. Man bestimme at
(
„. ' '
44. Einführung neuer Veränderlicher
169
LÖSUNG.
£
- 2 , cos (rf +
*
Λ >
2 , cos
+
* - j ,
* =
Λ
Also ist wegen (43; 3)
dz
1 = 2» cos (3? + y») · T + 2y cos (x2 + y2) · e( 2 In t cos (In2 ί + e2tΛ)
=
+ 2e2í cos (lna < + e21
+ 2e2ij cos (In2 f + e2i).
Wir können (43; 3) auch in folgender Form schreiben:
dz
=idx+%dy>
(43;4)
darin sind dz, dx und dy die in V, 18 definierten Differentiale. Man nennt dz das totale Differential der Funktion ζ = f(x,y). Für den Gebrauch dieser Differentiale gelten die Standardformeln d{x + y) = dx + dy, d(xy) = xdy + ^l'a;^ V!
wie man leicht zeigen kann.
ydx,
ydx — xdy y%
44. Einführung neuer Veränderlicher Sei ζ = f(x,y). Wir führen u und ν als neue Veränderliche ein, bestimmt durch die Funktionen χ = x(u, v), y — y{u,v). f{x(u, v), y(u, «)} ist dann eine (ebenfalls ineinandergesetzte) Funktion in u und v. Nach (43 ; 4) ist dz = Andererseits ist
du
dz = ^dx wobei
du + +
dv.
(44; 1)
^dy,
(44; 2)
dv
dx dx dx — — du + dv, du dv *
dy
(44; 3)
dv
Setzt man die Ausdrücke für dx und dy aus (44; 3) in (44; 2) ein, dann folgt dz — I + du + + dv \dx du dy du) \dx dv dy dv)
(44; 4)
170
V . Analysis — Funktionen von zwei Veränderlichen
(44; 4) muß mit (44; 1) identisch sein. Also ist
Beispiel.
dz _
dz
dx
.dz
dy
du
dx
du
dy
dz _
dz
dx
dz
dy
dv
dx
dv
dy
dv '
du'
ist gegeben. Es werden Polarkoordinaten eingeführt durch
F(x,y)
dF
dF
οφ
dr
die Gleichungen : χ = r cos φ, y = r sin φ. Man drücke -χ— und -5— aus durch
„
BF _ BF LÖSUNG. Βφ Bx BF Br
~
Bx Βφ
BF
Bx
Bx
Br
dF
+
BF
+
BF
8y
BF
II
dF
Bx
8y
, . . . BF . . ( - r sin φ) + - j g . (r cos φ) = , BF . Bx cos φ + -g^-sin φ
Sy Br
Oy
-
BF
=
x
y
BF
+ «
y
8 F
yofi + y2
BF
Sx
γα?
+
.
8 F
yi
·
By
Man kann derartige Aufgaben auch mit Hilfe von Differentialen lösen.
Anmerkung.
dF —
dx + -4t- dy, dx= oy
Bx
— r sin φ dm + cos φ dr ;
cos Vo + k ) = f(xo> 2/o) + hfx(x0 + Bh, y0 + Bk) + kfy(x0+6h,y0+Bk).
Vo)
k
· iy
(47; 2)
Das ist der Mittelwertsatz für eine Funktion von zwei Veränderlichen. Anmerkung. Da der Punkt (a;0 + Bh, y0 + Bk), (0 < θ < 1), einen Punkt (ξ, η) der Verbindungsgeraden der Punkte (x 0 , y0) und [x0 + h, yQ + k) darstellt (vgl. Fig. 30), kann man (47; 2) auch schreiben als: f(xQ + h,y0 + k) = f(x0, y0)
+
Ä/e(f,
η) + kfv(¡,
η).
48. Hinreichende Bedingungen fur lokale Extrema von Funktionen zweier Veränderlicher Wir setzen voraus, daß (x0, y0) ein stationärer Punkt von / ist, daß also fx(x0, y0) = fy{x0, ya) = 0. Ferner sollen die zweiten partiellen Ableitungen von / existieren und stetig sein. Nach der Taylorformel erhalten wir dann: /(*ο + Μ ο + * ) - / ( * ο . Vo) = M ^ U f . r¡) + 2A*/„(f. η) + dabei ist ξ = x0 + Bh, η = y0 + Bk und 0 < θ < 1.
V)}.
(48; 1)
174
V. Analysis — Funktionen von zwei Veränderlichen
Offensichtlich hat / ein lokales Extremum in (x0, y0), wenn die linke Seite von (48; 1) für hinreichend kleine h und k entweder stets positiv oder stets negativ ist, und es liegt kein Extremum vor, wenn man in jeder noch so kleinen Umgebimg von (0,0) Werte für h und k finden kann, für die (48; 1) verschiedene Vorzeichen aufweist. Wir haben also das Verhalten der rechten Seite zu untersuchen, einer Funktion in h und k: V(h, k) = *'/«{£(*. k), V(h, k)} + 2hkfxy{Hh,
k), V(h, k)}
+ *>%ν{ξ(ύ, k), η (à, k)}. Es genügt jedoch, das Verhalten der folgenden Funktion zu untersuchen: W(h, k) = h2fxx(x0, yQ) + 2hkfxy{x0, y0) + k2fyy(x0, y0), denn da die zweiten partiellen Ableitungen von / stetig sind, kann man zeigen > daß V(h, k) in (0,0) dann ein lokales Maximum (Minimum) hat, wenn W(h, k) in (0, 0) ein lokales Maximum (Minimum) hat. Wir setzen zur Abkürzung a
= fxx(xo> Vo), b = fxy(xa> Vo) und c = fyy(x0, y0), und schreiben die quadratische Funktion W(h, k) — ah2 + 2bhk der Form
ck2 in
Wir sehen, daß W(h, k) für (h, k) Φ (0,0) Werte konstanten Vorzeichens annimmt (d. h. définit ist), wenn die Diskriminante Δ = ac — b2 > 0 ist. Die Funktion ist positiv définit, wenn a > 0, und negativ définit, wenn a < 0 ist. Im ersten Fall hat / in (a;0, y0) ein Minimum, im zweiten Fall ein Maximum. Wie man leicht einsieht, ändert die quadratische Funktion ihr Vorzeichen, wenn Δ < 0 ist. Man nennt sie dann indefinit. In diesem Fall hat / kein Extremum in (x0> y0). Ist ¿ 1 = 0 , die quadratische Funktion also semidefinit, dann ist zwar W{h, k) entweder nicht negativ oder nicht positiv, aber man kann keine Schlüsse für F(A, k) ziehen. ZUSAMMENFASSUNG. Hat f(x, y) stetige partielle zweite Ableitungen an der Stelle {x0, y0), dann ist /xK. Vo) = °> fy(xo> Vo) = 0 eine notwendige Bedingung für die Existenz eines lokalen Extremums in (xQ, y0). Ist a = fxx(x0,y0), b — fxy(x0,y0) und c = fuy(x0,y0), dann ist Δ =ac—b2>0 eine hinreichende Bedingung dafür, daß f (x0, y0) ein lokales Extremum ist, und zwar liegt ein Maximum vor, wenn a < 0 (also c < 0), und ein Minimum, wenn a > 0 {also c > 0). Ist Δ = 0, dann kann man nichts schließen. Manchmal ist es in diesem Fall möglich, durch einfache elementare Überlegungen zu einer Entscheidung über das Verhalten von f(x, y) in der Umgebung von (a;0, y0) zu gelangen.
175
48. Bedingungen für lokale Extrema Beispiel. Man bestimme die Extrema der Funktion 2 = f(x,y)= LÖSUNG.
xt — 2x?y + y1.
fx - 6 a:5 — 4 xy,
= — 2a? + 2 y.
Stationäre Punkte bestimmt man aus
{
6a;5 — éxy= 0, — 2a? + 2 y = 0.
(48; 2)
Aus (48; 2) erhält man die Punkte (0,0), ( j / e i f ) , ( — D i e Funktionswerte sind 0, — — fxx = 3 0 a ; 4 - 4 y , fxy=
-4z,
entsprechenden
/ „ „ = 2.
In (0, 0) ist a = 0, 6 = 0, c = 2, so daß Δ= ac — δ = 0. Für die übrigen Punkte ist α=ψ, b= ψ i ]Í6, e = 2, so daß > 0, und die Funktion besitzt an diesen Stellen ein relatives Minimum. Zur Untersuchung des Punktes (0,0) schneiden wir die Bildfläche von / mit der durch (0,0,0) gehenden Ebene y = mx und untersuchen die Schnittkurven ζ = φ (χ) = χ? — 2mz* + m2a?, y = mx. φ (χ) = 6a;5 — ömz2 + 2m?x, φ"(χ) = 30a:4 — 12wa; + 2m2. Für * = 0 ist φ'(χ) = 0, während φ"(0) = 2m2 > 0 für m ^ O . Für jedes τη,φΟ hat also 0 ist, kann die Funktion also kein Extremum an der Stelle (0,0) haben.
χ
Fig. 31
V. Analysis — Mehrfaohe Integrale
176
Zur Verdeutlichung ist in Fig. 31 der Durchschnitt der Bildfläche von / mit der Niveauebene ζ = O gezeichnet. Die Schnittkurve ist bestimmt durch die Gleichung s· — 2a¡*y + y» = 0. (48; 3) Löst man (48; 3) nach y auf, dann erhält man: y — a? ± Κ«1 — x\ und daraus erhält man leicht den Verlauf der Kurve. Wir wissen schon, daß auf der Parabel y = x? f(x, y) < 0 ist für \ x\ < 1 . Also ist im ganzen Innern der in Fig. 31 skizzierten Kurve die Funktion negativ. Außerhalb der Kurve ist ζ > 0. In dem durch die Kurve begrenzten abgeschlossenen Gebiet hat die Funktion ein absolutes Minimum. Also ist ζ = — angenommen m den Punkten (± $ Ϋ&, §), nicht nur ein lokales, sondern auch ein absolutes Minimum. Die in Fig. 31 skizzierte Kurve berührt die »-Achse in 0 und liegt sonst ganz oberhalb der «-Achse. Die beiden durch 0 gehenden Zweige haben in 0 eine horizontale Tangente. Daher nähert man sich längs einer Geraden y = mx dem Nullpunkt stets vom positiven Wertebereich der Funktion her.
Mehrfache Integrale 49. Inhaltsbegriff — Integral In V, 19 ist der Inhalt ebener Figuren als bestimmtes Integral definiert worden. Wir wollen diesen Inhaltsbegriff jetzt erweitern zu einem Inhaltsund Oberflächenbegriff für räumliche Figuren. Wir setzen voraus, daß f(x, y) ^ 0 und beschränkt in dem (rechteckigen) Gebiet ist. Wir wollen nun den Inhalt desjenigen Raumteils definieren, der durch die Bildfläche von /, die (x, y)Ebene und die vier Ebenen: x = a, χ = b, y = c und y = d begrenzt wird (vgl. Fig. 32). Dazu teilen wir R durch Parallelen zu den Seiten in η kleinere Rechtecke Rl,..., Rn Fig. 32 auf, deren Flächeninhalte jeweils ΔRx,..., AR„ sind. Über Ri sei m { das Infimum und Mi das Supremum der Funktion /. Das Produkt m i AR i ist der Inhalt des Prismas mit Grundseite Rv das ganz in dem betrachteten Raumteil liegt; das Prisma mit Grundfläche R{, Höhe Mi und Inhalt MiARi umfaßt diesen Teil. Die Summe §
=
Σ m ¡AR,
50. Eigenschaften der Integrale
nennt man Untersumme sprechend heißt
177
bzgl. der gewählten Teilung von § =
¿ M
»=1
i
A B
Β
in
η
Teile. Ent-
i
bzgl. der gewählten Teilung. Ist M eine obere Schranke von f(x, y) über B, dann ist Obersumme
s ^ Μ Σ ΔR t = M · Fläche (Β). »=ι Die Menge {β} aller Untersummen bzgl. beliebiger Teilungen von R ist also nach oben beschränkt. Sie hat also eine kleinste obere Schranke, die Unterintegral l genannt wird: l = sup{s}. Ähnlich sieht man ein, daß die Menge der Obersummen {«} eine größte untere Schranke hat, das Oberintegral I: I =
ini
{§}.
Im allgemeinen werden / und 1 verschieden sein. Unter gewissen Voraussetzungen für f(x, y) ist aber 1 = 1. Die Funktion / heißt dann riemannsch integrierbar, oder kurz integrierbar. Ist 1 =
1 = 1 ,
dann stellt I das Riemann-Integral von / über Β dar. In diesem Fall definieren wir als Inhalt des betrachteten Raumteils dieses Integral. Man kann beweisen, daß die Funktion / über Β integrierbar ist, wenn sie über Β stetig ist. Wenn nicht ausdrücklich etwas anderes gesagt wird, setzen wir im folgenden voraus, daß / stetig ist. Das Integral von / über Β stellen wir dar durch
Hierin nennt man
f ( x , y)
den
Integranden,
dB
das
Flächenelement
und
Β
das
Integratiomgebiet.
50. Eigenschaften der Integrale In V, 49 haben wir vorausgesetzt, daß f ( x , y ) è 0 über B . Man kann aber dieselben Definitionen bringen, wenn f(x, y) über Β gelegentlich das Vorzeichen ändert. Das Integral kann dann aber nicht als Inhalt aufgefaßt werden. Wir wollen hier einige Eigenschaften nennen, die entweder unmittelbar aus den Definitionen folgen oder die ohne Mühe hergeleitet werden können. 12 Kulpeis-Timman, Mathematik
178
V. Analysis — Mehrfache Integrale
(1) Ist Β die Vereinigung zweier Rechtecke ¿2Χ und B2 und ist / stetig in B, dann gilt: f f f(x,y)dB JJ R
= [\ /(s, y) ¿Ä + f f f(x, y) dB. JJB, JJü,
(2) Stellen m und M Tnfimum bzw. Supremum von / über Β dar, dann gilt: m • Fläche (Ä) á (3) (4) (5)
f(x, y) dB ^ M- Fläche (B).
y) + g{x, y)} dB =
y) dB + j ^g(x, y) dB.
J ^ cf(x, y) dB = c · j j /(x, y) dB (c ist eine Konstante). J ^¿(x, y) dB g
y) dB (/(», y) í 9(ζ, y)).
51. Iterierte Integrale mit konstanten Grenzen Es ist im allgemeinen sehr unpraktisch, bei der Berechnung eines mehrfachen Integrals von der Definition auszugehen. In vielen Fällen gibt es bequemere Wege. So kann man zeigen, daß man das Integral einer stetigen Funktion über einem Rechteck Β : a ^ χ g 6, c ^ y ¿ d auch als iteriertes Integral schreiben kann: da;}dy· 1 L>y)dxdy,
52.
Krummlinig
179
begrenztes Integrationsgebiet
dabei stimmt die Reihenfolge der Integrationsgrenzen überein mit der Reihenfolge der Integrationsvariablen. Beispiel. Man berechne sin (x + y)esln» dy.
I=^dx
LÖSUNG. Das Integral auf der rechten Seite ist nicht so einfach zu berechnen. Wir ändern daher die Reihenfolge der Integrationen (stetiger Integrand !) und versuchen zu berechnen : I=\
fi"
f»
dy l sin (χ + y)ei n » dx.
Nun ist sin(x + y)ePlnV dx = e810" l ein(x + y)dx = — e'M cos (x + y) / " * = 2e»ln» cosy, Jo Jo / a=0 so daB
J = 2 j*" cos y e"!·»» dy = 2e»»n»
= 2 (e — 1).
52. Krummlinig begrenztes Integrationsgebiet Im allgemeinen wird das Integrationsgebiet 0 kein Rechteck, sondern ein krummlinig begrenztes Gebiet sein. In vielen Fällen kann man dann durch Aufteilung von G in Teilgebiete Gi ähnlich wie in V. 49 auch hier das Integral einer Funktion / definieren. Wir wollen hier nur beschränkte konvexe Gebiete betrachten, d. h. solche, deren Rand von einer beliebigen Geraden in höchstens zwei Punkten geschnitten wird, a und b seien der kleinste bzw. größte Wert, den die Abszissen der Randpunkte annehmen, c und d der kleinste bzw. größte Wert der Ordinaten (vgl. Fig. 33). G wird am oberen Rand durch die Kurve y = φ^χ) S- ö b ~ und am unteren Rand durch die Kurve pjg 33 y = φ2 {χ) begrenzt. Wir wollen ferner voraussetzen, daß φ1 und .(*> 7 = 1 dx\ Je J
f(x, y) dy
Ψι(Χ)
V. Analysis — Mehrfache Integrale
180
ist. Die Grenzen des ersten Integrals sind nicht konstant, sondern hängen von χ ab. Wird das Gebiet durch die Grenzen: χ = ψ1 (y), und χ = ip2(y) beschrieben, dann ist i ΓΨΜ
S
dy \ /(*, y) dx. C J Vi(f) der Integrationen vertauschen, doch Man kann also auch hier die Reihenfolge beachte man, daß die Integrationsgrenzen in beiden Fällen verschieden sind und nicht einfach vertauscht werden dürfen. Die Grenzen des zuerst zu berechnenden Integrals sind Funktionen der Integrationsvariablen des zweiten Integrals. Die Grenzen bei der zweiten Integration sind fest. Ist das Integrationsgebiet nicht konvex, dann kann man versuchen, es in solche Teilgebiete aufzuteilen, die ihrerseits konvex sind. Beispiel. Man berechne
HH
V» sin y ,
, fz , f1
sin« ,
y
LÖSUNG. Da man eine Stammfunktion von
Sm
y
^ nicht elementar berechnen kann, ver-
suchen wir I durch Vertauschung der Integrationsreihenfolge zu berechnen. Das Integrationsgebiet des ersten Intergrals ist begrenzt durch: χ = 0, χ — 1, y = y = fa, und wird in Fig. 34 durch das Gebiet OAB bezeichnet. Das Integrationsgebiet des zweiten Integrals wird begrenzt durch: χ = 1, χ = 2, y = ψζχ, y = 1, und durch ABG bezeichnet. Kehrt man die Reihenfolge der Integrationen um, dann kann man die Summe beider Integrale als ein Integral schreiben, nämlich als fi , f2»" sin y , fi sin y , f2¡/' I ay I — αχ = \ — ay 1 *h> y Jo y ®Jf
Jo
— [— y008 iy .1
+ \
Jo
fi V
.
αχ = ι y sm ydy 008
* *
yiy = — ° ° 8 1 + em i . |y
Β
c
2
Ò Fig. 34
Fig. 35
Anmerkung. Ist f(x,y) = 1, dann stellt 0 = JJgdxdy den Flächeninhalt des Gebietes 0 dar. Wählen wir als G das Gebiet, das durch die z-Achse, die
181
53. Krummlinige Koordinaten
Geraden χ — a und χ = b (a cm γ» 0 = 11 dxdy = \ dx\ dy = l f{x) dx, JJ a
Ja
JO
Ja
und dae ist gerade das bestimmte Integral, wodurch der Begriff Flächeninhalt in V, 19 definiert ist. 53. Krummlinige Koordinaten Statt der unabhängigen Veränderlichen χ und y wollen wir neue unabhängige Veränderliche u und ν einführen, die mit χ und y folgendermaßen zusammenhängen: χ = ç>(m, ü), y = ψ(ιι, ν). (53; 1) Wenn die Funktionen φ und ψ nicht in u und ν linear sind, nennt man diesen Übergang Transformation auf krummlinige Koordinaten. Wir nehmen an, daß durch (53; 1) ein Gebiet Η der (ω, i>)-Ebene eineindeutig auf ein Gebiet der (x, «/)-Ebene abgebildet wird, d. h. jedem Punkt (u, ν) von Η entspricht genau ein Punkt (x, y) von G, und umgekehrt. Die inversen Transformationen beschreiben wir durch:
{
= ν = h(x, y).
(53; 2)
U
Durch jedes Zahlenpaar («, v) von Η wird eindeutig ein Zahlenpaar (x, y) von G bestimmt, und dies bestimmt die Lage eines Punktes Ρ aus G in der (x, y)-Ebene. Ρ können wir also auch die neuen Koordinaten (u, v) zuordnen, auch krummlinige Koordinaten genannt. Die Koordinatenlinien u = konstant und ν = konstant werden in der (χ, y)-Ebene auf zwei Kurvenscharen abgebildet, deren Gleichungen g(x, y) = konstant und h(x, y) = konstant sind. Jeder Punkt aus G in der (x, y) Ebene ist dann der Schnittpunkt einer Kurve der einen Schar mit genau einer Kurve der anderen Schar. Beispiel. Wir fähren Polarkoordinaten ein:
χ = r cos a, y = r sin α (r > 0, 0 ^ α < 2 η). Die inversen Transformationen schreiben wir in der Form: r = Yx* + yt, sin
1^+7
v ^ + y2
Auf diese Weise wird jedem Punkt der in O punktierten (x, y)-Ebene (d. h. des Gebietes G) ein Punkt (α, r) des Gebietes E: 0 ¿ a < 2π, r > 0 in der (α, r)-Ebene zugeordnet (vgl. Fig. 36). Sind u, u und ψυ müssen existieren und stetig sein, während die Determinante D — . Schreiben wir statt φ und ψ wieder χ und y, dann erhält D die Form D = Vu y«
die auch symbolisch in der Form D =
3 (χ, y) 3 (M, v)
geschrieben wird. Man kann beweisen, daß zwischen D und der Determinante der inversen Transformation die Kelation d{u,v)
1
3(x, y)
d (x, y)
(53; 3)
d(u, v)
besteht. 54. Transformationsformel für Doppelintegrale Wir betrachten das Doppelintegral I =
^J{x,y)dxdy
(54; 1)
183
54. Traneformationsformel für Doppelintegrale
über einem Gebiet G der (x, j/)-Ebene, wobei /(x, y) eine stetige Funktion in χ und y sein soll. Wenn wir nun χ und y als Funktionen zweier neuer Veränderlicher auffassen: χ — (u,v), wobei φ und ψ die Voraussetzungen von V, 53 erfüllen sollen, dann können wir G als Bild eines Gebietes H der (u, υ)-Ebene auffassen (vgl. Fig. 37).
Wir wollen nun skizzieren, wie sich das Integral I bei dieser Transformation als Integral über das Gebiet Η schreiben läßt. In V, 49 ist das Integral: I = ^J{x,y)dxiy
=
^J{x,y)dG
definiert als sup{«}, wobei { « } die Menge aller Untersummen zu Teilungen von G in Gebiete Gt mit Fläche AGi darstellt. Das Gebiet H kann man in bekannter Weise durch Parallelen zu den Koordinatenachsen in kleinere Gebiete aufteilen, und es genügt — wie man beweisen kann — wenn wir nur die bei dieser Teilung entstandenen Rechtecke R f j betrachten, die ganz in H hegen. Jedes Rechteck B t ¡ wird begrenzt durch vier Geraden der Art: u = u(, u = ti1+1, ν = Vj, ν = vj+1. In der (x, j/)-Ebene bilden die beiden Scharen von Koordinatenlinien: u — konstant und ν = konstant ebenfalls ein Netz über G. Gtj ist das Bild von R { j , begrenzt durch diejenigen Koordinatenlinien, die Bilder der Geraden u = ut, u = ui+1, ν = v¡, υ = vi+1 sind. In Fig. 37 wird solch ein Gif beschrieben durch PQBS. Zur Berechnung von I nehmen wir nun eine Teilung von G in solche Gif zu Hilfe und berechnen zunächst den Flächeninhalt AGti von Gif. Wir setzen dazu: w j + 1 — u¡ = Au{, vf+1 — Vj = Avf. Sind P ( x , y ) die rechtwinkligen Koordinaten von P , dann hat Q die Abszisse χ + Αχ, wobei Αχ die Zunahme von φ(u, v) darstellt, wenn u — u{ — konstant gelassen und ν um Avf vergrößert wird. Diese Zunahme hat die Gestalt Α χ = df(ut, Vj)ldvAv}) kurz als a) und ζ durch diese Rotationsfläche wird dann vX ein Rotationskörper begrenzt. Um des1/ r \ y Pi sen Inhalt zu berechnen, betrachten wir \ s das Gebiet O in der (x, i/)-Ebene, das zwischen der x-Achse, der Kurve y = f(x) und den Geraden χ = a und χ = b jig. 44 liegt. Die z-Koordinate eines beliebigen
"vi
/
/
/
191
69. Der Inhalt von Rotationskörpern
Punktes P(x,y,z) der Rotationsfläche ist dann ζ = P P X = so daß nach (59.1)
7=4
Y{f
(a;)}2 —
y2,
S/^r
Das innere Integral stellt den Flächeninhalt eines Kreisviertels vom Radius f(x) dar und ist also gleich ¿π{/(ζ)} 2 , so daß I
=
{f(x)}2dx
π^
=
y2dx.
π^
In derselben Weise kann man den Inhalt eines Körpers berechnen, der durch Rotation der Kurve y = f(x) um die y-Achse entsteht (/ sei eine monotone Funktion) und der durch die Ebenen y = c und y = d(d > c) begrenzt wird. Man erhält dann Cd I
=
Cd {j/.Ra(y)
+
Β'2(φ)άφ,
(62; 2)
wie man aus (62; 1) durch einfache Umrechnung herleitet. Beispiel 1. Man berechne den Oberfläoheninhalt des Toros. LÖSUNG. Wie im Beispiel von V, 59 erhält man (vgL Kg. 46) 1 2 Vi = 6 + Kr -* ,
y2=
b-Vr*
— «•,
=
J/r» — χ* '
so daß wegen (62; 1) 0=
4π £ ( δ + K r 2 - * « ) | / l +
= 8πδτ
¿c So j/r»_a?
dx + 4π £ ( 6 - ) / r * - * • )
|[7+^-^dx
4πιδτ.
Beispiel 2. Man berechne den Oberflächeninhalt desjenigen Körpers, der durch Rotation der Kardioide mit der Polargleichung r— 2a (1— cos φ) um die Achse φ — 0 entsteht (vgl. Fig. 47). LÖSUNG. Gemäß (62; 2) ist dieser Flächeninhalt gleich
Fig. 47
2π ^ 2a Y1 — cos ψ sin φ Κ4α'(1 — cos φ)* + 4α* sin* φάφ
= 64πα1 Γ sin4 \φ cos hpdqi = ^πα*. 18·
V. Analysis — Mehrfache Integrale
196
63. Masse und Dichte von Flächen und Körpern Wir denken uns in einem Gebiet G der (x, t/)-Ebene eine Massenverteilung angebracht, derart daß die Masse auf jedem Teilgebiet von G beliebig klein ist, wenn nur das Teilgebiet hinreichend klein gewählt wurde. Besitzt ein Flächenelement AO von G die Masse Am, dann nennt man ^ ^ die mittlere Dichte auf AO. Geht AO ->0 (wobei sich die zugehörigen Teilgebiete von G auf einen Punkt Ρ zusammenziehen) und existiert der Limes a des obigen Quotienten, dann nennt man Am J S . 2 Ö -
dm dö
=
or
die Dichte des Gebiets in P. Dieses a hängt im allgemeinen von der Lage des Punktes Ρ ab, d. h. von den Koordinaten (a;, y) von P. Wenn σ eine stetige Funktion in χ und y ist, spricht man von einer stetigen Massenverteilung in G. Im folgenden nehmen wir an, daß wir es mit einer solchen Verteilung zu tun haben. Ist a(x, y) konstant, dann spricht man von einer homogenen Verteilung. In diesem Fall ist die Dichte gleich der Masse pro Flächeneinheit. Für die gesamte Masse in einem Gebiet G mit dem Flächeninhalt O und stetigem α (χ, y) erhält man dann adO.
(63; 1)
In rechtwinkligen Koordinaten schreibt sich dO = dxdy, in Polarkoordinaten dO = rd u»> · · ·> un> · · · · Die Zahl » nennt man den Index der Zahl un. Den Ausdruck uH nennt man das allgemeine Glied der Folge. Beispiele für Folgen: (α) 1, Ì , - ι , , . . . . Das allgemeine Glied ist —. 2 3 4 η (δ) 2, 22, 2 3 , . . . .
Das allgemeine Glied ist 2".
, » 2 (c) - , δ
_ ^ «+ 1 Das allgemeine Glied ist - — — . on + ¿
3 4 - , — α 11
ult u2, . . . sei eine gegebene Folge. Wenn sie die Eigenschaft hat, daß eine Zahl Κ existiert, so daß für jedes natürliche η
gilt, dann nennt man die Folge beschränkt. Die obigen Folgen (a) und (c) sind beschränkt.
2. Konvergenz DEFINITION. Eine Folge ult uit... konvergiert und hat den Limes L, wenn es zu jedem positiven e eine Zahl Ν gibt, so daß für alle natürlichen Zahlen η mit n>N gilt: \un —
L\00 eigentlicher Limes'. Wir sagen auch: un divergiert gegen unendlich. Für die unter (b) genannte Folge gilt : lim 2" = oo. «->00 Wir sprechen auch dann von einem uneigentlichen Limes, wenn lim un = — oo. η-»·οο (d. h. zu jeder Zahl Κ gibt es ein N, so daß «„ < Κ, falls n > N). Beispiel 8.1. Die Folge un= (—1)" ( « = 1, 2, . . . ) ist divergent. Die Glieder der Folge haben abwechselnd die Werte + 1 und — 1. Es gibt also keine Zahl mit der in 2 genannten Eigenschaft. Beispiel 8.2. Man zeige, daß lim (2» — »') = — oo. «->•00 BEWEIS. Κ sei eine beliebige (negative) Zahl. Die Ungleichung 2η—η2 < Κ ist sicher erfüllt, wenn η > 1 + Kl — Κ (Κ < 0). Wir können also Ν = 1 + Kl — Κ wählen.
207
4. Berechnung von Grenzwerten Beispiel 8.8. Die Folge itn =
¿n
konvergiert gegen unendlich. Denn -
n
-f- ¿
¿n
n
-τ~ ^
> Κ
ist erfüllt, wenn η > Κ + ΫΚ* + 2Κ. Wir können also Ν = 2Κ + 1 setzen (warum ?). Beispiel 8.4. Ist ρ > 0 konstant, dann ist«->00 lim n? = oo. BEWEIS. nP = eP )o8". Wegen lim ρ log η = oo wird (auf Grund von V, 26) auch für η
»
oo über alle Grenzen wachsen.
Beispiel 8.6. Ist y > 0 konstant, dann ist lim r ' — 0.
»->α>
BEWEIS. Die Behauptung folgt aus den Überlegungen in Beispiel 3. 4.
4. Berechnung von Grenzwerten In V, 2 ist der Limes von Funktionen behandelt worden. Sei / eine Funktion mit lim η-Ml f(x) = L, dann können wir die folgende Überlegung anstellen. xlt x%,... sei eine Zahlenfolge, die gegen α konvergiert, d. h. wenn ε0 eine beliebige positive Zahl ist, dann liegen von einem gewissen Index an alle Glieder der Folge in dem Intervall (a — e0, a + e 0 ). Wir wollen nun beweisen, daß die Folge /(Xj), /(x2)> · · · g e g e n den Limes L konvergiert. Bei beliebig gewähltem positiven ε gibt es ein Ν gilt: α — δ < x n < α δ. Für diese η gilt nun auch \f(xn)-L\
< ε .
Wir haben also folgendes bewiesen: SATZ 4.1. Folge
xlt
x
Wenn
für
,...
mit
2
eine
Funktion
f gilt:
l i m xn = a ebenfalls
ft->0O
lim f(x) x-*a l i m f(xn)
»->00
— L, =
dann
gilt
für
jede
L.
Wenn / die Eigenschaft hat, daß lim f(x) = L, dann kann man entsprechend «->00 herleiten, daß für jede Folge xlt x 2 , . . . mit xn -> oo gilt: lim f(xn) = L . «-> CO Insbesondere gilt dann: lim f(n) = L. II->00 Nehmen wir ζ. B . an, daß / {x) für ι ^ 1 definiert ist, dann haben wir erhalten : SATZ 4.2. /( 1), /(2),
Gilt
für
eine
/ ( 3 ) , . . . gegen
Funktion
f
lim
f{x)
— L,
f
lim £->00
f(x)
—
dann
konvergiert
die
Folge
divergiert
die
Folge
L.
Weiterhin gilt: SATZ 4.3.
GUU für
die^Funktion
7(1)> / ( 2 ) , / ( 3 ) , . . . gegen oo.
oo,
dann
208
VI. Zahlenfolgen und Reihen
Mit Hilfe der Sätze 4.1 und 4.2 können wir in vielen Fällen die Konvergenz einer Zahlenfolge beweisen und den Limes berechnen. So folgt aus lim «-»•oo
sin χ 1 = 1 (vgl. V, 9) der Limes lim η sin — = 1. or Ύ! n-*oo
Weiterhin gilt: lim η3 (sin — I = — ( v g l . Beispiel 8.7). η-»-oo \ η nj 6 2 lim log (n + 1) = oo (vgl. V, (24; 3)). lim η log 1 + — ) = 1 (vgl. V, 28, Eig. ΠΙ). •τ)fi-ναό \ lim
0; vgl. V, 28, Eig. I).
Da für jedes positive α gilt: lim x" = oo (vgl. V, 27) ist auch lim n" = oo »-•oo ft->oo (η natürlich; 0). Hieraus folgt wieder lim n~" = 0 (n natürlich; κ > 0). ft->-00 Wir bemerken noch, daß auch die Umkehrung von Satz 4.1 gilt: SATZ 4.4. Wenn für jede Folge xx, a r 2 , . . . mit xn^-a gilt, dann ist lim f(x) = L. x-*a Den Beweis überlassen wir dem Leser.
(n
oo) f(xn) -> L
Rechenregeln für Grenzwerte von Folgen. Aus lim un = L und lim vn = M »-»•oo η->oo erhalten wir: I. II. ΙΠ.
lim (un + vn) = L + M, »-»•00 lim (un — vn) = L — M, n->co lim unvn »-»•00
- LM.
Wenn außerdem vn Φ 0 (η = 1, 2 , . . . ) und Μ Φ 0, dann ist IV.
Km*. η->oo »» M Diese Hegeln können in derselben Weise wie die entsprechenden Sätze über Grenzwerte von Funktionen (vgl. V, 3) bewiesen werden. 2η 1 n2 Beispiel 4.1. Man zeige, daß lim 2λ . „ , —- = 4. η-co * + » + 4 *
5. Monotone Folgen
209
LÖSUNG. to2 —2w — 1 _
»a
η n
n
lim ( l - nî - Λn ) n^coV
»->00 V
*l
n
n
>
Beispiel 4.2. Man berechne lim {Vn? + 2η — Vn2 -)- 71}. n->eo LÖSUNG.
lim {Vre2 -f 2« —Km2 + »} η ->00 ((/w3 + 2» — [/re2 + to) (|/wa + 2ra + ^to2 + re)
_
n-> 00
Beispiel 4.3.
J/to2 + 2» + )/to2 + m J/TO* + 2TO + )/TO2 + TO „->=0 | / 1 + _2 + y i + _ l _ = lim 1 / < Λ ———. • |/ η ; = lim —... ι η — ^,/ 1 = 1.. ft->CO Um «->00 TO 1
Hieraus folgt
lim » η->00 ι
f = Q. 1_
TO* 1 η->oo
1
5. Monotone Folgen
Eine Folge ult u2, . . . heißt monoton wachsend (oder steigend), wenn Mj ^ «2 ^ ω3 ^ · · ·, monoton fallend, wenn u1 ^ « 2 ^ ω3 ^ · · · und ecÄi monoton wachsend bzw. fallend, wenn in keinem Fall das Gleichheitszeichen gilt. In jedem dieser Fälle nennt man die Folge monoton. SATZ 5.1. Eine beschränkte monotone Folge konvergiert. Der Beweis folgt aus der Tatsache, daß jede beschränkte Menge reeller Zahlen eine kleinste obere (bzw. größte untere) Grenze hat. Nehmen wir ζ. B. an, daß die Folge monoton wachsend ist, also ^ á « ¡ á « 3 á · · ·. Die Folge ist beschränkt; es gibt also ein K, so daß un ^ Κ (ra = 1, 2 , . . . ) (vgl. VI, 1). Sei L die kleinste obere Schranke (obere Grenze) der Zahlenmenge {«„, η = 1, 2, . . . } . Zu jedem ε > 0 gibt es dann ein n0, so daß L — ε — 1 und χ # 0 und k > 1 gilt (1 + x)k > 1 + kx, erhalten wir Λ
1V
»
(I-ÜF) so
n
— 1 /
(W>1>'
daß
> 1 für » > 1. Also ist die Folge u„ (n = 1, 2, . . . ) eckt monoton wachsend. Weiter beweisen wir, daß die Folge vn echt monoton abnimmt. 1
fl
hïr =
(
1
/
1 \ —n+1 ι— 1 \ η—1
1 - 1 ra » - ι ra — 1 η2 —ra— 1 α2 —
+
»—1
2η.
ra
ra» - 8 ra
— 2η» + 1 ^2 > 1; —2ra
ferner ist
^-('-τΓ-Ρ^Γ also ut < · · · < ítn_! < u
n
Ν gilt : \up — ue \ < ε. Man beachte, daß in diesem die Konvergenz betreffenden Satz der Limes der Folge überhaupt nicht vorkommt. BEWEIS. Wir zeigen zunächst, daß die Bedingung notwendig ist. Die Folge Mj, u2,. . . sei konvergent mit dem Limes L. Dann gibt es zu jedem ε > 0 gemäß VI,2*eine Zahl Ν = Ν (ε), so daß | u„ — L |
N.
Für
ρ und q > Ν gilt nun \up-uq\
= \up — L-(uq
— L)\ ^ \ up-L\+\u,
— L\ Ν sind. Bei festem g > Ν liegen alle Punkte u p mit ρ > Ν im Intervall \uq — 1 , uq + 1]. Wir setzen voraus, daß es unendlich viele verschiedene Punkte up gibt (sonst ist der Satz trivial). Höchstens endlich viele Zahlen liegen dann außerhalb dieses Intervalls. Nun hat eine beschränkte Folge mindestens einen Häufungspunkt (Satz 2.1). Sei L ein Häufungspunkt der Folge. Dann gibt es ein N, so daß für alle natürlichen Zahlen ρ und q> Ν g die Ungleichung | u — u | < — gilt. Ferner gibt es sicher ein p1 > Ν, so ύ daß \uPi — L\ < - | · . Also ist \uq — L\ g \u q — up¡\ + | upj — L \ < ε für alle q> N. Das bedeutet, daß lim un = L. it-*x> 14·
VI. Zahlenfolgen und Reihen
212
Beispiel 6. Man beweise, daß die Folge u n = 1 + -5- + -5- H
AO
l·
— (» = 1 , 2 , . . . )
fi
divergiert. LÖSUNG. Aus dem Cauchy'schen Konvergenzkriterium folgt: eine Folge w 2 ,... ist dann divergent, wenn es mindestens ein ε > 0 mit der Eigenschaft gibt, daß es zu jedem Ν mindestens zwei Zahlen ρ und q > Ν gibt, für die \up — uq\ > ε gilt. Nun ist in unserem Beispiel
Mit e = £ ist also nicht die Bedingung des Cauchy sehen Konvergenzkriteriums erfüllt. Also divergiert die Folge.
Vollständigkeitshalber geben wir hier noch den allgemeinen Cauchy'schen Grenzwertsatz für Limiten von Funktionen an. Er lautet: lim f(x) existiert dann und nur dann, wenn es zu jedem ε > 0 eine punktierte x-*a
Umgebung von χ = a gibt, so daß für je zwei Zahlen xx und x2 aus dieser Umgebung I f(z1)—f(x2) I < ε gilt. Zum Beweis siehe K U I P E R S , Leerboek der analyse, Kapitel 3,8. Entsprechend gilt: lim f(x) existiert dann und nur dann, wenn es zu jedem x-t-ao
ε > 0 eine Ν gibt, so daß für beliebige reelle Zahlen ρ und q> Ν gilt \M—M\oo η->• oo η >χ Anmerkung 7.1.1. I n Beispiel 7.1.6. gilt für un = sin nx (χ φ kn) nicht lim un = 0. Also ist diese Reihe divergent. Man betrachte auch die Reihen n->oo divergenten Reihe, für die un -»-Ο (η -> oo) gilt, ist die harmonische Reihe 1 + έ + i "t (siehe Beispiel 6). Der Leser wird leicht die Gültigkeit der folgenden Sätze einsehen. SATZ 7.1.2. Konvergiert die Reihe ux + u2 + · · · gegen die Summe S, dann konvergiert die Reihe aux + au2 + · · · gegen aS. SATZ 7.1.3. Ist die Reihe + ω2 + — konvergent (divergent), dann konvergiert (divergiert) auch die Reihe uK+l + uK+2 + · · · (K beliebige, aber feste natürliche Zahl), und umgekehrt. SATZ 7.1.4. Konvergieren die Reihen + «2 + • · · und vt + »2 + ' ' " QeQen die Summen S bzw. T, dann konvergiert die Reihe (u1 -+- -f («2 + v2) + · · · gegen die Summe S + T. Wir beweisen noch: SATZ 7.1.5. Gilt für eine Reihe + «2 -f- · · · mit positiven Gliedern, daß die Folge der Partialsummen beschränkt ist, dann konvergiert die Reihe.
7. Unendliche Reihen
215
BEWEIS. Aus den Voraussetzungen folgt, daß die Folge Sn=wx+u2 H \-un (n — 1 „ 2 , . . . ) eine monoton wachsende beschränkte Folge ist. Nach Satz 5.1. existiert dann lim Sn. »->•00 7.2. Yergleiehsreihen. Wir setzen voraus, daß die Reihen, die wir in diesem Paragraphen betrachten, ausschließlich positive Glieder haben. Häufig können wir die Konvergenz oder Divergenz einer Reihe durch Vergleich mit einer Reihe, deren Konvergenzverhalten bereits bekannt ist, feststellen. Eine solche Reihe nennen wir dann eine Vergleichsreihe. Wir beweisen nun die folgenden Sätze: SATZ 7.2.1. Ist un iS vn und konvergiert die Reihe v1-\- v2-\- · · ·, dann konvergiert auch die Reihe ut + «2 + · · ·. (Majorantenkriterium.) BEWEIS. Die Zahlenfolge Tn = vl+ v2-\ vn (n = 1, 2 , . . . ) ist beschränkt. Wegen un ^ v„ ist Sn = ut + u2 + · · · + un ^ Tn. Die Folge Sn ist eine monoton wachsende beschränkte Folge, also existiert lim Sn. η->·00 SATZ 7.2.2. Ist un ^ vn (n = 1, 2 , . . . ) und divergiert die Reihe t>x ——1 dann divergiert auch die Reihe «j + u2 +
,
BEWEIS. Angenommen ^ + ut + · · · sei konvergent. Wegen vn ^ un müßte dann die Reihe v t + »2 + · · · konvergieren (Satz 7.2.1.). Das ist ein Widerspruch zur Voraussetzung. SATZ 7.2.3. Konvergiert die Reihe vx + v2 + · · · und gilt Un
Vn
dann ist auch die Reihe ux + ut + · · · konvergent. BEWEIS.
Aus der Voraussetzung folgt V»-2
»1
Die Reihe mit dem allgemeinen Glied (ujvj vn konvergiert, also auf Grund von Satz 7.2.1. auch + u2 -+- · · ·. SATZ 7.2.4. Divergiert die Reihe v1 + v2-\ ^
' ^ ( » Un V»
=
dann divergiert auch die Reihe ul-\- u2-\- · · ·. BEWEIS. Der Leser wende Satz 7.2.2 an.
und giU 1,2,...),
VI. Zahlenfolgen und Reihen
216
SATZ 7.2.5. Die Reihen «x + «2 + · · · und + i>2 + · · · sind entweder beide konvergent oder beide divergent, wenn lim ujvn = L > 0. n-»-oo
BEWEIS. Angenommen, die Reihe v1 + i>2 -f- · · · sei konvergent. Von einem gewissen Index an gilt dann ujvn < L + 1 oder un < (L + 1) vn. Hieraus folgt nach Satz 7.2.1, daß die Reihe + m2 + · · · konvergiert. Die Reihe «j + v2 + · · · sei divergent. Von einem gewissen Index an ist dann ujvn > \L oder un> \Lvn. Daher ist die Reihe ux + « 2 + · · · divergent (vgl. Satz 7.2.2). 7.3. Konvergenzkriterien. Auch in diesem Paragraphen wollen wir voraussetzen, daß die betrachteten Reihen nur positive Glieder haben. In 7.1 schlossen wir in einer Anzahl von Fällen von dem Verhalten der Folge Sn = ul + w2 + · · · + m„ auf das Konvergenzverhalten der Reihe «ι + «2 Η · Ein Konvergenzkriterium ist ein Hilfsmittel, eine gegebene Reihe auf einem anderen Wege als durch Diskussion der Folge der Partialsummen auf Konvergenz zu untersuchen. Wir behandeln nur die folgenden Kriterien. 7.3.1. Integralkriterium. Ist f(x) (x à 1) eine positive, monoton abnehmende Funktion, dann sind das uneigentliche Integral f™ f(x)dx und die Reihe /( 1) + /(2) + · · · entweder beide konvergent oder beide divergent. BEWEIS. Sei
f(x) dx konvergent. Das bedeutet, daß lim f f f(x)dx N-* oo existiert. Ferner folgt aus der Definition des Integrals und aus der Monotonie von /, daß 0 < /(2) + /(3) + · · · + f(N) £ f f f(x) dx. Hieraus folgt, daß die Partialsummen der Reihe /(l) + /(2) + • · · eine monoton wachsende beschränkte Folge bilden, so daß also die betrachtete Reihe konvergiert. Sei nun das Integral f ™ f(x) dx divergent. Das bedeutet in diesem Fall, daß f f f(x) dx oo, wenn Ν ^ oo. Aus /(1) + /(2) + · · · + / ( Ι \ 0 > ^
f(x)dx
folgt, daß auch die Partialsummen der Reihe /(l) + /(2) + · · · über alle Grenzen wachsen. Die betrachtete Reihe ist also in diesem Fall divergent. Beispiel 7.8.1.1. Man beweise, daß die harmonische Reihe 1 + £ + J + ··· divergiert.
Reihe.
S
oo dχ
ι
χ
ist divergent (vgl. V, 24), also divergiert die betrachtete
7. Unendliche Reihen
217
Beispiel 7.3.1.2. Man beweise, daß die hyperharmonieche
Reihe
2* + 3* + 4* + konvergiert, wenn k > 1 (und divergiert, wenn k 1). 1 +
BEWEIS. Daß die betrachtete Reihe für k ¿ 1 divergiert, folgt aus Beispiel 7. 3.1.1. und oo dx
S
—g- (k > 1) ist konvergent ι (vgl. V, 37, die Definition des uneigentlichen Integrals). Hieraus folgt die Konvergenz der hypergeometrischen Reihe für k > 1. a> J Beispiel 7.3.1.3. Man zeige, daß die Reihe
w
(¡0g
konvergiert für k > 1 und
divergiert für LÖSUNG. Das Integral dx _ Γ J " u = lim ( ' J2 X (log X)* „ J2Jz « f l o g * ) * N->a>
(log x)~k+1
—
1
konvergiert. Die fragliche Reihe ist also in diesem Fall konvergent. Den Beweis, daß die Reihe für k ^ 1 divergiert, überlassen wir dem Leser. 7.3.2. Das Kriterium von Cauchy (Wurzelkriterium). Existiert »,—
ut + u2 + · · · (un > 0) lim \un = L,
n-»-oo
L < 1, und Reihe
divergent,
wenn
L > 1.
dann
Ist
ist
die
L = 1 und
Reihe
gilt
für
eine
Reihe
konvergent,
n. \un 11,
wenn
dann
ist
die
divergent.
BEWEIS. Sei L < 1. χ sei eine Zahl mit L 1, dann gilt von einem gewissen n.
Index Ν an \un > χ oder un > xn. Da die Reihe χ + χ2 -f · · · für χ > 1 divergiert, ist in diesem Fall auch u t + ω2 + · · · divergent. n,— Sei L = 1 und sei \un φ 1. In diesem Fall ist un 0 (n -> oo) nicht erfüllt. Die Reihe ist divergent. n, Ist L — 1 und nähert sich |!u n von unten her 1, dann gibt das Wurzelkriterium keine Auskunft. 7.3.3. Das Kriterium von d'Alembert (Quotientenkriterium). Gilt Reihe wenn Ist
ut + u2 + · · · (un L < 1, und L = 1 und
> 0) l i m un+Jun = L, dann n->oo divergent, wenn L~> 1.
überdies
ωη+1/ωη|
1 (η ->• ), dann
ist die
ist die
Reihe
Reihe
für
eine
konvergent,
divergent.
218
VI. Zahlenfolgen und Reihen
BEWEIS. Sei L < 1. Ist χ eine Zahl mit L < χ < 1, dann gilt von einem gewissen Index an, daß un+1/«n < x. Setzen wir vn = xn (n = 1 , 2 , . . . ) , dann können wir die letzte Ungleichung in der Form « n+1 /« n < vn+1/vn schreiben. Die Reihe + v2 + · · · konvergiert (Beispiel 7.1.3); wegen Satz 7.2.3 ist dann auch die Reihe + « 2 + · · · konvergent. Sei L > 1 . Von einem gewissen Index an ist dann stets «Λ+1/ωη > 1 oder un+1 > mb, was lim un — 0 ausschließt. Die Reihe ul-{· · • divergiert n->co also in diesem Fall. Wenn u n + Ju n von rechts her gegen 1 strebt, dann wenden wir dieselbe Überlegung an. Ist L = 1 und strebt «B+1/itM von Tinten her gegen 1, dann gibt das d'Alembert'sche Kriterium keinen Aufschluß. 1 2 1 2 Beispiel 7.8.8.1. Wir betrachten die Reihe-g- + -yî + -g» + -g« + " " für ungerades η n/— 1 1 ist« B = —, und für gerades η ist = _ n l . Offenbar gilt lim j/i¿n = J. Nach dem Wurzel«->00 kriterium ist die Reihe konvergent. Das Quotientenkriterium gibt in diesem Fall keine Auskunft, da iín+1/un = 1 (wenn η ungerade) und = £ (wenn η gerade). Beispiel 7.8.8.S. Man zeige, daB die Reihe 1 + τττ + v r Η konvergiert. ¿1 3! LÖSUNG. un = 1/n!, also «» +1 /« B = l/(» + 1) -»-0 (» -> oo). Nach dem Quotientenkriterium ist die Reihe konvergent. Beispiel 7.8.8.8. Mau beweise, daB die Reihe % + u8 + · · · (u„ > 0 ) divergiert, wenn lim nun Φ 0 ist. ft->oo LÖSUNG. Sei k = lim nu„ (k > 0). Setzen wir e„ = 1/n (n = 1, 2,...), dann können wir »-»•00 dies auch in der Form lim iin/vn = k > 0 schreiben. Nach Satz 7. 2. 5 und Beispiel 7.3.1.1 Λ->οο ist die Reihe % + u t + ... divergent. Beispiel 7.8.8.1. Man. beweist, daß die Reihe % + « 2 + ·• · {un > 0) konvergiert, lim n a u n Φ 0 ( 1). »->00
wenn
LÖSUNG. Setzen wir vn = 1/n" (η — 1,2,...), dann sehen wir, daB lim un/vn existiert und η->oo > 0 ist. Die Reihe 1/»" ist konvergent, wenn « > 1 (Beispiel 7. 3.1. 2.), also auch die Reihe % + ttj Η (Satz 7. 2.5). 00 J Beispiel 7.8.8.6. Man zeige, daB die Reihe Σ -= χ- divergiert. n=l 3 n ~ 2 LÖSUNG. Ist u„ = l/(3n — 2), dann ist lim nun — J> so daß die betrachtete Reihe wegen «->00 Beispiel 7.3. 3. 3 divergiert. Beispiel 7.8.8.6. Man zeige, daB die Reihe ein 1 + $ sin £ + J sin J + ··· konvergiert.
7. Unendliche Keihen
219
BEWEIS. Sei un = — sin—, dann ist lim nhi„ = 1 (der Leser prüfe ee nach 1) ; nach Bein n n-> oo spiel 7. 3. 3. 4 und wegen der Konvergenz der Reihe Σ n ~* konvergiert auch die betrachtete Reihe. Beispiel 7.3.3.7. Man zeige, daß die Reihe mit dem allgemeinen Glied un = nxn (x > 0) konvergiert, wenn χ < 1. LÖSUNG. Für χ S 1 ist lim w„ = 0 nicht erfällt. Sei also 0 < χ < 1. un+Jun
-+x,
wenn η -*• oo. Nach dem Quotientenkriterium ist die Reihe konvergent. Anwendung des n.— n. Wurzelkriteriums ergibt dasselbe Ergebnis, da |/ωη = χ ]/» -+x(n oo; vgl. auch Beispiel 2. 3). 7 . 3 . 4 . Das Kriterium von Baabe. Gilt für eine Reihe
+ w2 + · · · ( M „ > 0 ) ,
daß lim raíl—Un+1 j existiert und gleich L ist, dann ist die Reihe kon»->00 \ I vergervi, wenn L > 1, und divergent, wenn L < 1. Ist L = 1 und gilt η (1 —Un+1 !ι \ Un J
dann ist die Reihe divergent.
BEWEIS. Sei L>1.
Ist k eine Zahl mit L > k > 1, dann gilt von einem
gewissen Index an n [ 1 — u " + 1 \ > ¿ oder
V
Un j
"
M +1
Un
< 1 — — . Aber nach der η
Bernoullischen Ungleichung (vgl. den Beweis von Beispiel 5) ist ! _ * < η
(,_!)*.
\
nj
Von einem gewissen Index an gilt also JüL« < Λ _ I V < fi un \ »J \
L_\*= n + l j
1
/ JL (n+l)*/n*'
Setzen wir vn = 1 ¡nk (k > 1; η = 1, 2, . . .), dann erhält man nach Anwendung von Satz 7.2.3 und Beispiel 7.3.1.2 die Konvergenz der Reihe i + «2 Η
u
·
Ist 2 / < 1, oder gilt n(l— ω »+ι/ ω »)ΐ1> dann gilt von einem gewissen n+1 Un+l Index an n il \ — " Un J| 2), j/6"· )/7 · · · j/» + 5
dann gilt «n+x = K» ' + 1 α î ι1, wenn η -*• oo. «»
j/«, + 6
Bas Quotientenkriterium ist hier nicht brauchbar. Aber «n+i\ rafl/w + 6 — I''—I—L— M + 1) 6w η Λ1 =ü-] =—ir l
«η /
/η+β
l _» n21, wenn η-> oo.
J/n· + β (]/» + β + γη + 1)
Also ist die Reihe % + « 2 + · · · konvergent. Beispiel 7.3.4.2. Man untersuche auf Konvergenz
LÖSUNG. Das allgemeine Glied der Reihe ist gleich
°
2,...);
deshalb gilt
°
%n+1
un
1" !j " ' + w ~ *) xn ( n = l , 6(6 + 1) · · · (6 + η — 1)
= ° ~~ j U x-*-x, wenn η -*• oo. Nach dem Quotientenkriterium ο+ η
ist die Reihe konvergent für χ < 1 und divergent für χ > 1. Sei nun χ = 1. Dann ist = β^
Ist a ^ 6, dann ist die Reihe divergent (warum Î). Sei nun 0 < o < 6. Dann
«n+i/wn
gilt 11· Wenden wir jetzt das Raabesche Kriterium an, dann sieht man, daß »Ii — " n + 1 ) -»-6 — α (η -* oo). Deswegen ist die Reihe konvergent, wenn δ — a > 1, u \ n ' und divergent, wenn δ — α < 1. Ist δ — α = 1, dann gilt, daß η 1 — f i , so daß die Reihe divergiert.
\
un
/
7.4. Reihen mit positiven nnd negativen Gliedern. Sei ux + u2 -f- · · · eine Reihe mit positiven und negativen Gliedern. Wir nehmen an, daß es unendlich viele positive und unendlich viele negative Glieder gibt. Wir betrachten die Folge der Partialsummen S„ = + u2 + · · · + un. Pn sei die Summe der positiven Glieder unter den ult u2, •. - , u n , — N n die Summe der unter den ersten η Gliedern auftretenden negativen Zahlen. Dann ist Sn = Pn — Nn (n = 1, 2 , . . . ) . Wir unterscheiden nun die folgenden Fälle: (1) Die Folgen Pn und Nn sind beide konvergent. Dann ist auch 8n konvergent, und das bedeutet, daß die Reihe u t + u2 -f- · · · konvergiert. Wir können aber noch weitere Schlüsse ziehen. Auch die Reihe Pn + Nn konvergiert dann nämlich, d. h. die Reihe [ « j | + | tt2 | + · · · konvergiert, m. a. W. die Reihe der Absolutbeträge ist konvergent, kurz : die Reihe konvergiert absolut. Ohne weiteres erkennt man nun: ist eine Reihe absolut konvergent, dann ist sie konvergent schlechthin. Denn im Fall absoluter Konvergenz sind beide Folgen Ρn und Nn konvergent (das folgt aus der Konvergenz der Folge Pn + Nn), so daß auch Pn — Nn konvergiert.
7. Unendliche Reihen
221
(2) Wenn eine der beiden Folgen P„ und Nn konvergiert, während die andere divergiert, dann ist auch Pn — Nn divergent. (3) Wenn beide Folgen Pn und Nn divergieren, dann kann die Differenz Pn— Nn konvergent sein. In diesem Fall nennt man die Reihe u1-\-ui-\ bedingt konvergent, d. h. die Reihe ist konvergent, aber nicht absolut konvergent. Beispiel 7.4.1. Die Reihe 1 — £ + § — i + i — b beiden Reihen 1 + J + i + • · • und — £ — J konvergent, wie man folgendermaßen einsieht:
ist bedingt konvergent. Die sind divergent, aber die Summe ist
S» = 1 - h + i - έ + --• + 2 ^ = T - "¿Γ = " T T + I T T + "" +
1 (in— 1)2»
J_ J_ 1 32+ 52 + " · + (2»— l)s '
< 1 +
so daß 8m konvergiert. Weiterhin ist auch S2n+l = S2n + l/(2ji + 1) konvergent, und
i™ n->co
= limS2n. n->ao
Beispiel 7.4.2. Der Leser möge verifizieren, daß die Reihe
22
3» ^ 42 -
+
-
-
52
L+...
β2
absolut konvergiert.
Wir beweisen nun den folgenden Satz über absolut konvergente Reihen. SATZ 7.4.1. Ändert man die Reihenfolge der Glieder einer absolut konvergenten Reihe, dann konvergiert die umgeordnete Reihe gegen denselben Grenzwert wie die ursprüngliche Reihe. BEWEIS. Wir nehmen zunächst an, daß die Reihe nur aus positiven Gliedern besteht. % + u2 + · · · sei diese Reihe, und sie habe die Summe S = lim 8 n . η->00 v i + v2 + ' ' * s e i die durch Umordnung aus der ersten entstandene Reihe. Wir betrachten nun die Partialsummen Τ m = vx + v2 · · · der zweiten Reihe. Tm wächst mit m, ferner ist Tm beschränkt, denn zu jedem m gibt es einen gewissen Index n, so daß Tm ^ Sn ^ S. Also konvergiert die v-Reihe. Wir müssen nur noch zeigen, daß lim Tm = 8. Dies sieht man folgendermaßen »»-»•00 ein. Zu jedem η gibt es einen Index p, so daß Sn ¿ Tp, also S ^ lim Tp. p->oo Aus S g lim Tp ^ S folgt dann die Behauptung. p-yao Jetzt wollen wir zulassen, daß die absolut konvergente Reihe u 1 u 2 • · • auch nicht-positive Glieder hat. v·^ + v2 -f- · · · sei wieder die durch Umordnung der ω-Reihe entstandene Reihe. Sn bzw. Tn seien jeweils die n-ten Partialsummen, ferner sei Sn — Ρ„ — Nn und Tn= Pn — Nn, wobei Pn, Nn,
VI. Zahlenfolgen und Reihen
222
Pn und Nn die zu Beginn von VI, 7.4 beschriebene Bedeutung haben. Aus der absoluten Konvergenz der Reihe + u 2 + · · · folgt, daß die Folgen Pn und Nn konvergieren (gegen Ρ bzw. N). Pn ist aber eine Partialsumme einer Reihe, die durch Umordnung derjenigen Reihe entstanden ist, die P„ als Partial Wimm en hat. Aus dem ersten Teil unseres Beweises folgt also, daß lim P n = lim Pn = Ρ und lim Nn = lim Nn = N, und dan->- co
n->oo
n - > oo
τι ->oo
mit auch, daß lim Tn = lim 8n = S. η-ίαο n->oo Ordnet man eine bedingt konvergente Reihe um, dann kann sich dabei das Verhalten der Reihe völlig verändern. Die neue Reihe kann (bedingt) konvergieren, möglicherweise aber gegen eine andere Summe als die ursprüngliche Reihe. Man kann sogar beweisen, daß man eine solche Reihenfolge der Glieder wählen kann, daß die neue Reihe gegen eine beliebig vorgegebene Zahl als Summe konvergiert. Man kann die Reihe auch so umordnen, daß die neue Reihe divergiert. Beispiel 7.4.8. Die Reihe 1 — Ί + § — J + ··· konvergiert gegen log 2. Man bestimme die Summe der Reihe l - \ - \ + | - J - | + + - . LÖSUNG. Für die zweite Reihe gilt:
= (l + i + * + - + 2 ¿ T ) - ( Í + i + - + ¿ ) . Setzen wir 1 + Ί + $ +
— log η = Cn, dann gilt Cn -*• C (= Konstante von Eu-
ler). Nun ist 1 + 1 + ¿ + - + - ^ ¿ y
+ lo8 (2»-1) —i {C„-i + log (»—1»
und ^ + ¿ + ... + -τ— = \{Cm + log 2n). Hieraus leitet man leicht her, daS lim Sin =
4 71
\ log 2. Ebenso gilt lim è log 2.
n->co
η->oo
= lim Stn_2 = ¿ log 2. Die Summe der neuen Reihe ist also
n-> 0), daß « j > u2 > ω, > · · · und lim un= 0 ist, dann konvergiert die Reihe. «->00 BEWEIS. Sn sei die erste ra-te Partialsumme der'betrachteten Reihe. Dann ist S2m = Κ — «2) Η \- (U2m-1 ~ «2 J (m = 1, 2 , . . . ) , also ist Sin monoton steigend. Ferner ist S2„+l
= «1— («2— «3)
(«2»— «2*+l)> a l s ° St*+1 < U1·
223
7. Unendliche Reihen
Weiterhin ist dann S2m = S2m+1 < u l t also ist S2m auch beschränkt. Die Folge S2m (m = 1, 2, . . . ) ist daher konvergent. Nun ist 0, ist lim S 2 m + 1 = lim S2m = l i m S n . m -> co
m-*-co
n-> co
Hiermit ist der Satz bewiesen. Konvergierende alternierende Reihen haben noch die folgende Eigenschaft: Ist Sn die η-te Partialsumme und 8 die Summe der Reihe, dann ist I S '—Sn
I = I u„+1
— un+2
1 = 1 Mn+1 — (un+2
h
— w„+3)
I
0 gibt es eine. Zahl Ν — Ν (χ, ε) (ιabhängig von χ und ε), so daß für jedes n> Ν gilt: | /„ (a;) — f(x) | < ε. Die Folge flt f2,... konvergiert gleichmäßig gegen /, wenn folgendes gilt: zu jedem ε > 0 gibt es ein Ν {ε) (nur abhängig von ε), so daß für alle η > Ν gilt: I fn(x) — /(*) I < ε für jedes χ aus I. Beispiel 8.1. Es sei Für festes χ gilt lim fn(x) = lim η-»·οο n->oo
— = 1.
χ
1
Die Folge der /„ konvergiert im Intervall [1, oo) gegen / = 1. Es ist w» , ! ι ι ι . , . < —, für jedes χ aus [1, oo). »«+1 I »»+1 » + 1 η Man wähle nun, wenn e > 0 gegeben ist, Ν = 1/e. Dann ist für η > Ν die Bedingung \fn(x) — f(x) I < e für jedes χ erfüllt. Also konvergiert die Funktionenfolge der /„ in [1, oo) gleichmäßig gegen 1. Beispiel 8.8. Es sei Bei festem χ ist lim fn(x) — 0 = f(x). η-roo Aber IZ-W-ZWI-ss^r· Man wähle nun e = So groß Ν auch gewählt wird, immer findet sich ein n 0 > Ν und hinreichend nahe bei 0 ein χ, ζ. Β. χ = l/» 0 , so daß l/(n¿x + 1) ( = £ für χ = 1 ¡n0) größer als e ist. Also konvergieren die /„ in (0,1) nicht gleichmäßig.
Ein wichtiger Satz ist der folgende: SATZ 8.1. Wenn eine, Folge stetiger Funktionen flt f2,... in I gleichmäßig gegen f konvergiert, dann ist die Qrenzfunktion stetig. Zum Beweis siehe K U I P E B S , Leerboek der analyse, Kapitel 8.4. Zur Erläuterung dieses Satzes betrachten wir noch einmal die obigen Beispiele. In Beispiel 8.1 ist die Grenzfunktion / = 1 der gleichmäßig konvergenten Funktionenfolge stetig. In Beispiel 8.2 sehen wir aber, daß in dem Intervall (0,1) die Grenzfunktion stetig ist, obwohl die Funktionenfolge in diesem Intervall nicht gleichmäßig konvergiert. Gleichmäßige Konvergenz ist also keine notwendige Voraussetzung für die Stetigkeit der Grenzfunktion, allerdings nach obigem Satz eine hinreichende Bedingung. Wir definieren, daß eine Reihe ux(x) + u2(x) + · · · im Intervall I dann und nur dann gleichmäßig gegen 8(x) konvergiert, wenn die Folge der Partialsummen
8. Gleichmäßige Konvergenz
229
Sn(x) — u^x) + u2(x) + · · · + un(x) in I gleichmäßig gegen die Summe S(x) konvergiert. Beispiel 8.8. Man betrachte die Reihe z(l — x)n in [0, 2). 8(x) sei die Summe der Reihe, dann ist 5(0) = 0, während S(x) = l f ü r 0 < a ; < 2 . Die Summeniunktion 8(x) ist also in [0, 2) nicht stetig, folglich kann die Reihe nicht gleichmäßig konvergieren.
Das folgende Kriterium ist häufig nützlich, wenn man die gleichmäßige Konvergenz einer Reihe zeigen will. SATZ 8.2. (Kriterium von Weierstraß, Majorantenkriterium). Ist v1-\-v2 + · · · eine konvergente Reihe mit positiven Gliedern, und ist I u »( x ) I = vn (» = 1, 2, . . . ; z i n I), dann konvergiert die Reihe ut(x) + u2(x) + * • • gleichmäßig in I. Den Beweis überlassen wir dem Leser. Man wende Satz 7.2.1 an! Beispiel 8.4. Man betrachte die Reihe Ση=ι ne'"" in Das allgemeine Glied u„(x) genügt der Ungleichung
% (χ) = ne~nx < «e-I"
oo Ja Je SATZ 8.4. Wenn eine Reihe u^x) + u2(z) + · · • mit stetigen un(x) (» = 1,2,...) in [α, 6] gleichmäßig konvergiert, dann gilt
Gliedern
^ {u1(x) -f u2(x) + · · ·} dx — ^ u^x) dx + ^ u2(x) dx + · · ·. SATZ 8.5. Wenn eine Reihe u^x) + u2(x) + · · · in [α, 6] konvergiert und wenn die Reihe u[ (x) + u'2 (x) + · · · in [α, δ] gleichmäßig konvergiert, dann ist die Ableitung S'(«) der Summe S{x) der Reihe ux(x) + u2(x) + · · · gleich der Summe der Ableitungen u[(x) + u'2(x) + · · ·. Den folgenden Satz wollen wir hier beweisen: SATZ 8.6. Eine Potenzreihe a0 -j- atx + a2x2 + · · · konvergiert gleichmäßig in jedem Intervall, dessen Endpunkte im KonvergenzintervaU liegen. BEWEIS, i? > 0 sei der Konvergenzradius der gegebenen Potenzreihe und I sei ein Intervall innerhalb des Konvergenzgebietes mit den Endpunkten λ
230
VI. Zahlenfolgen und Reihen
und fi. Sei ν die größere der Zahlen | λ | und | μ |. Wir wählen nun eine positive Zahl β mit ν < β < R aus. Der Punkt β liegt innerhalb des Konvergenzintervalls der Potenzreihe, also konvergiert die Reihe a0 + αφ + a2ß2 + · · · absolut. Ist nun χ ein Punkt aus dem Intervall I , dann gilt | anxn | < | an | ßn. Nach Satz 8.2 ist also die Potenzreihe a0 + a1a; + a2x2 + · · • in I gleichmäßig konvergent. Unter Anwendung der Sätze 8.4 und 8.5 können aus Satz 8.6 unmittelbar die folgenden Sätze hergeleitet werden. SATZ 8.7.1. Ist f(x) die Summe der Potenzreihe α0 + axx + a2x2 + · · · mit dem, Konvergenzintervall I und liegen die Punkte a und b in I. do/un gilt n-o n Τ L m. a. W. eine Potenzreihe Icann innerhalb des Konvergenzintervalls gliedweise integriert werden. Je
n-0
Je
SATZ 8.7.2. Ist f(x) die Summe der Potenzreihe aa + axx + a2x2 + · · · mit dem Konvergenzintervall I, dann ist f(x) in jedem Punid innerhalb von I differenzierbar, und es gilt f'(x) = ax + 2a2x + 3 a3x2
+-··;
m. a. W. eine Potenzreihe kann innerhalb ihres KonvergenzintervaUs gliedweise differenziert werden. Beispiel 8.6. Im Interrali |x| < 1 gilt 00
n-o
1 1
~
x
Durch Differentiation erhält man daraus
io £
η—0
( n + 1 ) l B =
(T^P
(n + 1)(» + 2)s» =
2
l1
.
x
>
Beispiel 8.6. Es ist oft möglich, den Grenzwert sogenannter unbestimmter Ausdrücke mit Hilfe von Reihenentwicklungen zu bestimmen. (Vgl. dazu V, 14; Regel von de l'Hospital.) lim
ex
;
e-x
= lim *-*>
,·
X — — + —3! 51 2
(π+Ι^+···)
= ^ — «->0 ~ *
3 ! + 51
9r
1 +
- = 2 lim ... *-M> I 1
^
+
-
,
-¡— = 2. 4_ . . . + 31
8. Gleichmäßige Konvergenz
231
Die Reihen in Zähler und Nenner des letzten Braches konvergieren gleichmäßig in jedem endliohen Intervall, das χ = 0 enthält, so daß wir auf Grand von Satz 8.1 den Grenzübergang gliedweise vornehmen können. Beispiel 8.7. Man berechne 11111
sin χ — χ Zä—·
LÖSUNG. Auf Grund von Beispiel 7. 7. 2 ist sina; — χ _ _!_/ a* | ®» s* \ ~ 3 Í 6Í
\_ /
1 3Γ
a? 5Í
'
und wegen der gleichmäßigen Konvergenz der letzten Reihe erhalten wir durch gliedweisen Grenzübergang sm» — χ , sin r lim ^ = —i· "x> Zum Schloß wollen -wir noch den folgenden klassischen Satz nennen: SATZ 8.7.3. Ist die Reihe a 0 + -f a2 + · · · konvergent, dann konvergiert 2 die Potenzreihe a0 -f- axx + a 2 a; + · · · gleichmäßig im Intervall O á » oo Je r» lim l f(x) sin nxdx — 0. n->-00 J«
9. Fourierreihen
235
Falls / und f stetig sind in [α, δ], kann man diesen Satz einfach mittels partieller Integration beweisen. Denn
J
b
J
J f»
α f(x) sin nxdx —
η ¡f(x) cos ηχγα Η η \ J« f(x) cos nxdx.
Ist nun M eine obere Schranke von | f(x) | und | f'(x) | in [α, δ], dann ist
£
f(x) sin nxdx
2M
M\b — a\
η
η
Hieraus folgt die Behauptung. Den Beweis für den allgemeinen Fall bringen wir nicht. Wir wollen jetzt noch einige Beispiele besprechen. Beispiel 9.1.1. Sei f(x) = x, falle — π < χ < π; sei / ferner periodisch mit der Periode 2n (vgl. Fig. 2).
Fig. 2 1 f* o„ = — l χ cos nxdx = 0 (n. = 0 , 1 , . . . ) , η J—jj 1 f» 21—l)n+1 b. = — \ χ sin nxdx = — (man prüfe es nach!). η J—π η Die Fourierreihe von / hat daher die Gestalt sin 2a; sin 3a: o I o
2 ^sinx
Setzen wir /(ζ) per definitionem an den Stellen χ = (2k + 1)π (fe ganz) gleich 0, dann gilt für alle χ fix) = 2 J ; »-1
1)n+1 n
sin rix.
Die ersten vier Glieder dieser Reihe sind nacheinander 2 sin x, — sin 2x, $ sin 3a;, — \ sin 4 a;. Diese Funktionen sind in Fig. 3 gezeichnet, angedeutet durch 1, 2, 3 und 4. Die „Näherungsfunktion" 2 sin a; — ein2a; + $ ein3a; — ^sin4i ist mit einem Stern (*) bezeichnet. Für χ — 4r erhalten wir aus der gefundenen Entwicklung π
,
1 , 1
1
VI. Zahlenfolgen und Reihen
236
Mg. 3 Beispiel 9.1.2. Sei f{x) = l f ü r O < a : < t t = — 1 für —η < χ < 0 = 0 für χ = 0, ± π Ferner sei / periodisch mit der Periode 2π(— oo < χ < oo). Vgl. Fig. 4.
1
1
0
ir
It
1
21t
-1 Fig. 4
o„ =
1 r* — l
7t J—η
f{x)
o n = 0 ( w = 0 , l , 2,...) 2 sin nxdx = •— {1 — (— 1)"} (man prüfe es nach!). Tin
Daher gilt für alle χ /
W
=
4 /. i r
+
sin Sx sin Sx \ + - r + ···)· —
9. Fourierreihen
237
Setzt mon χ = -¿r, dann erhält man aufs neue die Beziehung
Beispiel 9.1.8. Sei f(x) = |x| für —π ίί χ ^π; sei ferner/periodisch mit der Periode 2ji (vgl. Fig. 6).
ao
1 f* x ix = = — η J —n\ \
71
a n = i r ( " |x|ooew«fa=i-¿-{(—1·) —1} (ra = 1,2,...) π J—π 7lW b„ = 0 (ra = 1,2,...) (man prüfe es nach!). Daher ist
π 4/ , cos 3x , cos δχ , = Τ " ¥ l0081 + " Ρ " + ) Setzt man χ = π, dann erhält man .
/(a:)
8
T
32
T
62
\ *
T
Beispiel 9.1.4. Sei f(x) = t? (—π < χ < π); sei / ferner periodisch mit der Periode 2π. Dann ist bn = 0 und 2η α 0= — \ η Jio 3 2 Γ« 2 4 α„=—l χ cos nxdx = (—1)η—r (ra = 1, 2,...). π Jo ra2 Daher ist , λ2 ./coax cos2a; , cos 3 ζ \ . . , «'=-3 22 h j (—π^χ^π). Ffir χ = 0 folgt: jfl = 1 - +-a -+···. 12 2a 3 4a Die Reihen der Punktionen in Beispiel 9.1.1 und 9.1.2 sind Sinusreihen. Die Reihen der Funktionen in Beispiel 9.1.3 und 9.1.4 dagegen sind Kosinusreihen. Der Leser mache sich klar, daß die Fourierreihen von geraden Funktionen Kosinusreihen sind und die von ungeraden Funktionen Sinusreihen. Wir brauchen uns nicht aui Funktionen mit der Periode 2 π zu beschränken. Es gilt nämlich das folgende:
VI. Zahlenfolgen und Beihen
238
Haben f und /' die oben genannten Stetigkeitseigenechaften im Intervall [0, Γ] (T > 0) und ist f periodisch mit der Periode T, dann gilt /(*) = K mit
2πηχ A COB + -S(«»ooe—jp— + n-1 '
2 f2"
.
N
2πηχ\ j,
f(x) cos 2π™Χ dx (η = 0, 1, 2 , . . . )
&„ =
(η =
1,2,...),
wobei wir unter f(x) in einem Punkt, in dem diese Funktion unstetig ist, den f( x Q\ _L f t x o) Wert — verstehen wollen. ¿t Die Koeffizienten an und bn einer zu / gehörigen Fourierreihe besitzen eine Anzahl schöner Eigenschaften. So geben wir hier ohne Beweis an, daß folgende Beziehung für eine über [—π, π] integrierbare Funktion / gilt: I i " [j(x)f|^|Z| + |M>|. Um sie zu beweisen, setzt man ζ = χ -J- iy, w = u -f- i y, und man hat dann zu zeigen, daß |/(a; + « ) 2 + {y + νγ ^ yx2jry2jr yui-\-vi. Durch Quadrieren kann man diese Beziehung zurückführen auf {xu + y υ)2 ^ (x2 + y2) · (u2 + v2), und diese Ungleichung gilt für alle x, y, u und v. Aufgabe 6. Man beweise die letzte Behauptung. Aufgabe 6. Man beweise, daß |z — w\ ^ |z| + \w\. Aufgabe 7. Man beweise, daß |z — w| ¡ä |z| — \w\ ; |z — w\ 2: |io| — |z|.
Wir geben noch eine Formel für | zw | an. Man hat I zw I = ^zw · zw = /zzww = rfzï ]¡ww — I ζ | | M; |. Aufgabe 8. Man beweise für w Φ 0 die Identität \z : w\ — |z| : \w\.
Ν
Aufgabe 9. Man beweise | Σ
z»l
n—1
Ν
^ Σ ΙΖ»Ι·
n=l
Aufgabe 10. Man beweise |Re z| ^ \z\ ; |Im z\ ίΐ |z| ; |z| g |Re z| + |Im z\. 1 . 2 . Geometrische Interpretation. Seit C. F . G A U S S ist folgende geometrische Interpretation der komplexen Zahlen üblich. Man ordnet in eineindeutiger Weise jeder komplexen Zahl ζ = χ + i y den Punkt (χ, y) in einer Ebene mit rechtwinkligem Koordinatensystem zu. Umgekehrt entspricht auch jedem Punkt der Ebene eine komplexe Zahl. Eine derartig interpretierte Ebene nennt man auch komplexe Ebene oder komplexe Zahlenebene. Die reellen Zahlen entsprechen den Punkten auf der x-Achse, die rein imaginären denen auf der y-Achse. Ist ζ nicht-reell, dann ist die x-Achse die Mittelsenkrechte der Strecke zwischen den Punkten ζ und z. Aufgabe 11. Man beweise die letzte Aussage. Aufgabe 12. Man formuliere und beweise eine entsprechende Eigenschaft der {/-Achse.
Zwei komplexe Zahlen ζ und —ζ liegen spiegelbildlich bzgl. des Ursprungs, d. h. der Ursprung halbiert ihre Verbindungsstrecke. Der Absolutbetrag der Zahl ζ ist der Abstand des Punktes ζ vom Ursprung. Das folgt sofort aus der Definition von | Ζ | und dem Satz des PYTHAGOBAS. Sind in der komplexen Ebene die Punkte ζ und w gegeben, dann kann man auf rein geometrischem Wege die Summe s = ζ + w bestimmen. Der Punkt s liegt nämlich so, daß die Punkte w, Ο, ζ und s ein Parallelogramm bilden. (Falls Ο, ζ und w kollinear sind, ist eine kleine Zusatzüberlegung
1. Komplexe Zahlen
243
nötig.) Die Parallelogrammeigenschaft folgt unmittelbar ans der Definition Ree = R e z + R e u ; ; I m a = Im ζ + I m « , die bedeutet, daß der Vektor O s die Summe der Vektoren Ο ζ und Ow ist. Aufgabe 18. Bestimme geometrisch die Differenz s = w — ζ zweier gegebener komplexer Zahlen, einmal ausgehend von der Identität w = ζ + β, zum anderen unter Berücksichtigung, daß β = w + (— z).
Aus der geometrischen Interpretation sieht man auch sofort, daß der Abstand zweier Punkte ζ und w gleich dem Absolutbetrag der Differenz w — ζ ist, also I w — ζ I. Aufgabe 14. Man beweise dies. Aufgabe 15. Man leite die Ungleichung \w -f- z| S» |w| + \z\ aus der geometrischen Interpretation der Zahlen w, ζ und w + ζ her.
In der analytischen Geometrie kann man einen Punkt außer durch rechtwinklige Koordinaten auch durch Polarkoordinaten beschreiben. In der komplexen Ebene kann man einen Punkt ζ außer durch die rechtwinkligen Koordinaten χ — Re ζ und y = Im ζ auch durch die Polarkoordinaten ] ζ | und φ beschreiben, wobei φ der Winkel ist, den Oz mit der positiven a;-Achse bildet. Das ist für jeden Punkt ζ Φ 0 möglich. Den Winkel ψ, der bis auf ganzzahlige Vielfache von 2 π bestimmt ist, nennt man arg z. Folgende Formeln geben uns den Zusammenhang zwischen den rechtwinkligen Koordinaten x, y und den Polarkoordinaten | z | , φ desselben Punktes an: Re ζ = I ζ I cos (arg ζ) ; Im ζ = | ζ | sin (arg ζ). Aufgabe 16. Man drücke \z\ und arg ζ durch Re ζ und Im ζ aus.
Für alle ζ Φ 0 haben wir die Relation z=\z\ (cos (arg z) + t sin (arg z)). Für das Produkt β = zw zweier von Null verschiedener Zahlen w und ζ erhalt man, wenn man arg ζ = « und arg w = ß setzt: β = zw = I ζ I (cos α + i sin α) | w | (cos ß + i sin ß) = \ z\\w\ {cos ( 0 dem Symbol j/χ zuordnet, ist das Symbol j/z doppeldeutig, und in konkreten Fällen muß noch angegeben werden, welche der Wurzeln man meint. Setzt man \ z\=r, arg ζ = φ, \ w | = s, arg w — ψ, dann muß also gelten s 2 = r und 2 ψ = φ + 2 π η (η ganz). Geometrisch sieht man sofort ein, daß es zwei verschiedene Lösungen gibt, beide mit dem Absolutbetrag J f r , aber mit den beiden verschiedenen Argumenten \φ und + π. Ebenso wie im Reellen haben die Wurzeln der betrachteten Gleichung entgegengesetztes Vorzeichen. Aufgabe 23. Bestimme zi in ähnlicher Weise.
Nun, da es möglich ist, aus einer beliebigen komplexen Zahl die Quadratwurzel zu ziehen, sieht man leicht ein, daß über der Menge der komplexen Zahlen jede quadratische Gleichung az2 + 6z + c = 0 lösbar ist, auch wenn die Koeffizienten a, b und c nicht-reell sind. Aufgabe 24. Man zeige, daß die Wurzeln der quadratischen Gleichung durch die „bekannten" Formeln ausgedrückt werden können.
Ferner kann man sogar zeigen, daß jede Gleichung «-ten Grades a0zn + ajz"-1 + · · · + an_jz + an = 0 mit komplexen Koeffizienten a0, alt.. ., an genau η (nicht notwendig verschiedene) komplexe Wurzeln hat (Fundamentalsatz der Algebra). Wir kommen hierauf noch zurück (VII, 5.2).
1. Komplexe Zahlen
245
1.3. Grenzwerteigensehalten. Die Definition des Limes einer Folge komplexer Zahlen zlt z2, . . . entspricht genau derjenigen für eine reelle Folge, lim zn = ζ bedeutet, daß es zu jedem positiven ε eine ΖαΜ Ν Η->OO
gibt, so daß \ ζ — z„ |
Ν.
Aus lim zn = ζ folgt η->oo lim Re zn = Re ζ und lim Im zn = Im ζ (weil | Re (z — z j | ¿ \z — zn\ η->oo η->oo und ] Im (ζ — zn) | | ζ — z„ |). Umgekehrt folgt aus lim Re zn = χ und η->oo lim Im zn = y auch die Beziehung lim z„ = χ + iy. Zum Beweis braucht n->oo n->oo man die Eigenschaft | ζ — z„ | S | Re (ζ — zn) | + | Im (ζ — z„) | (vgl. VII, 1.1; Aufgabe 10). Aufgabe 25. Man führe die beiden angedeuteten Beweise aus.
Wir sêhen also, daß die Grenzwerteigenschaften komplexer Zahlen äquivalent sind mit den entsprechenden Grenzwerteigenschaften der Real- und Imaginärteile. Da die Definition des Grenzwerts einer komplexen Zahlenfolge formal dieselbe ist wie im reellen Fall, gelten — sofern man sie unmittelbar aus der Definition herleiten kann — für komplexe Limiten dieselben Regeln wie für reelle: Aus lim zn = ζ und lim wn — w folgt »->00 η->oo lim (zB - f wn) = ζ + w = lim zn + lim wn; lim (zn — wn) = ζ — w\ »->oo n->oo η->oo η->oo lim czn — c ζ (c ist eine Konstante) ; η->oo lim znwn = zw, »->00 l i m — = — (falls ζ φ 0 und ζ, φ 0 für i — 1, 2 , . . . ) . ζ» ζ Aufgabe 28. Man prüfe diese Regeln nach.
Ferner folgt aus lim zn — ζ noch lim z„ = z, also lim | zn | = | ζ |. N->CO
A->GO
«->OO
Aufgabe 27. Man beweise diese beiden Eigenschaften.
Schließlich gilt noch (eventuell nur bis auf Vielfache von 2 π) lim (arg zn) «->00 - arg z. Denn . . . Imz» Im ζ lim sin (arg z„) = lim -——— = ——— = sin arg ζ n^. Ζ» \\
η->α>
Z
246
VII. Funktionentheorie
und entsprechend lim cos (arg zn) = cos arg z, also lim arg z„ = arg ζ evenη->οο η->00 tuell bis auf Vielfache von 2π. Umgekehrt folgt aus lim | z„ | = \ z\ und lim arg zn = arg z, daß auch n->«> n->- co lim zn = z. ft->00 Aufgabe 23. Man prüfe dies nach.
Das obige gilt natürlich nur, wenn arg zn und arg ζ existieren. Aufgabe 29. Man diskutiere die Fälle, wenn eines oder mehrere der auftretenden Argumente nioht existieren.
Wir geben eine Anwendung des eben Behandelten und beweisen, daß lim (1 + z¡n)n existiert. Den Limes nennt man ez. n->oo Man setze w. Dann ist I ν). Also
worin lim tn = 0 (man beweise es). Also lim In | wn | = x, lim | wn | = è η->00 Λ->·οο η->00 Ferner ist arg wn — n arg f 1 —|
ζ\ tilib ν ] = η arctg Ί '—— = η arctg η) 1 + %¡n η + ® ny η -j- z
îi + ï , y -arctg— y η + χ
Wir erhalten also ¡ w„ | ->ex und arg wn
>y (fur η
. oo).
y. Also
Re wn -> e cos y, Im wn -> ex sin y. x
Also existiert lim zn und ist gleich ex cos y + iex sin y. η->00 Bezeichnet man per definitionem den Grenzwert mit ez, dann gilt also ez = ex (cos y + i sin y). Wählt man ζ reell (ζ — χ, y = 0, dann erhält man die alte Definition von ex aus der reellen Analysis. Wählt man ζ rein imaginär (z — iy, χ — 0), dann erhält man eiy = cos y + i sin y (EuLEBsche Formel). Folglich gilt ez = exe{". Ferner gilt für beliebige komplexe Zahlen ζ
1. Komplexe Zahlen
247
und w die Gleichung ez+w = ezew. Denn wenn z — x-\-iy und w = u + ist, dann gilt auf Grund der Additionstheoreme für sinus und cosinus e'ew=
e*(cosy + isini/) e"(cosi;+ i sin υ) = e I + u {cos («/ + *>) + »sin
(y +
iv
u)}
Weiterhin definiert man w = In ζ durch ζ = e". Also | ζ | = e", arg ζ = υ und \nz = w = uJ[-iv = ln | z | - f i arg z. Da das Argument einer komplexen Zahl nur bis auf Vielfache von 2 π bestimmt ist, ist auch der Logarithmus einer komplexen Zahl nur bis auf ein Vielfaches von 2πί bestimmt. Den Wert von lnz, dessen Imaginärteil zwischen — π und + π liegt (einschließlich -f- π), nennt man den Hauptwert von In z. Dann definiert man für beliebiges komplexes ζ oos ζ = i ( e t ó + e~iz),
tg ζ =
sin ζ =
(e" — e
sin ζ , cos ζ , cotg ζ = cos ζ sin ζ
Aufgabe 30. Man beweise für beliebige komplexe Zahlen s und w die Additionstheoreme sin (a + w) = sin ζ cos w + cos ζ sin w; cos (z +
w)
= cos ζ cos w — sin ζ sin
io.
Schließlich kann man noch die zyklometrischen Funktionen definieren. Unter arc sin ζ versteht man einen der Werte w, die der Gleichung ζ = sin w genügen. Analoge Definitionen gelten für arc cos ζ und arctg z. Insbesondere führt w — arctg ζ zu ζ = tg
w=
sin w cos w
=
1 eiw — e~ia i
etu> + e~iw
= —
.
ι
eiiw—1 e2ia
, + 1
also zu Mm _
e
1
+
iz
— ~1ü — IZ · ·
Deshalb gilt 1 ,
w = artg ζ = — In 2i
1 + iz 1—iz'
Da der Logarithmus nur bis auf Vielfache von 2π% bestimmt ist, ist der Wert von arctg ζ nur bis auf Vielfache von π festgelegt. Für komplexe ζ und w haben wir noch nicht zw definiert. Per defmitionem setzen wir: zw = ewiaz. Dieser letzte Ausdruck ist für nicht-ganze w nicht eindeutig. Denn da In ζ nur bis auf ganzzahlige Vielfache von 2 π i bestimmt ist, ist der Exponent nur bis auf ein ganzzahliges Vielfaches von 2 n i w bestimmt, und das spielt bei nicht-ganzem w eine Rolle.
248
ΥΠ. Funktionentheorie
Für Μ>χ = i erhält man ζ. Β. s = eiìn* = e*1»M + H«««, a ig 0 | β | = j/[7¡"> a r g β = J arg ζ, und dies Argument ist nur bis auf ein Vielfaches von π bestimmt, so daß man wieder zwei Werte für s mit entgegengesetztem Vorzeichen erhält. Aufgabe 31. Man bestimme sin zi, In t, arctg 2t. Aufgabe 82. Man bestimme zwei Werte für t'.
1.4. Punktmengen in der komplexen Ebene. Wir wollen den Begriff Weg definieren. f(t) und g(t) seien für a ^ t ^ & reelle stetige Funktionen. Die Menge der in der komplexen Ebene liegenden Punkte der Art z(t) = f(t) -f- ig(t) (a ^ t 6) nennt man eine stetige Kurve. Liefern verschiedene Werte von t (eventuell mit Ausnahme der beiden Werte a und b) verschiedene Punkte, dann nennt man die Kurve einen Jordanbogen. Aufgabe 83. Man beweise, daß eine Strecke ein Jordanbogen ist.
Jeder Jordanbogen hat eine Orientierung, die durch die Orientierung des Intervalls [α, 6] induziert wird: ein Punkt z 1 = z(f1) soll per definitionem vor einem Punkte z2 - z(i2) liegen, wenn tl0
+
^
= lim u ( x ° + A^O
. ·,· v(z0 + h, y0)— v(x0, i/o) + t hm γ = h Α-M)
h
·
du o
dx
— u(xo> Vo) A 3v 1 - — . 3xo
252
VU. Funktionentheorie
Jetzt nehmen wir an, daß Re ζ — Re z 0 , oder ζ = z0 + ih, wobei 1c reell ist. Dann findet man *->• o =
^
u ( z
, y
0
0
+
k ) —
u ( x
, y
0
0
)
^
k-¥0
v { x
0
, y
+
0
λ)
i->-0
dv
.
•t-
3y0
—
v ( x
0
,
y
0
)
*k
du
3y0
'
Hieraus schließt man: falls eine Punktion / = u + i ν in einem Punkt ζ differenzierbar ist, dann gilt in diesem Punkte j3w
_
dx
du d y '
_
dv
dy
d x
Κ ' - ' Ί ί
(CAXJCHY-RrEMAîtNsche Differentialgleichungen).
Wir zeigen nim, daß diese Gleichungen nicht nur eine n o t w e n d i g e , , sondern auch eine h i n r e i c h e n d e Bedingung für die Differenzierbarkeit an der Stelle ζ sind. Dazu bestimmen wir aufs Neue f'(z) = lim
^
fS^L )
w o bei
h
nun eine komplexe Zahl h = j + ik darstellt und die Punkte ζ + h sich längs einer beliebigen Kurve dem Punkt ζ nähern. Dann hat man f ( z
+
h)
—
f ( z )
u ( x
+
j , y
+
k )
+
i l e
—
u ( x , y )
. v ( x ι -
—
h
j
+
j , y
+ j
+
k )
—
v ( x ,
y )
i k
Nun gilt u
{
x
+
j
,
y
+
k )
=
u
(*, „ + /
+ ,,) + *
+ r.),
wobei lim rx = lim r2 = 0; Λ->0 h-+0 (vgl. V, 47) ;^eine analoge Beziehung gilt für v{x + j, y + k). Da Ä-> 0 äquivalent ist mit j 0 und k -> 0, erhält man .
f ( z
+
/(z)
h)
( j
du
k
du
i j
dv
i k
d v \
Aus (2.2; 1) folgt, daß der letzte Grenzwert sich in der Form i j
+
i k
du
.
j
i k
3 î A
du
^
dv
a->o \ h dx h d x ] dx dx schreiben läßt, so daß der betrachtete Grenzwert einen Wert besitzt, der unabhängig ist von der Art, wie sich die Punkte ζ + h der Stelle ζ nähern.
253
2. Funktionen
Beispiel. Die Funktion w = z* = 3? — y2 -f 2ixy genügt den Cauchy-Riemannschen Differentialgleichungen. Denn ux = 2x = vy ; uy = — 2y — — vx. Ebenfalls ist die Funktion w — ex differenzierbar. Denn u = ex cos y, ν = ex sin y; ux = ex cos y =
uv = — e* sin y = — r,.
Aufgabe β. Man beweise, daß w = z" für jedes natürliche η differenzierbar ist und daß jedes Polynom differenzierbar ist. Aufgabe 7. Man beweise, daß die Funktionen to = sin ζ und w = cos ζ für alle ζ differenzierbar sind. Aufgabe 8. Man zeige, daß w = In ζ für ζ Φ 0 differenzierbar ist und daß w' — 1/z. Aufgabe 9. Jede rationale Funktion ist überall differenzierbar außer in den Nullstellen des Nenners. Aufgabe 10. Gilt in einem Gebiete w' = 0, dann ist w in diesem Gebiet konstant.
DEFINITION. Man nennt eine Funktion f in einem, Punkte z0 holomorph (oder auch regulär), wenn f in jedem Punkte einer Umgebung von z0 differenzierbar ist. 2.3. Integrierbarkeit. Wir gehen aus von einer stetigen Funktion / und einem Weg W, der durch die Gleichungen χ = x{t), y = y(t) mit dem Anfangspunkt a = x(tx) + iy(-facher Pol von /.
(Z — Λ;"
und ist g holomorph in α mit g(a) Φ 0, dann ist a
Ein Pol ist also eine isolierte Singularität einer Funktion. Es gibt verschiedene Methoden, um das Residuum einer Funktion / in einem p-fachen Pol α zu bestimmen. Ist z.B. g(z) = (z — a)pf(z), dann erhält man, wenn W ein geschickt gewählter, a einfach umschließender Weg ist, Res/(z)=-L( /(z)dz=_L( 2 π%)ψ 2nt)w(z fr-1)1"
g(2)
— a)v
dz
9(p-1}(*) = -τ—-m {(z-a)"/(Z)}^. w (P —1)1
Beispiel. Das Residuum von f(z) = (s2 + l) _ n im Punkt », der n-faeher Pol von / ist, lautet demnach
1
I
1
\Q-1) = (—)"-in(n + 1) · · · (2» — 2) ( )"~1(2n 2)1 (» — 1) ! (» — 1) 12,Λ-1»2η~1
/ i n - 2\ \n — l)
'
3.4. Anwendungen des Residuensatzes. Mit Hilfe des Residuensatzes kann man viele uneigentliche Integrale der reellen Analysis berechnen.
VII. Funktionentheorie
264
Wir behandeln als Beispiel das Integral .
dx d
f»
f 4 •X+ '·
1 J —00 Um I zu bestimmen, gehen wir von dem komplexen Integral J =
dz
[
)wzi
— z + l
aus, wobei IF aus der Strecke (— R, R) der reellen Achse und dem in positivem Sinn durchlaufenen Halbkreis H mit Mittelpunkt 0 und Radius R besteht, der im ersten und zweiten Quadranten liegt. R ist eine beliebige reelle Zahl > 1. Die einzigen Stellen, in denen der Integrand von J singular wird, sind die einfachen Nullstellen i ± Jt 1^3 von z2 — z + 1. Da i? > 1 ist, liegt der Punkt a = | + è»V3 im Innern von W, der Punkt ä allerdings nicht. Das Residuum des Integranden in α ist ζ— α ,. ζ—a 1 1 lim -- Jim z+a(z — a)(z—
^„z2 — 2 + 1
Also
à)
a—â
{ f ë '
w
2π
Daher gilt CR
dx
L«*2
f
— x + 1
dz
_
2π
J h z* — z + 1 ~ j/3 '
Wir lassen nun R gegen oo streben. Das erste der beiden Integrale strebt dann dem gesuchten Grenzwert zu. Für das zweite erhält man dz
JH z i
7t R
min
— z+ 1
|za
2 auf Η
JIR
< — z + 1 | $R
wenn R hinreichend groß gewählt wird. Aulgabe 11. Man prüfe die letzte Bemerkung nach.
Also strebt das zweite Integral für R f°° )_«,
oo gegen Null. Wir erhalten daher 2π
dx a2
— x+
1 ~~ ~γξ'
Aufgabe 12. Man beweise in derselben Weise für natürliche Zahlen η Γ» dx /2n 2\ 21-an
Jo («» + 1)"
Vη—1/
Aufgabe 18. Man berechne dx
ÎΟ χ* — ix* + 5 '
·
3. Integralsätze
265
Aufgabe 14. Man berechne r=°
dx
J-oo
(x — i)
(s —2 t)
'
Welche Formeln erhält man, -wenn man das letzte Integral in Real- und Imaginärteil aufspaltet?
Mit Hilfe des Residuensatzes kann man auch das wohlbekannte Integral sina; ,
H3
-dx
χ
berechnen. Dazu geht man von dem Integral (
Ü^Ä
Fig. 3
JW 2
aus, wobei W aus der Strecke (r, B), dem oben bereits beschriebenen Halbkreis H, dem Stück (—B, —r) und dem Halbkreis Κ mit Mittelpunkt O und Radius r besteht; der letztgenannte Halbkreis wird von —r nach r durchlaufen (r < B). Da im Innern von W keine Singularität des Integranden hegt, ist das betrachtete Integral Null. Der Wert des Integrals auf den Teilstücken der reellen Achse ist gleich r-r etx \ — d x j—R X
f B eix
4- \ — d x ir
=
X
CR \
e
ix_
Jr
e
-ix
®
Γ* sin*
dx =
2» \
Jr
,, dx.
»
Das Integral längs Η läßt sich in folgender Form schreiben:
S
η
/,iiÍ(coeí+islní) ,
p /
,
. •
çn Β (— sin t +
t COS t) dt =
»\
e-ÄBlni+iBcost
Ä
o if(cos t + Integral t sm t) in drei Teilintegrale längs Jo Wir spalten dieses der Teile
27,(0,-=), ]/Β)
2/,(—L-, π
¿Lr| und ΗΑπ 3 \
V B )
ΫΒ
π
,
auf. Für das mittlere erhält man, daß es — absolut genommen — höchstens gleich 2 \ Bstot im 0 — z- — = ( » e ' V o = *'·
Wenn r hinreichend klein ist, dann ist das erste dieser beiden Integrale längs efa— 1 Κ absolut genommen höchstens gleich πτ max , und es strebt gegen 0, da
J
QÍZ ζ
κ
z
in der Umgebung des Nullpunkts beschränkt ist.
Das zweite Integral ist gleich — n i . Aufgabe 16. Man beweise diese Behauptung. Γ
e te
Indem wir in l — dz = 0 r gegen 0 und R gegen oo oo streben lassen, erJjt ζ halten wir Γ® s i n * . f » sina; π ¿i \ dx — πι = 0, also \ dx = —. Jo χ Jo « 2 Aufgabe 17. Man berechne
wn^es
^
>
o)
4. Reihen 4.1. Orondeigenschaften. Man nennt eine Reihe ·Ση=ι wn konvergent, wenn die Folge ax, e 2 , . . . der Partialaummen einen Grenzwert besitzt; hierbei ist * * = J w « (N = 1 , 2 , . . . ) .
267
4. Reihen
Besitzt die betrachtete Folge keinen Limes, dann nennt man die Reihe divergent. Viele Eigenschaften von Reihen mit reellen Gliedern gelten auch für Reihen mit komplexen Gliedern. Wir wollen eine Anzahl wichtiger Eigenschaften von Reihen mit komplexen Gliedern zurückführen auf Eigenschaften reeller Reihen, die in Kapitel VI behandelt werden. Selbstverständlich kann man aber die Eigenschaften von Reihen mit komplexen Gliedern auch unmittelbar herleiten. Sei -Ση-ι wn konvergent mit der Summe s. Dann gilt also lim βχ = s, oder ¿f->a> nach Aufteilung in Real- und Imaginärteile «y
= Ρκ +
e = p + iq, lim py = p, lim q# = q.
Umgekehrt folgt aus den beiden letzten Beziehungen auch lim s y = s. Notwendig und hinreichend für die Konvergenz einer Reihe wn ist also, vn kondaß die Reihen der Real- und der Imaginärteile -Ση-ι un und vergieren. Das CAucHYsche Konvergenzkriterium für Reihen mit reellen Gliedern gilt auch für Reihen mit komplexen Gliedern. Es lautet dann wie folgt. Eine Reihe wn konvergiert dann und nur dann, wenn es zu jedem positiven ε eine Zahl Ν gibt, so daß I wn+1 + · · · + wn+t I < ε für alle η > Ν und k > 0. (4.1 ; 1) BEWEIS. Daß die Konvergenz der Reihe die angegebene Ungleichung zur g
Folge hat, ist unmittelbar einzusehen. Denn aus lim sn = s folgt | s — sn | < --η->oo " für allen > N . Also gilt | «n+* — β » | = | («„+* — «) + (e — « J I á | «•+» — « I € ß + I β — sn j < — +— = £ für alle n> Ν und k > 0. ¿ A Sei umgekehrt (4.1; 1) gegeben. Dann gilt I M„+x + · · · + Un+t I g I wn+1 H
h wn+k I < e
für alle re > Ν und k > 0, so daß auf Grund des CAUOHYschen Konvergenzkriteriums für reelle Reihen die Konvergenz der Reihe mit lauter reellen Gliedern feststeht. Ebenso erhält man aus (4.1; 1), daß die Reihe konvergiert. Dann ist aber auch die Reihe wn konvergent. w Gilt für eine Reihe -Ση-ι n> Glieder wn von einem gewissen Index Ν an der Ungleichung | wn | £ Wn genügen und konvergiert die Reihe Wn, dann konvergiert auch die Reihe (Die Reihe Wn nennt man eine Majorante der ursprünglichen Reihe; man sagt auch, die ursprüngliche Reihe wird durch Wn majorisiert.) Wir können diese Behauptung auch folgendermaßen formulieren: eine Reihe mit konvergenter Majorante ist selber auch konvergent.
268
ΥΠ. Funktionentheorie
Wir beweisen diesen Satz mit Hilfe des CAUCHY-Kriteriums. Zu jedem ε > 0 gibt es wegen der Konvergenz der Majorante ein N, so daß w
n+i Η
1" w*+i < ε für alle % > A . T und k > 0.
Mit Hilfe der Ungleichung I «>n+1 -\
h wn+i I á I W„+1 H
H «>„+* I ^ wn+1 + ··· + Wn+k < ε
ergibt dann das Cauchy-Kriterium, daß auch die ursprüngliche Reihe konvergiert. Genau wie bei Reihen mit reellen Gliedern gilt der folgende Satz über Minoranten von Reihen. SATZ. Wenn für die Glieder einer divergenten Reihe wn von einem gewissen Index Ν an \wn \ ^ Wn gilt, dann divergiert auch die Reihe W„. Aufgabe 1. Man beweise diesen Satz (indirekt).
DEFINITION. Eine Reihe ϋ ® , ] » , konvergiert absolut, wenn die Reihe •^n-i I wn I konvergiert. Aus dem Majorantensatz folgt unmittelbar: Wenn eine Reihe absolut konvergiert, dann konvergiert sie auch in gewöhnlicher Weise. Aufgabe 2. Man zeige dies.
Daß nicht jede gewöhnlich konvergente Reihe auch absolut konvergiert, sieht man an einfachen Gegenbeispielen. Aufgabe 8. Man gebe ein solches Gegenbeispiel an.
Die geometrische Reihe ·Σ„~ί z ° konvergiert für alle ζ mit | ζ | < 1. Aufgabe 4. Man beweise dies. 00
J
Die hyperharmonische Reihe Σ — ist absolut konvergent für alle ζ mit n-l M ι ι Re ζ > 1. Denn sei χ = Re ζ > 1. Dann hat man — = —x , so daß nz n unsere Reihe auf Grund der reellen Analysis absolut konvergent ist. Die Summe der Reihe bezeichnet man mit ζ(ζ) (RrEMANNsche f-Funktion). Die Funktion £(z) ist also für alle ζ definiert, die in der Halbebene Re ζ > 1 liegen. Aufgabe 5. Man zeige, daß {(1) nicht existiert.
4. Reihen
269
4.2. Reihen von Funktionen. Im vorangegangenen haben wir im wesentlichen Reihen mit konstanten Gliedern betrachtet. Nur am Ende kamen Reihen vor, deren Glieder Funktionen der komplexen Veränderlichen ζ sind. Wir wollen nun derartige Reihen Ση=ιίη( ζ ) näher untersuchen. Da für die Konvergenz einer solchen Reihe an einer gewissen Stelle ζ natürlich alle bisher genannten Eigenschaften von Reihen gelten, wollen wir jetzt untersuchen, in welcher Weise das Verhalten (eventuell die Konvergenz) einer solchen Reihe von der Veränderlichen ζ abhängt. Genau wie in der reellen Analysis führen wir dazu den Begriff der gleichmäßigen Konvergenz ein. DEFINITION. Man sagt·, eine Reihe Σ„=ι fn(z) konvergiert gleichmäßig in einem Gebiet G, wenn es zu jedem positiven ε eine Zahl N0 gibt, so daß für die Partialsummen | Sy(2) — s{z) \ < ε für alle Ν > N0 gilt. Dabei hängt N0 nur von ε ab und ist unabhängig von dem speziellen ζ aus G. Es ist unmittelbar einsichtig, daß für eine in G gleichmäßig konvergente Reihe J£"_i/„(z) auch die Ausdrücke i *„+*(*) - * » ( z > I = I /»+i(2) + · · · + /„+*(*) I
(4.2; 1)
gleichmäßig gegen Null gehen, d. h. zu jedem positiven ε gibt es ein von ζ unabhängiges N0, so daß die Ausdrücke (4.2; 1) kleiner als ε sind, wenn Ν > N 0 und Jfc>0. Aufgabe β. Man zeige dies.
Auch die Umkehrung gilt. Um das zu zeigen, setzen wir wieder / n (z) = = un{z) + iv„(z). Wir beweisen dann: wenn die Ausdrücke (4.2; 1) gleichmäßig gegen Null gehen, dann konvergiert die Reihe gleichmäßig. Die reellen Ausdrücke un+1(z) + · · · + un+t(z) sind absolut genommen höchstens gleich den Ausdrücken (4.2; 1) und gehen daher gleichmäßig gegen Null, so daß auf Grund der reellen Analysis die Reihe Σ η = ι u n( z ) gleichmäßig konvergiert. Ebenfalls gleichmäßig konvergent ist in diesem Fall die Reihe Σ ΰ = ι ν η ( ζ ) · Aufgabe 7. Man zeige dies.
Also ist auch die Reihe Ση=ιίη(ζ)
i11 ® gleichmäßig konvergent.
Aufgabe 8. Man zeige auch dies.
SATZ. Wenn man eine Reihe /n(z) in einem Gebiet G durch eine in G gleichmäßig konvergente Reihe majorisierenkann, dann ist auch die ln Reihe Ση-ιίη(ζ) ® gleichmäßig konvergent. BEWEIS. Zu jedem positiven ε gibt es wegen der gleichmäßigen Konvergenz der Reihe F„(z)ein v o n 2 unabhängiges N0, so daß | Fn+ x(z)H *(ζ) I < ε
VII. Funktionentheorie
270
für alle n>N0 und k> 0. Aus | / m (z) | ¿ Fm(z) folgt dann auch, daß I fn+i(z) + ' ' ' + / n + t( z ) I < e für alle η >N0 und k > 0. Dann konvergiert die Reihe fn(z) aber nach dem vorigen Satz auch gleichmäßig in G. SATZ. Wenn die Reihe / n (z) in einem Gebiet 0 gleichmäßig konvergiert und wenn jede der Funktionen /„ in 0 stetig ist, dann ist auch die Summe der Reihe in G stetig. BEWEIS. Sei s(z) die Summe der Reihe; ferner sei «(*)=
lfjz)+r B-l
y
( z ) (N=> 1 , 2 , . . . ) ·
Sei ε > 0 und ζ ein beliebiger Punkt aus G. Da die Reihe gleichmäßig konvergiert, gibt es eine Zahl N0, die nicht von ζ abhängt, so daß für alle Ν > N0 die Ungleichving | I < i e gilt. Wir fixieren nun ein solches N. Dann gilt dafür | rN(ζ') | < J e für alle z' aus G. Die Summe fn(z) ist als Summe endlich vieler stetiger Funktionen wieder stetig. Es gibt also eine Zahl δ, so daß für alle z* aus G mit | ζ* — z \ < δ gilt : Fl = Weiterhin gilt | r¡r{z*) |
Ν l s (ζ) dz — \ f^dz JW JÏF
l f„(z)dz }W
=
\ rn(z)dz < T ' JW
L
=
e
>
woraus die Behauptung unmittelbar folgt. SATZ. Wenn alle Funktionen fn in einem, Gebiet G holomorph sind und wenn die Reihe ^®=1/n(z) in G gleichmäßig konvergiert, dann ist auch die Summe f(z) der Reihe in G holomorph, und ferner gilt für k — 1 , 2 , . . . fk)(z) =
n=l
Ifnk)(z)·
BEWEIS. W sei ein beliebiger geschlossener Weg, der samt seinem Innern in G liegt. Da alle Punktionen /„ holomorph sind, gilt fw /„(«) de = 0. Alle Funktionen fn sind stetig (da holomorph). Da dießeihe i/»( 2 ) gleichmäßig in G konvergiert, erhalten wir aus dem vorigen Satz ( f(s)cU Λ
ί
i
ferner gilt n=0
n-=0
\Z1
z
0/
Wegen der Konvergenz der Reihe Σΰ-οα„(Ζι — z0)" ist lim an(z1 — z0)n = 0, « -> CO also I an(zl — z0)n | ^ M für alle n. Als Majorante der Reihe Σ„=0an(z — z0)n »
r
nehmen wir die Reihe Σ Mp n , wobei 0 ¿ ρ = ¡- < 1 und ρ λ—o I zx ZQ I eine von ζ unabhängige Zahl ist. Die Reihe Σ η = ο α η ( ζ — z0)n besitzt also im abgeschlossenen Innern von C eine konvergente Majorante ¿^0Mpn und ist dort gleichmäßig konvergent. Unmittelbar aus dem Satz folgt: Divergiert eine Potenzreihe Σ„=ο α «( ζ — zo)" in einem Punkt z2, dann divergiert sie auch in allen Punkten ζ mit I ζ — Z0 I > I z2 — z0 I. Denn wäre die Reihe in einem solchen Punkte konvergent, dann müßte die Reihe nach dem soeben Bewiesenen auch in z2 konvergent sein, im Widerspruch zur Voraussetzung. Auf Grund der bewiesenen Eigenschaften können wir den Konvergenzkreis definieren. Der Konvergenzkreis einer Potenzreihe in (z — z0) ist derjenige Kreis mit dem Mittelpunkt z0 und dem Radius R, in dessen Innern die Potenzreihe konvergiert und in dessen Äußerem sie divergiert (vgl. die Theorie der reellen Potenzreihen). Nach dem Bewiesenen konvergiert die Potenzreihe gleichmäßig in dem abgeschlossenen Innern eines jeden Kreises D, der ganz im Innern von G liegt. Die Reihe stellt hier also eine holomorphe Funktion dar (da alle Funktionen a„(z— z0)n holomorph sind). Sei f(z) = Ση=οαη(ζ— z0)n. Auf Grund des vorigen Paragraphen erhält man dann im Innern von D für k = 1 , 2 , . . . /(z) = Σ a„n(n — 1) · · · (n — k + 1) (ζ — ζ0)η~Κ n=0
273
4. Reihen
Also
/(z0) = klak, oder
und daher f(z) = Σ
(Z
, ·2θ)*/^'(Zo) (TAYLOB-Reihe).
Wir waren ausgegangen von einer Potenzreihe, zeigten, daß sie im (offenen) Innern von C eine holomorphe Funktion darstellt und fanden, daß die Ausgangsreihe gerade die TAYLOB-Reihe dieser Funktion ist. Jetzt gehen wir von einer Funktion / aus, die in einem Gebiet G holomorph ist, und zeigen, daß sie um jeden Punkt von G eine T A Y L O B Reihe besitzt. z0 sei ein Punkt von G und C ein Kreis mit Mittelpunkt z0> der samt seinem Innern noch ganz in G liegt, ζ sei ein Punkt 4 aus dem Innern von C. Dann hat man / m - Ö M 2π%
. Jc 2π%
Jo s — ζ
m de \
Da
s — z0
»—
für alle Punkte s auf C konstant und kleiner als 1 ist, läßt sich
der Integrand auf C in eine gleichmäßig konvergente Potenzreihe in (z — z0)n entwickeln:
m (z-z0)". Σ n-=0 » — *o)n+1 Wegen der gleichmäßigen Konvergenz kann man diese gliedweise integrieren. Man findet dann f(z)= Σ an(z — z0)n, n=0
wobei ι f m 2ret )o (a — z0)»+i
n) da =/< (z0)
W!
Also haben wir die Funktion / um den Punkt z„ in eine Taylor-Reihe entwickelt. ANWENDUNG. Die Funktion /(z) = é ist holomorph in jedem Punkt z; aus fn)(z) = e", also /(n>(0) = 1, erhält man e* = 18 KuJpera-TImman, Mathematik
Σ n=0
274
VII. Fuaktionentheorie
Aufgabe 9. Man leite die bekannten Reihenentwicklungen für sin ζ und cos ζ her. Aufgabe 10. Man entwickele die Funktion —— .,„ 2in eine Potenzreihe nach Poten-
te — l)
zen von z.
Aufgabe 11. Man bestimme die Reihenentwicklung nach Potenzen von (z — 1) der Funktion
Ή;*.
wobei der Integrationaweg geradlinig von 1 nach ζ verlaufen soll (diese Festlegung schließt aus, daß der Integrationsweg Schleifen um den Nullpunkt, die singulare Stelle des Integranden, legt). Negativ reelle Werte von ζ und ζ = 0 sind ausgeschlossen. Für welche ζ konvergiert die Reihe ? Aufgabe 12. Man untersuche die Funktion
(in ähnlicher Weise wie in Aufgabe 11).
Da die in VII, 1.3 definierte Funktion w = In ζ und die in Aufgabe 11 definierte Funktion /(z) dieselbe Ableitung ~ haben, sind sie bis auf eine additive Konstante gleich. Nehmen "wir denjenigen ,Zweig' von w — In ζ, für den I Im w [ < π ist, dann sieht man (indem man ζ. Β. ζ = 1 einsetzt), daß die Konstante 0 ist. Aufgabe 18. Man prüfe das nach.
Wir erhalten also CZ fe
l — = In ζ (ζ Φ 0, ζ nicht negativ reell). Ji 5 Betrachten wir nun zwei Punkte z1 = χ + i y und z2 = χ — iy mit χ < 0, y > 0. Nach obigem erhält man das Ergebnis, daß die Integrale f ( z j und / (z2) denselben Realteil haben (nämlich In | Zj [ ) und entgegengesetzt gleiche Imaginärteile. Geht y gegen 0, dann nähern sich /(zx) und f(z2) den Grenzwerten In I zx I + πι bzw. In | z1 [ — ni. Wir können die Funktion / also für negativ reelle ζ nicht so definieren, daß / auf der negativen reellen Achse stetig ist. Nimmt man diese und den Nullpunkt aus der komplexen Ebene heraus, dann ist die Funktion / in dem verbleibenden Gebiet stetig. Aufgabe 14. Man beweise dies.
— stetig ist, wenn man in der kom1 s plexen Ebene einen Schnitt anbringt, der vom Nullpunkt aus entlang der negativ reellen Achse läuft. Man könnte auch einen anderen Schnitt anbringen, ζ. B.
4. Reihen
275
längs des Strahles arg ζ = — . In diesem Fall wäre die Funktion / gleich demz
jenigen Zweig der Funktion In 2, für den — |π < Im w = Im In 2 < \π gilt. Ähnliche Betrachtungen gelten für die Funktionen w = z" = e n , a z . Falls η nicht ganz ist, werden diese Funktionen eindeutig und stetig, wenn man verabredet, daß | Im In 2 | < π sein soll. Bringt man den eben an erster Stelle besprochenen Schnitt an, dann sind die Funktionen in dem restlichen Gebiet stetig. Wir können die Funktion / von Aufgabe 11 für reelle negative 2 erklären, ζ. B. durch In | 2 | + ni, so daß / an diesen Stellen in einem gewissen Sinne .einseitig stetig* ist (wenn man sich nämlich nur vom 2. Quadranten her 2 nähert, — für 2 = 0 gibt es eine solche .natürliche' Definitionsmöglichkeit nicht). Die Funktion ist aber auch dann für negativ reelle 2 nicht stetig. Den Definitionsbereich von 2" können wir dann auch auf negativ reelle 2 ausdehnen, aber 2" ist ebenfalls nicht stetig auf der negativ reellen Achse, falls η nicht ganz ist. Wir geben noch die Reihenentwicklung der Funktion f(z) = (1 + 2)" um den Nullpunkt. Indem man | Im In (1 + 2) | ¿ π verabredet und ferner für 2 < — 1 Im In (1 + 2) = π nimmt, wird die Funktion für alle 2 Φ — 1 eindeutig. Es gilt für i = 1, 2 , . . . f*>(x)
=
η (η —
1) · · · (η — k +
1) (1 +
ζ)""*.
Wir bringen einen Schnitt an, auf dem alle Punkte der negativ reellen Achse liegen, für die 2 — 1. In allen verbleibenden Punkten ist / holomorph und daher in eine Taylor-Reihe entwickelbar. Diese lautet „ , >„ (1 + z ) n =
^ »(» Σ —
—
i=o
1) · · · (n — k + 1) 1 —Γ7 —Lzk
*I
j
. ,
,
(Binomialreihe).
Aufgabe 15. Für welche ζ konvergiert diese Reihe ? Aufgabe 16. Entwickle (1 + in eine Potenzreihe nach Potenzen von z; auch nach Potenzen von (z — 1). Läßt sich die Funktion auch nach Potenzen von ζ + 1 entwickeln ?
Für die Koeffizienten der TAYiOB-Entwicklung einer in einem Gebiet G holomorphen Funktion f(z) = JE£L 0 a n (2 — 20)" gilt die wichtige Ungleichung I an I ¿
M
i
wor n
d®r Radius eines Kreises G mit Mittelpunkt z0 ist, der
ganz im Konvergenzkreis liegt, und M sei eine obere Schranke für | f(z) | für ζ auf C. Diese Ungleichung folgt aus der Integraldarstellung für an 1
f
1i*)ds
2ni Je (3 — 2 0 )»
b. Beide Kreise seien positiv orientiert. Wir ziehen einen Verbindungsweg zwischen A und Β und erhalten dann aus dem Satz von C A U C H Y =
m
Fig. 7
2 π ι ) a
- ^ U - J - J s — ζ
2πι
Λi)
JBs
—
Aufgabe 1. Man führe das aus.
Der Integrand des ersten Integrals läßt sich wegen
S
— < ι ebenso
ZQ
wie in VII, 4.3 als auf A gleichmäßig konvergente geometrische Reihe m s —z
/w
m (s —
ζ0) —
(ζ —
ζ0)
ΗΖ
J/Z—¿oy 0
Η=0 \ Β
ZQ )
schreiben. Also 2 3 t t )
A
e — z
„to
nK
M
2 n i )
A
( s —
z 0 ] B+L
5. Singularitäten
281
Entsprechend behandeln wir das zweite Integral. Für s auf Β erhält man die gleichmäßig konvergente Reihenentwicklung m _ S —Ζ
m _ (Z — Z0) — (S — Zο)
m Ζ — Zq
^denn nun ist
n= 0
¿i*-** \ ζ — z0
auf Β konstant und < 1 1 .
Daraus erhält man dann des weiteren M πι JΒ S — Ζ 2πΐ
=
¿Kl*-**)—1 n=0
mitö^ö^rf
¿m
}s
f(s)(s-z0)»ds.
Wir finden schließlich m
=
Σ an(z n=0
z0)n +
Σ bn{z — z0) n-=0
-»-1
tftt) ι ζ \ Aufgabe 2. Warum ist es nicht zulässig, a n in der Form - — z u schreiben ? 7t 1
Die Integrale, durch die die Koeffizienten an und bn bestimmt sind, können statt über A bzw. Β auch beide längs desselben z0 umlaufenden Kreises C in β genommen werden. Wenn man dann noch bn = a_n_1 setzt, erhält man zusammenfassend
(LAHRENT-Reihe).
In vielen Fällen Hegt 6 = 0 vor. Dann haben wir es mit einer Funktion / zu tun, die außer in z0 in jedem Punkte ζ der Kreisscheibe | ζ — s 0 | < a holomorph ist. Beispiele.
Hier tritt in der LAUBENT-Reihe nur ein Glied mit negativem Exponenten η auf. Die Funktion —
j- ist holomorph im Gebiet 0 < |z| < 2π. Der Nullpunkt ist für diese
Funktion eine singulare Stelle. Aufgabe 8. Man zeige dies. Die Funktion besitzt also eine LAUBENT-Reihe vom Typ Funktion
£
ooan2"· Die Betrachtung der
, die auch in den Nullpunkt hinein analytisch fortgesetzt werden kann,
lehrt uns wegen lim z->0
8 e
1
= 1, daß
= 1, a_2 = a_3 = ... = 0. Die Koeffizienten
VII. Funktionentheorie
282 der Reihenentwicklung pflegt man in der Form an = - — z u (W "Γ 1) ' die Bn BBENOULLische Zahlen nennt. Man erhält also =
( [z| < 2π)
»fo
und
schreiben, wobei man
«Ζ S . = ηΣ= 0 ζ " -
(0 < |z| < 2π).
1
Auf die zahlreichen interessanten Eigenschaften der BoRNOULLlschen Zahlen gehen wir hier nicht ein. Wir geben nur noch an, daß B = B = B = B = ··· — B χ = 0. 1
t
s
1
i
n
+
Auch für die Koeffizienten der Laurententwicklungen kann man Abschätzungen angeben. Sei M wieder eine obere Schranke von | f [ z ) | auf C und R der Radius von C, dann erhält man für alle η ι
f
2 π ΐ
J e
z
0
1
£ | a0 \ \ ζ Aufgabe 7. Man zeige dies. Indem man | ζ | hinreichend groß wählt, kann | / (ζ) | größer als jede beliebige Schranke werden. Wir nehmen nun an, f(z) hätte keine Nullstelle. Dann ist die Funktion —ίt(z) in der ganzen komplexen Ebene holomorph und wird — nach dem Satz von LIOTXVTLLE — dem Betrage nach für hinreichend große | Ζ | beliebig groß. Das widerspricht aber der Tatsache, daß | / (ζ) | für hinreichend großes | ζ | ebenfalls beliebig groß wird. Also muß / mindestens eine Nullstelle haben. SATZ VON CASORATI-WEIERSTRASS. Eine ganze transzendente Funktion kommt außerhalb jedes Kreises jedem Wert beliebig nahe. Darunter verstehen wir folgendes, /(z) sei eine ganze transzendente Funktion. Dann gibt es zu jedem ε > 0 , jeder komplexen Zahl C und jedem R > 0 ein z, so daß I /(z) — C I < ε und | ζ | > R. B E W E I S . Wir unterscheiden drei Fälle. 1°. Zu G gibt es unendlich viele Punkte, in denen f(z) — C. Diese Punkte können nicht alle innerhalb eines Kreises | ζ [ = R liegen, da sonst überall f(z) = C gelten müßte (vgl. VII, 4.3), und f wäre dann nicht transzendent. Also gibt es dann zu jedem R einen Punkt | ζ | > R mit /(z) = G.
5. Singularitäten
285
2 o . Es gibt kein ζ mit f(z) = C. Wir betrachten dann die nicht-konstante ganze Punktion g(z) =
—~q · Nach dem Satz von Liotjvtlle gibt
es dann zu gegebenem R und ε ein ζ mit \ z\ > B, so daß | g(z) | >
, also
\f(z)-C\ — I ζ I", wobei η —
+ · · · + «*· -Also gilt für hinreichend große
I ζ I auch Die Funktion \ m - c [ < i ιz - z
iz-2lι-···ι*-ί»Γ*ΐβΓ"β. t
r * I 2 I— = 1 — *
nk
ζ
strebt für | ζ | -*• oo gegen 1 und ist für hinreichend große | ζ | sicher kleiner als 2. Also erhalten wir für hinreichend große | ζ | | /(z) — G | < e. Aufgabe 8. Bestimme einen Punkt ζ mit |z| > 100, für den ez — 2 gilt.
5.3. Isolierte Singularitäten, /(z) sei holomorph in einer in z0 punktierten Umgebung von z 0 . Für aile ζ mit ζ φ zu, | ζ — z0 | hinreichend klein, konvergiert dann die LAUBENT-Reihe m
=
1 S « f /(*) an(z — zo)" gegeben, dann nennt man die Funktion h (ζ) — ^ " = 1 α _ η ( ζ — z 0 )~" den Hauptteil der betrachteten Reihe. Setzen wir diesen gleich φ{ί), wobei t = — - — , dann ist φ ein Polynom Z
ZQ
in ( vom Grade k dann und nur dann, wenn z0 ein A-facher Pol ist, und sonst eine ganze transzendente Funktion (denn die φ darstellende Potenzreihe in t konvergiert für beliebig große | ί ], d. h. für beliebig kleine | ζ — z0 | ). Ist z0 ein Pol der Funktion, dann gibt es zu jedem M > 0 ein r > 0, so daß ] /(ζ) I > Μ, falls I ζ — z0 | < r. Denn wenn k die Ordnimg des Poles ist, gilt /(ζ) =
— ζ0Γ*
= (2 — z0rk(a-k
Η
= (Z — zor*(a_k
+ a1_k(z — z0) + >··)
+ 9(z)),
wobei lim g(z) = 0. Also gilt in einer hinreichend kleinen Umgebung von z-*z0 z0 I ¡7(2) I < | I a _ t I und daher | / (ζ) | 3: ^ ^ L » woraus die BehaupI z — zo I tung folgt. SATZ VON CASORATI-WEIERSTRASS. In jeder Umgehung einer wesentlichen Singularität z0 einer Funktion f kommen die Funktionswerte von f jeder komplexen Zahl beliebig nahe. Sei nämlich φ ( — ) der Hauptteil von / (z) in z0. Dann gilt \ Z — Za fW = R) die mit positivem Exponenten. Hat φ im Ursprung einen Pol der Ordnung k, dann hat / einen 4-fachen Pol im Unendlichen. Die Laurent-Entwicklung von φ besitzt nur endlich viele Glieder mit negativem Exponenten, und daraus sieht man, daß die einzigen Glieder mit positivem Exponenten, die in der Laurent-Entwicklung von / auftreten, in der Summe o,nzn zusammengefaßt werden können. Ist schließlich der Ursprung eine wesentliche Singularität von φ, dann ist ζ = oo eine wesentliche Singularität von /. Die Laurent-Entwicklung von φ besitzt dann unendlich viele Glieder mit negativem Exponenten, die von / unendlich viele Glieder mit positivem Exponenten. Die Ergebnisse von VII, 5.3 lassen sich nun auch auf das Verhalten im Unendlichen ausdehnen. So gilt ζ. B. Hat / in ζ = oo einen Pol, dann gibt es zu jedem positiven C ein R, so daß I f(z) I > C, falls I ζ | > R. Ist der Punkt Unendlich eine wesentliche Singularität von /, dann kommt / außerhalb jedes Kreises jeder komplexen Zahl beliebig nahe (Satz von C A S O R A T I - W E I E R S T R A S S ) . Unter einer Umgebung des Punktee Unendlich verstehen wir das Äußere eines beliebigen Kreises. Diese Definition ermöglicht es uns, alle bisherigen Ergebnisse folgendermaßen zusammenzufassen: SATZ VON RIEMANN. / sei eindeutig und holomorph in einer in zg punktierten Umgebung von z0 (z0 kann der Punkt Unendlich sein). Dann ist f in z0 ebenfalls holomorph dann und nur dann, wenn es eine Umgebung von z0 gibt, in der f beschränkt ist; zQ ist ein Pol von f dann und nur dann, wenn es zu jeder positiven Zahl C eine Umgebung von z0 gibt, in der \f(z)\>C für atte Punkte dieser Umgebung. In allen anderen Fällen ist z0 eine wesentliche Singularität von f. BEWEIS. Bei endlichem z0 untersuche man die Anzahl Glieder mit negativem Exponenten η in der Entwicklung f(z) = -Σ™^ „ on(z — z0)n und bei z0 = oo
Vil. Funktionentheorie
288 CO
in der Entwicklung f{z)=
Σ — · Die Richtigkeit der Behauptung wird n =—oo Zn
dann offensichtlich. Aufgabe 9. Man untersuche das Verhalten der folgenden Funktionen im Unendlichen z* + 4 z% + 4 . ζ2 + ζ + 1 -, cot xz, cos ζ — sin z, · z 2 e ' z —4' —' z+ 1 Aufgabe 10. Man untersuche jede der in der vorigen Aufgabe genannten Funktionen auf endliche Singularitäten und entscheide, ob es Pole oder wesentliche Singularitäten sind. Weitere Anwendungen des Residuensatzes. Die Theorie der L A U K E N T Reihen ermöglicht es uns, auf einfache Weise das Residuum einer Funktion / in einer isolierten Singularität zu bestimmen. Hat nämlich / in der Umgebung von z0 die LAUBENT-Entwicklung /(z) an(z — z 0 ) n , dann gilt 5.5.
=
»
j _ r f(a)ds 2ni Je (s — z0)"+1'
also
hierbei ist C ein passend gewählter Weg, der den Punkt z 0 einmal umläuft. Da der zuletzt auf der rechten Seite stehende Ausdruck per definitionem gerade das Residuum von / in z0 ist, ist dieses Residuum also gleich a_1, d. h. es ist gleich dem Koeffizienten von — - — in der LAUBENT-Entwicklung ζ — z0 von / um z 0 . Beispiel. Das Residuum im Punkte ζ = » der Funktion f(z) = • 2 * n (z + l)
* (z + «)»(z — i)n
findet man, indem man den Koeffizienten von —-—7 in der LAUBENT-Entwicklung von / ζ—% berechnet, d. h. man berechnet in der Entwicklung von -—•—τ-r nach Potenzen von (z—i) (z + t)™ den Koeffizienten von (z — t) n_1 . Nun hat man auf Grund der Binomialformel 1
(z + i)n
=
1
( 2 t + « — 0,
und die Zahlen w = p(s) liegen für s aus W stets in der oberen Hälfte der w-Ebene. Also ist der Zuwachs von In p(s) bei einem vollem Umlauf längs W gleich Null, da In p{s) dabei nicht den Nullpunkt in der w-Ebene umläuft. Also erhalten wir iV2 = ANWENDUNG. Wir geben einen dritten Beweis für den der Algebra. Wir betrachten die Polynome
f(z) = a0zn H
h α„; g(z) = a^"'1 -\
Fundamentahatz
+ a„; k(z) = a0zn.
Genau wie beim ersten Beweis beachten wir, daß es eine Zahl R gibt, so daß I g(z) I < I h(z) I für | 2 | > R. Aulgabe 12. Man prüfe dies nach.
Also haben h(z) und h(z) + g(z) = /(z) gleichviele Nullstellen innerhalb von I ζ I = Ä. Diese Anzahl ist für h(z) gleich
1 . f, na0n-8' sn-1-0 Der einzige innerhalb W gelegene singulare Punkt des Integranden ist ζ = — 1. Also Also
f = Res 2 - = lim ζ"' 1 = e (e-1) **. 2π% V Îz==_-1 + 1 ζ—>•—1 x
«
=
gifia—ny -L g —irla +ny
lim gflia —ay g —nia +ay y-* 00 girla -2jrj/ g —Me i lim gÄia—2ÄJ/ g —.nía y-tao
π(α + iy) = i
und entsprechend lim cot π (α + t'y) = », so daß J/-»~oo I cot π ζ I tatsächlich beschränkt ist ( | cot πζ \ ^ J f ) in dem Gebiet — £ ^ Re ζ 5Í | ζ | ^ J . Dann gilt cot π ζ — > 0, wenn R ->00, -dz s JW womit der Beweis beendet ist.
Fig. 9
Aulgabe 18. Beweise entsprechend
—τ- = -jrp-. n=l Λ yu
Wir geben noch eine Anwendung, durch die wir die Punktion cot πζ für ζ Φ η va. Partialbrüche entwickeln können. Wir gehen dazu aus von dem Integral 1 Γ οοΐπβ , ——-1 da, 2πι Jit β — ζ wobei W genau wie eben ein Kreis mit Radius Ε = Ν + £ ist. Außerdem wählen wir Β > | ζ |. Wir teilen den Kreis auf in eine linke Hälfte H 1 und eine rechte Hälfte H 2 . Dann erhält man ; ns cot ns \ _ Γ 2z cot ns f = ( + f = ( (ü*ül 8+ z ) ~ J H l s 2 — z2 JW JH1 ¡H, JffA« —* Also
III jw ι
Andererseits ist cot TIS s —ζ
2πι
s
2\z\M
= "dT—ι—^ ' z R·—l l
Í
)w
0) wenn R -+00.
gleich der Summe der Residuen der Punktion
in ihren Singularitäten a = z, 5 = 0, ¿ 1 » ± 2 , . . . . Das Residuum
in s = η ist gleich lim
(s — ra) c o t π «
pcotnp
= lim p-»o » — Ρ — ζ
1 π (η —
ζ)'
5. Singularitäten
295
gültig für η = O, ± 1 , ± 2 , . . .. Dae Residuum in β = ζ ist gleich ,· {β —ζ) coins lim = cot πζ. i->z S Ζ Also I f ñ—τ = cot πζ 2πι jw
πζ
1 1 ^ / 1 1 Σ Ji»=i\îi —•Ζ
1 —11-
Läßt man Ν gegen oo streben, dann erhält man 1 , ι \= — 1 +, Σ» —,2z r . π cot πζ = 1l· - Σ/ \—¡ ζ n-i\2 + » ζ — η) ζ »_i ζ*— ra2 10 / 1 1 \ Anmerkung. Man kann die Reihe Σ I 1 1 natürlich nicht in „=i\z + n z — n) 00 oo J 1 der Form Σ —; l· Σ als Summe zweier divergenter Reihen n-1 Ζ + η η _ ι ζ — η schreiben. Wohl aber kann man folgendermaßen vorgehen
z
n-il\z + w
n)
\z — η
η])
- ì ζ + „—co\z i Í -+ J w- - η) ì U ì ζ + η—co i η(ζ —+η)' η+0
η+0
Auígabe 14. Man prüfe dies nach. Aufgabe 15. Man beweise analog
; ζ" + ß2 — 1• - - 4 -2+ ^- Í ζ- +τ & 2„-fj
'
Die hier beschriebene Methode kann noch auf eine Reihe weiterer Funktionen angewandt werden. Es ist aber notwendig, vorher noch einen neuen Begriff einzuführen. DEFINITION. Man nennt eine Funktion / in einem (offenen) Gebiet β meromorph, wenn sie als Singularitäten in θ nur Pole hat und sonst überall holomorph ist. Gibt man in der (endlichen) komplexen Ebene höchstens abzählbar viele Punkte vor, die keinen endlichen Häufungspunkt haben, und gibt man ferner in jedem dieser Punkte einen Hauptteil vor, dann ist dadurch bis auf eine additive ganze Funktion eine meromorphe Funktion bestimmt. Die Differenz zweier in der endlichen Ebene meromorpher Funktionen, die dieselben Pole mit denselben Hauptteilen aufweisen, ist eine ganze Funktion. Der Satz von MITTAQ-LEFFLEB zeigt, wie man — bis auf eine ganze Funktion— eine Funktion mit vorgegebenen Polen und Hauptteilen konstruiert.
296
VII. Funktionentheorie
Sind nur endlich viele Pole mit ihren Hauptteilen vorgeschrieben, dann ist das natürlich trivial. So ist z. B. die Funktion /, die an den Stellen — 1 , 0 und 2 Pole mit den jeweiligen Hauptteilen 1/(1 + z)> l/z u11^ l/(z — 2)10 hat, gleich f(z) =h(z) H Funktion ist.
— î — + — -f- -—* lw , wobei h eine beliebige ganze ζ -f- I ζ (ζ — ¿)
Satz gibt aber auch an, wie man im Falle unendlich vieler Pole samt vorgeschriebenen Hauptteilen eine zugehörige meromorphe Funktion konstruiert. Wir haben an den Beispielen cot π ζ und l/(e*— 1) gezeigt, wie man umgekehrt eine meromorphe Funktion in Partialbrüche entwickelt. Auf den allgemeinen Fall können wir hier nicht eingehen. In der Wahrscheinlichkeitsrechnung kommt häufig das Integral MITTAG-LEFFLEBS
vor. Wir zeigen, daß jedes Integral Jw e~z'dz denselben Wert hat, wenn W die Halbgerade arg ζ — φ mit | φ | < ¿ π , durchlaufen von 0 bis oo, ist. Dazu betrachten wir zunächst den Weg C, der folgendermaßen zusammengesetzt ist: Cy, die reelle Achse, von 0 bis R durchlaufen; C2, der Kreisbogen | ζ | = R, durchlaufen von ζ = R bis ζ = Re1r; G3, die Strecke arg ζ = φ, durchlaufen von ζ = Re*9 bis ζ = 0. Im Innern von C ist e~z' holomorph, also ist J o = 0. Ferner gilt ( e~z'dz Je,
G—B'(COB2Í+Í3ÍII2Í)
IREUDT
< R φ I max e—ü'cos2i = R ι φ ι e-K'cosz». wenn R ->-oo. Also lim \ = —lim l , R-*oo JCi Β->oo Je, woraus die Behauptung folgt. Anmerkung. Auch für den Fall φ = ¿ J π gilt die Behauptung. Um dann zu zeigen, daß lim f c ¡ = 0 ist, teile man, ζ. B. im Fall φ = —, den Weg C2 R->- oo * 4 in zwei Stücke, wobei arg ζ jeweils von 0 bis —und von-^ — bis^4
Μ
4
λ
4
läuft. Für beide Teilintegrale kann man dann zeigen, daß sie gegen 0 streben, wenn R gegen oo strebt. Aufgabe 16. Man führe dies aus.
297
5. Singularitäten
FOLGERUNG. Längs des Weges W mit arg ζ = — hat man 2 = ueini
= i / 2 · it(l + {),
also \w=
+i)du
= \\fn.
Aufteilung in Realteil und Imaginärteil liefert peo fco \ cos u2du = \ sin u2du = J Aufgabe 17. Man prüfe dies nach. Aufgabe 18. Man berechne
00
Î
(fax
5.6. Die Umkehnmg einer holomorphen Funktion. Die Funktion / sei holomorph in einem Punkt z 0 , und ferner sei /'(z 0 ) # 0 . / ist dann natürlich auch stetig in z 0 , so daß es zu jedem positiven ε ein ó gibt, derart daß I f(z)—/(z0) I < ε, wenn | ζ — z0\ < (i) = —\/2(1 + i). Entsprechende Überlegungen können wir für w = f(z) = e2 durchführen. Da in jedem endlichen Punkte ζ f(z) = e? Φ 0 gilt, gibt es zu jedem w0 = e2· eine Umgebung, in der die Umkehrfunktion ζ = q>(W) existiert und den Bedingungen mj= e* und io0 = e2· genügt. Man nennt bekanntlich diese Funktion ζ = lnw, aber auch hier ist In w in einer
299
6. Konforme Abbildungen
Umgebung von w0 erst dann eindeutig bestimmt, wenn man den Ausgangswert z„ = 9>(u>o) kennt, der sich aus w„ — e2· herleitet. Geht man von einem anderen Wert zl aus, für den ebenfalls w0 = e2> gilt (ζ. B. = z 0 + 2π»), dann findet man eine andere Auflösung 2 = y>{w) der Gleichung e" = ζ für w in einer Umgebung von wQ. Bekanntlich gilt dann in diesem Beispiel y(w) = 2 = ßi — h· Der Schnittmnkd, den zwei differenzierbare Kurven in G miteinander bilden, ist also gleich dem Schnittwinkel der beiden Bildkurven (unter der Abbildung w = /(z)) in H. Man sagt, daß die Transformation w = f(z) winkeltreu oder konform ist. Betrachten wir auch noch die Beträge von | z t — z0 | usw., dann erhalten wir aus (6.1; 1), daß
und entsprechend
zi-«· lzi
E ^zo-Ii z - W I
hm Ζι->Ζο II 2 z0 Iι = Ι Π » ο ) Ι · Die Längen der Sehnen w0wlt w0wz; z0z1, z0z2 stehen also in demselben Verhältnis zueinander, wenn die Punkte hinreichend benachbart sind. Da dann auch die Winkel w2w1w0 und z2z1zQ gleich sind, sind die Dreiecke w2w1w0 und 2 2 Z 1 Z 0 nach bekannten Sätzen der Planimetrie ähnlich.
ANWENDUNGEN. Man betrachte die Transformation w — z2 und die Kurven | ζ | = 1 und arg ζ = \π. Die Tangenten bilden in ihrem Schnittpunkt ζ0 = %γ2 (1 + i) einen Winkel von \π. Denselben Schnittwinkel bilden aber auch die Tangenten an die Bildkurven | w \ = 1 und arg w — \π in ihrem Schnittpunkt w0 = i miteinander. Die Transformation w = e" genügt in jedem endlichen Punkte ζ der Bedingung w' Φ 0 und ist also in jedem endlichen Punkte ζ konform. Eine Gerade χ = Re ζ = a wird übergeführt in den Kreis | w \ = ex = e°, der den Ursprung der w-Ebene als Mittelpunkt hat. Eine Gerade y — Im ζ = b wird abgebildet auf den Strahl arg w — y = b. Der rechte Winkel zwischen den Geraden χ — a und y — b in ihrem Schnittpunkt ζ = c = a + ib wird abgebildet auf den rechten Winkel, den der Kreis | w | = e a und der Strahl arg w = b in ihrem Schnittpunkt w = e" miteinander bilden. In den Stellen, in denen /'(z0) = 0 ist, liegt eine ganz andere Situation vor. z0 sei eine solche Nullstelle von /', und zwar habe sie die Ordnung η — 1, wobei η ^ 2. Dann gilt also /'(z) = ( z - z 0 ) » - V ( 2 ) mit g(z0) Φ 0, also f(z) = w0 + (z — z0)nh(z) mit Ä(z0) Φ 0.
301
6. Konforme Abbildungen
Aufgabe 1. Man prüfe dies nach.
Also erhält man für w 1 = / ( z j in einer Umgebung von w0 arg {w1 — w0) = arg (z1 — z0)nh (zx) = η arg (zj — z0) + arg h (ζ,) und ebenso arg (w2 — w0) = n arg (z2 — z0) + arg h (z2). Führt man wieder wie oben die Winkel ψ 1 , ψ 2 , β λ und ß 2 ein, dann findet man
Für z1
z 0 , z2 ->z
Vi — Ψ 2 g e g e n n (ßi — β2) • Da η Φ 1, liegt keine Winkeltreue vor, der Winkel zwischen zwei sich in wü schneidenden Bildkurven ist das w-fache des Winkels den die beiden durch zg gehenden Originalkurven miteinander bilden. Auch für die Abstände zwischen Punkten der Originalkurven und Punkten der Bildkurven erhalten wir nun ein anderes Ergebnis. Es gilt nämlich lwi — wol = 1 2 i — zo ΓI
I; | w a — w 0 l = l z 2 — ζ ο Γ Ι α ( ζ 2 ) I»
da h{z1) und A(z2) gegen A(z0) streben, wenn z1 ->z0 und z2 ->z 0 , erhält man I w, —w„ Ι ,. I Wo — wa I . ν, ,, . , ^ . . lim -— — = lim . Von einer Ähnlichkeit zwischen OngiZ Z Z Z I 1 — 0 I" *,-«. I 2 — 0 I" nal- und Bildfigur kann also nicht mehr die Rede sein. 6.2. Anwendungen konformer Abbildungen. I n vielen Problemen der angewandten Mathematik geht es darum, eine Funktion F (χ, y) zu bestimmen, die auf einer gegebenen Kurve G der (x, y)-Ebene gewisse vorgegebene Werte annimmt und die im Innern von G harmonisch ist, d. h. der partiellen Differentialgleichung AF = Fxx + Fyy = 0 genügt (DmcHLETsches Problem). Häufig versucht man, in folgender Weise eine Lösung eines solchen Problems zu finden : zunächst faßt man F als Beai- oder Imaginärteil einer holomorphen Funktion φ(ζ) (mit ζ = χ + i y) auf. Dann ist AF = 0 jedenfalls erfüllt (vgl. VII, 3.3). Danach wenden wir eine Transformation w = u + iv = f{z) an, die G in eine geometrisch einfachere Kurve Κ überführt und die das Innere von C auf das Innere von Κ abbildet. Wenn / überall im abgeschlossenen Innern von C holomorph ist und ferner überall /' (ζ) Φ 0 ist, dann ist / umkehrbar, und ζ und damit auch φ ist ebenfalls eine holomorphe Funktion von w. Fassen wir F dann als ineinandergesetzte Funktion von u und ν auf, dann gilt sicher Fuu + Fm = 0 im ganzen Innern von K. Um unser ursprüngliches Problem zu lösen, müssen wir mm eine Funktion finden, die im Innern von Κ holomorph ist und die auf Κ gewisse vorgegebene Werte annimmt.
VII. Funktionentheorie
302
Auf diese Weise gelingt es manchmal, F als Funktion von w zu erhalten. Wegen w = f(z) erhält man dann auch F als Funktion von z, und damit ist das Problem gelöst. Daß dann auch Fxx + Fyy = 0 gilt, zeigt man durch eine einfache Rechnung. Man hat nämlich Fx = ί > * +
also Fxx = Fuuul
+ 2Fueuxvx
+ Fmv\ + Fuuxx
+
F,v„
und entsprechend F
= F
u2 4- 2 F
uvA-F
ν2 A-Fu
4- F υ
Indem wir von den CAUCHY-RiEMAfmschen Differentialgleichungen Gebrauch machen, die uns lehren, daß Au — Δν = 0, uxvx + uyvy = 0 , erhält man Δ F = FXX + Fyv = (Fuu + F J (ul + = (Ku + F J
ul)
I ux + iuy I2 = (Fau + F J I f'(z)21.
Aus /'(ζ) Φ 0 folgt dann die Äquivalenz von Fxx + Fyy — 0 und Fuu +
Fvt=0.
ANWENDUNG. Gesucht ist eine Funktion F (x, y), die im ersten Quadranten harmonisch ist und die ferner folgende Bedingungen erfüllt: F{x, y) = 0 für χ > 2, y = 0; F{x, y) = 2im0 0 der Differentialgleichung Fuu + Fvv = 0 genügt (der 1. Quadrant der z-Ebene geht in die obere Halbebene der w-Ebene über) und die auf der reellen Achse der «j-Ebene folgende Werte annimmt: F = 0 für m < — 1 ; F = 1 für — 1 < m < 0; F = 2 für 0 < m < 4; i 7 = 0 für m > 4. Berücksichtigt man nun, daß die Funktion ln(w — a) (a reell) (bzw. ein bestimmter Zweig der Logarithmusfunktion) für Im w Ξϊ 0, w φ a holomorph ist und daß ferner In (w — a) — In — (w — a) = — ni ist, falls (w — a) > 0, dann kann man als Funktion φ offenbar folgende Funktion nehmen ——τ In (w — 4) πι
πχ
In w
^r In (w 4- 1). πι
303
6. Konforme Abbildungen Mon erhält dann Re a(w) = — (2 arg (w — 4) — arg w — arg (to + 1)),
7t
also
F(x, y)=—( 2 arg (z2 — 4) — arg 7t
— arg (z2 + 1))
. ^ t r — « s ^ — V r ) · Dieses Beispiel lehrt uns, daß es bei der Lösung des DntiCHLETschen Problems vor allem darauf ankommt, eine Transformation w = /(z) zu finden, die eine gegebene Kurve G in eine einfachere Kurve Κ überführt und die im Innern von G überall holomorph ist mit f'(z) Φ 0 . Auf Grund des R I E M A NESCHEN Abbildungssatzes gibt es zu jeder einfachen geschlossenen Kurve G eine Transformation mit den gewünschten Eigenschaften, die diese Kurve auf den Einheitskreis abbildet. Hat man nun zwei einfach zusammenhängende Gebiete G und H, die jeweils von einer solchen Kurve begrenzt werden, dann gibt es nach dem R I E M A NESCHEN Satz zwei Transformationen Τ und U, die G bzw. H auf den Einheitskreis abbilden. Also führt die Transformation U~1T das Gebiet G in H über. Wir beweisen den RiEMANNachen Satz hier nicht, er ist nämlich ein reiner Existenzsatz und lehrt uns nicht, wie wir im konkreten Fall eine solche Abbildung finden. Wir wollen im folgenden nur noch einige wichtige Spezialfälle betrachten, aus denen man in vielen häufig vorkommenden Fällen durch Kombination die gesuchte Transformation w = /(z) erhalten kann. 6.3. Die linearen Transformationen. Wir betrachten Transformationen des _ az -f- b Typs w — -—- mit der Determinante D = ad — bc # 0 (lineare Transcz d formationen). Wegen D Φ 0 erhalten wir w' = -—^ Φ 0 für alle \CZ -j- CL) d ζΦ , und die Transformation ist also in all diesen Punkten konform. Lineare c Transformationen kann man sich entstanden denken durch Hintereinanderschaltung einfacherer Transformationen: d 1 bc — ad »! = «+ —, M>2 = —> Wa = Cr ll/j C/
, a W2, W = W3 + —, (/
falls c Φ 0. Ist c = 0, dann kommt man mit weniger Transformationen aus (in diesem Fall ist α Φ 0, d Φ 0, da sonst D = ad — bc = 0 wäre): b a w,1 = ζ -i , w = — w,. ^ a d 1
VII. Funktionentheorie
304
Wir werden jetzt die folgenden Gnmdtransformationen betrachten: I. w = ζ + A (Translationen); II. w = Bz (Β Φ 0) (Streckungen und Drehungen) ; I I I . w = -i- (Inversionen). Es ist geometrisch unmittelbar einsichtig, daß Transformationen vom Typ I Figuren der z-Ebene in dazu kongruente Figuren der «¿-Ebene überführen und daß Transformationen vom Typ I I Ähnlichkeitstransformationen sind. Aufgabe 2. Man beweise dies.
Insbesondere führen Transformationen vom Typ I und Π Geraden in Geraden und Kreise in Kreise über. Wir untersuchen nun, inwieweit dies auch auf Transformationen vom Typ I I I zutrifft. Sei C ein nicht durch O laufender Kreis \z — m | = Β in der z-Ebene 1 - Β beschrieben, mit \m\ Φ Β. Die Bildkurve wird dann durch •m w
oder, wenn wir m Φ 0 voraussetzen, durch
1
w•
|w| = Ä :
m
d. h . die Bildfigur ist der geometrische Ort aller Punkte, deren Abstände von zwei Punkten — und O ein konstantes Verhältnis Β : I m I ergeben. Aus m
der Planimetrie wissen wir, daß die Bildkurve dann (wegen Β : \m \ Φ 1) ein Kreis ist, dessen Mittelpunkt auf der Geraden durch O und — m liegt. Im 1 1 Fall m = 0 erhält man = B , oder | w | = — , so daß auch dann die Β
Bildkurve ein Kreis ist. Für Kreise durch O gilt | m — Β . Die Punkte der Bildkurve genügen dann der Gleichung
w•
*
m
: I w I = 1, und die
Bildkurve ist daher die Mittelsenkrechte der Strecke zwischen O uüd — . m
Wir kommen noch einmal zurück auf den soeben benutzten Satz aus der Planimetrie. ρ und q seien zwei beliebige komplexe Zahlen mit ρ φ q. Dann ist der geometrische Ort ζ —ρ aller Punkte ζ — χ + iy mit = k Φ 1 ein Kreis (Kreis dee APOLLONIUS). Man z— q 2 2 2 hat nämlich | ζ — ρ | = k \ ζ — q | , also zz( 1 — k?) — (zp + zp) + k*(zq + zq) + pp — k2qq = 0, die zu einer Gleichung der Art OL(X + y2) + ßx + yy + δ = 0 mit α = 1 — i? φ 0, also zu einem Kreis führt. Umgekehrt läßt sich jeder Kreis | ζ—τη \ = Β als ApoLLONius-Kreis auffassen. Wählt man auf einer beliebigen durch m gehenden Geraden zwei verschiedene Punkte ρ und q 2
305
6. Konforme Abbildungen
mit I ρ — m I I q — m \ = Κ* ans, wobei ρ und q auf derselben Seite von m liegen, und ist ζ ein beliebiger Punkt auf dem Kreisumfang, dann ist \ ζ — m | = Β , also I 2 — m I : I m — ρ | = \m, — g | : | s — m |, also sind die Dreiecke zmq undpmz ähn\ ζ — m, I = Ι ρ — m, lieh. Daher gilt auch | ζ - PI : I« — ? l = In- -m I : Ä = k. ζ —ρ konstant (und φ 1, denn sonst wäre Also ist z — q I ρ — m - R, also ρ ein Punkt des Kreisumfangs und
daher ρ = q). Da ferner die Schnittpunkte s und < von pq mit dem Kreis der Gleichung s
—ρ
s — q
t—p t — q
= k
genügen, liegen die Punkte p, q, a und t harmonisch zueinander, und ρ und q sind polverwandt.
Fig. 11
Unter einer Inversion geht eine Gerade durch O in eine Gerade durch O über. Denn aus arg Ζ = α (konstant) folgt arg w = arg — = — OÍ. ζ
Eine nicht durch O laufende Gerade r geht bei einer Inversion in einen Kreis über. Sei nämlich Ρ der Spiegelpunkt von O bzgl. r (r also Mittelsenkrechte von OP). Dann gilt für Punkte ζ auf r die Gleichung | ζ \ = | ζ — ρ \, wobei ρ die zu Ρ gehörige komplexe Zahl ist. Also d. h.
ρ
w
1
w
Ρ
Die Bildkurve von r ist also tatsächlich ein Kreis, und zwar ein Kreis, der durch O geht. Wir sehen also, daß die Transformationen vom Typ Ι Π eine durch O gehende Gerade in eine durch O gehende Gerade überführen, und einen nicht durch O gehenden Kreis in einen ebenfalls nicht durch O gehenden Kreis; eine nicht durch O gehende Gerade wird auf einen durch 0 gehenden Kreis abgebildet, und umgekehrt. Eine beliebige lineare Transformation, die aus Transformationen des Typs I, II und Ι Π zusammengesetzt ist, führt Geraden und Kreise in Geraden und Kreise über. Wir wollen noch zwei weitere wichtige Eigenschaften linearer Transformationen behandeln. Zunächst ist die Umkehrung einer linearen Transformation wieder eine lineare Transformation, und zwar gilt z—
wc — α
^ , wobei die Determinante
gleich ad — bc = D # 0 ist. Weiter ergibt die Kombination zweier linearer Transformationen w 20
Kuipers-Timman, Ilathematik
=
az
+
b
(xw +
β
cz +
d'
yw
ó
+
VII. Funktionentheorie
306 mit D = ad — be # 0 , Δ = N0 und alle natürlichen r (1 + aN+1)
· · · (1 + aN+r)
— 1 < e;
und daraus erhalten wir, indem wir wiederholt Gebrauch machen von der für positive c und d gültigen Ungleichung (1 + c) (1 + d) > 1 + c + d hOy+rC«.
(7; 2)
gültig für alle natürlichen r und alle Ν > N0. Daraus folgt die Konvergenz von Gilt umgekehrt (7; 2) für alle natürlichen r und alle Ν > N 0 , dann erhält man durch Anwendung von e" > 1 + c (c > 0) die Ungleichung (1 + aN+1)
···(!
+ 1 z dann konvergiert auch das Produkt üñ=i ( 1 + \ fn( ) I ) i· und damit auch das Produkt üñ=i Í 1 + /n(z))· Wir zeigen noch, daß dieses unendliche Produkt in G eine holomorphe Funktion darstellt, wenn die Funktionen /n(z) holomorph in G sind und wenn die Reihe -Ση=ι I /n(z) I ^ gleichmäßig konvergiert. Dann gibt es eine von ζ unabhängige Zahl m, so daß 1 + /„(ζ) φ 0 für alle η § m (denn lim (1 + /„(ζ)) = 1). Wir setzen nun für k = m, m + 1,. . . n->oo Π (1 +/„(z)) = ¿ V z ) ; P m _ 1 (z) = o.
n=m
7. Unendliche Produkte
313
Daun gilt I P*(z) I =
i
Je Σ I/n(z) I
i
Π I ι + /„(*) l àn=7H i l ( 1 + 1 fn(z) I) ^ e — n=m
;
die letzte Zahl ist beschränkt ( < Β), und Β ist nicht abhängig von z, da der Exponent eine Partialsumme einer in O gleichmäßig konvergenten Reihe Ä i l / » ( * ) l ist. Also ¿ I P»+ i(z) Λ=ΪΛ
ΡM
I=
J
I /η+1ω
Ρη(ζ) I £ Β
Σ ι /η+1(ζ) Λ»ΙΛ
ι.
Die Reihe ^S^Lm-i (Ρ»+ ι( ζ ) — Ρ Λ 2 ) ) also eine in 6? gleichmäßig konvergente Majorante, so daß sie ebenfalls gleichmäßig konvergiert und als Summe eine in G holomorphe Funktion hat. Diese Grenzfunktion ist gleich lim P N ( z ) , denn 2 Í - » CO
Py(z)=
S £ (Pn+1(z)-Pn(z)). n=m—1
Das bedeutet aber, daß die Funktion /(z) = morph ist.
(1 + /„(ζ)) in 0 holo-
Aufgabe 2. Man zeige, daß die einzigen Nullstellen der Funktion / in G die Nullstellen der Faktoren 1 + / x ( z ) , . . . , 1 -f- fm{z) sind.
ANWENDUNG. Wenn man eine holomorphe Funktion /(z) angeben soll, die an den vorgeschriebenen Stellen zv ..., zn Nullstellen der Vielfachheit « j , . . . , « „ hat, dann ist φ(ζ) = ΠΙ^ι (ζ — zk)"k sicher eine Lösung dieser Aufgabe. Der Quotient y)
zu schreiben, dann sagt man, daß y' explizit durch χ und y ausgedrückt wird. Die letzte Form der Gleichung ist ein Spezialfall der Gleichung P(x, y) dx + Q(x, y) dy = 0, wenn g(x, y) = — P{x, y)¡Q[x, y).
( 2 . 1 ; 1)
318
VILI. Gewöhnliche Differentialgleichungen
2.2. Trennung der Veränderlichen. Wenn die Funktionen Ρ und Q in (2.1 ; 1) die spezielle Gestalt P(x, y) = R^x) · S2(y)·,
Q(x, y) = R2(x) · S ¿y)
haben, dann kann man (2.1 ; 1) in die Gestalt Βχ(χ) dx
S1 (y) dy
= 0
(2.2; 1)
bringen, womit man die Veränderlichen getrennt hat, d. h. die Veränderlichen χ und y kommen jetzt nur noch in zwei voneinander getrennten Summanden vor. In diesem Fall kann dann die Differentialgleichung unmittelbar integriert werden, und durch Γ R^dx
CS^dy
J
J
=
c
ht
eine beliebi^e
Konstante)
SM
ist formal die allgemeine Lösung von (2.2; 1) bestimmt. Beispiel. 2.2. (x*+ W
— \)dx + xydy = 0·, t ± ± χ
i x
+
d y y —ι
= 0;
Nach Integration erhält man die ALLGEMEINE LÖSUNG loga^-Mog I y 2 — 1 | = C oder y» = 1 +
De—χ" .
.
2.3. Homogene Gleichungen. Wenn in (2.1; 1) P(x,y) und Q(x, y) homogen in χ und y von demselben Grade η sind (d. h. wenn P(ax, ay) = an P(x, y) und Q(ax, ay) — anQ(x, y)), dann kann man die gegebene Differentialgleichung mittels der Substitution y — xu in eine neue Gleichung überführen, in der die neuen Veränderlichen χ und u getrennt vorkommen. Da beide Funktionen Ρ und Q homogen in χ und y vom Gerade η sind, gilt P(x, y) = xnP
= xnP( 1, u); Q(x, y) = x*Q
Die Gleichung (2.1; 1) geht dann über in P ( l , u) dx + Q{ 1, u) (udx + xdu) = 0 oder dx χ
Q(l, u) du P(l,u) + uQ(l,u)
worin die Veränderlichen getrennt sind.
0,
=
xnQ(l, u).
3. Lineare Differentialgleichungen erster Ordnung
319
Beispiel 2.8. +
(1 + adx
1
« +
= χ
xy
+
+
dy
ew*) (udx
+
u + au* = = 1 — « s
, du
x d u )
=
! + « — ζ 1 —
+
xy
(a
+
+
u
« * , ; — au
y*)
dx
+ tt2) d x . , +
1 — w«·
=
(o
—
1)
u*du
· 1
—
u*
t fi du
du
1 —M Nach Integration:
= (αχ2 +
ay*)
+
( a - l )
1 —
u*
"
, α log I χ I = — log 11 — u a log 1 χ
(x
—
y)
α — 1log |1— u»| + logC( 3 a — 1 x — y log x * — y * = log c, I + log +
y»)(»-W/8
(x> —
=
oder
C
(χ
+
—
xy
y*) a~i
+
=
C*
=
D .
3. Lineare Differentialgleichungen erster Ordnung
Die allgemeine Form dieser Differentialgleichungen ist y
'
+
P
(
x
)
y
+
Q
(
x
)
=
0 ,
( 3 ;
1 )
wobei Ρ und Q vorgegebene stetige Funktionen der Veränderlichen χ sind. LÖSUNGSVERFAHREN. Wir setzen y
=
u ( x ) - v ( χ ) .
( 3 ;
2 )
Die Funktion u(x) werden wir im folgenden so wählen, daß (3; 1) in eine Gleichung mit getrennten Veränderlichen übergeht. Aus (3; 2) folgt y'
=
UV'
+
V U ' .
Einsetzung in (3; 1) ergibt v ( u '
N u n
b e s t i m m e n w i r
+
P ( x )
· u )
d i e F u n k t i o n u
+
u v '
+
d e r a r t , d a ß
Q ( x )
der
=
0.
(3; 3)
K o e f f i z i e n t v o n
ν v e r s c h w i n d e t ,
daß also u'
+
P ( x ) - u
=
0
( 3 ;
oder —
=
—
P ( x ) d x ,
- > « ( » )
=
C . e ~ I
p ( x ) i x
1
u
Aus (3 ; 3) erhalten wir unter Berücksichtigung von (3 ; 4)
Q(z)
,_
w ν
~ =
« ~
—
j
Q
( x ) e+
ct
.+ ι P(x)«te
e
I * W * d x
+
C
t
.
.
4 )
VIII. Gewöhnliche Differentialgleichungen
320
A L L G E M E I N E L Ö S U N G . Sie lautet folgendermaßen y(x)=u
(z) •v(x)
= C1· C2e~ !p(z)dx
— e~ ! p^dx
( Q (z)e+ '
p( x)dx
-
dx
oder e" ! p, Im = + C2
EaeRtlL =
C ^ i P + i^to»)
8in
+ Ψ*) —Lo* 0 0 8 ( ω < + Vo)} + Ca
und /(«) = « · « = f p ^ j j . ^ 21 Kuipera-Tímman, Uathematlk
sin (tot + 9>φ) — Χω cos (ωί + φ0)} + De~WI L ).
322
V i n . Gewöhnliche Differentialgleichungen
Aas dem Anfangswert 1(0) = 0 folgt E I(t) = p. , 0 Γ , . · {Β sin (coi + Vi) — /(*> Vi) I < M I yx — y2 | (Lipschitzbedingung). Behauptung. Zu jedem Punkt P(x0, y0) aus dem Innern von G gibt es eine und nur eine Kurve y = g (χ) durch Ρ , derart, daß g (χ) in einem gewissen Intervall | χ— x0 | < a stetig differenzierbar ist, daß die Kurve y = g (χ) ganz in G liegt und daß g die Bedingung g'{x) = f{x, g(x)) erfüllt. BEWEIS. Man berechne die Funktionenfolge Vi(x) = Vo + Γ /('. yo) dt, J*. ».(*) = y»+ Γ f{t>yÁt))dt, J«. X yn{x) = y0 + \IT. f(t, Vn-iW) àt,
Ferner bestimme man das größtmögliche Rechteck innerhalb von β mit (x0, y0) als Mittelpunkt, dessen Seiten parallel zu den Koordinatenachsen sind, nämlich — *ο|
·'
4n-2), ·
K-l
= 0.
,,(n-2)
Im ersten Fall sind die BT konstant, und dann ist der Beweis bereits gebracht. Im zweiten Fall wiederholt man den beschriebenen Prozeß mit (MJ, m2, . . . , Mn_1), usw. mit dem Ergebnis, daß entweder eine lineare Abhängigkeit zwischen weniger als η Funktionen ut besteht (dann aber auch zwischen den η Funktionen ut), oder daß schließlich ¿UK« « a ) =
«1 «2 = 0; «Í «2
«1
- 0, oder u1 = Au2.
In jedem Fall erhält man also eine lineare Beziehung zwischen den η Funktionen Mj, « 2 , . . ., u„. Aus ¿dn(«j, u2 un) = 0 folgt also: ut, u2, ..., un sind linear abhängig, und umgekehrt. Aus /!„(«!, u2,..., un) φ 0 folgt: ult u2,. . . , un sind linear unabhängig, und umgekehrt. Die Determinante An(ult u2, . . . , un) nennt man die WEONSKIsche Determinante der Funktionen ult u2, ..u„. 6.6. Linear unabhängige Lösungen einer homogenen Differentialgleichung — Hauptlösungen — Allgemeine Lösung. Wenn man unterstellt, daß die homogene Differentialgleichung Ln(y) = Poy{n) + P1y(n~1) + · · · + Pn^y' + P„y = 0 überhaupt Lösungen besitzt, dann kann man mit Hilfe des obigen Kriteriums leicht zeigen, daß diese Gleichung höchstens η linear unabhängige Lösungen y1(x), y2(x), · · ·, y„(x) besitzen kann, mit anderen Worten, daß jede weitere Lösung yn+1(x) in der Form W * ) = CiViW + GtVM
+ · · · + Cnyn(x)
geschrieben werden kann, wobei die Konstanten Clt C2, .. . Cn nicht alle verschwinden. Wir betrachten dazu die WßONSKYSche Determinante V» y[> yí· Vi> · - ·> y«+1) =
• ·> y»+1 · • ·> 3/n+l
y?, y?, ·
VIII. Gewöhnliche Differentialgleichungen
332
Wir multiplizieren die letzte Zeile mit p0 (x) # 0 und addieren dazu die mit px multiplizierte vorletzte Zeile, die mit p2 multiplizierte vorvorletzte Zeile, . . s c h l i e ß l i c h die mit pn multiplizierte erste Zeile und erhalten das Ergebnis Vi> vi.
2/2. 2/2.
• 2/n+l • ·» 2/n+l
r 1 1 , . ••>2« Ln{y d, A,(2/2). · • ·. ¿n(2/n+l) da in der letzten Zeile Ln(yt) = Ln(y2) = · · · = Ln(yn+1) = 0. Wegen p0(x) φ 0 ist AnJrl{ylt y2, ..., yn+l) = 0. Es gibt also ein System von Konstanten Ct, C2, ..., Gn (die nicht alle gleich Null sind), so daß W « ) = σι*ι(*) + + · · · + Onyn(z). Wenn also eine homogene Differentialgleichung ra-ter Ordnimg wirklich η linear unabhängige Lösungen besitzt, dann kann sie auch nicht mehr linear unabhängige Lösungen haben, und jede weitere Lösung kann als Linearkombination der linear unabhängigen Lösungen ylt yn geschrieben werden. Man nennt solch ein System linear unabhängiger Lösungen ylt y2,.. .,yn ein System von Hauptlösungen, oder ein Fundamentalsystem, oder eine Basis. Die Lösungen ylt y2 yn nennt man partikuläre Lösungen. Da jede Lösung in der Form y = ClVl + C2y2 + · · · + Cnyn (5.5;1) geschrieben werden kann, nennt man diesen Ausdruck die allgemeine Lösung. Die η Integrationskonstanten Clt . . C n können aus den Anfangs- oder Randwerten bestimmt werden, wie wir in späteren Beispielen zeigen werden. 6. Homogene Gleichungen mit konstonten Koeffizienten 6.1. Charakteristische Gleichung. Wenn es gelingt, η linear unabhängige partikuläre Lösungen der gegebenen homogenen Differentialgleichung Ln(y) = 0 zu finden, erhält man mittels (5.5; 1) die allgemeine Lösung, und damit ist das Problem der Lösung erledigt. Die Existenz eines solchen Fundamentalsystems partikulärer Lösungen wird nun (unter weiteren Voraussetzungen) durch das zitierte, aber nicht bewiesene Existenztheorem (VIII, 5.1) garantiert, so daß es des weiteren von Wichtigkeit ist, solch ein System praktisch anzugeben. In einigen elementaren, aber in den Anwendungen sehr wichtigen Fällen gelingt diese Aufgabe leicht. An erster Stelle stehen hier homogene Differentialgleichungen mit konstanten Koeffizienten: A0y +
lì/" -1 * + ••·+A„_lV'+
Any = 0.
(6.1 ; 1)
6. Homogene Gleichungen mit konstanten Koeffizienten
333
Die Koeffizienten Ar (r = 0,1, 2 , . . ., n) sind konstant; da es sich um eine Gleichung W-ter Ordnung handeln soll, ist A0 Φ 0 . EULER (1743) hat entdeckt, daß die Einsetzung von y = e rz (r konstant) in die linke Seite von (6.1; 1) e'x(A0r» + As»-1
+ · · · + A„_,r + An)
rx
liefert, so daß e = y dann und nur dann eine Lösung von (6.1 ; 1) ist, wenn r eine Lösung der algebraischen Gleichung ra-ten Grades A0rn + As"-1 rx
ist. (e
+ · · · + Λ η - ι r + Ä, = 0
(6.1 ; 2)
φ 0 für alle x.)
Nach dem Fundamentalsatz der Algebra besitzt (6.1 ; 2) stets η Lösungen r x , r 2 , . . . , r n , die im allgemeinen komplex sind (vgl. VII, 5.2 und 5.5). Unter diesen η Lösungen rlt r 2 rn können mehrfache Lösungen vorkommen, wie ζ. B. unter den Lösungen der Gleichung r 2 — 2r+
1 = 0 oder (r— l) 2 = 0 .
I n VIII, 6.2 wird bewiesen, daß die η Lösungen Vi =
y% = è**,..., yn = e'»*
dann und nur dann ein Fundamentalsystem von Lösungen liefern, wenn die η Zahlen rlt r 2 rn paarweise verschieden sind. Die Lösung einer homogenen Differentialgleichung mit konstanten Koeffizienten ist dadurch zurückgeführt auf das algebraische Problem der Bestimmung der Lösungen einer algebraischen Gleichung »-ten Grades (6.1; 2). Die Gleichung (6.1; 2) nennt man die charakteristische Gleichung. 6.2. Der Fall, daB die charakteristische Gleichung lauter verschiedene Lösungen hat. Setzt man yt = e'1*, y2 = er,x,..., yn = er»x in die WßONSKYsche Determinante An(y1,..., yn) ein, dann erhält man das Resultat
e(ri+rt+-+rn)x
1,
1,
. .-,1
r
r2,
.
i> . Tr 2 l> Tn-1
1
e(r1+r,+-+rn)x
φ Q fljj. a j j e endlichen VANDEBMONDEsche Determinante.
Xi
r 22 ' rr n - l
2
• •y.
>·
Diese Determinante ist die bekannte
334
VIII. Gewöhnliche Differentialgleichungen
Durch Anwendung einiger Determinanteneigenschaften erhält man auf einfache Weise das folgende Ergebnis A n =
e^+r.+.-.+r^ . ' f f
1
κ
_
r¡)
.
1=1
«-1
K
i
__
r < )
. . . (r2 _
r¡).
Hieraus folgt: An ist dann und nur dann gleich Null, wenn die charakteristische Gleichung (Abkürzung ch. G.) mehrfache Lösungen besitzt. Wenn die Lösungen der ch. G. alle verschieden sind, dann bildet das System Vi = e'lX> Vi = e',x> •••>yn=
e nX
'
ein Fundamentalsystem oder eine Basis, und die allgemeine Lösung der Differentialgleichung wird bestimmt durch y=
+ C2er,z + · · · + C„e'»*.
Beispiel β.2.1. y" — ñy' + 6 = 0; ch. G.: r2 — 5r + 6 = 0; rL = 2, r2 = 3. ALLGEMEINE LÖSUNG: y = G^
+ C2e3*.
Beispiel 6.2.2. y" + 9y = 0; ch. G.: r 2 + 9 = 0; rx = + 3 i , r2 = — 3 i . ALLGEMEINE LÖSUNG: y = C^*
+
C2e~3ix.
Beispiel 6.2.8. yW — 6y + 15y" — 1 8 y ' + 10y = 0. Ch. G.: r 4 — 6r® + lör 2 — 1 8 r + 10 = 0 oder (r2 — 2r + 2) (r2 — 4r + 5) = 0. » 1 = 1 + ». r 2 = 1 — i, r s = 2 + t, r 4 = 2 — i . ALLGEMEINE LÖSUNG: y = C 1 e( 1 +*> + C^1^*
+ Cie^+f>x + C 3 e< 2 - 1 >.
6.3. Konjugiert komplexe Lösungen der charakteristischen Gleichung. Aus der Algebra weiß man, daß mit einer komplexen Lösung auch die konjugiert komplexe Zahl als Lösung einer algebraischen Gleichung mit reellen Koeffizienten auftritt. Neben einer Lösung r1 = a + bi tritt auch die konjugiert komplexe Lösung r2 — a — bi auf (vgl. Beispiel 6.2.3). An Stelle von C1e(a+ib)x + C2e(-"'ib)x kann man dann schreiben eax{(7j(cos bx + i sin bx) + C2( cos bx — ¿sin bx)} = Dje"* cos bx + D2eax sin bx mit
=
+ C2, D2 = i(Ct— C 2 ).
Dadurch wird das Ergebnis besonders für numerische Berechnung (mittels Tabellen) handlicher. Auf diese Weise erhält man als Ergebnis von Beispiel 6.2.3 y = (Dje* + D2e2x) cos χ + (D 3 e x + Dieix) sin x.
335
β. Homogene Gleiohungen mit konstanten Koeffizienten
6.4. Beispiel einer gedämpften harmoniechen Schwingung. Lineare Differentialgleichungen finden vielfältige Anwendungen in der Mechanik, wie wir am Beispiel des folgenden Problems zeigen wollen. Beispiel 6.4. Eine Masse m bewegt sich geradlinig unter dem Einfluß einer rein elastischen Federkraft (einer Kraft, die proportional und entgegengesetzt gerichtet ist zur Entfernung aus der Gleichgewichtslage) durch ein zähes Medium, von dessen Widerstand wir annehmen, daß er die entgegengesetzte Richtung der Geschwindigkeit hat und daß er proportional zur Geschwindigkeit ist.
Fig. 4 Die an m angreifenden Kräfte können wir folgendermaßen darstellen: (a) die Federkraft — ky (Auslenkung y; k ist die Federkonstante); (b) der Widerstand des Mediums — a y = —a(dy/dt) (α ist die Dämpfungskonstante); y(t) ist die Auslenkung zur Zeit t. Der Gleichgewichtszustand bestand im Augenblick t = 0, also y(0) = 0. Die Bewegungsgleichung von m wird dargestellt durch m'y
—
ay
ky (y =
^pj.
Setzt man λ = -¡r— > 0, ¿m
«2 = ¿ > 0 , m
dann geht die Bewegungsgleichung über in
also in eine lineare homogene Differentialgleichung 2. Ordnung. Die charakteristische Gleichung lautet r a + 2 A r + a 2 = 0;
= — λ + Κ A2 — α (starke Dämpfung), χ = Υ λ* — «¡» reell. y = e-^Cje*' + Cae-*«) = e-·1®{Ci(cosh xt + sinh xt) +
F>..., berechnet hat, erhält man die gesuchten Funktionen V1, V2,.. V„ durch Integration, und hat damit das allgemeine Integral der inhomogenen Gleichung gefunden. Insbesondere findet man für Gleichungen zweiter Ordnung V
¿
X )
C u2(x)r(x)dx - - ) A2[ultu2)
_
v
, [ u1(x)r(x)dx ) A2(U1,U2) •
+
'
Wir bringen noch ein Beispiel für die Methode der Variation der Konstanten. Beispiel 7.8. y" + 4y = 2 t g « ; charakteristische Gleichung: r 2 + 4 = 0; r = ± 2 » . Allgemeine Lösung der homogenen Gleichung: u(x) = Cxéix + C 2 e- a t ó = D t cos 2x + D2 sin 2x
y{x) = Vt(x) cos 2a: + V2(x) sin 2a:.
(7.3; 8)
Hilfegleichungen zur Bestimmung von Vi und Vi cos 2z -f Vz sin 2a: = 0, — V[ sin 2a; +
V22 — 2Μλω + α 2 Ν ) sin ωί = β cos ωί, und daraus folgt /?(«*-ω*) , (λ2 — ω2)2 + 4λ 2 ω 2 '
2λβω (α2 — ω2)2 + 4 Α2ω2 "
ALLGEMEINE LÖSUNG von (7.4; 1): 0(λ 2 —ω2) , . 2λβω . 2 2 ι , H yC) = (α , .2 — ωm 1»2ωι2 s m ) + 4/ 2 ω 2, cos ωί + (α2 — ωa2)2 +ι 4i Α
.
ω1
+ e~u{A cos Κα 2 —Α 2 · ί + Β sin i V — λ2 · 0). Der letzte Anteil charakterisiert einen Übergangszustand, und er ist für große ί zu vernachlässigen. Der stationäre Zustand wird durch den ersten Anteil ß . cos (ωί — φ) (7.4; 3) |/(Λ2 —ω 2 ) 2 +4Α 2 ω 2 bestimmt. Bei sehr schwacher Dämpfung (A sehr klein) ist die Amplitude ~ β¡(a? — ω2), so daß sie katastrophale Ausmaße annehmen kann, wenn die Frequenz der angreifenden Kraft der Eigenfrequenz der schwingenden Masse nahekommt, wenn nämlich ω ~ «. Man spricht dann von Resonanz. Für A = 0 (keinerlei Dämpfung) und ω = α verliert der Ausdruck (7.4; 3) seine Bedeutung, aber in diesem Fall besitzt die charakteristische
y(i) =
V m . Gewöhnliche Differentialgleichungen
346
Gleichung von (7.4; 1) zwei Lösungen ± *a> während das Störglied auch in der Lösung der homogenen Gleichung auftritt. Nach VIII, 7.2(b) lautet dann die allgemeine Lösung von y + α 2 y = β cos at 2/(0 =
+ Ci) 8 i n
+ 0 2 cos ai.
Da t in dem Koeffizienten von sin α t linear vorkommt, ist auch dies Ergebnis verhängnisvoll: man erhält eine Amplitude, die periodisch linear mit der Zeit zunimmt. Diese Überlegungen spielen eine wichtige Bolle bei vielen technischen Problemen.
8. Nicht-lineare Differentialgleichungen 8.1. Vorbemerkungen. Die Theorie der nicht-linearen Differentialgleichungen kann nur kurz gestreift werden. Nur in Spezialfällen ist eine elementare Lösung möglich; in diesen Fällen bedarf beinahe jede Gleichung einer Spezialbehandlung (vgl. V m , 8.3). Allgemeine Lösungsverfahren fehlen hier gänzlich, und obwohl die Forschungen auf diesem Gebiet in den letzten Jahren ungewöhnlich intensiv waren, haben sie in den meisten Fällen nur zu — übrigens außergewöhnlich belangreichen — qualitativen Ergebnissen über den Verlauf der Integralkurven geführt. Wir behandeln hier einige praktisch wichtige und überdies interessante Beispiele, deren Lösung zufällig möglich ist. 8.2. Lösung durch Transformation — Spezialfall der Riccatischen Gleichung. Schon die sehr einfach gebaute nicht-lineare Gleichung y ' ^ x ^ + y*
(8.2; 1)
ist nicht elementar lösbar. Jacob B e b n o u l l i hat 1703 entdeckt, daß diese Gleichung nach Einführung einer neuen abhängigen Veränderlichen u(x), die durch
bestimmt ist, in eine lineare Differentialgleichung zweiter Ordnung u"(x) + x2u{x) = 0 übergeführt wird. Es ist tatsächlich möglich, die allgemeine Lösung dieser Gleichung anzugeben, aber nicht mit Hilfe endlich vieler elementarer Funktionen. I n IX, 2.8 wird bewiesen, daß ζ. B. diejenige partikuläre Lösung von (8.2; 1), die den Anfangswert «/(O) = 0 hat (die Integralkurve geht dann also durch den Ursprung), bestimmt wird durch oo ~Aic -1 y(x) = Σ (— l)k+1 yK ' ' 3 · 4 · 7 · 8 . . . ( 4 4 — 4) (44— 1) 00
1
iti
' 3 · 4 · 7 · 8 . . . (44 — 1) 44 j
347
8. Nicht-lineare Differentialgleichungen
also in Form eines Quotienten zweier unendlicher Potenzreihen angegeben werden kann. Die Gleichung (8.2; 1) ist ein Spezialfall einer allgemeineren nicht-linearen Differentialgleichung von RICOATI (RICCATI 1724, D'ALEMBEBT 1763) dy + A(x)-y*+B(x)y+C(x) dx
= 0,
mit der wir uns aber nicht weiter beschäftigen wollen. 8.3. Wichtige Beispiele nicht-linearer Differentialgleichungen. Beispiel 8.8.1. Die exakte Formel für die Schwingungszeit eines mathematischen Pendels. Ein Massenpunkt m hängt an einem nichtdehnbaren gewichtslosen Faden der Länge l (Fig. 5). Der Massenpunkt wird aus seinem Gleichgewichtszustand C nach der Stelle A gebracht und dann losgelassen, so daß der Massenpunkt längs des Kreisbogens AB hin und her schwingen kann. Winkel AOC = Winkel BOG = χ ^Amplitude, | α | á y ) · Im Zeitpunkt t befindet der Punkt sich in P. Winkel POC = φ. Die tangentielle Komponente der Beschleunigung in Ρ beträgt Fig. δ lip = 2(d2çp/di2). Die tangentielle Komponente der Schwerkraft in Ρ beträgt mg sin φ (entgegengesetzt zur tangentiellen Beschleunigung gerichtet). Die Bewegungsgleichung lautet dann ml = —mg sin φ oder φ -f -y- sin φ = 0
(8.3; 1)
(nicht-lineare Differentialgleichung 2. Ordnung). Die Lösung von (8.3; 1) gelingt auf die folgende Weise. Aus (8.3; 1) folgt 2φ · φ = — 2 -j- sin φ · φ, woraus wir durch Integration (ψ)2 —
2g
cos φ + G
(Energie-Integral)
erhalten. Die Integrationskonstante G bestimmen wir durch die Anfangswerte: für < = 0 ist m i n C(
= α ist © =
.
(8.3; 4)
Aus (8.3; 3) folgt φ
_ 2 sin (α/2) cos ΘάΘ ^ 2 sin (q/2) cos ΘάΘ ~ cos (φ β ) ~ J/l —sin 2 (α/2) sin 2 ©
cos φ — cos α = 2 ^sin2·^- — sin2-^- sin2 ©j = 2 sin2
cos2 Θ.
Also geht (8.3; 2) über in dt
d& - 1/T , . 2 ==T γ ΐ — sin V 9 ]/l —sin (α/2) sin2 ©
(8.3; 5)
Die letzte Integration ist auch nicht .elementar* ausführbar. Wenn Τ die Schwingungedauer von Β nach A ist und Τβ die Zeit von C nach A, dann folgt aus (8.3; 5) unter Berücksichtigung von (8.3; 4) * 2
ι IT M. « ]j g Jo γι — sin2 (α/2) sin 2 ©
i ÌT \ 3
/ \
.ν
wobei Κ (sin2 (α/2)) ein vollständiges elliptisches Integral erster Gattung darstellt. Durch Reihenentwicklung (also nicht-elementar) erhält man d 0 Ρ2 , - = r(l-sin2|-sin2©r»d© 2 J0 J/l — sin2 (α/2) sin2 Θ Jo \ I
= f"' 2 d© /l + -s- sin2 sin2 © + 7- sin4 ^ sin4 © Jo L 2 2 2·4 2 . 1-3-5 o den beiden nähert sich α/2.
361
8. Nicht-lineare Differentialgleichungen
Beispiel 8.8.3. Die Kettenlinie (vgl. Fig. 7). Eine Kette — aus einem vollkommen biegsamen undehnbaren Band — mit der Länge l ist an den Punkten A (Oj, bt) und B(a2, b¡¡) aufgehängt. Das Gewicht der Kette beträgt pro Längeneinheit h. Welche Gestalt nimmt die Kette an?
Fig. 7 Wir betrachten den Gleichgewichtszustand eines Linienelementes PQ = As, d. h. wir denken uns das Linienelement Αs aus der Kette herausgeschnitten und in Ρ und Q Kräfte K1 und K2 wirken, die As in seinem bisherigen Gleichgewichtszustand halten. K1 und K2 müssen tangential gerichtet sein, (x, y) seien die Koordinaten von Ρ, (χ + Ax, y + Ay) diejenigen von Q. Das Gewicht von PQ ist h As. Für die Beträge Xlt Yt, 7 a der horizontalen bzw. vertikalen Kraftkomponenten ergibt sich dann (vgl. Fig. 7) X2 — X
=
t
= 0; Y2 — Yi =
AX
tgOj, =
(Í)q; í
-
AY
tgai
=
hAs.
= (ΐ)ρ·
d X
Also für As-* 0 ^ - = 0, also ist die horizontale Komponente von X konstant gleich c (zunächst noch unbekannt). dY dx
^
dx
Aus (8.3; 10) und (8.3; 11) folgt É-L
dé·
=
J L ] / i - L .
c
y
1 +
( Ê L Y
\ d x ) '
oder d p ~dx
Das ist
die
= k Kl + ρ 2 ^ = -j = konstant, ρ = ^ ) .
Differentialgleichung
der
Kettenlinie
(nicht-linear).
352
V i l i . Gewöhnliche Differentialgleichungen
Wie in Beispiel 8.3.2(b) wird diese Differentialgleichung integriert mit Hilfe einer hyperbolischen Substitution ρ = - — « — = sinh z, also Kl + P 2 = 2t dx du
=
6
~t 6 — = cosh z. ¿
= c o s h z ^ - = ¿cosh«, = h, -+z = kx + d. dx dx
eix+d — e — < í 2 '
y =
e i ä ; + d 4- e-tx-i 2k
+ w =
1
, , o o e h ( i * + d) + m,
worin d u n d m Integrationskonstanten sind und auch die Konstante k = λ/e vorläufig noch unbekannt ist. U m diese Konstanten zu bestimmen, weisen wir zunächst darauf hin, daß sich die Gesamtlänge der Kette folgendermaßen berechnet: i = \ * Y T + f . dx = f- e**+ä + e - ^ JOi Ja, ¿
d x
= — {(e*««+d — e~la'-d)
— (elai+á — e-*"»-*')}
= - ί {sinh (k2 + d) — sinh (kax + (?)} ^ j-sinh Κ
cosh * + ¿
U
.
(8.3; 12)
Δ
Die Randbedingungen. Die Kettenlinie geht durch A(a1, &¿) und B(a¡, b2), also yΒ — Va = δ 2 — Κ = -i- {cosh (kaz + d) — cosh (fca2 + á)} 4 ΚM
¿i
sinh
Ha
* + **> +
2d
.
(8.3; 13)
Aus (8.3; 12) und (8.3; 13) folgt
Setzt man darin (k(az — βχ))/2 = u, dann erhält man einhtt tí
=
y P — (bj — 6 t ) 2 — tij
14)
Das ist eine transzendente Gleichung zur Bestimmung der einzigen Unbekannten u. Die rechte Seite ist vollständig bekannt. Durch Iteration oder mit Hilfe von Tabellen f ü r sinh u/u kann man hieraus den Wert u = (k(a2 — 0 eine holomorphe Funktion dar, die man Oamma-Funktion oder Γ-Funktion nennt und durch Γ(ζ) bezeichnet, also TO-
" e~tf~1dt o
für Re « > 0.
(1.1; 2)
Der Name und die Bezeichnung dieser Funktion stammen von (1809). Aus (1.1; 1) folgt
LEGENDBE
Γ{η + 1) = n\ für ganze » ^ 0. Aus (1.1; 2) erhält man durch partielle Integration die reieursive Formel Γ(ζ + 1) = ζΓ{ζ) (zunächst nur für Re ζ > 0). Eine andere häufig benutzte Bezeichnung stammt von Π{ζ)=Γ(ζ
GAUSS
(1812):
+ 1)*.
Außer den Funktionswerten für ganzzahlige ζ > 0 ist auch einfach zu berechnen. Die Substitution t = x2 ergibt =
(1.1 ; 3)
=
= f
dt (1.1; 4)
* Die manchmal gebrauchte Bezeichnung Γ(ζ + 1) — «1 auch für nicM-natürlicht ζ Ist nicht empfehlenswert. Tgl. JAHNKE, EMDB, LÖSCH (siehe Im Literatlirverzeichnis unter Tabellen).
1. Gamma-Funktion and Beta-Funktion
363
ein bekanntes Résultat, das man gewöhnlich zu Unrecht P o i s s o n zuschreibt (1813). In Wahrheit ist dieses Ergebnis bereits von E u l e b (1771) entdeckt worden. Aus (1.1; 4) folgt unter Berücksichtigung von (1.1; 3) +
¡^
(»ganz^O).
1.2. Analytische Fortsetzung der Gamma-Funktion. Für ζ mit Re ζ > 0 ist Γ (ζ) = = oo
/
e-'f-idt Jot-o
= Ç* e-'f-^ät
- t i p i f^dt + «1 Jl
+
e-'t'^dt
e-'f^dt.
Afc
Die Reihe Σ , , · ί 2 - 1 , die unter dem ersten Integralzeichen vor*=0 *» kommt, konvergiert gleichmäßig für alle t mit O á ' ú 1. also darf gliedweise integriert werden und r W e 00
¿
( J
-
1 , i
W + I Ö + L " · " ^
(Rez>0)
·
(L2:1)
Σ (— 1)* , ist holomorph in aßen Punkten der komplexen i-=o k \ [k z) z-Ebene außer in den Punkten ζ = 0, — 1, — 2 , . . . , und zwar treten an diesen Stellen Pole erster Ordnung auf. Das Residuum im Punkte ζ = —k (k ganz und positiv) lautet _ (-1)* k\~' 1 Man kann leicht zeigen, daß J^e~'^~ dt, der zweite Ausdruck in (1.2; 1), eine in der ganzen (endlichein) z-Ebene holomorphe Funktion von ζ ist. Also ist die rechte Seite von (1.2; 1) eine Funktion von z, die in allen Punkten holomorph ist, außer in den Stellen ζ = 0, —1, — 2 , . . . , wo Pole erster Ordnung auftreten. Also ist die rechte Seite von (1.2; 1) eine meromorphe Funktion von z. Man kann also in der ganzen, nur in ζ = 0, —1, —2,.. . punktierten komplexen Ebene die holomorphe Funktion
als analytische Fortsetzung von Γ(ζ) betrachten. Man überzeugt sich leicht, daß die rekursive Formel (1.1; 3) Γ(ζ + 1) = ζΓ{ζ) auch in dem erweiterten Defmitionsgebiet gültig ist.
364
IX- Spezielle Funktionen
1.3. Die B-Funktion oder Beta-Funktion B(z, u>). Das Integral J V - ^ l — t^dt ist definiert für Re ζ > 0, Re w > 0. Für derartige ζ und w definieren wir
B{z,
t'-^l — t)»- 1dt, und diese Funktion nennt man B-Funktion oder Beta-Funktion.
Der Name leitet sich her von BINET (1839). Aber bereits EULEB (1771) und LEGENDBE (1809) haben diese Funktion untersucht. Die Beta-Funktion ist keine selbständige Funktion, sondern man kann sie in einfacher Weise rational durch /"-Funktionen ausdrücken. Nimmt man vorläufig ζ und w als positiv reell an und definiert man
y
rfÑ
S N rfW e~ 'u ~ du, S e-'t >- dt = 2\ e~ 'v ~ dv, e- tt"- 1ät=2 \ tt
dann ist
1
2z 1
v
rVW 2cV^ 1
rN(z) · rN(w) = 4 1
u
du- u *- \
2w 1
e-C'+'V*-1^
(Integration über ein Quadrat mit der Seitenlänge j/ÎV in der (u, r)-Ebene). Führt man nun Polarkoordinaten u = r cos φ, ν = r sin φ ein, dann folgt aus der letzten Zeile die Ungleichung π/2 rVW 1 cos 21-1 φ - sin 2 " - φάφ\ e^r^+^dr,
S
wobei jetzt über einen Kreisquadranten vom Radius Ϋ2Ν (= Diagonale des früheren Quadrates) integriert wird. Entsprechend erhält man Γπ/2 ΓΫΊΓ ΓΝ(ζ) · r„(w) > á\ cos2*-1 φ · sin21"-1 l e - V ^ + ^ d r , wobei nun das Integrationsgebiet ein Kreisquadrant mit dem Radius YÑ (= Seite des früheren Quadrates) ist. Für Ν ->oo führen beide Ungleichungen zu Γπ/2 Γ{ζ)Γ(ιν) = 2Γ(ζ + w) \ cos22-1?) · άη^^φάφ
= Γ(ζ + w)
— ty^dt = Γ(ζ + w) Β (ζ, w).
(cos2 ψ = t)
1. Gamma-Funktion und Beta-Fnnktìon
365
Also erhält man für positiv reelle ζ und w Γ(ζ
+ w) B(z, w) = Γ(ζ)
·
r(w).
Da die linke und die rechte Seite dieser Gleichling eine holomorphe Funktion in ζ und w darstellen für Re ζ > 0, Re w > 0 , gilt diese Gleichung wegen der Eigenschaften der analytischen Fortsetzung auch für alle ζ und w mit Re ζ > 0, Re w > 0. Falls Γ(ζ + w) Φ 0 ist, kann man beide Seiten noch durch Γ(ζ + w) dividieren. In IX, 1.4 zeigen wir, daß tatsächlich in allen Punkten der z-Ebene Γ(ζ) φ 0 gilt. Also gilt für Re ζ > 0, Re w > 0 Ri,
«Λ
Γ(ζ)Γ(υή
1.4. Die Funktionalgleichung der Gamma-Fonktìon. Indem man Í ^—— Je 1 + t über einen Rand integriert, der aus einem großen Kreis um den Ursprung und aus einer Schleife längs der positiven reellen Achse um den Ursprung besteht, zeigt man leicht, daß
s:
" to
tf-i-dx
π
(0 < Re ζ < 1). Jo 1 + x sin πζ Ersetzt man hierin χ durch